国产成人剧情av麻豆果冻,国产无遮挡又爽又黄的视频,天天躁夜夜躁狠狠躁婷婷,性色香蕉av久久久天天网,真人性生交免费视频

所在分類:  ChatGPT 所屬圈子: ChatGPT Amazon

如何用ChatGPT 和Python Web抓取亞馬遜產(chǎn)品數(shù)據(jù)做競(jìng)品分析

發(fā)帖34次 被置頂3次 被推薦2次 質(zhì)量分0星 回帖互動(dòng)113次 歷史交流熱度21.07% 歷史交流深度0%
? 我們?cè)谧隹缇畴娚痰臅r(shí)候 有一個(gè)非常重要的工作就是做競(jìng)品分析,必須要抓取大量的產(chǎn)品數(shù)據(jù)。但是目前亞馬遜網(wǎng)站上他是禁止爬蟲去抓取數(shù)據(jù)的,所以今天我教大家利用chatgpt和Python Web做競(jìng)品分析

https://assert.wearesellers.com/questions/20230327/1451d53af77adc59c6c64bbdabba10ce.png https://assert.wearesellers.com/questions/20230327/779d511f5cf8d0a45512b8cc83ab6590.png
?
先到亞馬遜網(wǎng)站找到我們要分析產(chǎn)品的類目,我們需要獲取的數(shù)據(jù)是圖片,品名,評(píng)價(jià),價(jià)格。以廚房用品為例

https://assert.wearesellers.com/questions/20230327/e08f21280caf5d8ce8a84a9b4644cdcd.png https://assert.wearesellers.com/questions/20230327/92ff35ddab7506da60b8f19adcb4a258.png
?
總共有120個(gè)結(jié)果。就是這個(gè)細(xì)分產(chǎn)品下面有120個(gè)產(chǎn)品.
右鍵點(diǎn)擊這個(gè)產(chǎn)品頁(yè),檢查

https://assert.wearesellers.com/questions/20230327/89a28c276f7ab4d47519c2a360e37af1.png https://assert.wearesellers.com/questions/20230327/9975ba3e019c2aa2cede1af9c374c560.png
?
當(dāng)我們鼠標(biāo)放到這個(gè)Div上面的話,左邊這里有一塊是變灰了,右邊手指的這塊Div,對(duì)應(yīng)的就是這個(gè)變灰的產(chǎn)品

https://assert.wearesellers.com/questions/20230327/2602223f5ed5c224ee45ecf64f771b61.png
?
如果另外換一個(gè)Div的話是這個(gè)產(chǎn)品

https://assert.wearesellers.com/questions/20230327/fe45939745c53e04e34f474aedf17b5b.png
?
在不同的div里面這里的class name都是一樣的。我們把這個(gè)拷貝下來(lái)。

https://assert.wearesellers.com/questions/20230327/54de8874f26c599886447b654a685fb1.png
https://assert.wearesellers.com/questions/20230327/2e0ea2231e07169f181ca455842e3a5a.png
?
在前面加上div

https://assert.wearesellers.com/questions/20230327/923941e6a8f9a42d34d87d4844173e34.png
?
接下來(lái)繼續(xù)回到產(chǎn)品頁(yè)。把鼠標(biāo)放在圖片上面,右鍵點(diǎn)擊。還是選擇檢查。把這個(gè)class的名字也拷貝下來(lái)

https://assert.wearesellers.com/questions/20230327/37ca573d1752c3c38471a7c42fba59c5.png
https://assert.wearesellers.com/questions/20230327/9d7e565b461bb4a418f8df2a953a89cb.png
?
前面加上image。把鼠標(biāo)放在這個(gè)標(biāo)題上面

https://assert.wearesellers.com/questions/20230327/294f7c0e467cfdce4ce3a86519e0408d.png
?
右鍵點(diǎn)擊,再檢查把這個(gè)span的這個(gè)class也拷貝下來(lái)。前面加span。繼續(xù)鼠標(biāo)放到評(píng)價(jià)上面,右鍵點(diǎn)擊,把這里span class這里也拷貝下來(lái)

最后右邊點(diǎn)擊價(jià)格,也是把這個(gè)span class記錄下來(lái)。

https://assert.wearesellers.com/questions/20230327/3ab8f6d1b0b4f5eaa40fdf1c02ef6e6b.png
?
這五個(gè)做完以后,我們CTRL鍵+s鍵把我們這個(gè)網(wǎng)頁(yè)保存下來(lái)。

https://assert.wearesellers.com/questions/20230327/4b729ca8a1d5c7f4c865a38cb7c65c77.png
?
根據(jù)剛才找到的五個(gè)元素。我們給chat gpt發(fā)出指令讓他做三件事。
第一個(gè)使用PYTHON給我們編寫代碼,

https://assert.wearesellers.com/questions/20230327/65b165edcda5722a73b2d2f2a508521b.png
?
第二個(gè)讀取我們剛才保存下來(lái)的亞馬遜的產(chǎn)品頁(yè)。
第三個(gè)在這個(gè)頁(yè)面里面一一對(duì)應(yīng)這5個(gè)元素,最后把這些匹配的數(shù)據(jù)保存到一個(gè)json文件

https://assert.wearesellers.com/questions/20230327/6e1edb119d57c80d208ed5eb63972dbd.png
?
運(yùn)行一下
現(xiàn)在運(yùn)行一下然后看到左邊多了一個(gè)json的文件
?
https://assert.wearesellers.com/questions/20230327/88739b91636a8b89d0b5ca2414d2b9b3.png
https://assert.wearesellers.com/questions/20230327/a6ee3b05142566e4bfab94047ab20f63.png
?
我們打開看一下。這里數(shù)據(jù)已經(jīng)有了。這個(gè)是評(píng)級(jí)和價(jià)格。

https://assert.wearesellers.com/questions/20230327/583cfbce2a402e2429b077b51a3b0b0d.png
?
這個(gè)代碼是可以復(fù)用的,轉(zhuǎn)到第二頁(yè)

https://assert.wearesellers.com/questions/20230327/a861c905b79a8eaef1d9bccac88634b0.png

同樣我們把第二頁(yè)保存下來(lái)

https://assert.wearesellers.com/questions/20230327/419600961c575dd18a672a7dcd2c69d9.png
?
然后在這里把我們這個(gè)文件換一下,這個(gè)是2

https://assert.wearesellers.com/questions/20230327/82644d6361389d24a458b5bf4cb58adf.png
?
這里輸出的文件我把名字改成data2.新輸出了一份文件

https://assert.wearesellers.com/questions/20230327/57979318ae07170201e136f04c5562aa.png
?
最后讓chatgpt幫我們把兩個(gè)json文件合并成一個(gè)csv文件

https://assert.wearesellers.com/questions/20230327/5874339ccdf319e7f5c53284b379ca09.png
?
合并成功格式是csv

https://assert.wearesellers.com/questions/20230327/f021074bb407de27f6a1db0e6b8e9a31.png
?
這邊如果有不懂的,歡迎大家交流。
已邀請(qǐng):


? 我們?cè)谧隹缇畴娚痰臅r(shí)候 有一個(gè)非常重要的工作就是做競(jìng)品分析,必須要抓取大量的產(chǎn)品數(shù)據(jù)。但是目前亞馬遜網(wǎng)站上他是禁止爬蟲去抓取數(shù)據(jù)的,所以今天我教大家利用chatgpt和Python Web做競(jìng)品分析


?
但凡有點(diǎn)前置知識(shí)也不至于說出這種鬼話,這篇文章的前提就錯(cuò)了,亞馬遜壓根不禁止你爬商品頁(yè)面,只是禁止高頻率請(qǐng)求而已,不然你以為谷歌怎么搜得出商品頁(yè)面
亞馬遜自己寫的robot.txt:
https://www.amazon.com/robots.txt
?
像亞馬遜這種,簡(jiǎn)簡(jiǎn)單單request,加個(gè)等待時(shí)間就能自動(dòng)批量下網(wǎng)頁(yè)內(nèi)容了,十年前知乎怎么爬亞馬遜的,現(xiàn)在你也能爬
要回復(fù)問題請(qǐng)先登錄注冊(cè)

加入賣家社群
關(guān)注公眾號(hào)
加入線下社群
廣告 ×
10s