国产成人剧情av麻豆果冻,国产无遮挡又爽又黄的视频,天天躁夜夜躁狠狠躁婷婷,性色香蕉av久久久天天网,真人性生交免费视频

所在分類(lèi):  Amazon 所屬圈子: Amazon Review Amazon

抓取review很簡(jiǎn)單,但是表格怎么分析,有人能提出建議嗎?

發(fā)帖48次 被置頂2次 被推薦1次 質(zhì)量分1星 回帖互動(dòng)1337次 歷史交流熱度2% 歷史交流深度0%
如題所示,昨天研究了一下爬蟲(chóng)/插件,終于搞定了一個(gè) ,能夠很快地將目標(biāo)ASIN的所有review給抓取下來(lái)?,F(xiàn)在就是分析這個(gè)表格沒(méi)有譜,誰(shuí)能提出一些建議?
可以用排序把差評(píng)單獨(dú)弄出來(lái),也可以把評(píng)論里話放到字頻分析的網(wǎng)站看哪些單詞出現(xiàn)的頻率高,從中獲得一些關(guān)鍵詞,我目前想到的還只有這些。
已邀請(qǐng):

拉風(fēng)老年 - 人外有人,天外有天

贊同來(lái)自: 小小少年強(qiáng)

一般爬蟲(chóng)工程師將所需數(shù)據(jù)爬取下來(lái)后,有專(zhuān)門(mén)的數(shù)據(jù)分析包(numpy/pandas),將清洗后的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析(繪制成圖表)。爬蟲(chóng)爬取數(shù)據(jù)大概流程及所需技術(shù)如下:
分析url - 發(fā)送請(qǐng)求 - 爬取數(shù)據(jù) - 清洗數(shù)據(jù) - 存儲(chǔ)數(shù)據(jù)?- 數(shù)據(jù)分析
1、發(fā)送請(qǐng)求:瀏覽器+抓包工具
2、爬取數(shù)據(jù):requests、urllib
3、清洗數(shù)據(jù):lxml(個(gè)人喜愛(ài)),還有美麗湯(beautifulsoup)模塊
3、存儲(chǔ)數(shù)據(jù):mysql、excel
4、數(shù)據(jù)分析:numpy、pandas
?
爬蟲(chóng)是個(gè)很復(fù)雜的東西、里面涉及的知識(shí)點(diǎn)很多。如果你想知道更多關(guān)于爬蟲(chóng)方面的知識(shí),可以加我好友!
最后聲明:自己并不是什么大神,目前只會(huì)爬些簡(jiǎn)單數(shù)據(jù)!
要回復(fù)問(wèn)題請(qǐng)先登錄注冊(cè)

加入賣(mài)家社群
關(guān)注公眾號(hào)
加入線下社群

亞馬遜全球開(kāi)店

亞馬遜全球開(kāi)店
廣告 ×
10s