社區(qū) 發(fā)現(xiàn) Amazon 抓取review很簡(jiǎn)單,但是表格怎么分析...
抓取review很簡(jiǎn)單,但是表格怎么分析,有人能提出建議嗎?
可以用排序把差評(píng)單獨(dú)弄出來(lái),也可以把評(píng)論里話放到字頻分析的網(wǎng)站看哪些單詞出現(xiàn)的頻率高,從中獲得一些關(guān)鍵詞,我目前想到的還只有這些。
跨境電商人的科學(xué)世界,
真知、灼見(jiàn),
喜悅或快意的君子之爭(zhēng)。
見(jiàn)智慧,見(jiàn)性情。
本站原創(chuàng)內(nèi)容版權(quán)歸作者和知無(wú)不言共同所有,未經(jīng)本站許可,禁止以任何形式轉(zhuǎn)載。
亞馬遜全球開(kāi)店
10 個(gè)回復(fù)
拉風(fēng)老年 - 人外有人,天外有天
贊同來(lái)自: 小小少年強(qiáng)
分析url - 發(fā)送請(qǐng)求 - 爬取數(shù)據(jù) - 清洗數(shù)據(jù) - 存儲(chǔ)數(shù)據(jù)?- 數(shù)據(jù)分析
1、發(fā)送請(qǐng)求:瀏覽器+抓包工具
2、爬取數(shù)據(jù):requests、urllib
3、清洗數(shù)據(jù):lxml(個(gè)人喜愛(ài)),還有美麗湯(beautifulsoup)模塊
3、存儲(chǔ)數(shù)據(jù):mysql、excel
4、數(shù)據(jù)分析:numpy、pandas
?
爬蟲(chóng)是個(gè)很復(fù)雜的東西、里面涉及的知識(shí)點(diǎn)很多。如果你想知道更多關(guān)于爬蟲(chóng)方面的知識(shí),可以加我好友!
最后聲明:自己并不是什么大神,目前只會(huì)爬些簡(jiǎn)單數(shù)據(jù)!