社區(qū) 發(fā)現(xiàn) 產(chǎn)品開(kāi)發(fā) 產(chǎn)品開(kāi)發(fā)如何從宏觀數(shù)據(jù)里找到一些關(guān)鍵詞
產(chǎn)品開(kāi)發(fā)如何從宏觀數(shù)據(jù)里找到一些關(guān)鍵詞
我簡(jiǎn)單的分享一個(gè)思路:
首先我們都知道每條listing的標(biāo)題都是一款產(chǎn)品的精準(zhǔn)描述。所以找關(guān)鍵詞可以從標(biāo)題下手。
那么問(wèn)題來(lái)了,要怎么確定看哪條listing?
開(kāi)始我說(shuō)了從宏觀數(shù)據(jù)里找,所以并不是只看一條listing的標(biāo)題,而是成千上萬(wàn)條listing標(biāo)題。
那么問(wèn)題又來(lái)了,能看的過(guò)來(lái)嗎?
顯然逐條listing查閱并記住是不現(xiàn)實(shí)的,所以我們只需要在Excel里對(duì)所有的listing標(biāo)題做一次詞頻統(tǒng)計(jì),就可以知道哪些詞出現(xiàn)的次數(shù)最多,知道了什么詞大,找產(chǎn)品就不難了
那么問(wèn)題又又來(lái)了,哪有那么時(shí)間多把listing的標(biāo)題一條一條拷貝進(jìn)Excel里?
事實(shí)上拷貝的方式確實(shí)是最慢的,我一般都是用爬蟲(chóng)去亞馬遜首頁(yè)爬取,以類(lèi)目為單位爬取。
思路就是這么個(gè)思路,下面舉一個(gè)實(shí)例
我爬取了Beauty & Personal Care類(lèi)目, 3級(jí)以上所有子類(lèi)的BSR top100 listing,大概有39000條listing,然后在Excel里對(duì)這39000條listing標(biāo)題做一次詞頻分析。
得到的結(jié)果如下。(注:篇幅有限,我這里就只截取了出現(xiàn)次數(shù)前25的單詞)
通過(guò)這個(gè)結(jié)果,可以很快了解到Beauty類(lèi)目大概都賣(mài)啥產(chǎn)品。
第一名Hair,說(shuō)明關(guān)于Hair的產(chǎn)品占比最大
第二的nail,可以說(shuō)明趾甲類(lèi)的產(chǎn)品也很多。
第三的OZ,是一個(gè)容量/重量單位,說(shuō)明瓶瓶罐罐的產(chǎn)品也不少。
8 個(gè)回復(fù)
知言不無(wú) - 屌絲男
贊同來(lái)自: jackyin 、 修心慎言