社區(qū) 發(fā)現(xiàn) Amazon 【運營技術(shù)探討】根據(jù)搜索引擎工作原理怎么...
【運營技術(shù)探討】根據(jù)搜索引擎工作原理怎么運營好一條listing-----(一)怎么寫撰寫listing?
?這個分析內(nèi)容是亞馬遜搜索算法的基本邏輯,其中有很多是搜索算法通用的內(nèi)容,我不懂亞馬遜A9的核心算法,除了寫亞馬遜搜索算法團隊的人沒人知道算法核心,就是為了討論一下,望別杠!
先看一下,買家搜索一個產(chǎn)品到最后購買它,用戶和亞馬遜后臺的基本流程:??
?
?圖為人機交互過程
在第一階段中“調(diào)出所有符合條件的listing使用算法進行打分排序”這個對新的listing進行第一次的計算打分過程(沒有用戶瀏覽數(shù)據(jù),就沒有用戶體驗分值)-----稱新的listing數(shù)據(jù)搜集處理及第一次計算分值的過程為算法的靜態(tài)過程。
在第二階段中“根據(jù)用戶行為,使用算法對listing這次表現(xiàn)進行打分,對結(jié)果重新排序,等待下一次調(diào)用-------(對用戶進行評價)”當有了用戶體驗以后,listing的分值=靜態(tài)分值(基礎(chǔ)分值)+動態(tài)分值(用戶體驗分)-------人機交互稱這個過程為算法的動態(tài)過程。
(一)靜態(tài)過程1)過程分析靜態(tài)過程大概如下:
數(shù)據(jù)收集→【文本轉(zhuǎn)換→解析→停止詞去除→詞干提取→信息提取】→分類→索引創(chuàng)建→文檔統(tǒng)計→加權(quán)-正向索引-倒排索引
詳細點的解析在下面,有興趣的可以看一下,沒興趣的只看一下“加權(quán)-正向索引”就可以
1.listing數(shù)據(jù)收集:對新listing進行打分第一步要有l(wèi)isting的打分內(nèi)容和傳統(tǒng)搜索引擎(Google,百度)使用爬蟲收集相關(guān)文本相比,亞馬遜主要是通過賣家上傳的listing進行收集listing內(nèi)容,用賣家填寫的listing來進行搜集信息,同時亞馬遜自己規(guī)定了大部分填寫內(nèi)容和格式,文本搜集更加全面,對后續(xù)算法步驟更加友好。(正確的填寫亞馬遜產(chǎn)品表格十分重要)如果這個產(chǎn)品頁面信息是未被收錄的,則會對這個產(chǎn)品進行進行收錄,如果發(fā)現(xiàn)這個產(chǎn)品頁面已經(jīng)有些更新,則會重新對該頁面進行收錄。(收錄:把產(chǎn)品信息加入搜索引擎,可以通過關(guān)鍵詞搜索出來) ? ?
?
2.文本轉(zhuǎn)換:把人看的listing翻譯成機器看的listing
原始文本:Basic?Calculator:XXX?CD-8185?Office?and?Home?Style?Calculator–8-Digit–Educational?-?Suitable?for?School?and?Destop-use?(Purple)
解析后:Basic+Calculator%3A+XXX+CD-8185+Office+and+Home+Style+Calculator+%E2%80%93+8-Digit+%E2%80%93+Educational+-+Suitable+for+School+and+Destop-use+%28Purple%29
去停止詞詞干提取去除特殊符號等后:Basic+Calculator+XXX+CD-8185+Office+Home+Style+Calculator+8-Digit+Educational+Suitable+School+Destop-use+Purple
3.解析器(通俗說法:分詞)搜索引擎中的解析器主要負責處理文檔中的文本詞素序列,這就涉及到分詞的問題了,更好地理解詞與詞組的意思。
4.停止詞去除有一些詞在句子中只是讓句子更通順,并非起著非常重要的功能性上的作用,比如英文的“to”、“of”、“on”等,中文的“的”、“地”、“得”等。當然也可能存在實際的價值,如“大地”中的“地”就是有一定價值的詞,不能當做停止詞而被去除。
5.詞干提取針對于英文而言,需要提取詞的詞干,比如“fishing”提取fish。
6.信息的提取對于頁面上到底是與哪些詞相關(guān)的,哪個店鋪發(fā)布的,什么時間發(fā)布的,比如“Apple”到底是水果的意思還是iPhone公司相關(guān)產(chǎn)品的意思,需要對標題,五點,描述的內(nèi)容進行拆分成眾多詞組,進行理解這個產(chǎn)品頁面里面的apple到低是什么意思。(和類目選擇相互印證,如果類目錯誤較大會有相關(guān)懲罰的,沒有搜索展示,做不了廣告等)
7.分類分類組件對頁面都打上歸屬標簽,比如是關(guān)于體育的,還是關(guān)于IT的,亦或者是娛樂的。(理解的信息和類目選擇相互印證,如果類目錯誤較大會有相關(guān)懲罰的,沒有搜索展示,做不了廣告等)
8.索引創(chuàng)建索引就是幫助程序進行快速查找的。大家都用過新華字典。字典前邊的按照偏旁部首查字的部分就是索引。搜索引擎也一樣。
9.文檔統(tǒng)計文檔統(tǒng)計簡單匯總和記錄詞、特征和文檔的統(tǒng)計信息。搜索引擎所擁有的文檔中出現(xiàn)的每一個單詞都擁有一個反轉(zhuǎn)列表。它記錄了這個單詞在多少文檔中出現(xiàn),分別是哪些文檔,每個文檔分部出現(xiàn)多少次,分別出現(xiàn)在什么位置等信息。為了提高搜索質(zhì)量,搜索引擎需要對文檔的不同部分分別處理,構(gòu)造反轉(zhuǎn)列表。每一部分的單詞都要被加入到這個詞屬于此部分的反轉(zhuǎn)列表里。
10.加權(quán)-正向索引加權(quán)是搜索引擎的排名非常重要,它是搜索引擎對頁面識別并處理后的初始權(quán)重,體現(xiàn)出了文檔中某些詞的相對重要性,而這個加權(quán)結(jié)果是通過搜索引擎檢索模型來確定下來的。
??
11.倒排索引倒排索引組件是搜索引擎的核心組件,是將文檔對應(yīng)多個索引項的形式,轉(zhuǎn)化成為索引項對應(yīng)多個文檔的形式,這種做法稱之為建立倒排索引。?
?
?2)自己總結(jié)的撰寫listing的思路
靜態(tài)過程主要是涉及撰寫listing,而listing撰寫主要是關(guān)鍵詞布局和相關(guān)性,推廣之前,關(guān)鍵詞布局主要在“標題、五點、產(chǎn)品描述、ST”,推廣之后關(guān)鍵詞布局還要加上“QA和評論”
1.?關(guān)鍵詞的選擇:關(guān)鍵詞一般是選擇短的詞組,搜索量大,曝光量大,當然競爭也大,有一般就有特殊的選詞方法,選一個包含核心短詞組的長尾關(guān)鍵詞,放到標題里面,通過一段時間的高數(shù)據(jù)指標提高核心短詞組的權(quán)重,最后優(yōu)化到核心短詞組為關(guān)鍵詞。2.?標題:產(chǎn)品關(guān)鍵詞+修飾詞,重要的的關(guān)鍵詞放前面,從左到右排序,不要堆砌關(guān)鍵詞,注意語句通順,意思完整。惡意堆砌關(guān)鍵詞有可能被系統(tǒng)懲罰語句不通,影響用戶體驗修飾詞不是沒有作用的,他可以起到引導(dǎo)推銷,使消費者進入相對意境產(chǎn)品關(guān)鍵詞包含:核心關(guān)鍵詞,寬泛關(guān)鍵詞,長尾關(guān)鍵詞,根據(jù)產(chǎn)品,習(xí)慣,當前狀態(tài)不同,可以全用也可以組合著用,但必須要有一個核心關(guān)鍵詞,是曝光和轉(zhuǎn)化相對平衡。
3.?五點:一般寫關(guān)于產(chǎn)品核心賣點、尺寸、功能、特點、我們和同行的差異化賣點(特有的優(yōu)點)等,我一定會寫的是使用場景和售后,關(guān)于埋詞,核心關(guān)鍵詞埋在第一點里面,如果不好安排可以放到第二點里面,重要程度依次后排,通順的介紹產(chǎn)品是第一要務(wù),可以不埋那么多,沒有關(guān)系的。使用場景有代入感,增強購買欲售后你不寫,F(xiàn)BA也會這么干的,寫了還能增強信任感
4.?產(chǎn)品描述:主要寫產(chǎn)品參數(shù)、包裝信息、溫馨提示和使用場景即可,通順符合老外閱讀習(xí)慣,在合適的位置埋詞就行。
5.?ST:我一般是不寫,如果寫的主要是寫一些搜索框下拉詞,買家搜索使用頻率高,注意不要放入別人的品牌,不要重復(fù)即可6.?QA:會自己提前準備幾條,在到貨之后,會每天安排1-2條,會在問題和回答中都埋核心詞,其他詞看情況,如果產(chǎn)品銷售的國家使用多種語言,每種語言都會安排2條問答,問題內(nèi)容如果有同行的,一定要競調(diào)一下,看一下消費者關(guān)心的問題,找出對我們有力的,上上去。
7.?評價:會先埋核心關(guān)鍵詞,最后讓他出現(xiàn)在“Read?reviews?that?mention”
核心要點:有同行的一定要競調(diào)同行的,在小類前十的選幾家抄就行,不要自己搞,出力不討好,等自己的listing能進前20在個性化測試吧,不要一字不動的抄,所有的搜索引擎都喜歡新的,原封不動的抄會被降權(quán)的,自己做適當修改就行。
3)有兩個話題:
1.?關(guān)于各個部分埋詞權(quán)重的排序:標題、五點、產(chǎn)品描述、ST、評價、QA,有人驗證過他們的排序嗎?怎么驗證的?
猜測:標題>五點、產(chǎn)品描述、ST、進入“Read?reviews?that?mention”的關(guān)鍵詞(這幾個近似相等,五點前面可能略高一點)>QA
2.?假設(shè)標題的權(quán)重是100,我們現(xiàn)在的習(xí)慣是多埋關(guān)鍵詞,那如果我少埋關(guān)鍵詞,會不會使我的關(guān)鍵詞詞組權(quán)重變高?(如果標題是ABCDE權(quán)重為100,那關(guān)鍵詞BC權(quán)重為40,把標題縮短為ABC,那BC的權(quán)重為66)這種假設(shè)有可能嗎?有人驗證過嗎??
50 個回復(fù)
蕪湖666 - 精鋪小麥白帽可交流
贊同來自: 白玉京 、 夢內(nèi)傾心 、 芒果琪子 、 天選打工仔 、 盧盧盧 、 Book思議的辣 、 leniania 、 Alice666666 、 穆凡曉曉 、 叫我張張 、 愿知世故卻不世故 、 light0 、 三木SANMU 、 魚魚非魚 、 Jia_玲 、 楊家菇娘888 、 星垂平野 、 小泥巴168 、 平凡人生 、 Joylee29 、 嬌妹兒 、 一顆芋頭aa 、 小陳的億點點 、 小蟲子 、 筑一寧靜之地 、 windrunner 、 心中之城 、 這家伙很懶呀 、 Adora1991 、 gundam157 、 魚罐頭 、 lgl1996 、 LyonYYYY 更多 ?
第二個問題倒是可以通過測試驗證一下,不過在產(chǎn)品整體上來說,短期是看不出效果的,因為通常產(chǎn)品的關(guān)鍵詞,通過購買的加權(quán)遠超過單純的寫關(guān)鍵詞權(quán)重,靜態(tài)上短詞組可能一開始確實排名靠前,但是多一兩個詞的購買加權(quán)會促使整權(quán)重超過短的詞組
2、太多的詞組埋詞讓抓取變得復(fù)雜,流量不精確,反而適得其反(流量多不轉(zhuǎn)化或者錯誤的邏輯上面描述的原因),適當?shù)脑~組(一定量精準曝光)+適當動態(tài)轉(zhuǎn)化(精準轉(zhuǎn)化),動態(tài)的加權(quán)更利于鏈接的推廣,在平臺早期的疊加應(yīng)該是算法系統(tǒng)的不完善學(xué)習(xí)必經(jīng)路徑。