狠狠网/色综合久久久久综合体桃花网/日本护士三aaaaaa/久久久久久综合一区中文字幕

或者

對(duì)李彥宏百度搜索結(jié)果排序?qū)@乃伎?/h3>
作者:山里的苦丁 瀏覽:115 發(fā)布時(shí)間:2017-09-01
分享 評(píng)論 0

  百度《一種對(duì)搜索結(jié)果進(jìn)行排序的方法及設(shè)備》專(zhuān)利,申請(qǐng)于2011-05-09, 發(fā)明人:李彥宏 張子云,申請(qǐng)?zhí)枺?01110118082.6


  專(zhuān)利原文下載地址:http://pan.baidu.com/s/1c2bjT2g


  簡(jiǎn)單介紹該專(zhuān)利在說(shuō)什么


  搜索引擎一般是通過(guò)搜索詞和文章的相關(guān)度來(lái)排序,然后把排序后的結(jié)果展現(xiàn)給用戶。這樣的結(jié)果雖然速度快,但是它有一個(gè)缺點(diǎn),就是排在前面的不一定是用戶需要的搜索結(jié)果。所以就研發(fā)了該專(zhuān)利的方法來(lái)對(duì)結(jié)果進(jìn)行修正。


  修正的條件包括但不限于以下幾個(gè)方面:


  ?1、搜索結(jié)果所引用資源的有效性


  2、搜索結(jié)果所在站點(diǎn)的權(quán)威性


  3、搜索結(jié)果的頁(yè)面級(jí)別


  4、搜索結(jié)果的頁(yè)面類(lèi)型


  5、搜索結(jié)果的頁(yè)面質(zhì)量


  6、搜索結(jié)果的頁(yè)面編碼類(lèi)型


  7、搜索結(jié)果的頁(yè)面豐富程度


  ?8、在相同的檢索詞得到的搜索結(jié)果中是否被點(diǎn)擊過(guò)


  這個(gè)修正方法怎么工作的呢?


  ?通過(guò)對(duì)某類(lèi)詞設(shè)置相應(yīng)的修正條件和每個(gè)修正條件所占的權(quán)重,然后通過(guò) 每個(gè)修正值×權(quán)重 再相加,得到最后的 最終排序值,由高到低排序。具體的算法大家可以參閱專(zhuān)利文獻(xiàn)。


  思考來(lái)了,我列一些我的想法,大家補(bǔ)充


  ?1、不同的類(lèi)型的網(wǎng)站的排序標(biāo)準(zhǔn)是不一樣的


  根據(jù)專(zhuān)利所述,新聞?wù)?醫(yī)療站更重視權(quán)威性,資源站(影視,下載)更重視資源的有效性(是否可以在線觀看,可以下載)。所以我們?cè)卺槍?duì)不同類(lèi)型的網(wǎng)站優(yōu)化需要有所區(qū)別。


  2、頁(yè)面編碼確實(shí)是有影響的


  ?參加或者觀看過(guò)光年培訓(xùn)視頻的同學(xué)應(yīng)該記得,國(guó)平講過(guò)要注意網(wǎng)站的charset要設(shè)置正確,不要中文網(wǎng)站設(shè)置成英文,英文設(shè)置成中文,這個(gè)用國(guó)外模板或系統(tǒng)的同學(xué)得注意。


  ?3、是否被點(diǎn)擊過(guò)


  這個(gè)點(diǎn)擊過(guò)是指之前這個(gè)結(jié)果在同樣的檢索詞下,展現(xiàn)的時(shí)候是否有被用戶點(diǎn)擊過(guò)。有則標(biāo)記為1,無(wú)則0。


  ?從技術(shù)的角度來(lái)講,這個(gè)可以將展示次數(shù)和點(diǎn)擊不成比例的搜索結(jié)果排除掉,因?yàn)橛行┎幌嚓P(guān)的搜索結(jié)果肯定是點(diǎn)擊率低的。


  ?之前點(diǎn)擊器橫行跟這個(gè)應(yīng)該有關(guān),這個(gè)修正方案可能不像專(zhuān)利列舉的只有0,1,可以還包括點(diǎn)擊次數(shù)等。


  ?4、資源有效性的評(píng)分方式


  ?評(píng)分是通過(guò) -N ,0,+N 來(lái)進(jìn)行的, 資源全部可用為正分,資源部份可用為0 ,資源全部不可用為負(fù)分


  ?得到負(fù)分的結(jié)果基本從結(jié)果中被排除了。 因?yàn)椤∷惴ㄊ恰》种怠翙?quán)重 然后再加上別的修正項(xiàng)得分的,負(fù)分嚴(yán)重影響最終結(jié)果,最終得分難以有排名。


  ?5、頁(yè)面級(jí)別


  專(zhuān)利列舉了:首頁(yè),專(zhuān)題頁(yè)和其它底層頁(yè)面。越重要的頁(yè)面其得到的分值越大,我認(rèn)為不只這幾種頁(yè)面,比如: 列表頁(yè)、搜索結(jié)果頁(yè)


  ?6、排序的效率


  為了更快的對(duì)結(jié)果進(jìn)行排序,大部份值是被事先進(jìn)行計(jì)算,然后保存起來(lái),比如站點(diǎn)權(quán)威值,頁(yè)面級(jí)別這些修正值,但是一個(gè)搜索詞相關(guān)的結(jié)果可能很多,這時(shí)為了節(jié)約資源和得升效率,會(huì)提取相關(guān)度最高的N條結(jié)果來(lái)參與后續(xù)的修正排序,所以如果你相關(guān)度不夠擠入前N名里面,基本,你就是沒(méi)戲。這個(gè)在專(zhuān)利里是有說(shuō)明的。


  7、蛛絲馬跡


  專(zhuān)利原文:“[0043] 在本實(shí)施例的方案中,為搜索結(jié)果的每種修正條件選擇的修正參數(shù)攜帶在搜索結(jié)果的URL中(如搜索結(jié)果的PageRank的修正參數(shù)),或攜帶在搜索結(jié)果的檢索詞-網(wǎng)頁(yè)(Query-URL)對(duì)中(如針對(duì)之前之用相同的檢索詞得到的搜索結(jié)果是否被點(diǎn)擊過(guò)的修正參數(shù)),因此,根據(jù)預(yù)設(shè)的修正條件,可以從搜索結(jié)果的URL或Query-URL對(duì)中查詢出已選擇的修正參數(shù)”。


  ?根據(jù)這條,可能在百度的結(jié)果頁(yè)或結(jié)果頁(yè)的URL能找到使用了哪些修正參數(shù)的蛛絲馬跡。


  PS:


  ?百度的專(zhuān)利并不是百分百就是這樣子,我們可以從中得到一些啟發(fā),技術(shù)一直在進(jìn)步,現(xiàn)在的排序方法肯定是比這個(gè)先進(jìn)而有效率,請(qǐng)勿過(guò)于執(zhí)著。大膽假設(shè),小心求證。