百度搜索引擎的基本結(jié)構(gòu)

搜索引擎的基本結(jié)構(gòu)按照功能劃分的話可以分為以下4個(gè)系統(tǒng):

1)下載系統(tǒng)

2)分析系統(tǒng)

3)索引系統(tǒng)

4)檢索系統(tǒng)

下載系統(tǒng):就是從互聯(lián)網(wǎng)上將各種各樣的網(wǎng)頁(yè)下載下來(lái),并且保持對(duì)互聯(lián)網(wǎng)眾多網(wǎng)頁(yè)變化的同步。

分析系統(tǒng):就是負(fù)責(zé)分析下載系統(tǒng)中下載到的網(wǎng)頁(yè)數(shù)據(jù),然后進(jìn)行相應(yīng)的處理和分詞計(jì)算等等。

索引系統(tǒng):主要負(fù)責(zé)將分析處理好的網(wǎng)頁(yè)對(duì)象索引入庫(kù),建立合理的索引機(jī)制。

檢索系統(tǒng):就是查詢(xún)系統(tǒng),主要負(fù)責(zé)分析用戶(hù)提交的查詢(xún)請(qǐng)求,然后從索引庫(kù)中檢索出相應(yīng)的網(wǎng)頁(yè),并通過(guò)一系列的算法將網(wǎng)頁(yè)排序后,以查詢(xún)結(jié)果的形式返回給用戶(hù)。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容