2009年8月1日 星期六

搜尋引擎的種類

搜尋引擎依據其運作方式主要分為三種,包括全文搜尋(Full Text Search)、目錄搜尋(Search Index / Directory)及Meta搜尋(Meta Search Engine)。

全文搜尋(Full Text Search

主要透過網際網路擷取每個網站的網頁資訊透過網路機器人(Robot蜘蛛(Spider)等程式建立資料庫,使用者只要進行查詢或檢索,將按照一定的規則進行排序,同時將搜尋結果呈現給使用者,這類網站國外以GoogleAltavistaTeoma等為代表,中國地區則以百度(Baidu)、台灣地區以Yahoo為代表。

目錄搜尋(Search Index / Directory

目錄搜尋嚴格來說並不算是真正的搜尋引擎,主要提供依照目錄進行的分類網站連結列表。使用者可以不用關鍵字(Keywords)查詢,僅靠分類目錄也可找到需要的資訊。這類網站以Yahoo奇摩為代表,中國地區的蒐狐、網易等均屬於這一類。

Meag搜尋(META Search Engine

這類搜尋主要可以同時在多個搜尋引擎上進行搜尋動作,同時將搜尋結果呈現給使用者,搜尋的結果有部分是直接依照原始搜尋引擎的結果排序,其他則是依照自訂的規則來排序。這類搜尋引擎以InfoSpaceDogpileVivisimo等為代表。

這裡是對 全文搜尋/目錄搜尋 更清楚解釋

全文搜尋

在分類部分提到全文搜尋從網站擷取資訊建立網頁資料庫的概念,其擷取的方式主要分為兩種,一種是定期搜索,即每隔一段時間(例如GoogleYahoo),搜尋引擎自動執行『蜘蛛』程式,對一定IP位址範圍內的網站進行擷取,一旦發現新的網站(網頁),它會自動擷取網站的資訊和網址納入資料庫。

另一種是網站主動向搜索引擎提交網址及相關資訊,搜尋引擎在一定時間內(數分鐘、幾天到數月不等)向你的網站派出網路機器人(Robot蜘蛛(Spider程式,掃描你的網站(網頁)並將有關資訊存入資料庫。但近年來搜尋引擎的規則不段演變,主動提交網址無法保證提交的網站可以進入搜索引擎的資料庫,因此最有效率的方式就是儘量多獲得一些外部連結,藉由定期搜索和主動提交兩種方式交叉掃描,提高被搜尋引擎找到的機會。

當使用者以關鍵字查詢資料時,搜尋引擎將在資料庫中搜尋符合使用者查詢要求的資訊,並透過一套複雜的運演算法則(主要依據關鍵字匹配度、被點選頻率、連結成功率等)計算出每個網頁相關度及排名順序。

目錄搜尋

全文搜尋屬於自動檢索(使用程式自動執行),而目錄搜尋則完全依賴人工作業。使用者提交網站後,目錄編輯人員會親自瀏覽你的網站,然後根據一套判斷標準甚至依據編輯人員的主觀印象,決定是否接納你的網站。

其次,全文搜尋的搜索引擎在收錄網站時,只要網站本身沒有違反相關的規定,一般都能夠成功登錄。而目錄搜尋對網站的要求則高得多,有時即使登錄多次也不一定成功。

此外,在登錄全文搜尋的搜索引擎時,我們通常不用去設定分類,而登錄目錄搜尋時則必須將網站放在一個最合適的分類或稱為目錄(Directory)之下,而這些分類通常又有許多更細的子分類,因此使用者在選擇分類時,需要更為謹慎。

目錄搜尋的搜尋引擎要求登錄用戶必須自行填寫網站相關資訊,而且還有各種各樣的限制。更過分的是如果編輯人員認為你提交網站的分類或網站資訊不合適,編輯人員可隨時對進行調整,並且事先不會知會用戶。

目前,全文搜尋的搜索引擎與目錄搜尋有相互融合的趨勢。原來一些純粹的全文搜尋引擎現在也提供目錄搜索,如GoogleYahoo

而像 Yahoo 這些原本使用目錄搜尋的搜尋引擎則透過與GoogleYahoo等全文搜尋的搜索引擎合作,解益擴大搜索範圍。

Related Posts Plugin for WordPress, Blogger...