Google=搜尋 - 林子揚

Google=搜尋 - 林子揚

話說現在網上最少有大約100億個網頁,網站數目已經超過地球人口。互聯網就有如資訊大海,不過這個大海的資訊水流縱橫交錯,資訊水質參差。沒有條理、沒有經整理的資訊,就算再多,你都會得資訊無所用,因此,網上搜尋器應運而生,它的功能就是幫助我們,怎樣在這種資訊海中釣大魚而不是釣爛鞋。
Google是網上搜尋器龍頭大哥,原因簡單不過:它比其他搜尋器好用,它就是好像能讀到你的心意一樣,通常在少於一秒的時間之內,把你最想要的結果一一放在你眼前(首一、二頁搜尋結果之內)。怎會這麼神奇?
Google長年累月不斷在網上抓取資料,當使用者查詢時,Google其實是在自己的資料庫內尋找,並不是慢慢在網上尋找。04年11月,Google聲稱已經把80億頁網頁收入到自己的1萬台伺服器內。
Google所用的核心搜尋技術叫PageRank,理論是,一個有質素和實用的網頁,應該會被其他網頁連結。越好越有用的網頁,外來連結應該越多,這是一種比較客觀,非人為而自動化的網頁評分方法,這就是它搜尋結果排序的基礎。第二,如果一些有份量的網站放上你網站的連結,你網站的評分又會相對提高。這有如,互聯網是一個民主國家,網站與網站之間相互投票,而得票多的網站所投的票,份量又會比得票少的網站為高。
PageRank技術看似簡單,但實際運作起來絕對複雜,計算公式精密,變數多到不得了,強如微軟也只能望其項背,乖乖把搜尋器寶座讓給Google。