META與搜尋引擎
發表於 : 週四 2月 16, 2006 4:23 pm
許多網站提供了搜尋服務,它們是怎麼知道這個世界上的網頁呢?其實,它們所知的極其有限,像是Google登錄了十億篇以上的網頁,Yahoo登錄了數百萬個以上的網站,但據估計仍不及網際網路上的內容十分之一。META旗標就是來協助這些搜尋引擎,並且協助網友們找到你的網站,增加你的網站流量。
首先非常簡略的區分搜尋網站的登錄方式,第一種是人工登錄,最著名的例子是Yahoo,它聘有專人審核和分類從全世界寄去的登錄申請,是以每個網站為登錄主體。第二種是派出 "小機器人",定期 "爬" 過網際網路,其中翹楚為Google和AlltheWeb,是以每篇網頁為登錄主體。目前,搜尋網站多半同時採取兩種方式,它們的核心搜尋引擎弁鄐]大同小異,主要的區別在其資料庫的容量大小。
但無論登錄的是網站或網頁,在搜尋網站的資料庫中都要以一些關鍵字(Keywords)做為網頁索引,也要存一小段網頁描述,與其讓搜尋引擎"猜"你的網頁有些什麼,不如你用META旗標直接告訴它,互利互惠嘛!
關鍵字
語法如下:
<META NAME="keywords" CONTENT="key,word,keyword,關鍵字">
每個關鍵字用逗號(,)隔開;最好不要加上空白,例如:"key word keyword",因為有些搜尋引擎會將它們視為三個不同的字,有些搜尋引擎會把它們當成一個字(視空白為一個字母)。理論上,你可以加上無數個和你的網頁有關的關鍵字。
過去,有些搜尋引擎會比對網頁中的關鍵字出現的次數作為搜尋結果的排行順序,那麼豈不是輸入一大串相同的關鍵字,例如:"key,key,key,key,key,key,key,key,key,......,etc.",就可以讓你的網頁排在最前面的搜尋結果了呢?錯了!現在的搜尋引擎恨死了這種方式,它會將這種"作弊"的登錄從資料庫中刪除,轉列入黑名單上面。你也不能用八竿子打不著的詞彙做為關鍵字,例如:"Yahoo"經常被搜尋,你就以"Yahoo"為關鍵字,其實你的網頁壓根沒提到Yahoo,這樣的行為也會被列入黑名單。
語法如下:
<META NAME="generator" CONTENT="Notepad">
我不知道它的目的是什麼,用Notepad不見得比較笨,用Dreamweaver也不見得比較有錢。不過大部份 "所見即所得(What you see is what you get)" 的網頁製作軟體都會自動(偷偷)加上這行字。
網頁內容摘要
語法如下:
<META NAME="description" CONTENT="好棒的網頁啊!">
如果沒有這行指令,通常搜尋引擎都會以網頁的前廿五字做為網頁內容摘要,列於搜尋結果上。有時候網頁的前廿五字只是一些不能代表網頁的內容,例如:日期、時間、向大家問好......等等。最好的方式就是由你來提供網頁的內容摘要。
作者、版權、有效期間......
語法如下:
<META NAME="author" CONTENT="艾爾弗烈德">
告訴搜尋引擎這篇網頁是由誰製作的。
<META NAME="copyright" CONTENT="本網頁著作權屬艾爾弗烈德所有">
告訴搜尋引擎這篇網頁是......你知道嘛!
<META NAME="expires" CONTENT="31 December 2002">
告訴搜尋引擎這篇網頁何時需要從登錄資料庫中刪除。
<META NAME="distribution" CONTENT="global">
告訴搜尋引擎這篇網頁是全世界性的。
<META NAME="revisit-after" CONTENT="30 days">
告訴搜尋引擎30天之後再來一次這篇網頁,也陪n重新登錄。
<META NAME="robots" CONTENT="all">
告訴所有的搜尋引擎的"小機器人",來登錄這篇網頁吧!
<META NAME="expires" CONTENT="-1"> 或
<META NAME="pragma" CONTENT="no-cache"> (僅IE適用)
告訴瀏覽程式不要將這篇網頁放在電腦暫存檔中,當然同時告訴搜尋引擎這篇網頁不需要登錄至資料庫。
首先非常簡略的區分搜尋網站的登錄方式,第一種是人工登錄,最著名的例子是Yahoo,它聘有專人審核和分類從全世界寄去的登錄申請,是以每個網站為登錄主體。第二種是派出 "小機器人",定期 "爬" 過網際網路,其中翹楚為Google和AlltheWeb,是以每篇網頁為登錄主體。目前,搜尋網站多半同時採取兩種方式,它們的核心搜尋引擎弁鄐]大同小異,主要的區別在其資料庫的容量大小。
但無論登錄的是網站或網頁,在搜尋網站的資料庫中都要以一些關鍵字(Keywords)做為網頁索引,也要存一小段網頁描述,與其讓搜尋引擎"猜"你的網頁有些什麼,不如你用META旗標直接告訴它,互利互惠嘛!
關鍵字
語法如下:
<META NAME="keywords" CONTENT="key,word,keyword,關鍵字">
每個關鍵字用逗號(,)隔開;最好不要加上空白,例如:"key word keyword",因為有些搜尋引擎會將它們視為三個不同的字,有些搜尋引擎會把它們當成一個字(視空白為一個字母)。理論上,你可以加上無數個和你的網頁有關的關鍵字。
過去,有些搜尋引擎會比對網頁中的關鍵字出現的次數作為搜尋結果的排行順序,那麼豈不是輸入一大串相同的關鍵字,例如:"key,key,key,key,key,key,key,key,key,......,etc.",就可以讓你的網頁排在最前面的搜尋結果了呢?錯了!現在的搜尋引擎恨死了這種方式,它會將這種"作弊"的登錄從資料庫中刪除,轉列入黑名單上面。你也不能用八竿子打不著的詞彙做為關鍵字,例如:"Yahoo"經常被搜尋,你就以"Yahoo"為關鍵字,其實你的網頁壓根沒提到Yahoo,這樣的行為也會被列入黑名單。
語法如下:
<META NAME="generator" CONTENT="Notepad">
我不知道它的目的是什麼,用Notepad不見得比較笨,用Dreamweaver也不見得比較有錢。不過大部份 "所見即所得(What you see is what you get)" 的網頁製作軟體都會自動(偷偷)加上這行字。
網頁內容摘要
語法如下:
<META NAME="description" CONTENT="好棒的網頁啊!">
如果沒有這行指令,通常搜尋引擎都會以網頁的前廿五字做為網頁內容摘要,列於搜尋結果上。有時候網頁的前廿五字只是一些不能代表網頁的內容,例如:日期、時間、向大家問好......等等。最好的方式就是由你來提供網頁的內容摘要。
作者、版權、有效期間......
語法如下:
<META NAME="author" CONTENT="艾爾弗烈德">
告訴搜尋引擎這篇網頁是由誰製作的。
<META NAME="copyright" CONTENT="本網頁著作權屬艾爾弗烈德所有">
告訴搜尋引擎這篇網頁是......你知道嘛!
<META NAME="expires" CONTENT="31 December 2002">
告訴搜尋引擎這篇網頁何時需要從登錄資料庫中刪除。
<META NAME="distribution" CONTENT="global">
告訴搜尋引擎這篇網頁是全世界性的。
<META NAME="revisit-after" CONTENT="30 days">
告訴搜尋引擎30天之後再來一次這篇網頁,也陪n重新登錄。
<META NAME="robots" CONTENT="all">
告訴所有的搜尋引擎的"小機器人",來登錄這篇網頁吧!
<META NAME="expires" CONTENT="-1"> 或
<META NAME="pragma" CONTENT="no-cache"> (僅IE適用)
告訴瀏覽程式不要將這篇網頁放在電腦暫存檔中,當然同時告訴搜尋引擎這篇網頁不需要登錄至資料庫。