作者:Xavier de Morales,谷歌搜索質量團隊
原文:Working with multilingual websites
網站站長級別:中級
多語言網站是指擁有兩種以上語言版本的網站。比如說,您的網站既有中文版本,又有英文版本,那他就是一個多語言的網站。
顯然,如果瀏覽您的網站的人使用的是不同的語言,那么多語言網站就非常實用。如果您想讓巴西人瀏覽您寫的關于拉美足球的博客,您只需要選用葡萄牙語來發布。但如果您想讓阿根廷球迷也能瀏覽您的博客,使用西班牙語則能幫助您達到目的。
谷歌和語言識別
谷歌需要確定您每個網頁的主用語言。如果您在每個頁面僅使用一種語言,并且避免并行翻譯,這將更有利于谷歌進行語言識別。雖然谷歌可以對一種語言以上的網頁進行識別,但我們建議,網頁的基本部分如標題、工具條和菜單等最好使用同一種語言。
請注意,谷歌會忽略所有代碼級語言信息,包括從“lang”屬性到文檔類型定義(DTD)。有些網頁編輯程序會自動生成這些屬性,因此,在識別網頁語言時它們并不十分可靠。
如果有人在谷歌上使用本國語言進行搜索,并期望找到本地化的搜索結果,此時,網站站長要發揮作用了:如果您要使信息本地化,那么用以下技巧可使搜索結果顯現出來。
多語言網站剖析:URL結構
在開發多語言網站時無需建立特別的URL。但是,您的用戶可能希望查看URL來確定他們在瀏覽您網站的哪個版面。例如,下面的URL能讓用戶知道他們正在瀏覽網站的英語頁面:
http://example.ca/en/mountain-bikes.html
http://en.example.ca/mountain-bikes.html
而下面的URL能讓用戶知道他們在瀏覽同一頁面的法語頁面:
http://example.ca/fr/mountain-bikes.html
http://fr.example.ca/mountain-bikes.html
另外,URL結構能讓您更容易地分析多語言內容的索引。
如果您想用非英語字符建立URL,請一定使用UTF-8編碼。用UTF-8編輯的URL在鏈接內容時能正確的被轉換。 如果您需要對URL進行手動轉換,您可以找到一個在線URL編碼器來輕松幫您完成。例如,如果我想把下面的URL從英語轉換到法語,http://example.ca/fr/mountain-bikes.html
URL轉換之后可能會變為:
http://example.ca/fr/vélo-de-montagne.html
因為這個URL中包含一個非英語字符(é),所以在網頁鏈接轉換之后的情況可能是:
http://example.ca/fr/vélo-de-montagne.html
多語言網站的抓取和索引
我們建議您不要允許自動翻譯來獲得索引。自動翻譯有時候沒有意義,并且可能被當做垃圾信息。更重要的是,建立多語言網站的目的,在于通過提供多種語言的內容從而吸引更多的用戶。如果您的用戶無法理解自動翻譯的內容,或者覺得翻譯太僵硬,也許您需要考慮是否真的有必要為用戶提供自動翻譯的內容。
如果您計劃將信息本地化,讓Googlebot輕松地抓取到您網站所有語種的版本。您可以考慮在網頁與網頁間進行橫向連接。換句話說,您可以在同樣內容的不同語言的網頁間建立鏈接。這樣做對您的用戶也有很大幫助。用我們之前提供的例子,假設一個法語網民碰巧登陸了頁面http://example.ca/en/mountain-bikes.html; 現在,他可以點一下鏈接轉換到頁面http://example.ca/fr/vélo-de-montagne.html ,在這里他可以看到法語版的同樣內容。
為了讓您網站的所有內容更容易被抓取到,就應避免根據用戶所用語言而進行的自動重新定向。這些重新定向會使用戶(和搜索引擎)無法瀏覽您網站的所有版本。
最后,確保不同語言的內容有不同的URL,不用要cookies來顯示轉換的版本。
文字編碼的處理
谷歌直接從HTTP標題、HTML 頁面標題和內容中摘錄文字編碼。在文字編碼上您不需做什么,除開要留意沖突信息,如內容和標題間的沖突。雖然谷歌能識別不同的文字編碼,但我們建議您在網站上盡可能使用UTF-8。
如果您的舌頭已經打結……
既然您對此已經有所了解,那么使用多種語言時,即使您的舌頭會打結,但您的網站卻不會無法應對!
欲知更多信息,請關注我們的下一篇博文,我們將研究關于跨區域網站。謝謝。
上一篇 如果草根站長也像馬云那樣封了百度