一、網(wǎng)站架構(gòu)
1、二級(jí)域名的使用
因?yàn)闃I(yè)務(wù)的地域性擴(kuò)張或者內(nèi)容的分割,對(duì)于大型網(wǎng)站來(lái)說(shuō),二級(jí)域名的使用是不可避免的。2006年我們做第一個(gè)分站時(shí)也分別討論了兩種方案,一種是先按業(yè)務(wù)劃分,再按地域劃分,如:http://wuxi.sell.housexxx.com ;另一種是先按地域劃分,再按業(yè)務(wù)劃分,如:http://sell.wx.housexxx.com ,這兩種分法都都先例前一種是新浪房產(chǎn)在用,后一種是搜房在用。后來(lái)考慮到分站以后的業(yè)務(wù)擴(kuò)展的差異性,使用了第二種方案。對(duì)于在各分站開展的各項(xiàng)業(yè)務(wù)也就順理成章的變成三級(jí)域名。
網(wǎng):http://www.wfuwu.com/
眾所周知,二級(jí)域名或者三級(jí)域名對(duì)于搜索引擎來(lái)說(shuō)就是一個(gè)獨(dú)立的網(wǎng)站。對(duì)于大型網(wǎng)站開通眾多二級(jí)域名有什么好處呢。呵呵,好處是擺在明處的,鏈接啊,你有100個(gè)二級(jí)域名就相當(dāng)于100個(gè)網(wǎng)站,相互的交叉鏈接,了不得啊。另外一個(gè)好處不能明說(shuō),就是可以開一些二級(jí)域名出來(lái)做測(cè)試域名,就算被K了也不會(huì)影響到主站。沒有自己DNS服務(wù)器的小站長(zhǎng)也不要遺憾,只要有自己服務(wù)器,加一個(gè)DNS服務(wù)是很簡(jiǎn)單的。使用虛擬主機(jī)的朋友,只能說(shuō)抱歉了,國(guó)內(nèi)包括很多大的域名注冊(cè)商(比如萬(wàn)網(wǎng))的二級(jí)域名解析都很慢,不用說(shuō)其他的這些了。
2、多服務(wù)器架構(gòu)下對(duì)搜索引擎的影響
對(duì)于大型網(wǎng)站來(lái)說(shuō),使用負(fù)載均衡技術(shù)相當(dāng)普遍,常見的是基于LVS的Linux負(fù)載均衡技術(shù),部分網(wǎng)站也可能是使用F5這樣的專用設(shè)備。對(duì)于使用反向代理的網(wǎng)站,從外部訪問就是一個(gè)IP,就不存在什么問題了。如果是采用雙機(jī)熱備方式的網(wǎng)站,一旦主服務(wù)器宕機(jī),負(fù)載就自動(dòng)切換到從服務(wù)器上,這樣服務(wù)器的IP會(huì)變化,更尷尬的是有一段時(shí)間,我們的數(shù)據(jù)同步?jīng)]做好,百度快照總是不對(duì)勁,我還以為是百度數(shù)據(jù)倒回,結(jié)果是我們自己數(shù)據(jù)倒回,真是汗啊。所以服務(wù)器的穩(wěn)定對(duì)搜索引擎優(yōu)化來(lái)說(shuō)是一件很重要的事情。
3、目錄的部署
大家都知道,目錄的權(quán)重高于頁(yè)面,那么用Rewrite把網(wǎng)站做全站偽靜態(tài)就成了一個(gè)必然的選擇。配置Rewrite很簡(jiǎn)單,只要在httpd.conf里面加上Mod_rewrite模塊,然后寫上你的規(guī)則就可以了,如果是Apache服務(wù)器通常是去掉前面的注釋,具體操作網(wǎng)上有非常多的教程,就不贅述了。如果是虛擬主機(jī)用戶,可以在網(wǎng)站根目錄下加上.htaccess文件,文件里面寫上你的規(guī)則,國(guó)外主機(jī)基本上都是支持Rewrite的,國(guó)內(nèi)支持Rewrite的虛擬主機(jī)也越來(lái)越多了。
做完上面這些后,網(wǎng)站就變成全是目錄這樣的形式了,是不是挺清爽的。別急,下面是關(guān)鍵。當(dāng)你做完這一切,你會(huì)發(fā)現(xiàn),搜索引擎并不收錄你修改過(guò)的頁(yè)面,應(yīng)該說(shuō)Google還是逐步的更新鏈接的,而百度是很少更新的。用site命令看一下收錄的頁(yè)面,還是令人沮喪的.html文件,更糟糕的是還有一些動(dòng)態(tài)文件。原因很簡(jiǎn)單,我們只是更改了頁(yè)面的鏈接,而頁(yè)面的內(nèi)容和原來(lái)完全一樣,并且原來(lái)的內(nèi)容依然可以訪問到,搜索引擎不會(huì)收錄兩張完全相同的頁(yè)面,相似度100%的頁(yè)面。因此網(wǎng)站的結(jié)構(gòu)上線前就應(yīng)該規(guī)劃好,就省去了以后的很多麻煩,我個(gè)人的習(xí)慣是在網(wǎng)站上線前用Robots.txt把所有的搜索引擎都屏掉。如果發(fā)生了這種情況該怎么辦?做一次全新的改版嗎,大可不必那么費(fèi)事,在文件頭部加上301跳轉(zhuǎn)就可以了。
具體代碼:
if(strpos($_SERVER['REQUEST_URI'],”list.php”)!==false){ $id = intval($_GET["id"]);
Header(”HTTP/1.1 301 Moved Permanently”);
Header(”Location: http://newhouse.housexxx.com/list-”.$id.”/“); unset($id); }