百度站長俱樂部:我知道大多數站長,會使用不帶關鍵詞的site語法來進行收錄量觀察。這是一種方法,但很不準確。site語法設定的初衷,其實是期望用戶可以設定約束搜索范圍,實現更加精準的搜索。這同intitle,inurl,本質上是相同的。而在這些高級語法下的結果數,和常規搜索一樣,都是“估值”,而非精確值。因此,很有可能site下的“結果數”減少了,實際被索引數卻可能增加了。
更加精確的方法是什么呢?
1,對來自搜索引擎的流量進行監控。這是最直接和本質的。如果流量沒有大的波動,而site下的數值發生巨大波動,這只能說明site搜索結果數的不精確性。
2,對站內url進行抽樣監控。有些url已經被搜索引擎收錄了,那么取出一個集合,作為收錄狀態監控集;每天的新url尚未被收錄,也可以對其進行索引狀態的監控。腳本是很容易寫的,這種基于抽樣的評估也是很有效的。
3,由搜索引擎提供的統計工具。我們是否應該提供類似統計工具,目前還在評估中。
看到一則反饋,直接貼一下:莆田SEO還是有點小疑問的,希望能拋磚引玉,大家探討一下。
1、如果流量沒有大的波動,但實際上新的頁面是已經被收錄,只是因為排名不好,所以并沒有流量過來,這樣子的話也不能說site的結果不準?只能說是權重不夠高。因為一個新站,前期一定只是一個積累的過程,可能流量并不是那么的重要,但是收錄的確還是很重要的。代表的是,你已經進入了百度的索引了。 2、url抽樣監控,這樣子的一個收錄監控方式,我想,對于我們這些小站長或是個人站長來說,在現階段來說,在高手眼里的小技術的腳本,可能就是一座難以逾越的大山。而互聯網上,因為來說草根站長是占了絕大的一部分。 3、如果是百度提供類似統計工具,我相信站長們都是無上歡迎的。 4、其實site來說,對于站長本身,很大一部分就是讓自己心里有了一個底,可以用一個腳本來替換得到更準確的值的確是可行的,而且自己是可以通過流量統計后臺來實現成效的檢驗的。但是有一點可能被您給忽略了,site用的最多的場合不是自用,而是交換友情鏈接的時候用的。估計很小部分的人會交換一個友情從而去動用腳本去檢測索引對方網站的具體數據,這一塊,要如何更好地解決呢? |
對莆田seo的問題回復一下:
1,已經強調過很多次了,百度site語法的結果數不準。而且這種不準的幅度甚至不是穩定的,可能今天比較接近真實值,明天就發生大波動了。其中的原因不便多解釋。
2,沒有想像那么難。連備案這種復雜的事情都能搞定,學點腳本編程,實在不算什么。而且,作為站長,如果想深入的研究sem,我可以坦白的講,數據分析是必須的。在網絡上搜到的東鱗西爪的所謂seo技巧,大多是別人嚼剩下的、沒什么大用的、甚至有害的東西。站長要學會的首要事情之一,是對自己的網站日志做深入解剖,并能針對問題做各種實驗和分析。
3,略。
4,有一點可以肯定,索引結果數肯定不會是一個網站在搜索引擎中的站點評級指標。這是很容易理解的。舉個例子,site:www.job631.com,就幾百條而已。從投票權角度,它的權重會低于大部分索引了成千上萬網頁的站點?所以站長若要搞搞友情鏈接,更重要的是用自己的經驗去做價值分析——他是想撈一票就走的,還是想正經在互聯網上立立腕兒的。
附站長比較關注的問題:
站長問:最近有很多站都遇到這個情況,剛發布的文章都會很快被百度收錄,可過不了多長時間(8到24小時)又會被百度刪除,然后再過同樣多的時間百度重新收錄!
百度站長俱樂部答:這是我們系統的一個缺陷,正在修復中。預計很快就不會有這種讓人faint的事情出現了
站長問:一個站長都普遍疑惑的問題,那就是為什么有些站每天不更新反而百度的快照天天新。有些站提供原創內容每天更新反而百度快照不更新。是由于受到技術的局限還是對這個站的懲罰!如果是懲罰那么為什么那些天天不更新反而更占優勢呢?
百度站長俱樂部答:我們內部也對結果頁上的時間戳(在url后面)很糾結,有計劃整改。實際上有的搜索引擎早已經把這個時間戳去掉了,而代之以網頁更新的實際時間。這個時間戳既然給內部人員也帶來了困擾,那么對站長和用戶,顯見也是有困擾的。所以,我的建議是不必太過關注這個時間戳。如果期望看到精確的spider行為,最直接的手段是分析網站日志。我個人覺得站長如果想做出點名堂,一些起碼的技術手段還是要會的,數據分析對SEM極端重要。而不要動輒用“草根”來給自己開脫。
站長問:在交流中發現很多人認為:用site語法查詢之后,如果排在第一的不是該網站的首頁則表示該網站被百度降權。這種做法是否想當然?
百度站長俱樂部答:site語法查詢的檢索結果,更多情況下類似隨機的排序,除了說明這些網頁已經被收錄以外,不能說明任何問題。