多多色-多人伦交性欧美在线观看-多人伦精品一区二区三区视频-多色视频-免费黄色视屏网站-免费黄色在线

國內最全IT社區平臺 聯系我們 | 收藏本站
阿里云優惠2
您當前位置:首頁 > web前端 > 網絡優化 > 如何驗證谷歌 Googlebot(抓取機器人)

如何驗證谷歌 Googlebot(抓取機器人)

來源:程序員人生   發布時間:2014-05-19 12:34:17 閱讀次數:2255次

  近我聽到一些聰明 人士要求搜索引擎提供一種方法來驗證一個抓取機器人是正宗的。畢竟,任何垃圾制造者都可以用Googlebot來命名他們的抓取機器人,并聲稱自己是Google的。那么,你應該信任哪些抓取機器人,又應該阻截哪些?

  我們聽到最普遍的要求是把Googlebot的IP地址列表公布給大家。這個做法的問題是,如果/當我們的抓取工具的IP地址范圍改變時,并非每個人都知 道去檢查。事實上,爬行組幾年前搬遷過Googlebot的IP地址,他們遇到的一個真正的麻煩是提醒一些把Googlebot的IP范圍寫在他們的程序 里的網管們。所以爬行組的成員們提供了另一種方法來驗證Googlebot。這里是爬行組成員們提供的一個答案(經他們同意在此引述) :

  請告訴網站管理員們,最好的方法看來是使用域名解析服務器(DNS)來核實每個案例。我推薦的驗證技術是做反向DNS查找,核實該名字是在googlebot.com域名內,然后使用該googlebot.com名做一個相應的正向DNS->IP的查找; 例如:

  (譯者注:以下是Linux命令及執行結果)

  > host 66.249.66.1

  1.66.249.66.in-addr.arpa domain name pointer crawl-66-249-66-1.googlebot.com.

  (1.66.249.66.in-addr.arpa域名指針crawl-66-249-66-1.googlebot.com)

  > host crawl-66-249-66-1.googlebot.com

  crawl-66-249-66-1.googlebot.com has address 66.249.66.1

  (crawl-66-249-66-1.googlebot.com的IP地址是66.249.66.1)

  我認為只做反向DNS查找是不夠的,因為一個垃圾制造者可以建立反向的DNS來指向crawl-a-b-c-d.googlebot.com。

  這個答案也是我們內部的技術幫助中心提供給我的,所以我認為這是一個驗證Googlebot的官方方法。為了從“官方的”Googlebot IP范圍內抓取,抓取機器人要尊重robots.txt和我們內部的主機負荷慣例,從而使Google不過分爬行您的網站。

  (感謝N.和J.為此文提供的幫助,他們介紹了爬行方面涉及的東西) 。

  來自:谷歌網站管理員中文博客

生活不易,碼農辛苦
如果您覺得本網站對您的學習有所幫助,可以手機掃描二維碼進行捐贈
程序員人生
------分隔線----------------------------
分享到:
------分隔線----------------------------
關閉
程序員人生
主站蜘蛛池模板: 日韩淫片| 香蕉tv亚洲专区在线观看 | 成人hd | 天堂mv亚洲mv在线播放9蜜 | 久久久毛片免费全部播放 | 一二三四视频在线6 1免费观看 | 国产成人精品久久一区二区小说 | aⅴ一区二区三区无卡无码 aⅴ在线免费观看 | 欧美日本一区视频免费 | 免费看黄在线网站 | 韩国美女爽快一级毛片黄 | 微信影院手机在线播放 | 亚洲色图第1页 | 俄罗斯free性欧美hd | www.国产精品视频 | 天天拍夜夜添久久精品中文 | 亚洲欧美综合精品成 | 国产精品女人在线观看 | 亚洲在线精品视频 | 一区二区三区视频在线观看 | 国产妖精视频 | 国产福利一区二区三区在线视频 | 亚洲第五页| 欧美精品a毛片免费观看 | 国产高清福利91成人 | 国产一区二区三区日韩 | 成人亚洲在线观看 | 女人18毛片a级18毛多水真多 | 亚洲视频在线观看网址 | 久久一区二区三区免费播放 | 亚州国产视频 | free性欧美人与牛 | 日本一级毛片免费播放 | 福利片中文 | 久久久久国产一级毛片高清版 | free性vido另类重口 | 热灸灸这里只有精品 | 最近中文字幕国语完整视频 | 女人牲交一级毛片 | riav久久中文一区二区 | 久久91精品国产一区二区 |