《互聯網新聞開放協議》是百度新聞搜索制定的搜索引擎新聞源收錄標準,網站可將發布的新聞內容制作成遵循此開放協議的XML格式的網頁(獨立于原有的新聞發布形式)供搜索引擎索引。
由于現在百度新聞機器抓取成功率大幅提高,XML文件提交的新聞質量存在各種問題,因此原則上我們不再接受新提交的XML文件,已經收錄的XML文件我們會繼續收錄,請不要主動提交XML文件,我們不再受理相關審核。
如果您的站點還沒有被百度新聞收錄,請參考下面的收錄標準,符合收錄標準的站點請在貼吧提交http://tieba.baidu.com/f?kw=新聞搜索,我們會在7個工作日內完成審核。
您可以在百度新聞搜索框內輸入“site:網站域名”查看收錄來自您網站的新聞信息。
新聞源收錄問題
1、百度新聞收錄什么樣的網站?
我們收錄
正式出版的報刊和雜志、廣播、電視臺網絡版
政府及組織機構的官方網站
擁有高質量的原創資訊內容,在其目標領域內具有一定的用戶認知度和一定規模的忠實閱讀群的門戶、地方信息港、行業資訊網站
我們不收錄
博客、論壇、軟件下載等非新聞資訊類網站
企業網站
個人網站
沒有固定用戶群和影響力的網站
2、如何申請收錄?
如果您的網站符合上面的收錄標準,您可以通過貼吧http://tieba.baidu.com/f?kw=新聞搜索 進行申請,我們將在5個工作日內進行審核回復。
3、怎么查看我的網站是否被收錄了?
可以通過執行site語法查看,直接在百度新聞搜索中輸入site:您的域名,如site:baidu.com。如果可以查詢到結果,那您的網站就已經被百度新聞收錄了。
4、為什么我的網站只有部分內容被百度新聞收錄?
我們不允諾所有的內容都收錄,一方面會傾向收錄權威、原創的新聞內容,一方面可能存在少量漏抓情況。
我們明確不收錄如下內容:個人信息、博客、論壇、廣告、招標、報價、下載、試題、教程、招聘信息、幽默笑話、情感故事、情色、寫真、劇照、明星檔案、食譜。
5、為什么我的網站內容突然不再被百度新聞收錄了?
如果您的網站之前是被百度新聞收錄的,但突然從百度新聞的搜索結果中消失或停止更新,可能的原因有:
A.您的網站出現服務器不穩定等情況,會導致暫時抓取失敗,如果觀察兩三天依然有問題,可以通過貼吧反饋給我們,我們會在5個工作日內處理回復。貼吧反饋地址:http://tieba.baidu.com/f?kw=新聞搜索。
B. 您的網站進行了改版、域名更改,沒有及時被檢測到,您可以如上反饋。
C. 您的網站新聞質量出現問題,或者被舉報,我們保留處理的權利。
6、為什么我的原創新聞沒有展現,但是其他轉載站點的新聞展現出來了?
首先,您可以先定位一下原因:在百度新聞搜索框中直接輸入新聞url,如果查詢無結果,說明您的新聞沒有被收錄;如果查詢有結果,說明您的新聞沒有被正確展現。
上述兩種具體情況都可以通過貼吧反饋幫助我們改進算法,但不允諾可以立刻解決,貼吧反饋地址:http://tieba.baidu.com/f?kw=新聞搜索。