我所采集的都是論壇,而且只專注于IT論壇的采集工作,目前網上大部分的IT論壇都曾經被我光顧過,因此我在這方面上也取得了不小的回報。下面讓我們進入主題吧!
大家知道,從搜索做流量是最快最有效的方法,也因此不斷地有人做B,不斷地有人被封。我們也從搜索入手,但是我們不作B。我們提供大量內容讓搜索收錄,然后讓搜索穩定地給我們帶來流量。
從搜索做流量有兩種方法,一種是熱門關鍵詞,比如免費電影,如果你首頁排在前列的話,一天可以從上邊來一萬多IP,但是太危險,兩天后你就會消失了,不是長久之計。一種是子頁面通過大量收錄的方法帶來流量。這個方法比較好,一個關鍵詞的量不大,但是我們如果集合起幾百個幾千個甚至是幾萬個小關鍵詞的話,這個量可就不容小覬。從實際上來說這兒的量其實比那些熱門的詞是更可觀的。
我們的采集就是用的這第二個方法。
先來講講采集一定會有效果嗎?
我告訴你,我的這個方法它一定有效,以前和現在有效,以后也會有效。除非不再有搜索! 只要還存在搜索,它就要更新收錄內容,而我們只要能做大量的頁面讓搜索收錄,就一定可以帶來流量,不是嗎?
而最快速的大量頁面方法就是通過采集。
為什么選擇論壇
網上的內容大部分集中在論壇這些互動交流的平臺上,這上面他的信息量大。
這里還有一個最重要的搜索習慣和網站之間競爭的問題。
先說搜索習慣
網民經常搜索這些內容。我們發現論壇貼子的內容與網民使用百度的動機很相似,搜索與論壇這兩個是互補的,搜索找不到的人們去論壇詢問,又或者論壇沒有的人們找搜索(所以百度現在有個貼吧)。論壇的一些貼子標題與搜索關鍵詞非常類似(有空大家也可以研究一下用戶的搜索習慣),也因此很容易被搜索到。論壇的內容如果進入搜索你會發現你的點擊率非常之高。
競爭的問題
首先論壇上的貼子大部分都是原創的用戶交流,也就是獨此一份。不像一些新聞到處轉載,假如你的網站和新浪上同時有這些內容,我敢肯定你一定競爭不過新浪,你排不了最前,所以你沒流量。而論壇的信息(包括回復)一般就獨此一份,屬于原創性。用戶一搜就是你的。
采集的關鍵是看采集的對象,你所采集的內容是什么,是否在搜索上的搜索量巨大?是不是相同的內容搜索上不多,競爭小,可以確保排在前列?
百度一般不支持論壇的抓取
大家知道,要讓百度收錄的最好辦法就是把頁面生成HTML靜態網頁,而對于一些動態的頁面,如論壇的貼子,因為它的地址包含著很多的參數,一般是不容易被收錄的。這就給我們留下了一個巨大的市場空白。這個市場上它搜索量高,而百度里相關內容少,假如我們可以把論壇的內容采集過來轉化生成HTML頁面,然后讓百度收錄,就可以輕易地排到前列,不是嗎。。。
大家可以查詢一下這些站點在ALEXA上的排名,這些站點看起來像是論壇,其實不是,它們都是應用我上面所說的采集之后再來生成。這些站點一般都有1萬IP以上,如果你一天只采一個,一段時間之后,假如你被百度收錄了,你就會發現你的IP很快地達到數萬。
好了,我現在已經基本上把為什么采集論壇和它的特點講清楚了,相信許多人已經躍躍欲試了,那么如何采集和生成呢,我趕快來講一講吧
當然是使用采集軟件了,目前網上有不少的專業采集軟件,它們各有優勢,建議使用一些可以進行多線程和能支持網站登錄的采集軟件,目前所有的論壇均可以實現采集的。
上一篇 露珠:淺談國內最新備案的相關情況