
如何做搜尋引擎蜘蛛日誌分析
搜尋引擎蜘蛛日誌檔案是一種非常強大但未被站長充分利用的檔案,分析它可以獲取有關每個搜尋引擎如何爬取網站內容的相關資訊點,及檢視搜尋引擎蜘蛛在一段時間內的行為。
IP地址(2) | 伺服器名稱 | 所屬國家 |
---|---|---|
216.151.2.53 | 216.151.2.53.teloshost.net | US |
216.151.2.52 | 216.151.2.52.teloshost.net | US |
IP地址(4) | 伺服器名稱 | 所屬國家 |
---|---|---|
45.33.19.243 | li973-243.members.linode.com | US |
75.164.193.16 | 75-164-193-16.ptld.qwest.net | US |
216.151.17.11 | 216.151.17.11.fasternetwork.com | US |
216.151.17.10 | 216.151.17.10.fasternetwork.com | US |
IP地址(1) | 伺服器名稱 | 所屬國家 |
---|---|---|
216.151.2.52 | ? | US |
142.93.30.149 | crawler2.wbsrch.com | US |
216.151.3.108 | test1.totalwebservices.net | US |
216.151.3.110 | pdx1.portlandmeshnet.org | US |
45.56.74.154 | li924-154.members.linode.com | US |
45.33.19.243 | li973-243.members.linode.com | US |
75.164.193.16 | 75-164-193-16.ptld.qwest.net | US |
216.151.17.11 | 216.151.17.11.fasternetwork.com | US |
216.151.17.10 | 216.151.17.10.fasternetwork.com | US |
IP地址(1) | 伺服器名稱 | 所屬國家 |
---|---|---|
216.151.17.11 | 216.151.17.11.fasternetwork.com | US |
IP地址(1) | 伺服器名稱 | 所屬國家 |
---|---|---|
216.151.17.10 | 216.151.17.10.fasternetwork.com | US |
一般不要攔截。搜尋引擎爬蟲為搜尋引擎提供動力,是使用者發現您網站的有效途徑。事實上,攔截搜尋引擎爬蟲可能會嚴重減少網站的自然流量。
您可以通過在網站的 robots.txt 中設定使用者代理訪問規則來遮蔽 WbSrch 或限制其訪問許可權。我們建議安裝 Spider Analyser 外掛,以檢查它是否真正遵循這些規則。
# robots.txt # 下列程式碼一般情況可以攔截該代理 User-agent: WbSrch Disallow: /
您無需手動執行此操作,可通過我們的 Wordpress 外掛 Spider Analyser 來攔截不必要的蜘蛛或者爬蟲。
通過WbSrch爬蟲的官方可以獲取到僅有的開發者資訊,具體如下:
我從7歲起就是一個電腦怪胎,從15歲起就是一個音樂家。我喜歡科幻小說、電影和電視,喜歡玩技術,喜歡任何能讓法西斯分子哭泣的東西。
2014年及以前的帖子來自Basternae 3專案的部落格,這是一個用C#.Net編寫的MUD,基於最初的Basternae 1和2 MUD。它最初託管在basternae.org,但它的帖子被保留在這裡。有些帖子來自於我以前經營的已經不復存在的網站。
——@xangis