
如何做搜尋引擎蜘蛛日誌分析
搜尋引擎蜘蛛日誌檔案是一種非常強大但未被站長充分利用的檔案,分析它可以獲取有關每個搜尋引擎如何爬取網站內容的相關資訊點,及檢視搜尋引擎蜘蛛在一段時間內的行為。
IP地址(17) | 伺服器名稱 | 所屬國家 |
---|---|---|
124.122.41.12 | ppp-124-122-41-12.revip2.asianet.co.th | TH |
95.216.80.134 | static.134.80.216.95.clients.your-server.de | FI |
178.205.244.156 | 178.205.244.156 | RU |
141.98.252.169 | 141.98.252.169 | GB |
89.207.131.169 | servi.ouups.fr | NL |
54.167.12.189 | ec2-54-167-12-189.compute-1.amazonaws.com | US |
3.89.71.26 | ec2-3-89-71-26.compute-1.amazonaws.com | US |
3.89.229.78 | ec2-3-89-229-78.compute-1.amazonaws.com | US |
52.90.246.82 | ec2-52-90-246-82.compute-1.amazonaws.com | US |
54.160.206.72 | ec2-54-160-206-72.compute-1.amazonaws.com | US |
20.15.105.226 | 20.15.105.226 | US |
83.147.52.37 | 83.147.52.37 | US |
218.60.22.105 | 218.60.22.105 | CN |
46.19.137.90 | hostedby.privatelayer.com | CH |
54.169.143.234 | ec2-54-169-143-234.ap-southeast-1.compute.amazonaws.com | SG |
45.200.149.249 | 45.200.149.249 | ID |
94.156.64.214 | 94.156.64.214 | BG |
81.161.238.40 | 81.161.238.40 | NL |
87.120.125.126 | 87.120.125.126 | BG |
通常不需要。除非您不希望資訊流網站或者APP對您的網站內容進行抓取,網站也不提供Feed訂閱服務,則可以考慮攔截此型別爬蟲。
您可以通過在網站的 robots.txt 中設定使用者代理訪問規則來遮蔽 everyfeed-spider 或限制其訪問許可權。我們建議安裝 Spider Analyser 外掛,以檢查它是否真正遵循這些規則。
# robots.txt # 下列程式碼一般情況可以攔截該代理 User-agent: everyfeed-spider Disallow: /
您無需手動執行此操作,可通過我們的 Wordpress 外掛 Spider Analyser 來攔截不必要的蜘蛛或者爬蟲。