如何做搜尋引擎蜘蛛日誌分析
搜尋引擎蜘蛛日誌檔案是一種非常強大但未被站長充分利用的檔案,分析它可以獲取有關每個搜尋引擎如何爬取網站內容的相關資訊點,及檢視搜尋引擎蜘蛛在一段時間內的行為。
| IP地址(1) | 伺服器名稱 | 所屬國家 |
|---|---|---|
| 170.187.237.84 | 170-187-237-84.ip.linodeusercontent.com | IN |
| 13.57.26.90 | ec2-13-57-26-90.us-west-1.compute.amazonaws.com | US |
| 52.159.245.146 | 52.159.245.146 | US |
| 35.86.227.192 | ec2-35-86-227-192.us-west-2.compute.amazonaws.com | US |
| 103.28.253.147 | 103.28.253.147 | IN |
| 185.128.227.19 | 185.128.227.19 | SG |
| 45.88.190.155 | 45.88.190.155 | CA |
| 3.133.85.202 | ec2-3-133-85-202.us-east-2.compute.amazonaws.com | US |
| 89.42.231.244 | 89.42.231.244 | RO |
| 161.97.148.40 | vmi2566589.contaboserver.net | DE |
一般不攔截。此類爬蟲通常是網站所有者提交掃描請求才會出現。如果攔截,則無法執行相應的掃描動作。
您可以通過在網站的 robots.txt 中設定使用者代理訪問規則來遮蔽 Assetnote 或限制其訪問許可權。我們建議安裝 Spider Analyser 外掛,以檢查它是否真正遵循這些規則。
# robots.txt # 下列程式碼一般情況可以攔截該代理 User-agent: Assetnote Disallow: /
您無需手動執行此操作,可通過我們的 Wordpress 外掛 Spider Analyser 來攔截不必要的蜘蛛或者爬蟲。