
如何做搜尋引擎蜘蛛日誌分析
搜尋引擎蜘蛛日誌檔案是一種非常強大但未被站長充分利用的檔案,分析它可以獲取有關每個搜尋引擎如何爬取網站內容的相關資訊點,及檢視搜尋引擎蜘蛛在一段時間內的行為。
IP地址(450) | 伺服器名稱 | 所屬國家 |
---|---|---|
3.86.112.40 | ec2-3-86-112-40.compute-1.amazonaws.com | US |
54.211.180.241 | ec2-54-211-180-241.compute-1.amazonaws.com | US |
3.92.216.94 | ec2-3-92-216-94.compute-1.amazonaws.com | US |
3.234.221.123 | ec2-3-234-221-123.compute-1.amazonaws.com | US |
54.198.185.112 | ec2-54-198-185-112.compute-1.amazonaws.com | US |
34.204.202.78 | ec2-34-204-202-78.compute-1.amazonaws.com | US |
52.90.167.143 | ec2-52-90-167-143.compute-1.amazonaws.com | US |
184.72.93.45 | ec2-184-72-93-45.compute-1.amazonaws.com | US |
18.234.160.148 | ec2-18-234-160-148.compute-1.amazonaws.com | US |
34.229.132.0 | ec2-34-229-132-0.compute-1.amazonaws.com | US |
3.235.175.88 | ec2-3-235-175-88.compute-1.amazonaws.com | US |
3.237.87.114 | ec2-3-237-87-114.compute-1.amazonaws.com | US |
3.87.20.79 | ec2-3-87-20-79.compute-1.amazonaws.com | US |
18.212.253.137 | ec2-18-212-253-137.compute-1.amazonaws.com | US |
34.201.10.172 | ec2-34-201-10-172.compute-1.amazonaws.com | US |
52.91.160.37 | ec2-52-91-160-37.compute-1.amazonaws.com | US |
18.204.230.188 | ec2-18-204-230-188.compute-1.amazonaws.com | US |
34.204.36.91 | ec2-34-204-36-91.compute-1.amazonaws.com | US |
44.204.143.4 | ec2-44-204-143-4.compute-1.amazonaws.com | US |
3.80.6.160 | ec2-3-80-6-160.compute-1.amazonaws.com | US |
3.93.60.35 | ec2-3-93-60-35.compute-1.amazonaws.com | US |
44.201.27.0 | ec2-44-201-27-0.compute-1.amazonaws.com | US |
34.204.186.198 | ec2-34-204-186-198.compute-1.amazonaws.com | US |
44.203.135.86 | ec2-44-203-135-86.compute-1.amazonaws.com | US |
44.200.183.182 | ec2-44-200-183-182.compute-1.amazonaws.com | US |
54.80.192.161 | ec2-54-80-192-161.compute-1.amazonaws.com | US |
3.86.34.135 | ec2-3-86-34-135.compute-1.amazonaws.com | US |
54.160.219.142 | ec2-54-160-219-142.compute-1.amazonaws.com | US |
18.205.41.10 | ec2-18-205-41-10.compute-1.amazonaws.com | US |
44.193.201.241 | ec2-44-193-201-241.compute-1.amazonaws.com | US |
52.23.171.177 | ec2-52-23-171-177.compute-1.amazonaws.com | US |
54.166.83.48 | ec2-54-166-83-48.compute-1.amazonaws.com | US |
54.234.143.15 | ec2-54-234-143-15.compute-1.amazonaws.com | US |
IP地址(1) | 伺服器名稱 | 所屬國家 |
---|---|---|
37.140.238.54 | rev54.rtbhouse.net | NL |
可以考慮攔截。。爬蟲通常會下載公開的網際網路內容,這些內容預設情況下可以免費訪問。不過,如果你不希望你的內容被用於未經授權的目的,你應該攔截它們。
您可以通過在網站的 robots.txt 中設定使用者代理訪問規則來遮蔽 AdsTxtCrawler 或限制其訪問許可權。我們建議安裝 Spider Analyser 外掛,以檢查它是否真正遵循這些規則。
# robots.txt # 下列程式碼一般情況可以攔截該代理 User-agent: AdsTxtCrawler Disallow: /
您無需手動執行此操作,可通過我們的 Wordpress 外掛 Spider Analyser 來攔截不必要的蜘蛛或者爬蟲。