
如何做搜尋引擎蜘蛛日誌分析
搜尋引擎蜘蛛日誌檔案是一種非常強大但未被站長充分利用的檔案,分析它可以獲取有關每個搜尋引擎如何爬取網站內容的相關資訊點,及檢視搜尋引擎蜘蛛在一段時間內的行為。
IP地址(11) | 伺服器名稱 | 所屬國家 |
---|---|---|
54.204.20.250 | rigby03.embed.ly | US |
54.221.199.147 | rigby00.embed.ly | US |
54.225.104.196 | rigby04.embed.ly | US |
54.204.20.249 | rigby02.embed.ly | US |
54.221.198.105 | rigby01.embed.ly | US |
107.21.253.49 | rigby05.embed.ly | US |
192.225.214.131 | ? | US |
173.203.238.247 | 173-203-238-247.static.cloud-ips.com | US |
IP地址(13) | 伺服器名稱 | 所屬國家 |
---|---|---|
3.232.144.146 | ec2-3-232-144-146.compute-1.amazonaws.com | US |
18.213.90.179 | ec2-18-213-90-179.compute-1.amazonaws.com | US |
3.232.106.50 | ec2-3-232-106-50.compute-1.amazonaws.com | US |
54.175.48.214 | ec2-54-175-48-214.compute-1.amazonaws.com | US |
52.1.109.34 | ec2-52-1-109-34.compute-1.amazonaws.com | US |
52.21.76.65 | ec2-52-21-76-65.compute-1.amazonaws.com | US |
52.21.133.138 | ec2-52-21-133-138.compute-1.amazonaws.com | US |
54.157.10.41 | ec2-54-157-10-41.compute-1.amazonaws.com | US |
54.90.131.130 | ec2-54-90-131-130.compute-1.amazonaws.com | US |
23.22.43.179 | ec2-23-22-43-179.compute-1.amazonaws.com | US |
52.20.184.229 | ec2-52-20-184-229.compute-1.amazonaws.com | US |
IP地址(8) | 伺服器名稱 | 所屬國家 |
---|---|---|
54.225.104.196 | rigby04.embed.ly | US |
54.204.20.249 | ec2-54-204-20-249.compute-1.amazonaws.com | US |
54.204.20.250 | rigby03.embed.ly | US |
54.221.198.105 | rigby01.embed.ly | US |
54.221.199.147 | rigby00.embed.ly | US |
107.21.253.49 | rigby05.embed.ly | US |
192.225.214.131 | ? | US |
173.203.238.247 | 173-203-238-247.static.cloud-ips.com | US |
通常不需要。除非您不希望資訊流網站或者APP對您的網站內容進行抓取,網站也不提供Feed訂閱服務,則可以考慮攔截此型別爬蟲。
您可以通過在網站的 robots.txt 中設定使用者代理訪問規則來遮蔽 Embedly 或限制其訪問許可權。我們建議安裝 Spider Analyser 外掛,以檢查它是否真正遵循這些規則。
# robots.txt # 下列程式碼一般情況可以攔截該代理 User-agent: Embedly Disallow: /
您無需手動執行此操作,可通過我們的 Wordpress 外掛 Spider Analyser 來攔截不必要的蜘蛛或者爬蟲。