
如何做搜尋引擎蜘蛛日誌分析
搜尋引擎蜘蛛日誌檔案是一種非常強大但未被站長充分利用的檔案,分析它可以獲取有關每個搜尋引擎如何爬取網站內容的相關資訊點,及檢視搜尋引擎蜘蛛在一段時間內的行為。
IP地址(8) | 伺服器名稱 | 所屬國家 |
---|---|---|
45.66.35.10 | torix.dizum.com | NL |
2a01:7e01::f03c:93ff:fe0e:7c4b | 2a01:7e01::f03c:93ff:fe0e:7c4b | DE |
88.80.187.198 | li695-198.members.linode.com | GB |
192.42.116.208 | 11.tor-exit.nothingtohide.nl | NL |
185.220.101.82 | tor-exit-82.cccs.de | DE |
192.42.116.175 | 23.tor-exit.nothingtohide.nl | NL |
107.189.1.160 | onion-exit.stagingdomain.name | LU |
185.81.115.120 | cerutty546y.online | NL |
IP地址(6) | 伺服器名稱 | 所屬國家 |
---|---|---|
2a01:7e01::f03c:93ff:fe0e:7c4b | 2a01:7e01::f03c:93ff:fe0e:7c4b | DE |
88.80.187.198 | li695-198.members.linode.com | GB |
192.42.116.199 | 9.tor-exit.nothingtohide.nl | NL |
192.42.116.198 | 8.tor-exit.nothingtohide.nl | NL |
192.42.116.213 | 16.tor-exit.nothingtohide.nl | NL |
192.42.116.191 | 1.tor-exit.nothingtohide.nl | NL |
IP地址(12) | 伺服器名稱 | 所屬國家 |
---|---|---|
2a01:7e00::f03c:92ff:fe06:c333 | 2a01:7e00::f03c:92ff:fe06:c333 | ? |
162.247.74.201 | kunstler.tor-exit.calyxinstitute.org | US |
2a01:7e01::f03c:93ff:fe0e:7c4b | 2a01:7e01::f03c:93ff:fe0e:7c4b | DE |
88.80.187.198 | li695-198.members.linode.com | GB |
192.42.116.173 | 21.tor-exit.nothingtohide.nl | NL |
192.42.116.217 | 20.tor-exit.nothingtohide.nl | NL |
103.251.167.20 | 103.251.167.20 | NL |
23.137.251.61 | tor-exit-incognet01.tuxli.org | NL |
5.45.98.162 | nurembergtor13.quetzalcoatl-relays.org | DE |
23.128.248.24 | tor-exit24.stormycloud.org | US |
107.189.7.144 | luxembourgtornew20.quetzalcoatl-relays.org | LU |
45.141.215.21 | 45.141.215.21 | NL |
IP地址(18) | 伺服器名稱 | 所屬國家 |
---|---|---|
89.58.42.239 | 05.nur.exit.tor.loki.tel | DE |
192.42.116.15 | this-is-a-tor-exit-node-hviv115.hviv.nl | NL |
109.70.100.22 | tor-exit-anonymizer.appliedprivacy.net | AT |
195.206.105.217 | zrh-exit.privateinternetaccess.com | CH |
185.195.71.2 | ? | CH |
51.195.166.202 | ip202.ip-51-195-166.eu | FR |
185.220.101.10 | berlin01.tor-exit.artikel10.org | DE |
185.170.114.125 | nurembergtor2.quetzalcoatl-relays.org | DE |
185.243.218.27 | tor-exit-terrahost01.tuxli.org | NO |
185.220.101.177 | tor-exit-177.relayon.org | DE |
對於未知蜘蛛或者爬蟲。它的用途對網站來說可能是好的,也可能是壞的,這取決於它是什麼。所以說,這需要站長進一步分析判斷這些尚不明確的爬蟲行為,再作最終決定。 但,根據以往的經驗,未宣告行為目的及未命名的蜘蛛爬蟲,通常都有不可告人的祕密,我們理應對其行為進行控制,比如攔截。
您可以通過在網站的 robots.txt 中設定使用者代理訪問規則來遮蔽 TorusBot 或限制其訪問許可權。我們建議安裝 Spider Analyser 外掛,以檢查它是否真正遵循這些規則。
# robots.txt # 下列程式碼一般情況可以攔截該代理 User-agent: TorusBot Disallow: /
您無需手動執行此操作,可通過我們的 Wordpress 外掛 Spider Analyser 來攔截不必要的蜘蛛或者爬蟲。