PageThing

基本資訊

PageThing的基本資訊如下表。但部分不是很規範的蜘蛛和爬蟲，可能存在資訊不明的情況。

蜘蛛/爬蟲名稱: PageThing

型別: 其他

開發商: specialnoise

當前狀態: 活動

使用者代理

關於PageThing蜘蛛或者爬蟲的使用者代理字串，IP地址和伺服器，所在地等資訊如下表格所示：

使用者代理字串: PageThing.com

首次出現: 2020-09-10 20:49:26

最後出現: 2021-03-31 21:11:36

遵循robots.txt: 未知

來源

IP地址(2)	伺服器名稱	所屬國家
2a01:7e00::f03c:92ff:fef9:ff4a	2a01:7e00::f03c:92ff:fef9:ff4a	GB
213.168.249.115	crawler.pagething.com	GB

使用者代理字串: PageThing http://pagething.com

首次出現: 2021-02-17 05:28:13

最後出現: 2021-03-03 11:33:39

遵循robots.txt: 未知

來源

IP地址(4)	伺服器名稱	所屬國家
213.168.249.115	crawler.pagething.com	GB
139.162.221.220	pagething.com	GB
80.85.84.52	south.newbyhost.com	GB
109.74.201.130	west.steampunkjunkies.com	GB

使用者代理字串: PageThing http://pagething.com curl www

首次出現: 2020-12-12 19:37:40

最後出現: 2021-02-07 12:33:05

遵循robots.txt: 未知

來源

IP地址(1)	伺服器名稱	所屬國家
213.168.249.115	crawler.pagething.com	GB

使用者代理字串: Mozilla/5.0 (Windows; U; Windows NT 5.1; pl; PageThing http://pagething.com); rv:1.9; Gecko/2008052906 Firefox/3.0

首次出現: 2020-11-06 05:20:00

最後出現: 2020-12-16 15:28:46

遵循robots.txt: 未知

來源

IP地址(2)	伺服器名稱	所屬國家
213.168.249.115	crawler.pagething.com	GB
2a01:7e00::f03c:92ff:fef9:ff4a	2a01:7e00::f03c:92ff:fef9:ff4a	GB
139.162.221.220	pagething.com	GB
80.85.84.52	south.newbyhost.com	GB
109.74.201.130	west.steampunkjunkies.com	GB

使用者代理字串: Mozilla/5.0 (Windows; U; Windows NT 5.1; pl; PageThing http://pagething.com); rv:1.9; Gecko/2008052906 Firefox/3.0

首次出現: 2020-11-06 05:20:00

最後出現: 2020-12-16 15:28:46

遵循robots.txt: 未知

來源

IP地址(2)	伺服器名稱	所屬國家
213.168.249.115	crawler.pagething.com	GB
2a01:7e00::f03c:92ff:fef9:ff4a	2a01:7e00::f03c:92ff:fef9:ff4a	GB

訪問控制

瞭解如何控制PageThing訪問許可權，避免PageThing抓取行為不當。

是否攔截PageThing？

對於未知蜘蛛或者爬蟲。它的用途對網站來說可能是好的，也可能是壞的，這取決於它是什麼。所以說，這需要站長進一步分析判斷這些尚不明確的爬蟲行為，再作最終決定。但，根據以往的經驗，未宣告行為目的及未命名的蜘蛛爬蟲，通常都有不可告人的祕密，我們理應對其行為進行控制，比如攔截。

通過Robots.txt攔截

您可以通過在網站的 robots.txt 中設定使用者代理訪問規則來遮蔽 PageThing 或限制其訪問許可權。我們建議安裝 Spider Analyser 外掛，以檢查它是否真正遵循這些規則。

# robots.txt
# 下列程式碼一般情況可以攔截該代理
User-agent: PageThing
Disallow: /

您無需手動執行此操作，可通過我們的 Wordpress 外掛 Spider Analyser 來攔截不必要的蜘蛛或者爬蟲。

怎樣才算有利於SEO的網站結構

眾所周知，扁平且層級不超過三級的網站結構是最有利於搜尋引擎蜘蛛爬取的。顯淺的一句看似易懂但如深入，又未必是那麼容易理解。下面我們將深入瞭解網站結構的定義，重要性及實踐，以便於各位技術開發、站長和SEOer在未來的網站開發及運營中應用。

PageThing

基本資訊

使用者代理

訪問控制

是否攔截PageThing？

通過Robots.txt攔截

站長工具

常見蜘蛛/爬蟲

相關文章