PagePeeker

PagePeeker蜘蛛/爬蟲屬於快照型別,由PAGEPEEKER SRL開發執行。您可以繼續閱讀下方資訊,以深入瞭解PagePeeker基本資訊,使用者代理和訪問控制等。

基本資訊

PagePeeker的基本資訊如下表。但部分不是很規範的蜘蛛和爬蟲,可能存在資訊不明的情況。
蜘蛛/爬蟲名稱
PagePeeker
型別
快照
開發商
PAGEPEEKER SRL
當前狀態
活動

使用者代理

關於PagePeeker蜘蛛或者爬蟲的使用者代理字串,IP地址和伺服器,所在地等資訊如下表格所示:
PagePeeker/3.0
使用者代理字串
Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.121 Safari/537.36 (compatible; PagePeeker/3.0; +https://pagepeeker.com/robots/)
首次出現
2019-03-29 11:51:34
最後出現
2023-12-18 13:51:56
遵循robots.txt
來源
IP地址(5) 伺服器名稱 所屬國家
88.99.245.93 ? DE
94.130.238.229 ? DE
88.99.3.154 ? DE
94.130.162.177 static.177.162.130.94.clients.your-server.de DE
136.243.102.17 static.17.102.243.136.clients.your-server.de DE
使用者代理字串
Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.120 Safari/537.36 (compatible; PagePeeker/3.0; +https://pagepeeker.com/robots/)
首次出現
2019-10-24 03:06:06
最後出現
2021-02-15 19:29:18
遵循robots.txt
未知
來源
IP地址(1) 伺服器名稱 所屬國家
88.99.3.154 static.154.3.99.88.clients.your-server.de DE
使用者代理字串
Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36 (compatible; PPBot/2.1; +https://pagepeeker.com/robots/)
首次出現
2019-01-23 09:21:55
最後出現
2019-03-13 04:21:16
遵循robots.txt
未知
來源
IP地址(1) 伺服器名稱 所屬國家
136.243.102.17 static.17.102.243.136.clients.your-server.de DE
使用者代理字串
Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/535.21 (KHTML, like Gecko) Chrome/19.0.1042.0 Safari/535.21 PagePeeker/2.1; +http://pagepeeker.com/robots/
首次出現
2012-10-09 22:17:42
最後出現
2012-11-17 11:18:58
遵循robots.txt
未知
來源
IP地址(2) 伺服器名稱 所屬國家
46.4.120.2 templatix.org DE
85.10.246.235 r26.pagepeeker.com DE
使用者代理字串
PagePeeker.com
首次出現
2011-11-15 20:40:47
最後出現
2012-01-31 15:42:20
遵循robots.txt
未知
來源
IP地址(4) 伺服器名稱 所屬國家
188.40.82.149 r22.pagepeeker.com DE
188.40.84.81 pagepeeker.com DE
46.4.120.2 templatix.org DE
176.9.146.12 r25.pagepeeker.com DE
85.10.246.235 r26.pagepeeker.com DE
5.9.49.41 r28.pagepeeker.com DE
176.9.24.168 r20.pagepeeker.com DE
46.4.32.18 pagepeeker.com DE
使用者代理字串
PagePeeker.com
首次出現
2011-11-15 20:40:47
最後出現
2012-01-31 15:42:20
遵循robots.txt
未知
來源
IP地址(4) 伺服器名稱 所屬國家
176.9.24.168 r20.pagepeeker.com DE
188.40.82.149 r22.pagepeeker.com DE
46.4.120.2 templatix.org DE
46.4.32.18 pagepeeker.com DE

訪問控制

瞭解如何控制PagePeeker訪問許可權,避免PagePeeker抓取行為不當。

是否攔截PagePeeker?

這取決於你。數字存檔通常是為了儲存歷史記錄。如果你出於某種原因不想成為歷史記錄的一部分,你可以攔截這型別的蜘蛛爬蟲。

通過Robots.txt攔截

您可以通過在網站的 robots.txt 中設定使用者代理訪問規則來遮蔽 PagePeeker 或限制其訪問許可權。我們建議安裝 Spider Analyser 外掛,以檢查它是否真正遵循這些規則。

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
# robots.txt
# 下列程式碼一般情況可以攔截該代理
User-agent: PagePeeker
Disallow: /
# robots.txt # 下列程式碼一般情況可以攔截該代理 User-agent: PagePeeker Disallow: /
# robots.txt
# 下列程式碼一般情況可以攔截該代理
User-agent: PagePeeker
Disallow: /

您無需手動執行此操作,可通過我們的 Wordpress 外掛 Spider Analyser 來攔截不必要的蜘蛛或者爬蟲。

更多資訊

PagePeeker使使用者能夠從網頁上生成螢幕截圖和縮圖。

PagePeeker的技術專注於三個點,並試圖在每個點上實現完美:

速度

當包含縮圖的頁面載入時,它可以同時訪問PagePeeker的伺服器,請求縮圖 20 個。將其乘以數千名客戶,其中一些客戶擁有高流量的網站,您會發現速度對於良好的縮圖服務至關重要。這就是PagePeeker的技術大放異彩的地方。它可以同時處理來自商用硬體的數千個請求。這使PagePeeker能夠實現小於 5 秒的渲染時間和每個請求的顯示時間小於 100 毫秒。

可靠性

有這麼多網站依靠PagePeeker的服務看起來不錯,想象一下如果它崩潰會發生什麼。PagePeeker的客戶的網站看起來很糟糕,他們的客戶保留率會受到影響,一般來說,這對業務不利。這就是為什麼PagePeeker要確保這種情況永遠不會發生。我們使用多臺伺服器、冗餘網際網路連線和可靠的擴充套件策略來實現高度可靠的服務。即使PagePeeker的軟體在商用硬體上執行,PagePeeker也儘可能使用頂級伺服器,因此您可以確保PagePeeker的服務是可靠的。

準確性

您可能想知道為什麼準確性會成為縮圖服務的問題。畢竟,頁面是縮小的,有時太大了,以至於很難識別它們。對於PagePeeker的一些高階客戶來說,這很重要。PagePeeker已經看到PagePeeker的服務以我們從未設想過的方式使用。例如,有些使用完全沒有縮小的螢幕截圖,因此捕獲的頁面必須與原始頁面相同。PagePeeker的機器人在這方面非常出色,您自己完成的螢幕截圖和它完成的螢幕截圖絕對沒有區別。

常見蜘蛛/爬蟲

Common Spiders
Googlebot
GoogleBot蜘蛛/爬蟲屬於搜尋引擎型別,由Google Inc.開發執行。您可以繼續閱讀下方資訊,以深入瞭解GoogleBot基本資訊,使用者代理和訪問控制等。
SeznamBot
SeznamBot蜘蛛/爬蟲屬於搜尋引擎型別,由Seznam.cz, a.s.開發執行。您可以繼續閱讀下方資訊,以深入瞭解SeznamBot基本資訊,使用者代理和訪問控制等。
WordPress.com bots
WordPress.com bots蜘蛛/爬蟲屬於資訊流型別,由Automattic Inc.開發執行。您可以繼續閱讀下方資訊,以深入瞭解WordPress.com bots基本資訊,使用者代理和訪問控制等。
Hatena
Hatena蜘蛛/爬蟲屬於快照型別,由Hatena Co., Ltd.開發執行。您可以繼續閱讀下方資訊,以深入瞭解Hatena基本資訊,使用者代理和訪問控制等。
hyperhost.ua crawler
hyperhost.ua crawler蜘蛛/爬蟲屬於快照型別,由HyperHost Ukraine開發執行。您可以繼續閱讀下方資訊,以深入瞭解hyperhost.ua crawler基本資訊,使用者代理和訪問控制等。
bingbot
Bingbot蜘蛛/爬蟲屬於搜尋引擎型別,由Microsoft Corporation.開發執行。您可以繼續閱讀下方資訊,以深入瞭解Bingbot基本資訊,使用者代理和訪問控制等。
PhantomJsCloud.com
PhantomJsCloud.com蜘蛛/爬蟲屬於快照型別,由Novaleaf Software Co. Ltd.開發執行。您可以繼續閱讀下方資訊,以深入瞭解PhantomJsCloud.com基本資訊,使用者代理和訪問控制等。
Daumoa
Daumoa蜘蛛/爬蟲屬於搜尋引擎型別,由Kakao Corp.開發執行。您可以繼續閱讀下方資訊,以深入瞭解Daumoa基本資訊,使用者代理和訪問控制等。

相關文章

Related Articles