SnapBot

SnapBot蜘蛛/爬蟲屬於快照型別,由Snap Inc.開發執行。您可以繼續閱讀下方資訊,以深入瞭解SnapBot基本資訊,使用者代理和訪問控制等。

基本資訊

SnapBot的基本資訊如下表。但部分不是很規範的蜘蛛和爬蟲,可能存在資訊不明的情況。
蜘蛛/爬蟲名稱
SnapBot
型別
快照
開發商
Snap Inc.
當前狀態
活動

使用者代理

關於SnapBot蜘蛛或者爬蟲的使用者代理字串,IP地址和伺服器,所在地等資訊如下表格所示:
Snap-URL-Preview
使用者代理字串
Snap-URL-Preview (bot; snapchat; +https://developers.snap.com/robots)
首次出現
2023-05-05 10:46:22
最後出現
2024-07-16 04:37:52
遵循robots.txt
未知
來源
IP地址(12) 伺服器名稱 所屬國家
34.203.239.213 ec2-34-203-239-213.compute-1.amazonaws.com US
54.196.247.103 ec2-54-196-247-103.compute-1.amazonaws.com US
44.204.29.242 ec2-44-204-29-242.compute-1.amazonaws.com US
54.81.136.113 ec2-54-81-136-113.compute-1.amazonaws.com US
18.208.137.30 ec2-18-208-137-30.compute-1.amazonaws.com US
54.85.217.133 ec2-54-85-217-133.compute-1.amazonaws.com US
44.202.48.139 ec2-44-202-48-139.compute-1.amazonaws.com US
44.203.66.63 ec2-44-203-66-63.compute-1.amazonaws.com US
54.89.111.19 ec2-54-89-111-19.compute-1.amazonaws.com US
3.95.250.234 ec2-3-95-250-234.compute-1.amazonaws.com US
54.197.64.237 ec2-54-197-64-237.compute-1.amazonaws.com US
52.207.132.121 ec2-52-207-132-121.compute-1.amazonaws.com US
使用者代理字串
Mozilla/5.0 (compatible; SnapPreviewBot; en-US; rv:1.8.0.9) Gecko/20061206 Firefox/1.5.0.9
首次出現
2009-05-11 05:50:00
最後出現
2023-06-09 04:56:12
遵循robots.txt
未知
來源
IP地址(3) 伺服器名稱 所屬國家
185.222.58.109 hosted-by.rootlayer.net NL
35.226.151.117 117.151.226.35.bc.googleusercontent.com US
20.124.28.120 20.124.28.120 US
2607:ff28:b012::91b8 2607:ff28:b012::91b8 US
185.29.10.118 185.29.10.118 SE
149.129.50.37 149.129.50.37 SG
使用者代理字串
Snap URL Preview Service; bot; https://developer.snapchat.com/robots
首次出現
2021-06-03 05:19:12
最後出現
2022-05-28 19:54:21
遵循robots.txt
未知
來源
IP地址(29) 伺服器名稱 所屬國家
54.91.57.211 ec2-54-91-57-211.compute-1.amazonaws.com US
35.175.235.123 ec2-35-175-235-123.compute-1.amazonaws.com US
54.224.65.188 ec2-54-224-65-188.compute-1.amazonaws.com US
54.198.34.58 ec2-54-198-34-58.compute-1.amazonaws.com US
54.164.129.53 ec2-54-164-129-53.compute-1.amazonaws.com US
54.167.35.251 ec2-54-167-35-251.compute-1.amazonaws.com US
54.205.95.22 ec2-54-205-95-22.compute-1.amazonaws.com US
54.235.13.179 ec2-54-235-13-179.compute-1.amazonaws.com US
54.224.139.138 ec2-54-224-139-138.compute-1.amazonaws.com US
54.198.241.12 ec2-54-198-241-12.compute-1.amazonaws.com US
使用者代理字串
Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.0.7) Gecko/20060909 Firefox/1.5.0.7 SnapPreviewBot
首次出現
2021-11-09 14:14:43
最後出現
2021-12-22 20:54:53
遵循robots.txt
未知
來源
IP地址(2) 伺服器名稱 所屬國家
20.124.28.120 20.124.28.120 US
2607:ff28:b012::91b8 2607:ff28:b012::91b8 US
使用者代理字串
Snap URL Preview Service; bot; https://developers.snap.com/robots
首次出現
2021-07-07 05:41:32
最後出現
2021-10-14 06:49:55
遵循robots.txt
未知
來源
IP地址(2) 伺服器名稱 所屬國家
54.82.59.229 ec2-54-82-59-229.compute-1.amazonaws.com US
18.208.251.130 ec2-18-208-251-130.compute-1.amazonaws.com US
54.227.95.100 ec2-54-227-95-100.compute-1.amazonaws.com US
34.207.81.132 ec2-34-207-81-132.compute-1.amazonaws.com US
3.89.217.40 ec2-3-89-217-40.compute-1.amazonaws.com US
52.90.187.191 ec2-52-90-187-191.compute-1.amazonaws.com US
54.175.12.134 ec2-54-175-12-134.compute-1.amazonaws.com US
54.92.186.78 ec2-54-92-186-78.compute-1.amazonaws.com US
35.173.187.22 ec2-35-173-187-22.compute-1.amazonaws.com US
54.163.59.2 ec2-54-163-59-2.compute-1.amazonaws.com US
52.30.250.78 ec2-52-30-250-78.eu-west-1.compute.amazonaws.com IE
18.234.123.37 ec2-18-234-123-37.compute-1.amazonaws.com US
44.203.86.237 ec2-44-203-86-237.compute-1.amazonaws.com US
54.205.12.99 ec2-54-205-12-99.compute-1.amazonaws.com US
54.242.118.182 ec2-54-242-118-182.compute-1.amazonaws.com US
34.228.189.79 ec2-34-228-189-79.compute-1.amazonaws.com US
54.162.167.174 ec2-54-162-167-174.compute-1.amazonaws.com US
54.246.74.99 ec2-54-246-74-99.eu-west-1.compute.amazonaws.com IE
34.245.186.199 ec2-34-245-186-199.eu-west-1.compute.amazonaws.com IE
34.242.250.129 ec2-34-242-250-129.eu-west-1.compute.amazonaws.com IE
54.91.57.211 ec2-54-91-57-211.compute-1.amazonaws.com US
35.175.235.123 ec2-35-175-235-123.compute-1.amazonaws.com US
54.224.65.188 ec2-54-224-65-188.compute-1.amazonaws.com US
54.198.34.58 ec2-54-198-34-58.compute-1.amazonaws.com US
217.138.197.10 217.138.197.10 IT
54.164.129.53 ec2-54-164-129-53.compute-1.amazonaws.com US
54.205.95.22 ec2-54-205-95-22.compute-1.amazonaws.com US
54.167.35.251 ec2-54-167-35-251.compute-1.amazonaws.com US
54.235.13.179 ec2-54-235-13-179.compute-1.amazonaws.com US
54.224.139.138 ec2-54-224-139-138.compute-1.amazonaws.com US
54.196.178.24 ec2-54-196-178-24.compute-1.amazonaws.com US
54.167.42.113 ec2-54-167-42-113.compute-1.amazonaws.com US
54.204.106.30 ec2-54-204-106-30.compute-1.amazonaws.com US
54.157.47.149 ec2-54-157-47-149.compute-1.amazonaws.com US
44.206.239.15 ec2-44-206-239-15.compute-1.amazonaws.com US
18.212.100.185 ec2-18-212-100-185.compute-1.amazonaws.com ?
3.252.211.82 ec2-3-252-211-82.eu-west-1.compute.amazonaws.com IE
52.213.52.43 ec2-52-213-52-43.eu-west-1.compute.amazonaws.com IE
107.23.97.77 ec2-107-23-97-77.compute-1.amazonaws.com US
34.226.219.151 ec2-34-226-219-151.compute-1.amazonaws.com US
3.93.48.143 ec2-3-93-48-143.compute-1.amazonaws.com US
174.129.142.153 ec2-174-129-142-153.compute-1.amazonaws.com US
18.212.74.149 ec2-18-212-74-149.compute-1.amazonaws.com US
54.164.206.78 ec2-54-164-206-78.compute-1.amazonaws.com US
54.90.108.93 ec2-54-90-108-93.compute-1.amazonaws.com US
54.216.233.31 ec2-54-216-233-31.eu-west-1.compute.amazonaws.com IE
34.244.61.247 ec2-34-244-61-247.eu-west-1.compute.amazonaws.com IE
34.245.227.212 ec2-34-245-227-212.eu-west-1.compute.amazonaws.com IE
54.173.152.193 ec2-54-173-152-193.compute-1.amazonaws.com US
44.202.159.232 ec2-44-202-159-232.compute-1.amazonaws.com US
63.34.12.159 ec2-63-34-12-159.eu-west-1.compute.amazonaws.com IE
54.155.136.174 ec2-54-155-136-174.eu-west-1.compute.amazonaws.com IE
54.166.192.130 ec2-54-166-192-130.compute-1.amazonaws.com US
44.212.1.133 ec2-44-212-1-133.compute-1.amazonaws.com US
34.239.113.79 ec2-34-239-113-79.compute-1.amazonaws.com US
54.89.176.173 ec2-54-89-176-173.compute-1.amazonaws.com US
18.232.163.197 ec2-18-232-163-197.compute-1.amazonaws.com ?
34.224.32.22 ec2-34-224-32-22.compute-1.amazonaws.com US
54.234.135.108 ec2-54-234-135-108.compute-1.amazonaws.com US
54.221.44.111 ec2-54-221-44-111.compute-1.amazonaws.com US
18.234.68.150 ec2-18-234-68-150.compute-1.amazonaws.com US
54.235.60.83 ec2-54-235-60-83.compute-1.amazonaws.com US
3.88.177.234 ec2-3-88-177-234.compute-1.amazonaws.com US
54.157.212.48 ec2-54-157-212-48.compute-1.amazonaws.com US
34.228.144.95 ec2-34-228-144-95.compute-1.amazonaws.com US
18.203.154.235 ec2-18-203-154-235.eu-west-1.compute.amazonaws.com IE
44.217.231.99 ec2-44-217-231-99.compute-1.amazonaws.com US
3.92.208.199 ec2-3-92-208-199.compute-1.amazonaws.com US
18.212.135.164 ec2-18-212-135-164.compute-1.amazonaws.com US
107.22.103.1 ec2-107-22-103-1.compute-1.amazonaws.com US
54.83.73.140 ec2-54-83-73-140.compute-1.amazonaws.com US
35.171.185.217 ec2-35-171-185-217.compute-1.amazonaws.com US
使用者代理字串
Snap URL Preview Service; bot; https://developers.snap.com/robots
首次出現
2021-07-07 05:41:32
最後出現
2021-10-14 06:49:55
遵循robots.txt
未知
來源
IP地址(2) 伺服器名稱 所屬國家
54.196.178.24 ec2-54-196-178-24.compute-1.amazonaws.com US
54.167.42.113 ec2-54-167-42-113.compute-1.amazonaws.com US
使用者代理字串
Snapbot/1.0 (Snap Shots, +http://www.snap.com)
首次出現
2009-05-11 05:50:00
最後出現
2011-03-27 17:26:58
遵循robots.txt
未知
來源
IP地址(4) 伺服器名稱 所屬國家
38.98.19.111 38.98.19.111 US
38.98.19.66 38.98.19.66 US
38.98.19.67 38.98.19.67 US
38.98.19.68 38.98.19.68 US

訪問控制

瞭解如何控制SnapBot訪問許可權,避免SnapBot抓取行為不當。

是否攔截SnapBot?

這取決於你。數字存檔通常是為了儲存歷史記錄。如果你出於某種原因不想成為歷史記錄的一部分,你可以攔截這型別的蜘蛛爬蟲。

通過Robots.txt攔截

您可以通過在網站的 robots.txt 中設定使用者代理訪問規則來遮蔽 SnapBot 或限制其訪問許可權。我們建議安裝 Spider Analyser 外掛,以檢查它是否真正遵循這些規則。

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
# robots.txt
# 下列程式碼一般情況可以攔截該代理
User-agent: SnapBot
Disallow: /
# robots.txt # 下列程式碼一般情況可以攔截該代理 User-agent: SnapBot Disallow: /
# robots.txt
# 下列程式碼一般情況可以攔截該代理
User-agent: SnapBot
Disallow: /

您無需手動執行此操作,可通過我們的 Wordpress 外掛 Spider Analyser 來攔截不必要的蜘蛛或者爬蟲。

更多資訊

Snapbot,用於URL預覽服務掃描網站的HTML,為Snapchatters提供其朋友在聊天中分享的網站的預覽。預覽是一張帶有標題、副標題和縮圖的卡片,連結到該網站。例如:

careers.snap.com URL預覽卡

URL預覽服務優先考慮Open Graph標籤(og:title和og:image),但會使用Twitter Card標籤(twitter:title和twitter:img:src)來收集預覽的資訊。URL預覽服務以使用者代理 “Snap URL Preview Service; bot; https://developer.snapchat.com/robots “進行HTTP請求,它將對URL的響應進行30分鐘的快取,以避免單一URL的過多流量。如果你的連結在Snapchat中的顯示方式有問題。

  • 嘗試將我們的使用者代理新增到您網站的允許列表中
  • 確保您的網站在HTML標題中使用適當的後設資料標籤進行響應

常見蜘蛛/爬蟲

Common Spiders
Googlebot
GoogleBot蜘蛛/爬蟲屬於搜尋引擎型別,由Google Inc.開發執行。您可以繼續閱讀下方資訊,以深入瞭解GoogleBot基本資訊,使用者代理和訪問控制等。
SeznamBot
SeznamBot蜘蛛/爬蟲屬於搜尋引擎型別,由Seznam.cz, a.s.開發執行。您可以繼續閱讀下方資訊,以深入瞭解SeznamBot基本資訊,使用者代理和訪問控制等。
WordPress.com bots
WordPress.com bots蜘蛛/爬蟲屬於資訊流型別,由Automattic Inc.開發執行。您可以繼續閱讀下方資訊,以深入瞭解WordPress.com bots基本資訊,使用者代理和訪問控制等。
Hatena
Hatena蜘蛛/爬蟲屬於快照型別,由Hatena Co., Ltd.開發執行。您可以繼續閱讀下方資訊,以深入瞭解Hatena基本資訊,使用者代理和訪問控制等。
hyperhost.ua crawler
hyperhost.ua crawler蜘蛛/爬蟲屬於快照型別,由HyperHost Ukraine開發執行。您可以繼續閱讀下方資訊,以深入瞭解hyperhost.ua crawler基本資訊,使用者代理和訪問控制等。
bingbot
Bingbot蜘蛛/爬蟲屬於搜尋引擎型別,由Microsoft Corporation.開發執行。您可以繼續閱讀下方資訊,以深入瞭解Bingbot基本資訊,使用者代理和訪問控制等。
PhantomJsCloud.com
PhantomJsCloud.com蜘蛛/爬蟲屬於快照型別,由Novaleaf Software Co. Ltd.開發執行。您可以繼續閱讀下方資訊,以深入瞭解PhantomJsCloud.com基本資訊,使用者代理和訪問控制等。
Daumoa
Daumoa蜘蛛/爬蟲屬於搜尋引擎型別,由Kakao Corp.開發執行。您可以繼續閱讀下方資訊,以深入瞭解Daumoa基本資訊,使用者代理和訪問控制等。

相關文章

Related Articles