Tomba Crawler

Tomba Crawler蜘蛛/爬蟲屬於其他型別,由Tomba technology web service LLC開發執行。您可以繼續閱讀下方資訊,以深入瞭解Tomba Crawler基本資訊,使用者代理和訪問控制等。

基本資訊

Tomba Crawler的基本資訊如下表。但部分不是很規範的蜘蛛和爬蟲,可能存在資訊不明的情況。
蜘蛛/爬蟲名稱
Tomba Crawler
型別
其他
開發商
Tomba technology web service LLC
當前狀態
活動

使用者代理

關於Tomba Crawler蜘蛛或者爬蟲的使用者代理字串,IP地址和伺服器,所在地等資訊如下表格所示:
TombaPublicWebCrawler/3.5
使用者代理字串
Mozilla/5.0 (compatible; TombaPublicWebCrawler/3.5; +https://tombascraper.com)
首次出現
2022-05-01 21:47:53
最後出現
2022-05-01 21:47:53
遵循robots.txt
未知
來源
IP地址(1) 伺服器名稱 所屬國家
161.97.144.155 vmi487123.contaboserver.net DE
使用者代理字串
Mozilla/5.0 (compatible; TombaPublicWebCrawler/1.0; +https://tombascraper.com)
首次出現
2021-01-11 07:32:40
最後出現
2021-04-05 00:22:04
遵循robots.txt
來源
IP地址(2) 伺服器名稱 所屬國家
161.97.144.155 vmi487123.contaboserver.net US
104.238.159.242 ? DE

訪問控制

瞭解如何控制Tomba Crawler訪問許可權,避免Tomba Crawler抓取行為不當。

是否攔截Tomba Crawler?

對於未知蜘蛛或者爬蟲。它的用途對網站來說可能是好的,也可能是壞的,這取決於它是什麼。所以說,這需要站長進一步分析判斷這些尚不明確的爬蟲行為,再作最終決定。 但,根據以往的經驗,未宣告行為目的及未命名的蜘蛛爬蟲,通常都有不可告人的祕密,我們理應對其行為進行控制,比如攔截。

通過Robots.txt攔截

您可以通過在網站的 robots.txt 中設定使用者代理訪問規則來遮蔽 Tomba Crawler 或限制其訪問許可權。我們建議安裝 Spider Analyser 外掛,以檢查它是否真正遵循這些規則。

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
# robots.txt
# 下列程式碼一般情況可以攔截該代理
User-agent: Tomba Crawler
Disallow: /
# robots.txt # 下列程式碼一般情況可以攔截該代理 User-agent: Tomba Crawler Disallow: /
# robots.txt
# 下列程式碼一般情況可以攔截該代理
User-agent: Tomba Crawler
Disallow: /

您無需手動執行此操作,可通過我們的 Wordpress 外掛 Spider Analyser 來攔截不必要的蜘蛛或者爬蟲。

更多資訊

Tomba成立於2021年,其使命是為專業人士提供與重要人物建立新聯絡的力量。

什麼是Tomba robot?

TombaPublicWebCrawler是一個網路搜尋引擎的索引機器人,類似於谷歌。由Tomba技術網路服務有限公司(Tomba.io)建立,TombaPublicWebCrawler的專利技術不斷掃描數百萬個公司網站、新聞稿、電子新聞服務、SEC檔案和其他線上來源。利用先進的自然語言處理演算法,Tomba建立了一個下一代搜尋引擎,專注於尋找有企業和商業專業人士資訊的網頁。

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
Version: 3.0 Obeys
Robots.txt: Yes
User-Agent String: Mozilla/5.0 (compatible; TombaPublicWebCrawler/3.0; +https://tombascraper.com)
Version: 3.0 Obeys Robots.txt: Yes User-Agent String: Mozilla/5.0 (compatible; TombaPublicWebCrawler/3.0; +https://tombascraper.com)
Version: 3.0 Obeys 
Robots.txt: Yes 
User-Agent String: Mozilla/5.0 (compatible; TombaPublicWebCrawler/3.0; +https://tombascraper.com)

Tomba Crawler在你的網站上做什麼?

該機器人只分析公共網頁。

它是否遵循robots.txt檔案?

是的。絕對的。我們嚴格遵循robots.txt,包括禁止和允許規則。

如何在您的網站上控制TombaPublicWebCrawler?

如上所述,TombaPublicWebCrawler嚴格遵守您網站上的robots.txt檔案。因此,如果您需要,您可以完全控制您網站上的它。

要改變TombaPublicWebCrawler訪問您網站的頻率,您可以在Robots.txt檔案中指定我們的機器人連續兩次請求之間的最小可接受延遲。

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
User-agent: TombaPublicWebCrawler
Crawl-Delay: [value]
User-agent: TombaPublicWebCrawler Crawl-Delay: [value]
User-agent: TombaPublicWebCrawler

Crawl-Delay: [value]

其中Crawl-Delay值是以秒為單位的時間。如果由於某種原因,你想阻止TombaPublicWebCrawler訪問你的網站,請在你的伺服器上的robots.txt檔案中放入以下兩行。

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
User-agent: TombaPublicWebCrawler
Disallow: /
User-agent: TombaPublicWebCrawler Disallow: /
User-agent: TombaPublicWebCrawler

Disallow: /

請注意,TombaPublicWebCrawler可能需要一些時間來選擇robots.txt檔案中的變化。這將在每次預定抓取之前進行。

還請注意,如果您的robots.txt包含錯誤,TombaPublicWebCrawler將無法識別您的命令,它將繼續按照以前的方式抓取您的網站。

閱讀更多關於robots.txt的資訊:https://support.google.com/webmasters/answer/6062608?hl=en

如果您認為TombaPublicWebCrawler在您的網站上有某種程度的不當行為,或者您對它有任何疑問,請毫不猶豫地聯絡tomba的支援團隊:support@tomba.io。

常見蜘蛛/爬蟲

Common Spiders
Fraunhofer crawler
Fraunhofer crawler蜘蛛/爬蟲屬於其他型別,由Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.開發執行。您可以繼續閱讀下方資訊,以深入瞭解Fraunhofer crawler基本資訊,使用者代理和訪問控制等。
companyspotter
companyspotter蜘蛛/爬蟲屬於其他型別,由CompanySpotter BV開發執行。您可以繼續閱讀下方資訊,以深入瞭解companyspotter基本資訊,使用者代理和訪問控制等。
DataForSeo bot
DataForSeo bot蜘蛛/爬蟲屬於其他型別,由DataForSEO OU開發執行。您可以繼續閱讀下方資訊,以深入瞭解DataForSeo bot基本資訊,使用者代理和訪問控制等。
CloudFlare crawler
CloudFlare crawler蜘蛛/爬蟲屬於其他型別,由CloudFlare, Inc.開發執行。您可以繼續閱讀下方資訊,以深入瞭解CloudFlare crawler基本資訊,使用者代理和訪問控制等。
Odin
Odin蜘蛛/爬蟲屬於其他型別,由Cyble, Inc.開發執行。您可以繼續閱讀下方資訊,以深入瞭解Odin基本資訊,使用者代理和訪問控制等。
Chrome Privacy Preserving Prefetch Proxy
Chrome Privacy Preserving Prefetch Proxy蜘蛛/爬蟲屬於其他型別,由Google Inc.開發執行。您可以繼續閱讀下方資訊,以深入瞭解Chrome Privacy Preserving Prefetch Proxy基本資訊,使用者代理和訪問控制等。
EFF crawler
EFF crawler蜘蛛/爬蟲屬於其他型別,由Electronic Frontier Foundation開發執行。您可以繼續閱讀下方資訊,以深入瞭解EFF crawler基本資訊,使用者代理和訪問控制等。
Modat crawler
Modat crawler蜘蛛/爬蟲屬於其他型別,由Modat B.V.開發執行。您可以繼續閱讀下方資訊,以深入瞭解Modat crawler基本資訊,使用者代理和訪問控制等。

相關文章

Related Articles