Tomba Crawler

基本資訊

Tomba Crawler的基本資訊如下表。但部分不是很規範的蜘蛛和爬蟲，可能存在資訊不明的情況。

蜘蛛/爬蟲名稱: Tomba Crawler

型別: 其他

開發商: Tomba technology web service LLC

當前狀態: 活動

使用者代理

關於Tomba Crawler蜘蛛或者爬蟲的使用者代理字串，IP地址和伺服器，所在地等資訊如下表格所示：

使用者代理字串: Mozilla/5.0 (compatible; TombaPublicWebCrawler/3.5; +https://tombascraper.com)

首次出現: 2022-05-01 21:47:53

最後出現: 2022-05-01 21:47:53

遵循robots.txt: 未知

來源

IP地址(1)	伺服器名稱	所屬國家
161.97.144.155	vmi487123.contaboserver.net	DE

使用者代理字串: Mozilla/5.0 (compatible; TombaPublicWebCrawler/1.0; +https://tombascraper.com)

首次出現: 2021-01-11 07:32:40

最後出現: 2021-04-05 00:22:04

遵循robots.txt: 否

來源

IP地址(2)	伺服器名稱	所屬國家
161.97.144.155	vmi487123.contaboserver.net	US
104.238.159.242	?	DE

訪問控制

瞭解如何控制Tomba Crawler訪問許可權，避免Tomba Crawler抓取行為不當。

是否攔截Tomba Crawler？

對於未知蜘蛛或者爬蟲。它的用途對網站來說可能是好的，也可能是壞的，這取決於它是什麼。所以說，這需要站長進一步分析判斷這些尚不明確的爬蟲行為，再作最終決定。但，根據以往的經驗，未宣告行為目的及未命名的蜘蛛爬蟲，通常都有不可告人的祕密，我們理應對其行為進行控制，比如攔截。

通過Robots.txt攔截

您可以通過在網站的 robots.txt 中設定使用者代理訪問規則來遮蔽 Tomba Crawler 或限制其訪問許可權。我們建議安裝 Spider Analyser 外掛，以檢查它是否真正遵循這些規則。

# robots.txt
# 下列程式碼一般情況可以攔截該代理
User-agent: Tomba Crawler
Disallow: /

您無需手動執行此操作，可通過我們的 Wordpress 外掛 Spider Analyser 來攔截不必要的蜘蛛或者爬蟲。

更多資訊

Tomba成立於2021年，其使命是為專業人士提供與重要人物建立新聯絡的力量。

什麼是Tomba robot?

TombaPublicWebCrawler是一個網路搜尋引擎的索引機器人，類似於谷歌。由Tomba技術網路服務有限公司(Tomba.io)建立，TombaPublicWebCrawler的專利技術不斷掃描數百萬個公司網站、新聞稿、電子新聞服務、SEC檔案和其他線上來源。利用先進的自然語言處理演算法，Tomba建立了一個下一代搜尋引擎，專注於尋找有企業和商業專業人士資訊的網頁。

Version: 3.0 Obeys 
Robots.txt: Yes 
User-Agent String: Mozilla/5.0 (compatible; TombaPublicWebCrawler/3.0; +https://tombascraper.com)

Tomba Crawler在你的網站上做什麼？

該機器人只分析公共網頁。

它是否遵循robots.txt檔案？

是的。絕對的。我們嚴格遵循robots.txt，包括禁止和允許規則。

如何在您的網站上控制TombaPublicWebCrawler？

如上所述，TombaPublicWebCrawler嚴格遵守您網站上的robots.txt檔案。因此，如果您需要，您可以完全控制您網站上的它。

要改變TombaPublicWebCrawler訪問您網站的頻率，您可以在Robots.txt檔案中指定我們的機器人連續兩次請求之間的最小可接受延遲。

User-agent: TombaPublicWebCrawler

Crawl-Delay: [value]

其中Crawl-Delay值是以秒為單位的時間。如果由於某種原因，你想阻止TombaPublicWebCrawler訪問你的網站，請在你的伺服器上的robots.txt檔案中放入以下兩行。

User-agent: TombaPublicWebCrawler

Disallow: /

請注意，TombaPublicWebCrawler可能需要一些時間來選擇robots.txt檔案中的變化。這將在每次預定抓取之前進行。

還請注意，如果您的robots.txt包含錯誤，TombaPublicWebCrawler將無法識別您的命令，它將繼續按照以前的方式抓取您的網站。

閱讀更多關於robots.txt的資訊：https://support.google.com/webmasters/answer/6062608?hl=en

如果您認為TombaPublicWebCrawler在您的網站上有某種程度的不當行為，或者您對它有任何疑問，請毫不猶豫地聯絡tomba的支援團隊：support@tomba.io。

怎樣才算有利於SEO的網站結構

眾所周知，扁平且層級不超過三級的網站結構是最有利於搜尋引擎蜘蛛爬取的。顯淺的一句看似易懂但如深入，又未必是那麼容易理解。下面我們將深入瞭解網站結構的定義，重要性及實踐，以便於各位技術開發、站長和SEOer在未來的網站開發及運營中應用。

Tomba Crawler

基本資訊

使用者代理

訪問控制

是否攔截Tomba Crawler？

通過Robots.txt攔截

更多資訊

什麼是Tomba robot?

Tomba Crawler在你的網站上做什麼？

它是否遵循robots.txt檔案？

如何在您的網站上控制TombaPublicWebCrawler？

站長工具

常見蜘蛛/爬蟲

相關文章