InfoTigerBot

InfoTigerBot蜘蛛/爬虫属于搜索引擎类型,由Infotiger UG开发运行。您可以继续阅读下方信息,以深入了解InfoTigerBot基本信息,用户代理和访问控制等。

基本信息

InfoTigerBot的基本信息如下表。但部分不是很规范的蜘蛛和爬虫,可能存在信息不明的情况。
蜘蛛/爬虫名称
InfoTigerBot
类型
搜索引擎
开发商
Infotiger UG
当前状态
活动

用户代理

关于InfoTigerBot蜘蛛或者爬虫的用户代理字符串,IP地址和服务器,所在地等信息如下表格所示:
InfoTigerBot/1.9
用户代理字符串
Mozilla/5.0 (compatible; InfoTigerBot/1.9; +https://infotiger.com/bot)
首次出现
2021-06-11 12:03:57
最后出现
2023-02-26 06:24:47
遵循robots.txt
未知
来源
IP地址(4) 服务器名称 所属国家
91.143.80.66 crawler-66-80-143-91.infotiger.com DE
91.143.88.40 crawler-40-88-143-91.infotiger.com DE
85.31.186.210 crawler-210-186-31-85.infotiger.com DE
91.143.93.12 crawler-12-93-143-91.infotiger.com DE

访问控制

了解如何控制InfoTigerBot访问权限,避免InfoTigerBot抓取行为不当。

是否拦截InfoTigerBot?

一般不要拦截。搜索引擎爬虫为搜索引擎提供动力,是用户发现您网站的有效途径。事实上,拦截搜索引擎爬虫可能会严重减少网站的自然流量。

通过Robots.txt拦截

您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 InfoTigerBot 或限制其访问权限。我们建议安装 Spider Analyser 插件,以检查它是否真正遵循这些规则。

	# robots.txt
	# 下列代码一般情况可以拦截该代理
	
	User-agent: InfoTigerBot
	Disallow: /

您无需手动执行此操作,可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。

更多信息

什么是InfoTigerBot?

InfoTigerBot是为infotiger搜索引擎的网络爬虫提供的网络机器人(bot)。基本上,InfoTigerBot正在浏览网页并检索网页,这些网页可能会被解析,并可能在以后被infotiger搜索引擎收录。

如何验证InfoTigerBot

InfoTigerBot通常由以下用户代理字符串来识别。

Mozilla/5.0 (compatible; InfoTigerBot/1.9; +https://infotiger.com/bot)

infotiger.com的爬虫的源IP地址确实解决了类似的问题。

crawler-40-88-143-91.infotiger.com

你可以通过比较反向DNS(ip->name)和正向DNS(name->ip)来验证真实性,它们应该与原始IP地址相匹配。

# nslookup 91.143.88.40
40.88.143.91.in-addr.arpa name = crawler-40-88-143-91.infotiger.com.

# nslookup crawler-40-88-143-91.infotiger.com
Name: crawler-40-88-143-91.infotiger.com
Address: 91.143.88.40

请注意,用户代理(User-Agent)字符串很容易被欺骗,所以并不是每个名字中带有InfoTigerBot的请求都可能来自infotiger.com的爬虫。

控制InfoTigerBot

InfoTigerBot总是(尽量)有礼貌的,并且将每分钟的请求数限制在一个主机上。

InfoTigerBot遵守robots.txt规则,该规则由robots排除标准定义。

此外,InfoTigerBot还尊重HTML头中的robots元标签,特别是 noindex 和 nofollow

如果你不希望你的网页被infotiger搜索引擎收录,你可以通过适当地编辑你的robots.txt或robots元标签来轻松排除InfoTigerBot。

 

如何将我的URL添加到infotiger的索引中?

您可以在infotiger.com的添加URL页面提交您的URL,以便被InfoTigerBot抓取。

报告问题

如果您有任何问题或想报告InfoTigerBot的问题,请给他们留言: contact (at) infotiger (point) com

常见蜘蛛/爬虫

Common Spiders
fynd.bot crawler
fynd.bot crawler蜘蛛/爬虫属于搜索引擎类型,由fynd.bot开发运行。您可以继续阅读下方信息,以深入了解fynd.bot crawler基本信息,用户代理和访问控制等。
Alibaba crawler
Alibaba crawler蜘蛛/爬虫属于搜索引擎类型,由Alibaba Group开发运行。您可以继续阅读下方信息,以深入了解Alibaba crawler基本信息,用户代理和访问控制等。
Googlebot
GoogleBot蜘蛛/爬虫属于搜索引擎类型,由Google Inc.开发运行。您可以继续阅读下方信息,以深入了解GoogleBot基本信息,用户代理和访问控制等。
Swisscows Crawler
Swisscows Crawler蜘蛛/爬虫属于搜索引擎类型,由Swisscows AG开发运行。您可以继续阅读下方信息,以深入了解Swisscows Crawler基本信息,用户代理和访问控制等。
star-finder.de Bot
star-finder.de Bot蜘蛛/爬虫属于搜索引擎类型,由projektnet开发运行。您可以继续阅读下方信息,以深入了解star-finder.de Bot基本信息,用户代理和访问控制等。
SeznamBot
SeznamBot蜘蛛/爬虫属于搜索引擎类型,由Seznam.cz, a.s.开发运行。您可以继续阅读下方信息,以深入了解SeznamBot基本信息,用户代理和访问控制等。
MojeekBot
MojeekBot蜘蛛/爬虫属于搜索引擎类型,由Mojeek Ltd.开发运行。您可以继续阅读下方信息,以深入了解MojeekBot基本信息,用户代理和访问控制等。
Bravebot
Bravebot蜘蛛/爬虫属于搜索引擎类型,由Brave Software Inc.开发运行。您可以继续阅读下方信息,以深入了解Bravebot基本信息,用户代理和访问控制等。

相关文章

Related Articles
利用OpenAI Agent SDK防护机制确保教育支持系统的完整性特色图
利用OpenAI Agent SDK防护机制确保教育支持系统的完整性
随着 OpenAI Agent SDK 的发布,开发人员现在拥有了构建智能系统的强大工具。其中最重要的一项功能是 Guardrails(防护机制),它可以过滤不需要的请求,帮助维护系统的完整性。这一功能在教育环境中尤为重要,因为在教育环境中,区分真正的学习支持和试图绕过学术道德的行为可能具有挑战性。 在本文中,我将展示一个在教育支持助理中使用 Guardrails 的实用而有影响力的案例。通过利用 Guardrails,我成功地阻止了不恰当的作业辅导请求,同时确保了真正的概念学习问题得到有效处理。 学习目标 了解 Guardrails 通过过滤不适当的请求来维护人工智能完整性的作用。 探索在教…