vuhuvBot

vuhuvBot蜘蛛/爬虫属于搜索引擎类型,由Vuhuv开发运行。您可以继续阅读下方信息,以深入了解vuhuvBot基本信息,用户代理和访问控制等。

基本信息

vuhuvBot的基本信息如下表。但部分不是很规范的蜘蛛和爬虫,可能存在信息不明的情况。
蜘蛛/爬虫名称
vuhuvBot
类型
搜索引擎
开发商
Vuhuv
当前状态
活动

用户代理

关于vuhuvBot蜘蛛或者爬虫的用户代理字符串,IP地址和服务器,所在地等信息如下表格所示:
vuhuvRBT/2.0
用户代理字符串
Mozilla/5.0 (compatible; vuhuvRBT/2.0; +https://vuhuv.com/rbt.html)
首次出现
2024-10-15 21:49:53
最后出现
2024-10-15 21:49:53
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
194.9.191.20 bot.vuhuv.net TR
用户代理字符串
Mozilla/5.0 (compatible; vuhuvBot/1.0; +http://vuhuv.com/bot.html)
首次出现
2019-03-17 12:25:32
最后出现
2022-12-22 14:41:54
遵循robots.txt
未知
来源
IP地址(4) 服务器名称 所属国家
194.9.191.20 bot.vuhuv.com TR
185.93.54.51 bot.vuhuv.net TR
162.158.90.215 ? DE
162.158.90.227 ? DE

访问控制

了解如何控制vuhuvBot访问权限,避免vuhuvBot抓取行为不当。

是否拦截vuhuvBot?

一般不要拦截。搜索引擎爬虫为搜索引擎提供动力,是用户发现您网站的有效途径。事实上,拦截搜索引擎爬虫可能会严重减少网站的自然流量。

通过Robots.txt拦截

您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 vuhuvBot 或限制其访问权限。我们建议安装 Spider Analyser 插件,以检查它是否真正遵循这些规则。

	# robots.txt
	# 下列代码一般情况可以拦截该代理
	
	User-agent: vuhuvBot
	Disallow: /

您无需手动执行此操作,可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。

更多信息

Vuhuv Bot

vuhuv使用一个自行开发的机器人来抓取互联网,目前它访问的网站有以下凭证。

Mozilla/5.0 (compatible; vuhuvBot/1.0; +http://vuhuv.com/bot.html)

robots.txt支持

vuhuv机器人符合http://www.robotstxt.org/robotstxt.html 中规定的标准,并使用vuhuvbot ID。

User-agent: vuhuvbot

使用Html标签

vuhuvbot会考虑到放置在页面中的一些html标签,并进行相应的处理。以下是vuhuvbot考虑到的例子。

  • <title>页面链接</title>从标题标签中获取页面标题。
  • <meta name=”keywords” content=”…” />从元关键字标签中获取页面内容的关键字。
  • <meta name=”Description” content=”…” /> 从元描述标签中获取相关页面的摘要。
  • <meta http-equiv=”Content-Type” content=”type; charset=…” />从charset部分获得页面的字符编码。
  • <meta http-equiv=”refresh” content=”5;url=directed-page.html” /> vuhuvbot检测页面上的元重定向并检索相关地址。
  • <meta name=”robots” content=”index, follow” /> vuhuvbot在用meta robots指定相关页面是否应该包含在搜索索引中时,会考虑到这一点。
  • 在<a href=”…html” rel=”nofollow”>示例</a>页面中,vuhuvbot会识别写在href中的rel=”nofollow “参数,即不希望采取的地址,而不采取相关地址。

常见蜘蛛/爬虫

Common Spiders
fynd.bot crawler
fynd.bot crawler蜘蛛/爬虫属于搜索引擎类型,由fynd.bot开发运行。您可以继续阅读下方信息,以深入了解fynd.bot crawler基本信息,用户代理和访问控制等。
Alibaba crawler
Alibaba crawler蜘蛛/爬虫属于搜索引擎类型,由Alibaba Group开发运行。您可以继续阅读下方信息,以深入了解Alibaba crawler基本信息,用户代理和访问控制等。
Googlebot
GoogleBot蜘蛛/爬虫属于搜索引擎类型,由Google Inc.开发运行。您可以继续阅读下方信息,以深入了解GoogleBot基本信息,用户代理和访问控制等。
Swisscows Crawler
Swisscows Crawler蜘蛛/爬虫属于搜索引擎类型,由Swisscows AG开发运行。您可以继续阅读下方信息,以深入了解Swisscows Crawler基本信息,用户代理和访问控制等。
star-finder.de Bot
star-finder.de Bot蜘蛛/爬虫属于搜索引擎类型,由projektnet开发运行。您可以继续阅读下方信息,以深入了解star-finder.de Bot基本信息,用户代理和访问控制等。
SeznamBot
SeznamBot蜘蛛/爬虫属于搜索引擎类型,由Seznam.cz, a.s.开发运行。您可以继续阅读下方信息,以深入了解SeznamBot基本信息,用户代理和访问控制等。
MojeekBot
MojeekBot蜘蛛/爬虫属于搜索引擎类型,由Mojeek Ltd.开发运行。您可以继续阅读下方信息,以深入了解MojeekBot基本信息,用户代理和访问控制等。
Bravebot
Bravebot蜘蛛/爬虫属于搜索引擎类型,由Brave Software Inc.开发运行。您可以继续阅读下方信息,以深入了解Bravebot基本信息,用户代理和访问控制等。

相关文章

Related Articles