vuhuvBot

基本信息

vuhuvBot的基本信息如下表。但部分不是很规范的蜘蛛和爬虫，可能存在信息不明的情况。

用户代理

关于vuhuvBot蜘蛛或者爬虫的用户代理字符串，IP地址和服务器，所在地等信息如下表格所示：

用户代理字符串: Mozilla/5.0 (compatible; vuhuvRBT/2.0; +https://vuhuv.com/rbt.html)

来源

IP地址(1)	服务器名称	所属国家
194.9.191.20	bot.vuhuv.net	TR

来源

访问控制

了解如何控制vuhuvBot访问权限，避免vuhuvBot抓取行为不当。

一般不要拦截。搜索引擎爬虫为搜索引擎提供动力，是用户发现您网站的有效途径。事实上，拦截搜索引擎爬虫可能会严重减少网站的自然流量。

您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 vuhuvBot 或限制其访问权限。我们建议安装 Spider Analyser 插件，以检查它是否真正遵循这些规则。

# robots.txt
# 下列代码一般情况可以拦截该代理
User-agent: vuhuvBot
Disallow: /

您无需手动执行此操作，可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。

更多信息

vuhuv使用一个自行开发的机器人来抓取互联网，目前它访问的网站有以下凭证。

Mozilla/5.0 (compatible; vuhuvBot/1.0; +http://vuhuv.com/bot.html)

vuhuv机器人符合http://www.robotstxt.org/robotstxt.html 中规定的标准，并使用vuhuvbot ID。

User-agent: vuhuvbot

vuhuvbot会考虑到放置在页面中的一些html标签，并进行相应的处理。以下是vuhuvbot考虑到的例子。

<title>页面链接</title>从标题标签中获取页面标题。
<meta name=”keywords” content=”…” />从元关键字标签中获取页面内容的关键字。
<meta name=”Description” content=”…” /> 从元描述标签中获取相关页面的摘要。
<meta http-equiv=”Content-Type” content=”type; charset=…” />从charset部分获得页面的字符编码。
<meta http-equiv=”refresh” content=”5;url=directed-page.html” /> vuhuvbot检测页面上的元重定向并检索相关地址。
<meta name=”robots” content=”index, follow” /> vuhuvbot在用meta robots指定相关页面是否应该包含在搜索索引中时，会考虑到这一点。
在<a href=”…html” rel=”nofollow”>示例</a>页面中，vuhuvbot会识别写在href中的rel=”nofollow “参数，即不希望采取的地址，而不采取相关地址。