vuhuvBot
vuhuvBot蜘蛛/爬虫属于搜索引擎类型,由Vuhuv开发运行。您可以继续阅读下方信息,以深入了解vuhuvBot基本信息,用户代理和访问控制等。
基本信息
vuhuvBot的基本信息如下表。但部分不是很规范的蜘蛛和爬虫,可能存在信息不明的情况。
- 蜘蛛/爬虫名称
- vuhuvBot
- 类型
- 搜索引擎
- 开发商
-
Vuhuv
- 当前状态
-
活动
用户代理
关于vuhuvBot蜘蛛或者爬虫的用户代理字符串,IP地址和服务器,所在地等信息如下表格所示:
vuhuvRBT/2.0
-
vuhuvRBT/2.0
-
vuhuvBot/1.0
- 用户代理字符串
- Mozilla/5.0 (compatible; vuhuvRBT/2.0; +https://vuhuv.com/rbt.html)
- 首次出现
- 2024-10-15 21:49:53
- 最后出现
- 2024-10-15 21:49:53
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
194.9.191.20 |
bot.vuhuv.net |
TR |
- 用户代理字符串
- Mozilla/5.0 (compatible; vuhuvBot/1.0; +http://vuhuv.com/bot.html)
- 首次出现
- 2019-03-17 12:25:32
- 最后出现
- 2022-12-22 14:41:54
- 遵循robots.txt
- 未知
- 来源
-
IP地址(4) |
服务器名称 |
所属国家 |
194.9.191.20 |
bot.vuhuv.com |
TR |
185.93.54.51 |
bot.vuhuv.net |
TR |
162.158.90.215 |
? |
DE |
162.158.90.227 |
? |
DE |
访问控制
了解如何控制vuhuvBot访问权限,避免vuhuvBot抓取行为不当。
是否拦截vuhuvBot?
一般不要拦截。搜索引擎爬虫为搜索引擎提供动力,是用户发现您网站的有效途径。事实上,拦截搜索引擎爬虫可能会严重减少网站的自然流量。
通过Robots.txt拦截
您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 vuhuvBot 或限制其访问权限。我们建议安装 Spider Analyser
插件,以检查它是否真正遵循这些规则。
# robots.txt
# 下列代码一般情况可以拦截该代理
User-agent: vuhuvBot
Disallow: /
您无需手动执行此操作,可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。
更多信息
Vuhuv Bot
vuhuv使用一个自行开发的机器人来抓取互联网,目前它访问的网站有以下凭证。
Mozilla/5.0 (compatible; vuhuvBot/1.0; +http://vuhuv.com/bot.html)
robots.txt支持
vuhuv机器人符合http://www.robotstxt.org/robotstxt.html 中规定的标准,并使用vuhuvbot ID。
User-agent: vuhuvbot
使用Html标签
vuhuvbot会考虑到放置在页面中的一些html标签,并进行相应的处理。以下是vuhuvbot考虑到的例子。
- <title>页面链接</title>从标题标签中获取页面标题。
- <meta name=”keywords” content=”…” />从元关键字标签中获取页面内容的关键字。
- <meta name=”Description” content=”…” /> 从元描述标签中获取相关页面的摘要。
- <meta http-equiv=”Content-Type” content=”type; charset=…” />从charset部分获得页面的字符编码。
- <meta http-equiv=”refresh” content=”5;url=directed-page.html” /> vuhuvbot检测页面上的元重定向并检索相关地址。
- <meta name=”robots” content=”index, follow” /> vuhuvbot在用meta robots指定相关页面是否应该包含在搜索索引中时,会考虑到这一点。
- 在<a href=”…html” rel=”nofollow”>示例</a>页面中,vuhuvbot会识别写在href中的rel=”nofollow “参数,即不希望采取的地址,而不采取相关地址。