Sosospider

Sosospider蜘蛛/爬虫属于搜索引擎类型,由Tencent, Inc.开发运行。您可以继续阅读下方信息,以深入了解Sosospider基本信息,用户代理和访问控制等。

基本信息

Sosospider的基本信息如下表。但部分不是很规范的蜘蛛和爬虫,可能存在信息不明的情况。
蜘蛛/爬虫名称
Sosospider
类型
搜索引擎
开发商
Tencent, Inc.
当前状态
活动

用户代理

关于Sosospider蜘蛛或者爬虫的用户代理字符串,IP地址和服务器,所在地等信息如下表格所示:
Sosospider
用户代理字符串
Sosospider+(+http://help.soso.com/webspider.htm)
首次出现
2009-08-06 23:35:40
最后出现
2024-10-05 06:49:20
遵循robots.txt
未知
来源
IP地址(64) 服务器名称 所属国家
62.109.8.153 62-109-8-153.domengood.ru RU
91.217.129.10 ns.nvhost.ru RU
94.250.254.92 vds2.domengood.ru RU
123.151.139.216 123.151.139.216 CN
123.151.148.202 123.151.148.202 CN
123.151.148.159 ? CN
123.151.148.208 ? CN
123.151.139.215 123.151.139.215 CN
123.151.148.166 123.151.148.166 CN
123.151.42.89 123.151.42.89 CN
91.227.68.183 vps-68-183.nvhost.ru RU
185.189.12.120 dmg.domengiood.ru RU
用户代理字符串
Mozilla/5.0(compatible;Sosospider/2.0;+http://help.soso.com/webspider.htm)
首次出现
2013-07-01 08:15:00
最后出现
2013-07-08 08:46:25
遵循robots.txt
未知
来源
IP地址(10) 服务器名称 所属国家
123.151.148.173 123.151.148.173 CN
123.151.139.217 ? CN
123.151.47.115 ? CN
123.151.148.202 ? CN
123.151.148.186 123.151.148.186 CN
123.151.148.180 123.151.148.180 CN
123.151.139.192 123.151.139.192 CN
123.151.148.193 123.151.148.193 CN
123.151.42.89 123.151.42.89 CN
123.151.148.164 123.151.148.164 CN
用户代理字符串
Mozilla/5.0(compatible; Sosospider/2.0; +http://help.soso.com/webspider.htm)
首次出现
2012-08-17 19:32:00
最后出现
2013-03-21 06:27:11
遵循robots.txt
未知
来源
IP地址(10) 服务器名称 所属国家
123.151.139.212 ? CN
123.151.148.190 123.151.148.190 CN
123.151.148.198 ? CN
123.151.148.160 123.151.148.160 CN
123.151.148.175 ? CN
123.151.148.178 ? CN
123.151.148.174 123.151.148.174 CN
123.151.43.96 123.151.43.96 CN
123.151.43.79 123.151.43.79 CN
123.151.40.184 123.151.40.184 CN
123.151.43.42 123.151.43.42 CN
123.151.139.214 123.151.139.214 CN
123.151.148.173 123.151.148.173 CN
123.151.139.217 ? CN
123.151.47.115 ? CN
123.151.148.202 ? CN
123.151.148.164 123.151.148.164 CN
123.151.148.180 123.151.148.180 CN
123.151.148.186 123.151.148.186 CN
123.151.148.193 123.151.148.193 CN
123.151.42.89 123.151.42.89 CN
123.151.139.192 123.151.139.192 CN
124.115.6.14 ? CN
124.115.6.13 124.115.6.13 CN
124.115.4.200 124.115.4.200 CN
124.115.0.171 124.115.0.171 CN
124.115.2.34 124.115.2.34 CN
124.115.6.10 124.115.6.10 CN
124.115.6.11 124.115.6.11 CN
124.115.6.12 124.115.6.12 CN
124.115.6.15 124.115.6.15 CN
124.115.0.162 124.115.0.162 CN
123.151.47.113 123.151.47.113 CN
123.151.47.114 123.151.47.114 CN
用户代理字符串
Mozilla/5.0(compatible; Sosospider/2.0; +http://help.soso.com/webspider.htm)
首次出现
2012-08-17 19:32:00
最后出现
2013-03-21 06:27:11
遵循robots.txt
未知
来源
IP地址(10) 服务器名称 所属国家
124.115.6.14 ? CN
124.115.6.13 124.115.6.13 CN
124.115.4.200 124.115.4.200 CN
124.115.0.171 124.115.0.171 CN
124.115.6.10 124.115.6.10 CN
124.115.6.11 124.115.6.11 CN
124.115.6.12 124.115.6.12 CN
124.115.6.15 124.115.6.15 CN
124.115.0.162 124.115.0.162 CN
124.115.2.34 124.115.2.34 CN
用户代理字符串
sosoimagespider+(+http://help.soso.com/soso-image-spider.htm)
首次出现
2012-06-09 10:53:27
最后出现
2011-11-22 14:11:22
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
124.115.5.14 124.115.5.14 CN

访问控制

了解如何控制Sosospider访问权限,避免Sosospider抓取行为不当。

是否拦截Sosospider?

一般不要拦截。搜索引擎爬虫为搜索引擎提供动力,是用户发现您网站的有效途径。事实上,拦截搜索引擎爬虫可能会严重减少网站的自然流量。

通过Robots.txt拦截

您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 Sosospider 或限制其访问权限。我们建议安装 Spider Analyser 插件,以检查它是否真正遵循这些规则。

	# robots.txt
	# 下列代码一般情况可以拦截该代理
	
	User-agent: Sosospider
	Disallow: /

您无需手动执行此操作,可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。

常见蜘蛛/爬虫

Common Spiders
fynd.bot crawler
fynd.bot crawler蜘蛛/爬虫属于搜索引擎类型,由fynd.bot开发运行。您可以继续阅读下方信息,以深入了解fynd.bot crawler基本信息,用户代理和访问控制等。
Alibaba crawler
Alibaba crawler蜘蛛/爬虫属于搜索引擎类型,由Alibaba Group开发运行。您可以继续阅读下方信息,以深入了解Alibaba crawler基本信息,用户代理和访问控制等。
Googlebot
GoogleBot蜘蛛/爬虫属于搜索引擎类型,由Google Inc.开发运行。您可以继续阅读下方信息,以深入了解GoogleBot基本信息,用户代理和访问控制等。
Swisscows Crawler
Swisscows Crawler蜘蛛/爬虫属于搜索引擎类型,由Swisscows AG开发运行。您可以继续阅读下方信息,以深入了解Swisscows Crawler基本信息,用户代理和访问控制等。
star-finder.de Bot
star-finder.de Bot蜘蛛/爬虫属于搜索引擎类型,由projektnet开发运行。您可以继续阅读下方信息,以深入了解star-finder.de Bot基本信息,用户代理和访问控制等。
SeznamBot
SeznamBot蜘蛛/爬虫属于搜索引擎类型,由Seznam.cz, a.s.开发运行。您可以继续阅读下方信息,以深入了解SeznamBot基本信息,用户代理和访问控制等。
MojeekBot
MojeekBot蜘蛛/爬虫属于搜索引擎类型,由Mojeek Ltd.开发运行。您可以继续阅读下方信息,以深入了解MojeekBot基本信息,用户代理和访问控制等。
Bravebot
Bravebot蜘蛛/爬虫属于搜索引擎类型,由Brave Software Inc.开发运行。您可以继续阅读下方信息,以深入了解Bravebot基本信息,用户代理和访问控制等。

相关文章

Related Articles
利用OpenAI Agent SDK防护机制确保教育支持系统的完整性特色图
利用OpenAI Agent SDK防护机制确保教育支持系统的完整性
随着 OpenAI Agent SDK 的发布,开发人员现在拥有了构建智能系统的强大工具。其中最重要的一项功能是 Guardrails(防护机制),它可以过滤不需要的请求,帮助维护系统的完整性。这一功能在教育环境中尤为重要,因为在教育环境中,区分真正的学习支持和试图绕过学术道德的行为可能具有挑战性。 在本文中,我将展示一个在教育支持助理中使用 Guardrails 的实用而有影响力的案例。通过利用 Guardrails,我成功地阻止了不恰当的作业辅导请求,同时确保了真正的概念学习问题得到有效处理。 学习目标 了解 Guardrails 通过过滤不适当的请求来维护人工智能完整性的作用。 探索在教…