LinqiaBot

LinqiaBot蜘蛛/爬虫属于营销类型,由Linqia, Inc开发运行。您可以继续阅读下方信息,以深入了解LinqiaBot基本信息,用户代理和访问控制等。

基本信息

LinqiaBot的基本信息如下表。但部分不是很规范的蜘蛛和爬虫,可能存在信息不明的情况。
蜘蛛/爬虫名称
LinqiaBot
类型
营销
开发商
Linqia, Inc
当前状态
活动

用户代理

关于LinqiaBot蜘蛛或者爬虫的用户代理字符串,IP地址和服务器,所在地等信息如下表格所示:
metadata-downloader-bot/1.0
用户代理字符串
metadata-downloader-bot/1.0 (eng@linqia.com)
首次出现
2018-08-28 12:23:58
最后出现
2021-02-18 12:44:50
遵循robots.txt
未知
来源
IP地址(13) 服务器名称 所属国家
34.75.38.255 ? US
34.74.71.41 ? US
107.22.148.63 ec2-107-22-148-63.compute-1.amazonaws.com US
34.229.18.40 ec2-34-229-18-40.compute-1.amazonaws.com US
52.91.174.59 ec2-52-91-174-59.compute-1.amazonaws.com US
34.234.64.60 ec2-34-234-64-60.compute-1.amazonaws.com US
34.204.37.30 ec2-34-204-37-30.compute-1.amazonaws.com US
34.207.143.200 ec2-34-207-143-200.compute-1.amazonaws.com US
54.164.83.97 ec2-54-164-83-97.compute-1.amazonaws.com US
54.85.213.61 ec2-54-85-213-61.compute-1.amazonaws.com US
用户代理字符串
inactive-blog-skipper/1.0 (eng@linqia.com)
首次出现
2019-11-18 21:36:36
最后出现
2020-12-10 05:18:10
遵循robots.txt
未知
来源
IP地址(2) 服务器名称 所属国家
34.73.57.113 ? US
34.74.71.41 ? US
用户代理字符串
linqia-discovery/1.0 (eng@linqia.com)
首次出现
2020-02-14 01:01:15
最后出现
2020-02-14 01:01:15
遵循robots.txt
未知
来源
IP地址(1) 服务器名称 所属国家
34.74.71.41 41.71.74.34.bc.googleusercontent.com US
用户代理字符串
queuedriver/1.0 (eng@linqia.com)
首次出现
2018-04-27 06:20:31
最后出现
2019-04-08 10:02:57
遵循robots.txt
未知
来源
IP地址(4) 服务器名称 所属国家
34.234.64.60 ec2-34-234-64-60.compute-1.amazonaws.com US
34.207.143.200 ec2-34-207-143-200.compute-1.amazonaws.com US
34.235.127.157 ec2-34-235-127-157.compute-1.amazonaws.com US
52.205.232.47 ec2-52-205-232-47.compute-1.amazonaws.com US
用户代理字符串
LinqiaMetadataDownloaderBot/1.0 (eng@linqia.com)
首次出现
2016-03-31 06:45:00
最后出现
2018-03-27 11:52:58
遵循robots.txt
未知
来源
IP地址(36) 服务器名称 所属国家
34.228.254.105 ec2-34-228-254-105.compute-1.amazonaws.com US
34.229.13.202 ec2-34-229-13-202.compute-1.amazonaws.com US
54.211.128.173 ec2-54-211-128-173.compute-1.amazonaws.com US
34.228.78.144 ec2-34-228-78-144.compute-1.amazonaws.com US
34.207.143.200 ec2-34-207-143-200.compute-1.amazonaws.com US
34.202.163.39 ec2-34-202-163-39.compute-1.amazonaws.com US
34.229.129.180 ec2-34-229-129-180.compute-1.amazonaws.com US
54.157.12.231 ec2-54-157-12-231.compute-1.amazonaws.com US
184.73.7.172 ec2-184-73-7-172.compute-1.amazonaws.com US
52.91.161.237 ec2-52-91-161-237.compute-1.amazonaws.com US
用户代理字符串
LinqiaCrawlerBot/1.0 (eng@linqia.com)
首次出现
2017-03-06 07:25:31
最后出现
2018-02-13 09:16:36
遵循robots.txt
未知
来源
IP地址(2) 服务器名称 所属国家
52.23.238.242 ec2-52-23-238-242.compute-1.amazonaws.com US
52.87.184.230 ec2-52-87-184-230.compute-1.amazonaws.com US
用户代理字符串
LinqiaScrapeBot/1.0 (eng@linqia.com)
首次出现
2015-06-11 12:15:00
最后出现
2016-08-06 02:53:43
遵循robots.txt
未知
来源
IP地址(7) 服务器名称 所属国家
52.90.154.140 ec2-52-90-154-140.compute-1.amazonaws.com US
52.23.238.242 ec2-52-23-238-242.compute-1.amazonaws.com US
54.84.173.234 ec2-54-84-173-234.compute-1.amazonaws.com US
54.174.239.89 ec2-54-174-239-89.compute-1.amazonaws.com US
54.86.74.253 ec2-54-86-74-253.compute-1.amazonaws.com US
54.86.114.33 ec2-54-86-114-33.compute-1.amazonaws.com US
52.1.221.190 ec2-52-1-221-190.compute-1.amazonaws.com US
用户代理字符串
LinqiaRSSBot/1.0 (eng@linqia.com)
首次出现
2015-06-15 08:10:00
最后出现
2016-03-23 12:56:35
遵循robots.txt
未知
来源
IP地址(20) 服务器名称 所属国家
52.91.159.33 ec2-52-91-159-33.compute-1.amazonaws.com US
52.4.174.17 ec2-52-4-174-17.compute-1.amazonaws.com US
52.91.158.186 ec2-52-91-158-186.compute-1.amazonaws.com US
52.7.27.120 ec2-52-7-27-120.compute-1.amazonaws.com US
54.88.107.32 ec2-54-88-107-32.compute-1.amazonaws.com US
52.5.117.89 ec2-52-5-117-89.compute-1.amazonaws.com US
52.6.194.93 ec2-52-6-194-93.compute-1.amazonaws.com US
52.6.148.155 ec2-52-6-148-155.compute-1.amazonaws.com US
52.7.245.255 ec2-52-7-245-255.compute-1.amazonaws.com US
52.7.240.26 ec2-52-7-240-26.compute-1.amazonaws.com US
52.1.233.32 ec2-52-1-233-32.compute-1.amazonaws.com US
52.4.175.15 ec2-52-4-175-15.compute-1.amazonaws.com US
54.164.49.41 ec2-54-164-49-41.compute-1.amazonaws.com US

访问控制

了解如何控制LinqiaBot访问权限,避免LinqiaBot抓取行为不当。

是否拦截LinqiaBot?

一般不需要拦截,尤其是如果你自己也受益于搜索引擎优化服务。不过,如果你担心服务器资源占用等问题,且您都不使用这些工具,当然也可以选择拦截它们。

通过Robots.txt拦截

您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 LinqiaBot 或限制其访问权限。我们建议安装 Spider Analyser 插件,以检查它是否真正遵循这些规则。

	# robots.txt
	# 下列代码一般情况可以拦截该代理
	
	User-agent: LinqiaBot
	Disallow: /

您无需手动执行此操作,可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。

常见蜘蛛/爬虫

Common Spiders
Matchory Bot
Matchory Bot蜘蛛/爬虫属于营销类型,由Matchory GmbH开发运行。您可以继续阅读下方信息,以深入了解Matchory Bot基本信息,用户代理和访问控制等。
Googlebot
GoogleBot蜘蛛/爬虫属于搜索引擎类型,由Google Inc.开发运行。您可以继续阅读下方信息,以深入了解GoogleBot基本信息,用户代理和访问控制等。
Online Domain Tools
Online Domain Tools蜘蛛/爬虫属于监控类型,由AITIS s.r.o.开发运行。您可以继续阅读下方信息,以深入了解Online Domain Tools基本信息,用户代理和访问控制等。
AhrefsBot
AhrefsBot蜘蛛/爬虫属于营销类型,由Ahrefs Pte Ltd开发运行。您可以继续阅读下方信息,以深入了解AhrefsBot基本信息,用户代理和访问控制等。
SEMrushBot
SEMrushBot蜘蛛/爬虫属于营销类型,由Semrush Inc开发运行。您可以继续阅读下方信息,以深入了解SEMrushBot基本信息,用户代理和访问控制等。
DotBot
DotBot蜘蛛/爬虫属于营销类型,由SEOmoz, Inc.开发运行。您可以继续阅读下方信息,以深入了解DotBot基本信息,用户代理和访问控制等。
SentiBot
SentiBot蜘蛛/爬虫属于营销类型,由SentiOne开发运行。您可以继续阅读下方信息,以深入了解SentiBot基本信息,用户代理和访问控制等。
Awario crawler
Awario crawler蜘蛛/爬虫属于营销类型,由Link-Assistant.Com开发运行。您可以继续阅读下方信息,以深入了解Awario crawler基本信息,用户代理和访问控制等。

相关文章

Related Articles
利用OpenAI Agent SDK防护机制确保教育支持系统的完整性特色图
利用OpenAI Agent SDK防护机制确保教育支持系统的完整性
随着 OpenAI Agent SDK 的发布,开发人员现在拥有了构建智能系统的强大工具。其中最重要的一项功能是 Guardrails(防护机制),它可以过滤不需要的请求,帮助维护系统的完整性。这一功能在教育环境中尤为重要,因为在教育环境中,区分真正的学习支持和试图绕过学术道德的行为可能具有挑战性。 在本文中,我将展示一个在教育支持助理中使用 Guardrails 的实用而有影响力的案例。通过利用 Guardrails,我成功地阻止了不恰当的作业辅导请求,同时确保了真正的概念学习问题得到有效处理。 学习目标 了解 Guardrails 通过过滤不适当的请求来维护人工智能完整性的作用。 探索在教…