

IP地址(20) | 服务器名称 | 所属国家 |
---|---|---|
135.125.219.90 | ? | US |
37.187.162.178 | ns338306.ip-37-187-162.eu | FR |
37.187.162.184 | ns338312.ip-37-187-162.eu | FR |
37.187.165.37 | ns336619.ip-37-187-165.eu | FR |
37.187.167.33 | ns339849.ip-37-187-167.eu | FR |
37.187.162.186 | ns338314.ip-37-187-162.eu | FR |
37.187.162.165 | ns338293.ip-37-187-162.eu | FR |
37.187.165.36 | ns336618.ip-37-187-165.eu | FR |
37.187.162.191 | ns338319.ip-37-187-162.eu | FR |
37.187.162.193 | ns338321.ip-37-187-162.eu | FR |
IP地址(28) | 服务器名称 | 所属国家 |
---|---|---|
135.125.219.72 | crawler15.paper.li | DE |
135.125.216.246 | crawler1.paper.li | FR |
152.228.166.119 | crawler9.paper.li | FR |
135.125.219.40 | crawler4.paper.li | FR |
135.125.217.232 | crawler10.paper.li | FR |
135.125.216.65 | crawler12.paper.li | FR |
135.125.219.90 | ? | US |
135.125.88.213 | crawler13.paper.li | FR |
152.228.167.63 | crawler8.paper.li | FR |
51.210.126.244 | crawler5.paper.li | FR |
135.125.218.78 | crawler2.paper.li | DE |
51.210.249.89 | crawler14.paper.li | FR |
152.228.166.33 | crawler3.paper.li | FR |
51.210.36.36 | crawler11.paper.li | FR |
37.187.162.178 | ns338306.ip-37-187-162.eu | FR |
37.187.162.184 | ns338312.ip-37-187-162.eu | FR |
37.187.165.37 | ns336619.ip-37-187-165.eu | FR |
37.187.167.33 | ns339849.ip-37-187-167.eu | FR |
37.187.162.186 | ns338314.ip-37-187-162.eu | FR |
37.187.162.165 | ns338293.ip-37-187-162.eu | FR |
37.187.165.36 | ns336618.ip-37-187-165.eu | FR |
37.187.162.191 | ns338319.ip-37-187-162.eu | FR |
37.187.162.193 | ns338321.ip-37-187-162.eu | FR |
37.187.162.183 | ns338311.ip-37-187-162.eu | FR |
37.187.162.185 | ns338313.ip-37-187-162.eu | FR |
37.187.162.187 | ns338315.ip-37-187-162.eu | FR |
37.187.162.192 | ns338320.ip-37-187-162.eu | FR |
37.187.162.126 | ns335800.ip-37-187-162.eu | FR |
37.187.165.195 | ns337541.ip-37-187-165.eu | FR |
51.91.136.171 | crawler6.paper.li | FR |
37.187.165.31 | ns336613.ip-37-187-165.eu | FR |
IP地址(28) | 服务器名称 | 所属国家 |
---|---|---|
37.187.162.183 | ns338311.ip-37-187-162.eu | FR |
37.187.162.185 | ns338313.ip-37-187-162.eu | FR |
37.187.162.193 | ns338321.ip-37-187-162.eu | FR |
37.187.162.184 | ns338312.ip-37-187-162.eu | FR |
37.187.165.31 | ns336613.ip-37-187-165.eu | FR |
37.187.162.192 | ns338320.ip-37-187-162.eu | FR |
37.187.162.187 | ns338315.ip-37-187-162.eu | FR |
37.187.162.191 | ns338319.ip-37-187-162.eu | FR |
37.187.162.178 | ns338306.ip-37-187-162.eu | FR |
37.187.162.186 | ns338314.ip-37-187-162.eu | FR |
IP地址(4) | 服务器名称 | 所属国家 |
---|---|---|
5.135.140.29 | ns2309991.ip-5-135-140.eu | FR |
5.135.138.175 | ns2307208.ip-5-135-138.eu | FR |
5.135.139.138 | ns2308071.ip-5-135-139.eu | FR |
5.135.139.114 | ns2308047.ip-5-135-139.eu | FR |
对于未知蜘蛛或者爬虫。它的用途对网站来说可能是好的,也可能是坏的,这取决于它是什么。所以说,这需要站长进一步分析判断这些尚不明确的爬虫行为,再作最终决定。 但,根据以往的经验,未声明行为目的及未命名的蜘蛛爬虫,通常都有不可告人的秘密,我们理应对其行为进行控制,比如拦截。
您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 PaperLiBot 或限制其访问权限。我们建议安装 Spider Analyser 插件,以检查它是否真正遵循这些规则。
# robots.txt # 下列代码一般情况可以拦截该代理 User-agent: PaperLiBot Disallow: /
您无需手动执行此操作,可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。
PaperLiBot是Paper.li的网络爬虫的通用名称。
Paper.li是一项内容策划服务,让你把社会共享的内容变成美丽的在线报纸和通讯。
PaperLiBot可能因为以下原因开始抓取你的网站:
您的内容可能被包含在Paper.li的一篇或多篇论文中。这些内容可以在论文网页上看到,也可以包含在电子邮件通讯和社会宣传中(Twitter、Facebook和LinkedIn)。
当您的内容被收录时,将采取以下格式:
当PaperLiBot爬虫访问您的网站时,它将发送一个有效的用户代理头,并从Paper.li的基础设施连接。
PaperLiBot的用户代理是:
Mozilla/5.0 (compatible; PaperLiBot/2.1; https://support.paper.li/entries/20023257-what-is-paper-li)
PaperLiBot被设计为同时在多台不同的机器上运行以提高性能和规模。因此,您的日志可能会显示来自我们基础设施内的几台机器的访问,我们的基础设施托管在OVHcloud(欧洲)和亚马逊网络服务(美国)。
PaperLiBot通常平均每几秒钟访问你的网站不超过一次。然而,由于社会媒体内容的病毒性质,有可能在短期内出现稍高的比率。
如果您想阻止PaperLiBot抓取您网站上的内容,请与Paper.li联系,以便Paper.li将您的网站添加到Paper.li的封锁名单中,并阻止未来的内容被纳入Paper.li服务中。