LinkedInBot

蜘蛛/爬虫名称
LinkedInBot
开发商
LinkedIn Inc.
官网
www.linkedin.com
当前状态
活动
  • LinkedInBot/1.0
  • LinkedInBot/1.0
  • LinkedInBot/1.0
  • LinkedInBot/1.0
  • LinkedInBot/1.0
  • Catch crawler/1.0
  • libot/1.9
  • libot/1.9
用户代理字符串
LinkedInBot/1.0 (compatible; Mozilla/5.0; Jakarta Commons-HttpClient/4.3 +http://www.linkedin.com)
类型
营销
首次出现
2016-02-01 14:48:00
最后出现
2019-09-08 23:26:28
遵循robots.txt
IP地址
17
来源
IP地址 服务器名称 所属国家
108.174.8.21 108-174-8-21.fwd.linkedin.com US
144.2.2.50 ? US
108.174.2.214 108-174-2-214.fwd.linkedin.com US
108.174.5.112 108-174-5-112.fwd.linkedin.com US
108.174.5.117 108-174-5-117.fwd.linkedin.com US
108.174.2.200 108-174-2-200.fwd.linkedin.com US
108.174.5.123 108-174-5-123.fwd.linkedin.com US
108.174.8.17 108-174-8-17.fwd.linkedin.com US
108.174.5.114 108-174-5-114.fwd.linkedin.com US
108.174.8.18 108-174-8-18.fwd.linkedin.com US
用户代理字符串
LinkedInBot/1.0 (compatible; Mozilla/5.0; Jakarta Commons-HttpClient/3.1 +http://www.linkedin.com)/1.0 (LinkedInBot; https://www.linkedin.com/; omni-crawler@linkedin.com)
类型
营销
首次出现
2017-06-09 10:56:37
最后出现
2018-05-31 05:31:14
遵循robots.txt
IP地址
14
来源
IP地址 服务器名称 所属国家
54.67.45.158 ec2-54-67-45-158.us-west-1.compute.amazonaws.com US
52.53.204.77 ec2-52-53-204-77.us-west-1.compute.amazonaws.com US
52.53.175.56 ec2-52-53-175-56.us-west-1.compute.amazonaws.com US
54.193.75.91 ec2-54-193-75-91.us-west-1.compute.amazonaws.com US
52.53.156.183 ec2-52-53-156-183.us-west-1.compute.amazonaws.com US
54.183.144.30 ec2-54-183-144-30.us-west-1.compute.amazonaws.com US
54.183.188.202 ec2-54-183-188-202.us-west-1.compute.amazonaws.com US
54.193.114.69 ec2-54-193-114-69.us-west-1.compute.amazonaws.com US
54.183.224.227 ec2-54-183-224-227.us-west-1.compute.amazonaws.com US
54.67.67.3 ec2-54-67-67-3.us-west-1.compute.amazonaws.com US
用户代理字符串
LinkedInBot/1.0 (compatible; Mozilla/5.0; Jakarta Commons-HttpClient/3.1 +http://www.linkedin.com)
类型
营销
首次出现
2014-01-31 11:10:00
最后出现
2018-03-31 13:02:40
遵循robots.txt
IP地址
14
来源
IP地址 服务器名称 所属国家
108.174.8.21 108-174-8-21.fwd.linkedin.com US
2620:119:50c0:501::209a 2620:119:50c0:501::209a US
2620:119:50c0:501::2093 2620:119:50c0:501::2093 US
2620:119:50c0:501::2092 2620:119:50c0:501::2092 US
216.52.242.13 216-52-242-13.fwd.linkedin.com US
108.174.2.205 108-174-2-205.fwd.linkedin.com US
108.174.2.203 108-174-2-203.fwd.linkedin.com US
108.174.2.206 108-174-2-206.fwd.linkedin.com US
108.174.2.204 108-174-2-204.fwd.linkedin.com US
108.174.5.115 108-174-5-115.fwd.linkedin.com US
用户代理字符串
LinkedInBot/1.0 (compatible; Mozilla/5.0; Jakarta Commons-HttpClient/3.1 +http://www.linkedin.com)/1.0 (LinkedInBot; https://www.linkedin.com/; wkrupa@linkedin.com)
类型
营销
首次出现
2017-04-07 18:58:13
最后出现
2017-04-28 05:35:19
遵循robots.txt
IP地址
1
来源
IP地址 服务器名称 所属国家
108.174.5.112 108-174-5-112.fwd.linkedin.com US
108.174.8.21 108-174-8-21.fwd.linkedin.com US
108.174.8.20 108-174-8-20.fwd.linkedin.com US
108.174.5.123 108-174-5-123.fwd.linkedin.com US
108.174.8.27 108-174-8-27.fwd.linkedin.com US
108.174.2.216 108-174-2-216.fwd.linkedin.com US
108.174.2.215 108-174-2-215.fwd.linkedin.com US
108.174.5.113 108-174-5-113.fwd.linkedin.com US
108.174.8.23 108-174-8-23.fwd.linkedin.com US
108.174.8.22 108-174-8-22.fwd.linkedin.com US
108.174.2.214 108-174-2-214.fwd.linkedin.com US
144.2.2.50 ? US
108.174.5.117 108-174-5-117.fwd.linkedin.com US
108.174.2.200 108-174-2-200.fwd.linkedin.com US
108.174.8.17 108-174-8-17.fwd.linkedin.com US
108.174.5.114 108-174-5-114.fwd.linkedin.com US
108.174.8.18 108-174-8-18.fwd.linkedin.com US
54.67.45.158 ec2-54-67-45-158.us-west-1.compute.amazonaws.com US
52.53.204.77 ec2-52-53-204-77.us-west-1.compute.amazonaws.com US
52.53.175.56 ec2-52-53-175-56.us-west-1.compute.amazonaws.com US
54.193.75.91 ec2-54-193-75-91.us-west-1.compute.amazonaws.com US
52.53.156.183 ec2-52-53-156-183.us-west-1.compute.amazonaws.com US
54.183.144.30 ec2-54-183-144-30.us-west-1.compute.amazonaws.com US
54.183.188.202 ec2-54-183-188-202.us-west-1.compute.amazonaws.com US
54.193.114.69 ec2-54-193-114-69.us-west-1.compute.amazonaws.com US
54.183.224.227 ec2-54-183-224-227.us-west-1.compute.amazonaws.com US
54.67.67.3 ec2-54-67-67-3.us-west-1.compute.amazonaws.com US
2620:119:50c0:501::209a 2620:119:50c0:501::209a US
2620:119:50c0:501::2093 2620:119:50c0:501::2093 US
2620:119:50c0:501::2092 2620:119:50c0:501::2092 US
216.52.242.13 216-52-242-13.fwd.linkedin.com US
108.174.2.205 108-174-2-205.fwd.linkedin.com US
108.174.2.203 108-174-2-203.fwd.linkedin.com US
108.174.2.206 108-174-2-206.fwd.linkedin.com US
108.174.5.115 108-174-5-115.fwd.linkedin.com US
108.174.2.204 108-174-2-204.fwd.linkedin.com US
108.174.2.219 108-174-2-219.fwd.linkedin.com US
用户代理字符串
LinkedInBot/1.0 (compatible; Mozilla/5.0; Jakarta Commons-HttpClient/3.1 +http://www.linkedin.com)/1.0 (LinkedInBot; https://www.linkedin.com/; wkrupa@linkedin.com)
类型
营销
首次出现
2017-04-07 18:58:13
最后出现
2017-04-28 05:35:19
遵循robots.txt
IP地址
1
来源
IP地址 服务器名称 所属国家
54.183.224.227 ec2-54-183-224-227.us-west-1.compute.amazonaws.com US
用户代理字符串
Catch crawler/1.0 (Catch crawler; https://www.linkedin.com/; wkrupa@linkedin.com)
类型
营销
首次出现
2017-02-02 07:19:13
最后出现
2017-02-04 03:51:48
遵循robots.txt
IP地址
1
来源
IP地址 服务器名称 所属国家
54.183.224.227 ec2-54-183-224-227.us-west-1.compute.amazonaws.com US
用户代理字符串
LinkedInBot/1.0 (compatible; Mozilla/5.0; Apache-HttpClient +http://www.linkedin.com), libot/Nutch-1.9 (http://www.linkedin.com; libot@linkedin.com)
类型
营销
首次出现
2016-06-22 08:50:00
最后出现
2016-12-30 12:26:48
遵循robots.txt
IP地址
3
来源
IP地址 服务器名称 所属国家
108.174.5.117 108-174-5-117.fwd.linkedin.com US
108.174.5.115 108-174-5-115.fwd.linkedin.com US
108.174.5.116 108-174-5-116.fwd.linkedin.com US
用户代理字符串
LinkedInBot/1.0 (compatible; Mozilla/5.0; Apache-HttpClient +http://www.linkedin.com), libot/Nutch-1.9 (http://www.linkedin.com; libot@linkedin.com)
类型
营销
首次出现
2016-06-22 08:50:00
最后出现
2016-12-30 12:26:48
遵循robots.txt
IP地址
3
来源
IP地址 服务器名称 所属国家
108.174.5.117 108-174-5-117.fwd.linkedin.com US
108.174.5.115 108-174-5-115.fwd.linkedin.com US
108.174.5.116 108-174-5-116.fwd.linkedin.com US

通过查看其他人的资料,增加你在LinkedIn上的人脉和潜在的面试机会的可能性,提高你的个人资料的知名度。

关于

当你在LinkedIn上查看用户的资料时,他们会被通知你已经查看了他们的资料。这个机器人将允许你查看用户的资料,从而增加你在你建议的LinkedIn网络中的可见度。

LinkedInBot结果

Note

这个项目是一个修改和更新的版本,它是由很棒的helloitsimLInBot项目开发的。我发现他的资源库,并注意到在LinkedIn修改了他们的网站后,它已经过时了,需要一些更新。

要求

重要:确保你的个人资料查看设置从 “Anonymous”改为 “Public”,这样LinkedIn成员就可以看到你访问了他们,并可以访问你的个人资料作为回报。你还必须将你的语言设置改为英语

在你运行机器人之前,你需要安装一些Python的依赖项。运行pip3 install -r requirements.txt 来安装它们。

如果你打算使用Firefox(或Iceweasel),你不需要任何东西了。

对于Chrome,首先获得webdriver,然后把它放在与机器人相同的文件夹中(如果你在Windows上),或者在 /usr/bin 文件夹中(如果你在OS X上)。

PhantomJS:

  • 在Windows上,从官方网站下载二进制文件并将其放在与机器人相同的文件夹中。
  • 在OS X Yosemite上,PhantomJS团队提供的二进制文件不能工作(selenium.common.exceptions.WebDriverException.Selenium.common.exceptions.WebDriverException:Message: ‘Can not connect to GhostDriver’)。你可以自己编译它,或者下载超棒的eugene1g提供的二进制文件。然后把它放在 /usr/bin 文件夹中。
  • 对于Raspbian也是一样的:编译它并把它放在/usr/bin 文件夹中,或者下载由很棒的fg2it提供的二进制文件。

如果你想建立自己的二进制文件,这里有PhantomJS的构建说明

配置

Before you run the bot, create a .env file with the configuration of the script. This will include your account login information (email, password, etc.) and other logical values to make the bot more of your own. It’s that simple!

在你运行机器人之前,创建一个包含脚本配置的 .env 文件。这将包括你的账户登录信息(电子邮件、密码等)和其他逻辑值,以使机器人更符合你的要求。就这么简单!

# Configurable Constants
EMAIL = 'youremail@gmail.com'
PASSWORD = 'password'
VIEW_SPECIFIC_USERS = False
SPECIFIC_USERS_TO_VIEW = ['CEO', 'CTO', 'Developer', 'HR', 'Recruiter']
NUM_LAZY_LOAD_ON_MY_NETWORK_PAGE = 5
CONNECT_WITH_USERS = True
RANDOMIZE_CONNECTING_WITH_USERS = True
JOBS_TO_CONNECT_WITH = ['CEO', 'CTO', 'Developer', 'HR', 'Recruiter']
ENDORSE_CONNECTIONS = False
RANDOMIZE_ENDORSING_CONNECTIONS = True
VERBOSE = True

运行

一旦你安装了所需的依赖项,用你的数据创建了 .env 文件,你就可以运行机器人了。

确保你在正确的文件夹中并运行以下命令:python LinkedInBot.py

然后,在选择你喜欢的浏览器后,机器人将开始访问配置文件。

输出

LinkedInBot演示Gif

T: 机器人试图访问的档案数量。

V: 机器人实际访问的资料数量(你可以访问的资料:等级3或以下)。

Q: 队列中的资料数量。

潜在问题

  • 双因子认证
    解决方案。正在研究一个设置,给更多的时间来获得它,如果它被启用,你不能使用无头模式
  • 卡在 -> -> Scraping User URLs on Network tab.
    解决方案。我以前也遇到过这个问题,重启脚本通常会起作用。
  • LinkedIn的安全电子邮件
    你被发送了一个密码,以确保它真的是你,如果你不在无头模式下,可以输入密码,或者重新启动机器人。
    在这一点上,你最好谨慎行事,因为你的账户可能被标记并被监控。然而,我并不确定这一点。

免责声明

这里提到了使用机器人和抓取器的问题。使用这个机器人,风险自负。只是为了推动更多的知识,加州的一位法官裁定,他们不能禁止机器人(文章)。

注意

在过去的几年里,我对这个项目进行了严格的修改。其他人已经把它作为一个基础,并在此基础上开展工作。当我了解到更多关于其他人使用这个项目的工作时,我将在这里链接他们的项目。