Scrapy
Scrapy蜘蛛/爬虫属于爬虫类型,由Zyte开发运行。您可以继续阅读下方信息,以深入了解Scrapy基本信息,用户代理和访问控制等。
基本信息
Scrapy的基本信息如下表。但部分不是很规范的蜘蛛和爬虫,可能存在信息不明的情况。
- 蜘蛛/爬虫名称
- Scrapy
- 类型
- 爬虫
- 开发商
-
Zyte
- 当前状态
-
活动
用户代理
关于Scrapy蜘蛛或者爬虫的用户代理字符串,IP地址和服务器,所在地等信息如下表格所示:
Scrapy/2.11.2
-
Scrapy/2.11.2
-
Scrapy/2.11.1
-
Scrapy/2.6.3
-
Scrapy/2.8.0
-
Scrapy/2.0.1
-
Scrapy/2.11.0
-
Scrapy/1.7.3
-
Scrapy/2.9.0
-
Scrapy/1.7.4
-
Scrapy/2.10.0
-
Scrapy/2.6.1
-
Scrapy/2.6.2
-
Scrapy/2.7.1
-
Scrapy/2.4.1
-
Scrapy/2.5.1
-
Scrapy/1.1.3
-
Scrapy/1.5.1
-
Scrapy/2.5.0
-
Scrapy/1.5.0
-
Scrapy/2.2.1
-
Scrapy/2.3.0
-
Scrapy/1.8.0
-
Scrapy/1.6.0
-
Scrapy/2.2.0
-
Scrapy/2.1.0
-
Scrapy/1.7.2
-
Scrapy/1.4.0
-
Scrapy/1.0.5
-
Scrapy/1.7.1
-
Scrapy/1.5.2
-
Scrapy/1.0.3
-
Scrapy/1.3.0
-
Scrapy/1.1.2
-
Scrapy/1.3.2
-
Scrapy/1.3.3
-
Scrapy/0.16.5
-
Scrapy/0.24.5
-
Scrapy/1.2.2
-
Scrapy/1.0.5.post4
-
Scrapy/1.2.1
-
Scrapy/1.1.1
-
Scrapy/1.1.0
-
Scrapy/1.0.4
-
Scrapy/1.0.1
-
Scrapy/0.24.0
-
Scrapy/0.24.6
-
Scrapy/0.25.1
-
Scrapy/0.24.4
-
Scrapy/0.22.0
- 用户代理字符串
- Scrapy/2.11.2 (+https://scrapy.org)
- 首次出现
- 2024-06-28 05:06:35
- 最后出现
- 2025-01-09 08:23:21
- 遵循robots.txt
- 未知
- 来源
-
IP地址(7) |
服务器名称 |
所属国家 |
185.182.232.46 |
185.182.232.46 |
DE |
155.254.51.43 |
155.254.51.43 |
GB |
185.214.198.228 |
185.214.198.228 |
FR |
4.226.43.141 |
4.226.43.141 |
CH |
35.204.148.234 |
234.148.204.35.bc.googleusercontent.com |
NL |
34.147.120.7 |
7.120.147.34.bc.googleusercontent.com |
NL |
35.204.181.133 |
133.181.204.35.bc.googleusercontent.com |
NL |
- 用户代理字符串
- Scrapy/2.11.1 (+https://scrapy.org)
- 首次出现
- 2024-03-19 08:46:40
- 最后出现
- 2024-12-26 08:09:56
- 遵循robots.txt
- 未知
- 来源
-
IP地址(10) |
服务器名称 |
所属国家 |
91.107.213.136 |
static.136.213.107.91.clients.your-server.de |
DE |
162.55.168.120 |
static.120.168.55.162.clients.your-server.de |
DE |
49.13.139.227 |
static.227.139.13.49.clients.your-server.de |
DE |
116.202.100.106 |
static.106.100.202.116.clients.your-server.de |
DE |
188.34.167.47 |
static.47.167.34.188.clients.your-server.de |
DE |
49.13.126.20 |
static.20.126.13.49.clients.your-server.de |
DE |
128.140.85.122 |
static.122.85.140.128.clients.your-server.de |
DE |
49.13.53.188 |
static.188.53.13.49.clients.your-server.de |
DE |
47.236.177.76 |
47.236.177.76 |
SG |
51.178.26.232 |
vps-0cd8feaf.vps.ovh.net |
FR |
- 用户代理字符串
- Scrapy/2.6.3 (+https://scrapy.org)
- 首次出现
- 2023-08-03 18:44:39
- 最后出现
- 2024-10-25 06:06:52
- 遵循robots.txt
- 未知
- 来源
-
IP地址(2) |
服务器名称 |
所属国家 |
34.29.54.138 |
138.54.29.34.bc.googleusercontent.com |
US |
199.223.234.1 |
1.234.223.199.bc.googleusercontent.com |
US |
- 用户代理字符串
- Scrapy/2.8.0 (+https://scrapy.org)
- 首次出现
- 2023-02-05 22:33:02
- 最后出现
- 2024-09-16 20:26:27
- 遵循robots.txt
- 未知
- 来源
-
IP地址(20) |
服务器名称 |
所属国家 |
89.24.145.140 |
89-24-145-140.customers.tmcz.cz |
CZ |
171.221.61.96 |
171.221.61.96 |
CN |
192.9.248.72 |
? |
US |
34.27.23.105 |
105.23.27.34.bc.googleusercontent.com |
US |
104.154.228.190 |
190.228.154.104.bc.googleusercontent.com |
US |
35.192.116.164 |
164.116.192.35.bc.googleusercontent.com |
US |
35.224.118.65 |
65.118.224.35.bc.googleusercontent.com |
US |
35.192.40.136 |
136.40.192.35.bc.googleusercontent.com |
US |
34.41.63.205 |
205.63.41.34.bc.googleusercontent.com |
US |
34.170.34.250 |
250.34.170.34.bc.googleusercontent.com |
US |
34.69.163.244 |
244.163.69.34.bc.googleusercontent.com |
US |
34.29.13.147 |
147.13.29.34.bc.googleusercontent.com |
US |
34.170.11.231 |
231.11.170.34.bc.googleusercontent.com |
US |
35.202.239.24 |
24.239.202.35.bc.googleusercontent.com |
US |
34.135.125.76 |
76.125.135.34.bc.googleusercontent.com |
US |
34.135.155.68 |
68.155.135.34.bc.googleusercontent.com |
US |
34.71.173.104 |
104.173.71.34.bc.googleusercontent.com |
US |
34.123.92.193 |
193.92.123.34.bc.googleusercontent.com |
US |
34.42.253.119 |
119.253.42.34.bc.googleusercontent.com |
US |
134.169.32.5 |
134.169.32.5 |
DE |
- 用户代理字符串
- Scrapy/2.0.1 (+https://scrapy.org)
- 首次出现
- 2024-04-27 23:11:01
- 最后出现
- 2024-05-21 03:56:46
- 遵循robots.txt
- 未知
- 来源
-
IP地址(5) |
服务器名称 |
所属国家 |
138.201.57.139 |
static.139.57.201.138.clients.your-server.de |
DE |
88.99.214.242 |
static.242.214.99.88.clients.your-server.de |
DE |
5.9.90.24 |
static.24.90.9.5.clients.your-server.de |
DE |
136.243.134.82 |
static.82.134.243.136.clients.your-server.de |
DE |
148.251.133.219 |
static.219.133.251.148.clients.your-server.de |
DE |
- 用户代理字符串
- Scrapy/2.11.0 (+https://scrapy.org)
- 首次出现
- 2024-01-04 09:09:43
- 最后出现
- 2024-05-16 09:11:31
- 遵循robots.txt
- 未知
- 来源
-
IP地址(5) |
服务器名称 |
所属国家 |
112.49.240.214 |
112.49.240.214 |
CN |
223.73.191.20 |
223.73.191.20 |
CN |
222.185.36.65 |
222.185.36.65 |
CN |
77.181.127.82 |
dynamic-077-181-127-082.77.181.pool.telefonica.de |
DE |
49.37.117.241 |
49.37.117.241 |
IN |
- 用户代理字符串
- Scrapy/1.7.3 (+https://scrapy.org)
- 首次出现
- 2019-08-16 06:35:10
- 最后出现
- 2024-03-16 08:02:20
- 遵循robots.txt
- 未知
- 来源
-
IP地址(8) |
服务器名称 |
所属国家 |
154.19.200.18 |
154.19.200.18 |
US |
27.224.137.106 |
27.224.137.106 |
CN |
124.160.236.43 |
124.160.236.43 |
CN |
78.47.48.49 |
? |
DE |
128.91.91.211 |
hpcc017.wharton.upenn.edu |
US |
128.91.88.38 |
hpcc032.wharton.upenn.edu |
US |
38.242.214.236 |
vmi888550.contaboserver.net |
DE |
38.242.214.232 |
vmi888549.contaboserver.net |
DE |
- 用户代理字符串
- Scrapy/2.9.0 (+https://scrapy.org)
- 首次出现
- 2023-07-08 12:50:36
- 最后出现
- 2024-02-22 05:43:33
- 遵循robots.txt
- 未知
- 来源
-
IP地址(5) |
服务器名称 |
所属国家 |
150.109.18.41 |
150.109.18.41 |
SG |
54.152.101.126 |
ec2-54-152-101-126.compute-1.amazonaws.com |
US |
154.13.203.88 |
154.13.203.88 |
US |
52.128.13.174 |
52.128.13.174 |
US |
3.73.63.44 |
ec2-3-73-63-44.eu-central-1.compute.amazonaws.com |
DE |
- 用户代理字符串
- Scrapy/1.7.4 (+https://scrapy.org)
- 首次出现
- 2021-03-28 12:45:23
- 最后出现
- 2023-09-15 03:34:15
- 遵循robots.txt
- 未知
- 来源
-
IP地址(5) |
服务器名称 |
所属国家 |
95.216.173.132 |
static.132.173.216.95.clients.your-server.de |
FI |
95.216.173.189 |
static.189.173.216.95.clients.your-server.de |
FI |
65.21.253.28 |
static.28.253.21.65.clients.your-server.de |
FI |
88.99.170.66 |
static.66.170.99.88.clients.your-server.de |
DE |
116.203.206.201 |
static.201.206.203.116.clients.your-server.de |
DE |
- 用户代理字符串
- Scrapy/2.10.0 (+https://scrapy.org)
- 首次出现
- 2023-08-27 17:31:21
- 最后出现
- 2023-08-27 17:31:21
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
176.42.28.173 |
176.42.28.173 |
TR |
- 用户代理字符串
- Scrapy/2.6.1 (+https://scrapy.org)
- 首次出现
- 2022-03-26 07:45:49
- 最后出现
- 2023-04-11 07:34:22
- 遵循robots.txt
- 未知
- 来源
-
IP地址(8) |
服务器名称 |
所属国家 |
23.247.47.198 |
23.247.47.198 |
US |
104.154.180.126 |
126.180.154.104.bc.googleusercontent.com |
US |
173.212.239.43 |
173.212.239.43 |
DE |
95.216.46.199 |
static.199.46.216.95.clients.your-server.de |
FI |
45.9.88.123 |
45.9.88.123 |
RU |
37.35.43.58 |
37.35.43.58 |
IT |
154.194.8.121 |
154.194.8.121 |
FR |
52.72.8.185 |
ec2-52-72-8-185.compute-1.amazonaws.com |
US |
- 用户代理字符串
- Scrapy/2.6.2 (+https://scrapy.org)
- 首次出现
- 2023-01-22 19:28:46
- 最后出现
- 2023-03-26 23:16:58
- 遵循robots.txt
- 未知
- 来源
-
IP地址(2) |
服务器名称 |
所属国家 |
61.135.204.194 |
61.135.204.194 |
CN |
46.2.14.184 |
? |
TR |
- 用户代理字符串
- Scrapy/2.7.1 (+https://scrapy.org)
- 首次出现
- 2023-01-29 23:30:42
- 最后出现
- 2023-02-02 13:18:10
- 遵循robots.txt
- 未知
- 来源
-
IP地址(2) |
服务器名称 |
所属国家 |
90.154.10.130 |
90.154.10.130 |
RU |
79.110.55.10 |
79.110.55.10 |
KR |
- 用户代理字符串
- Scrapy/2.4.1 (+https://scrapy.org)
- 首次出现
- 2021-03-25 04:33:03
- 最后出现
- 2022-10-20 07:16:34
- 遵循robots.txt
- 未知
- 来源
-
IP地址(4) |
服务器名称 |
所属国家 |
52.72.8.185 |
ec2-52-72-8-185.compute-1.amazonaws.com |
US |
142.255.86.85 |
cpe-142-255-86-85.nyc.res.rr.com |
US |
175.102.16.34 |
175.102.16.34 |
CN |
183.253.10.84 |
183.253.10.84 |
CN |
- 用户代理字符串
- Scrapy/2.5.1 (+https://scrapy.org),gzip(gfe)
- 首次出现
- 2022-10-17 10:38:17
- 最后出现
- 2022-10-17 10:38:17
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
118.166.228.227 |
118-166-228-227.dynamic-ip.hinet.net |
TW |
88.99.214.242 |
static.242.214.99.88.clients.your-server.de |
DE |
194.15.127.107 |
194.15.127.107 |
RU |
45.9.88.123 |
45.9.88.123 |
RU |
3.123.200.64 |
ec2-3-123-200-64.eu-central-1.compute.amazonaws.com |
DE |
62.76.155.21 |
62.76.155.21 |
RU |
52.72.8.185 |
ec2-52-72-8-185.compute-1.amazonaws.com |
US |
14.139.127.131 |
14.139.127.131 |
IN |
176.103.91.127 |
176.103.91.127 |
RU |
34.85.151.35 |
35.151.85.34.bc.googleusercontent.com |
US |
66.249.81.109 |
google-proxy-66-249-81-109.google.com |
US |
193.232.205.105 |
193.232.205.105 |
RU |
212.193.168.225 |
212.193.168.225 |
RU |
62.76.7.12 |
62.76.7.12 |
RU |
45.147.0.40 |
45.147.0.40 |
RU |
62.76.155.146 |
62.76.155.146 |
RU |
45.139.126.183 |
45.139.126.183 |
RU |
45.139.55.19 |
45.139.55.19 |
RU |
94.158.189.159 |
94.158.189.159 |
SC |
194.226.123.223 |
194.226.123.223 |
RU |
45.146.168.134 |
45.146.168.134 |
RU |
45.130.144.233 |
45.130.144.233 |
RU |
195.19.169.199 |
195.19.169.199 |
RU |
45.153.52.77 |
45.153.52.77 |
RU |
45.154.163.170 |
45.154.163.170 |
RU |
77.83.80.207 |
77.83.80.207 |
RU |
212.193.187.8 |
212.193.187.8 |
RU |
45.142.73.232 |
45.142.73.232 |
RU |
193.232.204.171 |
193.232.204.171 |
RU |
85.142.42.20 |
85.142.42.20 |
RU |
84.54.29.239 |
84.54.29.239 |
RU |
212.193.184.172 |
212.193.184.172 |
RU |
- 用户代理字符串
- Scrapy/1.1.3 (+http://scrapy.org)
- 首次出现
- 2018-03-10 17:09:30
- 最后出现
- 2022-08-29 20:04:55
- 遵循robots.txt
- 未知
- 来源
-
IP地址(8) |
服务器名称 |
所属国家 |
88.99.0.174 |
static.174.0.99.88.clients.your-server.de |
DE |
148.251.144.116 |
static.116.144.251.148.clients.your-server.de |
DE |
46.4.114.158 |
static.158.114.4.46.clients.your-server.de |
DE |
116.202.83.62 |
? |
DE |
88.99.164.194 |
? |
DE |
138.201.34.140 |
? |
DE |
195.201.85.124 |
? |
DE |
138.201.36.40 |
? |
DE |
- 用户代理字符串
- Scrapy/1.5.1 (+https://scrapy.org)
- 首次出现
- 2018-09-05 13:34:29
- 最后出现
- 2021-12-09 04:54:59
- 遵循robots.txt
- 未知
- 来源
-
IP地址(21) |
服务器名称 |
所属国家 |
13.56.111.204 |
ec2-13-56-111-204.us-west-1.compute.amazonaws.com |
US |
54.172.91.236 |
ec2-54-172-91-236.compute-1.amazonaws.com |
US |
121.156.47.204 |
? |
KR |
195.3.144.210 |
colo-200.altnet.lv |
LV |
189.120.120.204 |
bd7878cc.virtua.com.br |
BR |
195.3.144.185 |
colo-185.altnet.lv |
LV |
83.137.2.249 |
? |
GB |
78.145.209.112 |
host-78-145-209-112.as13285.net |
GB |
208.110.66.34 |
? |
US |
188.92.74.189 |
? |
LV |
- 用户代理字符串
- Scrapy/2.5.0 (+https://scrapy.org)
- 首次出现
- 2021-08-10 20:54:06
- 最后出现
- 2021-11-24 23:39:36
- 遵循robots.txt
- 未知
- 来源
-
IP地址(3) |
服务器名称 |
所属国家 |
185.58.206.67 |
ih2083552.ihor-dedic.ru |
RU |
137.184.96.247 |
137.184.96.247 |
US |
35.223.102.40 |
40.102.223.35.bc.googleusercontent.com |
US |
- 用户代理字符串
- Scrapy/1.5.0 (+https://scrapy.org)
- 首次出现
- 2018-01-15 20:38:07
- 最后出现
- 2021-07-29 22:13:37
- 遵循robots.txt
- 否
- 来源
-
IP地址(27) |
服务器名称 |
所属国家 |
100.25.46.189 |
ec2-100-25-46-189.compute-1.amazonaws.com |
US |
54.152.77.31 |
ec2-54-152-77-31.compute-1.amazonaws.com |
US |
52.86.112.146 |
ec2-52-86-112-146.compute-1.amazonaws.com |
US |
13.56.179.125 |
ec2-13-56-179-125.us-west-1.compute.amazonaws.com |
US |
104.144.97.164 |
? |
US |
52.193.88.113 |
ec2-52-193-88-113.ap-northeast-1.compute.amazonaws.com |
JP |
34.232.52.147 |
ec2-34-232-52-147.compute-1.amazonaws.com |
US |
121.156.47.204 |
? |
KR |
35.193.175.92 |
? |
US |
54.236.48.97 |
ec2-54-236-48-97.compute-1.amazonaws.com |
US |
- 用户代理字符串
- Scrapy/2.2.1 (+https://scrapy.org)
- 首次出现
- 2021-01-28 17:17:23
- 最后出现
- 2021-01-28 17:17:23
- 遵循robots.txt
- 未知
- 来源
-
IP地址(2) |
服务器名称 |
所属国家 |
34.76.170.167 |
167.170.76.34.bc.googleusercontent.com |
US |
34.76.224.176 |
176.224.76.34.bc.googleusercontent.com |
US |
- 用户代理字符串
- Scrapy/2.3.0 (+https://scrapy.org)
- 首次出现
- 2020-11-07 05:39:00
- 最后出现
- 2021-01-04 07:55:09
- 遵循robots.txt
- 未知
- 来源
-
IP地址(2) |
服务器名称 |
所属国家 |
2a01:4f9:c010:eaec::1 |
2a01:4f9:c010:eaec::1 |
DE |
51.15.119.74 |
74-119-15-51.instances.scw.cloud |
FR |
- 用户代理字符串
- Scrapy/1.8.0 (+https://scrapy.org)
- 首次出现
- 2019-11-11 05:12:58
- 最后出现
- 2021-01-03 04:29:13
- 遵循robots.txt
- 未知
- 来源
-
IP地址(7) |
服务器名称 |
所属国家 |
107.178.236.15 |
15.236.178.107.gae.googleusercontent.com |
US |
35.202.86.46 |
46.86.202.35.bc.googleusercontent.com |
US |
47.89.225.105 |
? |
US |
160.114.55.188 |
rgai3.inf.u-szeged.hu |
HU |
123.25.21.157 |
mail.soft365.com.vn |
VN |
14.238.15.74 |
static.vnpt.vn |
VN |
47.90.241.157 |
47.90.241.157 |
US |
- 用户代理字符串
- Scrapy/1.6.0 (+https://scrapy.org)
- 首次出现
- 2019-02-04 21:58:11
- 最后出现
- 2020-10-19 13:26:38
- 遵循robots.txt
- 未知
- 来源
-
IP地址(62) |
服务器名称 |
所属国家 |
138.201.35.152 |
static.152.35.201.138.clients.your-server.de |
DE |
138.201.36.40 |
static.40.36.201.138.clients.your-server.de |
DE |
80.211.112.51 |
host51-112-211-80.serverdedicati.aruba.it |
IT |
39.100.157.53 |
? |
CN |
39.100.156.45 |
? |
CN |
93.137.135.119 |
93-137-135-119.adsl.net.t-com.hr |
HR |
47.92.141.136 |
? |
CN |
39.100.121.198 |
? |
CN |
47.92.96.33 |
? |
CN |
39.100.156.237 |
? |
CN |
- 用户代理字符串
- Scrapy/2.2.0 (+https://scrapy.org)
- 首次出现
- 2020-07-06 11:04:52
- 最后出现
- 2020-07-06 11:12:46
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
185.153.151.34 |
185.153.151.34 |
LU |
- 用户代理字符串
- Scrapy/2.1.0 (+https://scrapy.org)
- 首次出现
- 2020-07-01 14:16:52
- 最后出现
- 2020-07-01 14:52:14
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
82.102.19.196 |
ncopus196.niliny.pw |
BE |
- 用户代理字符串
- Scrapy/1.7.2 (+https://scrapy.org)
- 首次出现
- 2019-10-17 16:38:47
- 最后出现
- 2020-06-25 04:38:18
- 遵循robots.txt
- 未知
- 来源
-
IP地址(2) |
服务器名称 |
所属国家 |
176.74.192.99 |
hbase7.domaincrawler.com |
SE |
176.74.199.2 |
? |
SE |
- 用户代理字符串
- Scrapy/1.4.0 (+http://scrapy.org)
- 首次出现
- 2017-07-28 16:43:00
- 最后出现
- 2020-01-13 13:16:28
- 遵循robots.txt
- 否
- 来源
-
IP地址(51) |
服务器名称 |
所属国家 |
36.226.224.37 |
36-226-224-37.dynamic-ip.hinet.net |
TW |
36.227.109.231 |
36-227-109-231.dynamic-ip.hinet.net |
TW |
36.224.51.7 |
36-224-51-7.dynamic-ip.hinet.net |
TW |
36.226.231.20 |
36-226-231-20.dynamic-ip.hinet.net |
TW |
36.228.229.79 |
36-228-229-79.dynamic-ip.hinet.net |
TW |
36.228.229.94 |
36-228-229-94.dynamic-ip.hinet.net |
TW |
36.226.224.54 |
36-226-224-54.dynamic-ip.hinet.net |
TW |
36.228.225.171 |
36-228-225-171.dynamic-ip.hinet.net |
TW |
36.228.224.131 |
36-228-224-131.dynamic-ip.hinet.net |
TW |
36.226.230.208 |
36-226-230-208.dynamic-ip.hinet.net |
TW |
- 用户代理字符串
- Scrapy/1.0.5 (+http://scrapy.org)
- 首次出现
- 2016-02-12 15:26:00
- 最后出现
- 2019-12-30 08:01:46
- 遵循robots.txt
- 否
- 来源
-
IP地址(12) |
服务器名称 |
所属国家 |
136.243.11.22 |
? |
DE |
78.46.88.202 |
? |
DE |
136.243.76.224 |
? |
DE |
58.246.174.26 |
? |
CN |
52.198.176.249 |
ec2-52-198-176-249.ap-northeast-1.compute.amazonaws.com |
JP |
52.196.217.192 |
ec2-52-196-217-192.ap-northeast-1.compute.amazonaws.com |
JP |
52.201.250.99 |
ec2-52-201-250-99.compute-1.amazonaws.com |
US |
52.68.41.151 |
ec2-52-68-41-151.ap-northeast-1.compute.amazonaws.com |
JP |
164.132.160.129 |
ns3035942.ip-164-132-160.eu |
FR |
93.186.148.94 |
93.186.148.94-ifnl.net |
GB |
- 用户代理字符串
- Scrapy/1.7.1 (+https://scrapy.org)
- 首次出现
- 2019-08-06 08:42:08
- 最后出现
- 2019-08-27 11:30:05
- 遵循robots.txt
- 未知
- 来源
-
IP地址(2) |
服务器名称 |
所属国家 |
147.92.33.234 |
147.92.33.234 |
HK |
8.44.182.23 |
? |
US |
- 用户代理字符串
- Scrapy/1.5.2 (+https://scrapy.org)
- 首次出现
- 2019-02-03 19:06:16
- 最后出现
- 2019-07-07 06:18:17
- 遵循robots.txt
- 未知
- 来源
-
IP地址(3) |
服务器名称 |
所属国家 |
130.203.136.75 |
? |
US |
185.47.220.131 |
? |
CZ |
188.175.125.148 |
188.175.125.148 |
CZ |
- 用户代理字符串
- Scrapy/1.0.3 (+http://scrapy.org)
- 首次出现
- 2015-12-14 08:00:00
- 最后出现
- 2018-05-11 07:16:04
- 遵循robots.txt
- 否
- 来源
-
IP地址(21) |
服务器名称 |
所属国家 |
54.160.194.98 |
ec2-54-160-194-98.compute-1.amazonaws.com |
US |
61.164.42.140 |
? |
CN |
139.59.29.77 |
? |
IN |
52.88.187.57 |
ec2-52-88-187-57.us-west-2.compute.amazonaws.com |
US |
108.61.242.65 |
108.61.242.65.vultr.com |
US |
46.166.188.231 |
? |
NL |
52.40.148.43 |
ec2-52-40-148-43.us-west-2.compute.amazonaws.com |
US |
54.69.99.109 |
ec2-54-69-99-109.us-west-2.compute.amazonaws.com |
US |
108.83.93.215 |
108-83-93-215.lightspeed.wepbfl.sbcglobal.net |
US |
108.61.205.28 |
108.61.205.28.vultr.com |
US |
- 用户代理字符串
- Scrapy/1.3.0 (+http://scrapy.org)
- 首次出现
- 2017-01-30 01:37:54
- 最后出现
- 2018-04-27 06:46:07
- 遵循robots.txt
- 未知
- 来源
-
IP地址(5) |
服务器名称 |
所属国家 |
13.57.36.202 |
ec2-13-57-36-202.us-west-1.compute.amazonaws.com |
US |
104.218.141.98 |
? |
US |
23.106.83.199 |
? |
US |
23.81.67.216 |
? |
US |
136.243.66.162 |
? |
DE |
- 用户代理字符串
- Scrapy/1.1.2 (+http://scrapy.org)
- 首次出现
- 2016-09-10 01:45:54
- 最后出现
- 2018-03-19 11:01:04
- 遵循robots.txt
- 未知
- 来源
-
IP地址(8) |
服务器名称 |
所属国家 |
13.113.121.129 |
ec2-13-113-121-129.ap-northeast-1.compute.amazonaws.com |
JP |
52.197.188.46 |
ec2-52-197-188-46.ap-northeast-1.compute.amazonaws.com |
JP |
52.68.219.226 |
ec2-52-68-219-226.ap-northeast-1.compute.amazonaws.com |
JP |
13.113.12.64 |
ec2-13-113-12-64.ap-northeast-1.compute.amazonaws.com |
JP |
52.199.78.154 |
ec2-52-199-78-154.ap-northeast-1.compute.amazonaws.com |
JP |
52.199.104.67 |
ec2-52-199-104-67.ap-northeast-1.compute.amazonaws.com |
JP |
52.43.49.188 |
ec2-52-43-49-188.us-west-2.compute.amazonaws.com |
US |
52.25.226.122 |
ec2-52-25-226-122.us-west-2.compute.amazonaws.com |
US |
- 用户代理字符串
- Scrapy/1.3.2 (+http://scrapy.org)
- 首次出现
- 2017-12-20 10:34:45
- 最后出现
- 2017-12-20 10:34:45
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
111.200.195.186 |
111.200.195.186 |
CN |
- 用户代理字符串
- Scrapy/1.3.3 (+http://scrapy.org)
- 首次出现
- 2017-02-08 11:05:24
- 最后出现
- 2017-11-07 09:12:10
- 遵循robots.txt
- 未知
- 来源
-
IP地址(8) |
服务器名称 |
所属国家 |
13.114.207.110 |
ec2-13-114-207-110.ap-northeast-1.compute.amazonaws.com |
JP |
52.196.202.55 |
ec2-52-196-202-55.ap-northeast-1.compute.amazonaws.com |
JP |
34.208.16.193 |
ec2-34-208-16-193.us-west-2.compute.amazonaws.com |
US |
107.23.10.123 |
ec2-107-23-10-123.compute-1.amazonaws.com |
US |
54.167.210.113 |
ec2-54-167-210-113.compute-1.amazonaws.com |
US |
176.27.243.42 |
b01bf32a.bb.sky.com |
GB |
124.72.95.10 |
? |
CN |
45.33.43.32 |
li993-32.members.linode.com |
US |
- 用户代理字符串
- Scrapy/0.16.5 (+http://scrapy.org)
- 首次出现
- 2016-08-18 20:17:35
- 最后出现
- 2017-08-16 09:26:14
- 遵循robots.txt
- 未知
- 来源
-
IP地址(2) |
服务器名称 |
所属国家 |
98.100.180.20 |
rrcs-98-100-180-20.central.biz.rr.com |
US |
67.53.77.196 |
rrcs-67-53-77-196.west.biz.rr.com |
US |
- 用户代理字符串
- Scrapy/0.24.5 (+http://scrapy.org)
- 首次出现
- 2014-12-19 09:53:17
- 最后出现
- 2017-04-14 00:30:33
- 遵循robots.txt
- 未知
- 来源
-
IP地址(5) |
服务器名称 |
所属国家 |
52.197.129.56 |
ec2-52-197-129-56.ap-northeast-1.compute.amazonaws.com |
JP |
52.69.69.138 |
ec2-52-69-69-138.ap-northeast-1.compute.amazonaws.com |
JP |
52.192.241.191 |
ec2-52-192-241-191.ap-northeast-1.compute.amazonaws.com |
JP |
107.23.56.124 |
ec2-107-23-56-124.compute-1.amazonaws.com |
US |
52.69.82.104 |
ec2-52-69-82-104.ap-northeast-1.compute.amazonaws.com |
JP |
- 用户代理字符串
- Scrapy/1.2.2 (+http://scrapy.org)
- 首次出现
- 2017-01-12 23:59:17
- 最后出现
- 2017-03-26 23:59:17
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
52.200.30.172 |
ec2-52-200-30-172.compute-1.amazonaws.com |
US |
- 用户代理字符串
- Scrapy/1.0.5.post4+g4b324a8 (+http://scrapy.org)
- 首次出现
- 2017-01-07 23:32:39
- 最后出现
- 2017-01-07 23:32:39
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
98.126.65.56 |
? |
US |
- 用户代理字符串
- Scrapy/1.2.1 (+http://scrapy.org)
- 首次出现
- 2016-11-09 23:25:03
- 最后出现
- 2016-12-13 16:37:29
- 遵循robots.txt
- 未知
- 来源
-
IP地址(3) |
服务器名称 |
所属国家 |
5.230.153.214 |
? |
GB |
178.18.151.162 |
? |
CZ |
54.213.151.77 |
ec2-54-213-151-77.us-west-2.compute.amazonaws.com |
US |
- 用户代理字符串
- Scrapy/1.1.1 (+http://scrapy.org)
- 首次出现
- 2016-09-11 07:43:33
- 最后出现
- 2016-12-04 14:34:58
- 遵循robots.txt
- 否
- 来源
-
IP地址(3) |
服务器名称 |
所属国家 |
138.201.52.218 |
? |
DE |
134.96.225.227 |
colossus02.cs.uni-saarland.de |
DE |
192.240.14.1 |
host01.fna.fujitsu.com |
US |
- 用户代理字符串
- Scrapy/1.1.0 (+http://scrapy.org)
- 首次出现
- 2016-06-12 20:00:00
- 最后出现
- 2016-09-01 16:03:46
- 遵循robots.txt
- 否
- 来源
-
IP地址(4) |
服务器名称 |
所属国家 |
138.201.57.140 |
? |
DE |
148.251.133.219 |
? |
DE |
192.240.14.1 |
host01.fna.fujitsu.com |
US |
92.249.223.121 |
92-249-223-121.pool.digikabel.hu |
HU |
- 用户代理字符串
- Scrapy/1.0.4 (+http://scrapy.org)
- 首次出现
- 2016-01-27 06:10:00
- 最后出现
- 2016-02-19 11:08:30
- 遵循robots.txt
- 未知
- 来源
-
IP地址(2) |
服务器名称 |
所属国家 |
103.14.245.38 |
103.14.245.38 |
SG |
219.92.50.109 |
gbk-50-109.tm.net.my |
MY |
- 用户代理字符串
- Scrapy/1.0.1 (+http://scrapy.org)
- 首次出现
- 2015-02-07 05:07:09
- 最后出现
- 2016-02-10 14:16:41
- 遵循robots.txt
- 未知
- 来源
-
IP地址(3) |
服务器名称 |
所属国家 |
194.150.168.95 |
kaputte.li |
DE |
46.105.110.61 |
ns3435966.ip-46-105-110.eu |
FR |
158.69.26.33 |
ns517020.ip-158-69-26.net |
CA |
- 用户代理字符串
- Scrapy/0.24.0 (+http://scrapy.org)
- 首次出现
- 2014-08-08 09:15:00
- 最后出现
- 2015-12-05 09:29:21
- 遵循robots.txt
- 未知
- 来源
-
IP地址(2) |
服务器名称 |
所属国家 |
114.212.190.201 |
cs-cloud.nju.edu.cn |
CN |
54.72.183.135 |
ec2-54-72-183-135.eu-west-1.compute.amazonaws.com |
US |
- 用户代理字符串
- Scrapy/0.24.6 (+http://scrapy.org)
- 首次出现
- 2015-08-19 21:13:23
- 最后出现
- 2015-08-19 21:13:23
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
188.40.45.131 |
? |
DE |
- 用户代理字符串
- Scrapy/0.25.1 (+http://scrapy.org)
- 首次出现
- 2015-04-08 18:52:07
- 最后出现
- 2015-04-08 18:52:08
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
69.124.113.52 |
ool-457c7134.dyn.optonline.net |
US |
- 用户代理字符串
- Scrapy/0.24.4 (+http://scrapy.org)
- 首次出现
- 2015-12-01 07:19:29
- 最后出现
- 2014-12-10 23:03:17
- 遵循robots.txt
- 未知
- 来源
-
IP地址(2) |
服务器名称 |
所属国家 |
97.74.4.58 |
ip-97-74-4-58.ip.secureserver.net |
US |
54.72.183.135 |
ec2-54-72-183-135.eu-west-1.compute.amazonaws.com |
IE |
- 用户代理字符串
- Scrapy/0.22.2 (+http://scrapy.org)
- 首次出现
- 2014-02-18 10:40:06
- 最后出现
- 2014-06-18 20:56:00
- 遵循robots.txt
- 未知
- 来源
-
IP地址(2) |
服务器名称 |
所属国家 |
201.204.48.114 |
201.204.48.114 |
CR |
64.53.192.27 |
d53-64-27-192.nap.wideopenwest.com |
US |
访问控制
了解如何控制Scrapy访问权限,避免Scrapy抓取行为不当。
是否拦截Scrapy?
可以考虑拦截。。爬虫通常会下载公开的互联网内容,这些内容默认情况下可以免费访问。不过,如果你不希望你的内容被用于未经授权的目的,你应该拦截它们。
通过Robots.txt拦截
您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 Scrapy 或限制其访问权限。我们建议安装 Spider Analyser
插件,以检查它是否真正遵循这些规则。
# robots.txt
# 下列代码一般情况可以拦截该代理
User-agent: Scrapy
Disallow: /
您无需手动执行此操作,可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。
更多信息
一个开源的协作框架,用于从网站中提取你需要的数据。
以一种快速、简单而又可扩展的方式。
由Zyte(以前的Scrapinghub)和许多其他贡献者维护。