ImagesiftBot ImagesiftBot

蜘蛛/爬虫名称
ImagesiftBot
开发商
Castle Global, Inc.
官网
thehive.ai
当前状态
活动
  • ImagesiftBot
用户代理字符串
Mozilla/5.0 (compatible; ImagesiftBot; +imagesift.com)
类型
首次出现
2023-11-24 07:47:42
最后出现
2024-03-01 09:15:25
遵循robots.txt
IP地址
75
来源
IP地址 服务器名称 所属国家
64.124.8.60 ? US
64.124.8.25 ? US
64.124.8.52 ? US
64.124.8.24 ? US
64.124.8.62 ? US
64.124.8.81 ? US
64.124.8.94 ? US
64.124.8.83 ? US
64.124.8.50 ? US
64.124.8.93 ? US
64.124.8.46 ? US
64.124.8.89 64.124.8.89.available.above.net US
64.124.8.76 ? US
64.124.8.80 ? US
64.124.8.86 64.124.8.86.available.above.net US
64.124.8.75 ? ?
64.124.8.47 ? US
64.124.8.77 ? US
64.124.8.53 ? US
64.124.8.99 ? US
64.124.8.95 ? US
64.124.8.91 ? US
64.124.8.28 ? US
64.124.8.82 64.124.8.82.available.above.net US
64.124.8.54 ? US
64.124.8.66 ? US
64.124.8.74 ? US
64.124.8.32 ? US
64.124.8.90 ? US
64.124.8.68 ? US
64.124.8.39 ? US
64.124.8.56 ? US
64.124.8.30 smtp.actionet.com US
64.124.8.72 ? US
64.124.8.69 ? US
64.124.8.27 64.124.8.27.available.above.net US
64.124.8.44 ? US
64.124.8.85 ? US
64.124.8.36 ? US
64.124.8.33 ? US
64.124.8.96 ? ?
64.124.8.34 ? US
64.124.8.61 ? US
64.124.8.84 ? US
64.124.8.58 ? US
64.124.8.43 ? US
64.124.8.37 ? US
64.124.8.71 ? ?
64.124.8.40 ? US
64.124.8.48 ? US
64.124.8.88 ? US
64.124.8.35 ? US
64.124.8.23 ? US
64.124.8.51 ? US
64.124.8.31 ? US
64.124.8.70 ? ?
64.124.8.49 ? US
64.124.8.65 ? US
64.124.8.59 ? US
64.124.8.67 ? US
64.124.8.78 ? US
64.124.8.29 ? US
64.124.8.55 ? US
64.124.8.87 ? ?
64.124.8.64 ? US
64.124.8.26 ? US
64.124.8.41 ? US
64.124.8.97 ? US
64.124.8.92 ? US
64.124.8.57 64.124.8.57.available.above.net US
64.124.8.98 ? US

ImageSiftBot 是一个网络爬虫,可以在互联网上抓取公开可用的图像,以支持 Imagesift 的网络智能产品套件。

来自 ImageSiftBot 的请求将用户代理设置为:

Mozilla/5.0 (compatible; ImagesiftBot; +imagesift.com)

常问问题

ImageSiftBot 是否遵循 Robots.txt 规则?

尊重 robots.txt 中针对 ImagesiftBot 的标准指令。例如,以下内容将允许 ImagesiftBot 抓取除 /private/ 下的页面之外的所有页面:

User-Agent: ImagesiftBot 
Allow: / 
Disallow: /private/

ImagesiftBot 还支持 robots.txt 文件中的抓取延迟指令。它将值解释为连续请求开始之间的最短持续时间(以秒为单位)。例如,假设您在 robots.txt 文件中指定了以下内容:

User-Agent: ImagesiftBot
Crawl-delay: 5

ImagesiftBot 会将每天分成 5 秒的时间间隔,并在每个时间间隔内最多向您的域发出一个请求。

如果没有针对 ImagesiftBot 的规则,但有针对 Googlebot 的规则,则 ImagesiftBot 将遵循 Googlebot 指令。例如,ImagesiftBot 将获取所有页面,除了 /private/ 下的页面,其中包含以下 robots.txt:

User-Agent: *
Disallow: /
User-Agent: Googlebot 
Allow: / 
Disallow: /private/

ImageSiftBot 保存哪些信息?

除了图像之外,ImageSiftBot 还保存以下信息:

  • 页面上的主机 URL 和文本
  • 与图像关联的替代文本

ImageSift 如何使用这些信息?

从网页下载图像和文本后,ImageSift 会分析该页面的数据并将信息存储在索引中。我们的网络智能产品使用此索引来搜索和检索类似图像。

关于 ImageSift

ImageSift 是一个允许用户从互联网上的各种来源搜索和发现图片的网站(反向图像搜索平台)。它为用户提供了一个根据自己的兴趣和喜好筛选和整理图片的平台。

有关 ImageSift 的更多信息,请访问其官方网站:https://www.imagesift.com/。

此外,您还可以查看其社交媒体页面,了解更新和新闻:

  • Twitter: https://twitter.com/imagesift
  • Facebook: https://www.facebook.com/ImageSift/

联系

如果您对 ImageSiftBot 有任何疑问或希望选择不被抓取,请通过电子邮件联系:support@imagesift.com

常见问题

FAQs
查看更多 >