TelegramBot

TelegramBot蜘蛛/爬蟲屬於資訊流型別,由Telegram Messenger LLP開發執行。您可以繼續閱讀下方資訊,以深入瞭解TelegramBot基本資訊,使用者代理和訪問控制等。

基本資訊

TelegramBot的基本資訊如下表。但部分不是很規範的蜘蛛和爬蟲,可能存在資訊不明的情況。
蜘蛛/爬蟲名稱
TelegramBot
型別
資訊流
開發商
Telegram Messenger LLP
當前狀態
活動

使用者代理

關於TelegramBot蜘蛛或者爬蟲的使用者代理字串,IP地址和伺服器,所在地等資訊如下表格所示:
TelegramBot
使用者代理字串
TelegramBot (like TwitterBot)
首次出現
2015-12-24 09:00:46
最後出現
2025-01-09 07:03:13
遵循robots.txt
來源
IP地址(70) 伺服器名稱 所屬國家
149.154.161.214 ? GB
149.154.161.236 149.154.161.236 GB
149.154.161.205 149.154.161.205 GB
149.154.161.15 ? GB
149.154.161.8 ? GB
149.154.161.17 ? GB
149.154.161.5 ? GB
149.154.161.14 ? GB
149.154.161.19 ? GB
149.154.161.18 ? GB
149.154.161.253 ip-149-154-161-253.ptr.telegram.org GB
149.154.161.232 ip-149-154-161-232.ptr.telegram.org GB
149.154.161.196 crawler.telegram.org GB
149.154.161.250 ip-149-154-161-250.ptr.telegram.org GB
149.154.161.215 ip-149-154-161-215.ptr.telegram.org GB
149.154.161.219 ip-149-154-161-219.ptr.telegram.org GB
149.154.161.198 ip-149-154-161-198.ptr.telegram.org GB
149.154.161.251 crawler.telegram.org GB
149.154.161.220 ip-149-154-161-220.ptr.telegram.org GB
149.154.161.197 ip-149-154-161-197.ptr.telegram.org GB
149.154.161.200 ip-149-154-161-200.ptr.telegram.org GB
149.154.161.245 ip-149-154-161-245.ptr.telegram.org GB
149.154.161.249 ip-149-154-161-249.ptr.telegram.org GB
149.154.161.212 ip-149-154-161-212.ptr.telegram.org GB
149.154.161.218 ip-149-154-161-218.ptr.telegram.org GB
149.154.161.213 ip-149-154-161-213.ptr.telegram.org GB
149.154.161.244 ip-149-154-161-244.ptr.telegram.org ?
149.154.161.221 ip-149-154-161-221.ptr.telegram.org GB
149.154.161.234 ip-149-154-161-234.ptr.telegram.org GB
149.154.161.252 crawler.telegram.org GB
149.154.161.201 ip-149-154-161-201.ptr.telegram.org GB
149.154.161.216 ip-149-154-161-216.ptr.telegram.org GB
149.154.161.247 ip-149-154-161-247.ptr.telegram.org GB
149.154.161.235 crawler.telegram.org GB
149.154.161.203 crawler.telegram.org GB
149.154.161.233 ip-149-154-161-233.ptr.telegram.org GB
149.154.161.231 ip-149-154-161-231.ptr.telegram.org GB
149.154.161.199 ip-149-154-161-199.ptr.telegram.org GB
149.154.161.204 crawler.telegram.org GB
149.154.161.246 ip-149-154-161-246.ptr.telegram.org GB
149.154.161.217 ip-149-154-161-217.ptr.telegram.org GB
149.154.161.248 ip-149-154-161-248.ptr.telegram.org GB
149.154.161.230 ip-149-154-161-230.ptr.telegram.org GB
149.154.161.202 ip-149-154-161-202.ptr.telegram.org GB

訪問控制

瞭解如何控制TelegramBot訪問許可權,避免TelegramBot抓取行為不當。

是否攔截TelegramBot?

通常不需要。除非您不希望資訊流網站或者APP對您的網站內容進行抓取,網站也不提供Feed訂閱服務,則可以考慮攔截此型別爬蟲。

通過Robots.txt攔截

您可以通過在網站的 robots.txt 中設定使用者代理訪問規則來遮蔽 TelegramBot 或限制其訪問許可權。我們建議安裝 Spider Analyser 外掛,以檢查它是否真正遵循這些規則。

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
# robots.txt
# 下列程式碼一般情況可以攔截該代理
User-agent: TelegramBot
Disallow: /
# robots.txt # 下列程式碼一般情況可以攔截該代理 User-agent: TelegramBot Disallow: /
# robots.txt
# 下列程式碼一般情況可以攔截該代理
User-agent: TelegramBot
Disallow: /

您無需手動執行此操作,可通過我們的 Wordpress 外掛 Spider Analyser 來攔截不必要的蜘蛛或者爬蟲。

更多資訊

一般問題

我如何建立一個機器人?

建立Telegram機器人是非常容易的,但你至少需要一些計算機程式設計技能。為了使機器人能夠正常工作,請在@BotFather設定一個機器人賬戶,然後通過我們的API將其連線到你的後臺伺服器。

不幸的是,如果你不是一個開發人員,沒有開箱即用的方法來建立一個工作的機器人。但我們相信,你很快就會發現有很多由其他人建立的機器人可以玩。

我是一個開發者。我在哪裡可以找到一些例子?

這裡有兩個機器人的例子,都是用PHP寫的:

  • Hello Bot 演示了Telegram機器人API的基礎知識。
  • Simple Poll bot 是一個更完整的例子,它支援長時間的投票和Webhooks的更新。

我們社羣的許多成員都在建立機器人併發布來源。
我們在這個頁面上收集了它們。

如果你已經建立了一個機器人並希望與他人分享,請在@BotSupport上與我們聯絡。

你會向機器人API新增X嗎?

機器人API仍然相當年輕。有許多潛在的功能需要考慮和實現。我們將在一段時間內研究人們用他們的機器人做什麼,看看哪些方向對平臺來說是最重要的。

歡迎所有機器人開發者與我們的@BotSupport賬戶分享對我們的機器人API的想法。

我的機器人會得到哪些資訊?

1. 所有機器人,無論設定如何,都會收到:

  • 所有的服務資訊。
  • 與使用者私下聊天的所有資訊。
  • 來自他們是成員的頻道的所有資訊。

2. 禁用隱私模式機器人管理員和機器人將收到所有的訊息,除了其他機器人傳送的訊息。

3. 啟用隱私模式的機器人將收到:

  • 如果該機器人是最後一個向群組傳送訊息的機器人,那麼來自使用者的一般命令(例如:/start)。
  • 通過這個機器人傳送的資訊。
  • 對任何隱含或明確針對該機器人的資訊的回覆。

請注意,每個特定的訊息在同一時間只能對一個啟用了隱私的機器人可用,即,對機器人A的回覆包含對機器人B的明確命令或通過機器人C傳送的訊息將只對機器人A可用,回覆具有最高的優先權。

為什麼我的機器人看不到其他機器人的資訊?

機器人之間的對話有可能陷入不受歡迎的迴圈中。為了避免這種情況,我們決定,無論何種模式,機器人都不能看到來自其他機器人的資訊。

獲得更新

我如何獲得更新?

目前有兩種獲得更新的方式。你可以使用長期輪詢或Webhooks。請注意,在設定了出站的Webhook的情況下,不可能通過長時間輪詢獲得更新。

長時間輪詢會讓我一次又一次地得到相同的更新!

getUpdates方法返回最早的100個未確認的更新。要確認一個更新,在呼叫getUpdates時使用offset引數,像這樣:

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
offset = update_id of last processed update + 1
offset = update_id of last processed update + 1
offset = update_id of last processed update + 1

所有update_id小於或等於offset的更新將在伺服器上被標記為確認,並不再被返回。

我在使用Webhooks時遇到了問題。

如果你已經成功設定了你的Webhook,但沒有得到任何更新,請記住:

  • 你需要一個有效的SSL證書才能讓Webhooks工作。
  • 要使用自簽名證書,你需要使用setWebhook中的證書引數上傳你的公鑰證書。請以輸入檔案的形式上傳,傳送一個字串將不起作用。
  • 目前支援Webhooks的埠:443, 80, 88, 8443.
  • 萬用字元證書可能不被支援。
  • 不支援重定向。
  • CN必須與你的域名完全匹配。

請檢視這個新的WEBHOOK指南,以瞭解關於WEBHOOK的所有知識!

我的自簽名證書有問題!

請看看我們專門為您製作的自簽名證書指南。如果你讀完後仍有問題,請在botsupport上與我們聯絡。

我怎樣才能確保Webhook請求來自Telegram?

如果你想確保Webhook請求來自Telegram,我們建議在你給我們的URL中使用一個祕密路徑,例如:www.example.com/your_token。因為沒有其他人知道你的機器人的令牌,所以你可以很確定是我們。

我怎樣才能在更新時提出請求?

如果你使用webhooks,這是有可能的。好處是你需要更少的請求,壞處是在這種情況下,不可能知道這樣的請求是否成功或得到其結果。

每當你收到一個webhook更新,你有兩個選擇:

1. 發出POST到https://api.telegram.org/bot<token>/方法

5c6d684ee0d6a4399d

2. 2. 直接回復並在回覆中給出方法作為JSON有效載荷

6cffad00cbe72be7f2

你可能還想看看我們的樣本HelloBot,它提供了一個這樣的PHP實現。

處理媒體

我如何下載檔案?

使用getFile方法。請注意,這隻對大小不超過20MB的檔案有效。

我如何上傳一個大檔案?

目前,機器人可以傳送大小不超過50MB的任何型別的檔案,所以是的,非常大的檔案目前還不能使用。對不起。這個限制在未來可能會被改變。

我可以指望file_ids是持久的嗎?

是的,file_ids可以被視為永續性的。

向使用者廣播

我的機器人遇到了限制,我如何避免這種情況?

當在一個特定的聊天室內傳送訊息時,避免每秒傳送超過一條訊息。我們可能會允許短時間內超過這個限制,但最終你會開始收到429錯誤。

如果您要向多個使用者批量傳送通知,API不允許每秒鐘超過30條左右的訊息。考慮將通知分散在8-12小時的大間隔內,以獲得最佳效果。

還要注意的是,你的機器人將不能每分鐘向同一群體傳送超過20條資訊。

我怎樣才能一次給我的機器人的所有使用者發資訊?

不幸的是,目前我們還沒有傳送批量資訊的方法,例如通知。我們可能會在未來新增一些類似的功能。

為了避免在群發通知時觸及我們的限制,可以考慮將它們分散在較長的時間間隔內,例如8-12小時。API不允許每秒鐘向超過30個使用者群發通知,如果你超過了,你將開始收到429個錯誤。

參見:如何避免觸及限制


如果你有本頁面沒有回答的問題,請在Telegram的@BotSupport上與Telegram聯絡。
Telegram歡迎對機器人平臺和API的任何建議。

常見蜘蛛/爬蟲

Common Spiders
Twitterbot
Twitterbot蜘蛛/爬蟲屬於資訊流型別,由X Corp.開發執行。您可以繼續閱讀下方資訊,以深入瞭解Twitterbot基本資訊,使用者代理和訪問控制等。
SeznamBot
SeznamBot蜘蛛/爬蟲屬於搜尋引擎型別,由Seznam.cz, a.s.開發執行。您可以繼續閱讀下方資訊,以深入瞭解SeznamBot基本資訊,使用者代理和訪問控制等。
Blogtrottr
Blogtrottr蜘蛛/爬蟲屬於資訊流型別,由Blogtrottr Ltd.開發執行。您可以繼續閱讀下方資訊,以深入瞭解Blogtrottr基本資訊,使用者代理和訪問控制等。
RSSingBot
RSSingBot蜘蛛/爬蟲屬於資訊流型別,由RSSING.COM開發執行。您可以繼續閱讀下方資訊,以深入瞭解RSSingBot基本資訊,使用者代理和訪問控制等。
WordPress.com bots
WordPress.com bots蜘蛛/爬蟲屬於資訊流型別,由Automattic Inc.開發執行。您可以繼續閱讀下方資訊,以深入瞭解WordPress.com bots基本資訊,使用者代理和訪問控制等。
Feedspotbot
Feedspotbot蜘蛛/爬蟲屬於資訊流型別,由Feedspot開發執行。您可以繼續閱讀下方資訊,以深入瞭解Feedspotbot基本資訊,使用者代理和訪問控制等。
Discordbot
Discordbot蜘蛛/爬蟲屬於資訊流型別,由Discord Inc.開發執行。您可以繼續閱讀下方資訊,以深入瞭解Discordbot基本資訊,使用者代理和訪問控制等。
Awario crawler
Awario crawler蜘蛛/爬蟲屬於營銷型別,由Link-Assistant.Com開發執行。您可以繼續閱讀下方資訊,以深入瞭解Awario crawler基本資訊,使用者代理和訪問控制等。

相關文章

Related Articles