Grok 3 API 已经发布,它的“scary‑smart”推理、实时网络功能,以及在编码和 STEM 基准测试中的顶级性能,已经撼动了人工智能世界。无论您是开发人员、研究人员还是人工智能爱好者,现在都是访问 Grok 3 API 并探索其功能的最佳时机。在本教程中,您将学习如何注册使用 Grok 3 API、安全地验证您的凭据以及使用 Python 连接 Grok 3 API。我们还将介绍一些实际用例,从将 Grok 3 API 集成到工作流程,到使用 Grok 3 API 进行数据检索和高级推理任务。
Grok 3的主要功能
Grok 3 引入了几项突破性功能,这些功能增强了 Grok 3 在各个领域的性能和适用性:
- 高级推理模式:Grok 3 提供了专门的推理模式,包括用于逐步解决问题的 “思考 ”模式和用于处理复杂任务的 “大大脑 ”模式。这些模式可使模型更深入地处理信息,并提供准确的响应。
- 深度搜索功能:该模型集成了 DeepSearch,这是一种人工智能代理,可实时扫描互联网和 X(前 Twitter),生成有关特定主题的综合报告。该功能可确保 Grok 3 的回复与时俱进、信息灵通。
- 增强的性能基准:Grok 3 在 2025 年美国数学邀请考试(AIME)中取得了 93.3% 的高分,并在聊天机器人竞技场中取得了 1402 的 Elo 分数,显示了其在 STEM 领域的优势。
- 实时数据整合:与静态的人工智能模型不同,Grok 3 整合了来自网络和 X 帖子的实时数据,确保其回复是最新的、相关的。
- 多模式功能:该模型可以处理和生成文本、图像和代码,从而将其适用范围扩展到各个领域。
这些功能使 Grok 3 成为人工智能语言模型的一大进步。它提供了增强的推理能力、实时数据处理能力和广泛的功能,可满足不同用户的需求。
价格和模型规格
xAI 推出了 Grok-3 模型系列的多个变体。每种模型都针对不同的性能和成本效益水平进行了微调。这些模型可满足开发人员、研究人员和组织机构的计算和推理需求。
Source: X.com
在调用API之前使用xAI的成本计算器
在您开始调用多个 API 之前,xAI 为其每种模型(包括 grok-3-beta、grok-3-fast-beta 和迷你变体)提供了一个超级方便的成本计算器。
您可以直接访问 https://x.ai/api(向下滚动即可)。
您可以自定义
- 文本输入 token
- 图像输入 token
- 输出 token
该工具可为您提供实时成本估算,以便您有效规划使用量,避免意外计费。例如,在 grok-3-beta 上使用 50,000 个文本输入 token 和 500 个输出 token,只需花费 0.16 美元(如前面的截图所示)。
智能开发提示:经常使用此计算器来优化您的 API 策略,尤其是在扩展或处理大型有效载荷时。
如何访问API?
1. 访问 grok.com,使用您的账户凭据登录。
2. 点击右上角的个人资料头像,选择“Settings”,然后选择“Manage”。您将被重定向到 xAI 账户页面。
3. 在 xAI 账户页面,导航至 API Console。
4. 在 API 控制台的左侧边栏,点击密钥图标,查看并复制您的 Grok API 密钥。
瞧,这就是你的 API 密钥!请务必妥善保管。
Grok 3的实现
基本实现
让我们尝试使用 Grok xAI 文档中提供的代码片段来检查我们的 Grok 3 模型是否能够响应。
!pip install openai import os os.environ['GROK_API_KEY'] = "xai-..." # your own api key from IPython.display import Markdown from openai import OpenAI client = OpenAI( api_key=os.getenv("GROK_API_KEY"), base_url="https://api.x.ai/v1", ) completion = client.chat.completions.create( model="grok-3-mini-beta", messages=[ {"role": "user", "content": "What is the meaning of life?"} ] ) Markdown(completion.choices[0].message.content)
输出:
现在,让我们测试一下 Grok 3 模型: – 生成代码
- 代码生成
- 推理能力
- 复杂用例
- 科学研究理解
您可以随意更换其他 Grok 3 变体(例如,grok-3-beta、grok-3-fast-beta)或制作您的提示。然后,在笔记本或脚本中直接比较输出结果。
在下面的实现中,我们将利用
代码生成
1. 让我们使用 Grok 3 模型生成代码,将华氏度转换为摄氏度,反之亦然。
prompt = """ Write a Python function that converts a temperature from Fahrenheit to Celsius and vice versa. The function should take an input, determine the type (Fahrenheit or Celsius), and return the converted temperature. """ client = OpenAI( api_key=os.getenv("GROK_API_KEY"), base_url="https://api.x.ai/v1", ) response = client.chat.completions.create( model="grok-3-mini-beta", messages=[ { "role": "user", "content": prompt } ] ) # Output the generated Python code print(response.choices[0].message.content) Markdown(response.choices[0].message.content)
输出:
2. 让我们用 Grok 3 模型生成一个 HTML 页面,页面上有一个按钮,点击后页面上就会洒满纸屑。
prompt = """Create an HTML page with a button that explodes confetti when you click it. You can use CSS & JS as well.""" client = OpenAI( api_key=os.getenv("GROK_API_KEY"), base_url="https://api.x.ai/v1", ) response = client.chat.completions.create( model="grok-3-mini-beta", messages=[ { "role": "user", "content": prompt } ] ) # Output the generated Python code print(response.choices[0].message.content) Markdown(response.choices[0].message.content)
输出:
为了测试这段代码的功能,我将使用 CodePen 来测试 HTML 代码。
这就是它的外观:
推理能力
1. 让我们用这道通用能力推理题来测试一下 Grok 3 模型
prompt = """Anu is a girl. She has three brothers. Each of her brothers has the same two sisters. How many sisters does Anu have?""" client = OpenAI( api_key=os.getenv("GROK_API_KEY"), base_url="https://api.x.ai/v1", ) response = client.chat.completions.create( model="grok-3-mini-beta", messages=[ { "role": "user", "content": prompt } ] ) # Output the generated Python code print(response.choices[0].message.content) Markdown(response.choices[0].message.content)
输出:
已验证答案正确。
2. 让我们来测试一下 Grok 3 的模式识别能力,提供这个基于日期的模式问题
prompt = """January = 1017, February = 628, March = 1335, April = 145, May = 1353, June = 1064, July = 1074, August = 186, September = ? Think carefully before answering also show the steps""" client = OpenAI( api_key=os.getenv("GROK_API_KEY"), base_url="https://api.x.ai/v1", ) response = client.chat.completions.create( model="grok-3-beta", messages=[ { "role": "user", "content": prompt } ] ) # Output the generated Python code print(response.choices[0].message.content) Markdown(response.choices[0].message.content)
输出:
GROK-BETA 和 GROK-BETA-MINI 都失败了
答案应为 1999。
3. 让我们用这个问题来测试一下 Grok 3 模型的简单数学推理能力吧
/cod prompt = """I have two apples, then I buy two more. I bake a pie with two of the apples. After eating half of the pie, how many apples do I have left?""" client = OpenAI( api_key=os.getenv("GROK_API_KEY"), base_url="https://api.x.ai/v1", ) response = client.chat.completions.create( model="grok-3-mini-beta", messages=[ { "role": "user", "content": prompt } ] ) # Output the generated Python code print(response.choices[0].message.content) Markdown(response.choices[0].message.content)
输出:
已验证答案正确。
复杂案例
让我们要求 Grok 3 模型为我们提供一个完整的项目结构计划和相应的代码片段,这些代码片段必须相应地添加到相应的文件中。
prompt = """ I want to develop an inventory management system that tracks products, quantities, and locations. It should notify the user when stock is low. Create a plan for the directory structure and provide code snippets for the key components. """ client = OpenAI( api_key=os.getenv("GROK_API_KEY"), base_url="https://api.x.ai/v1", ) response = client.chat.completions.create( model="grok-3-mini-beta", messages=[ { "role": "user", "content": prompt } ] ) # Output the generated Python code print(response.choices[0].message.content) Markdown(response.choices[0].message.content)
输出:
科学研究理解
在此,我们将测试 Grok 3 模型基于领域的理解能力,以及它是如何理解问题和阐述某些科学研究主题的。
prompt = """ Explain how CRISPR technology can be used to treat genetic disorders. What are the main challenges, and what future advancements might be necessary to make it widely available? """ client = OpenAI( api_key=os.getenv("GROK_API_KEY"), base_url="https://api.x.ai/v1", ) response = client.chat.completions.create( model="grok-3-mini-beta", messages=[ { "role": "user", "content": prompt } ] ) # Output the generated Python code print(response.choices[0].message.content) Markdown(response.choices[0].message.content)
输出:
我的观点
编码能力
我发现 Grok 3 的代码生成准确度令人印象深刻。在典型的算法任务上,它的表现优于 gpt-4o、Deepseek-R1 等较轻的模型,不过我建议在下结论之前,先在更复杂的场景中对它进行压力测试。
推理能力
Grok 3 具有很强的数学推理能力,能够可靠地解决多步骤问题。不过,我注意到在基于模式的推理方面出现了一些失误,如识别不明显的类比或隐藏序列。
复杂用例和科学理解
当被要求概述项目结构时,Grok 3 提供了一份条理清晰的计划,并附有模板代码片段。它对 CRISPR 应用的了解给我留下了深刻印象,因为它提供了详细的概述,显示了对科学的深刻理解。
Grok 3 擅长阐述,并能清晰、深入地给出答案。它在 LLM 推理方面迈出了一大步,但我们还是应该一如既往地根据您的基准来验证它的输出结果。
小结
Grok 3 是大型语言模型发展史上的一个重要里程碑。从其“scary‑smart”推理模式和实时 DeepSearch 功能,到多模态支持和业界领先的基准测试,xAI 推出的工具包不仅功能强大,而且用途广泛。通过本指南,您将学会如何
- 保护您的 Grok 3 API 密钥并确保其安全
- 使用 xAI 的内置计算器预先估算成本
- 在几分钟内完成基本聊天
- 在代码生成、逻辑谜题、复杂工作流和科学查询中试用 Grok 3。
- 评估其优势并确定需要进一步压力测试的领域
无论您是开发下一个伟大聊天机器人的开发人员,还是探索人工智能驱动分析的研究人员,抑或仅仅是对LLM 尖端技术充满好奇的爱好者,Grok 3 都能将深度、速度和现实世界的相关性完美结合。
当您将 Grok 3 集成到您的项目中时,请记得根据您的领域基准验证其输出结果,优化令牌的使用,并与社区分享您的发现。编码快乐 🙂
评论留言