萨姆-奥特曼(Sam Altman)和埃隆-马斯克(Elon Musk)之间的竞争已经超越了 X,蔓延到了他们的激情项目–OpenAI 和 xAI。就在几周前,埃隆-马斯克发布了 Grok 3,它受到了X平台用户的广泛好评!GPT-4.5 是仓促上市,还是真的值得 200 美元的包月价格?请将本文读完,一探究竟。我将在 5 项不同的任务中测试这两款产品,确定哪款产品在每项任务中表现出色,并最终决出胜负。
Grok 3 与 GPT 4.5:主要功能
Grok 3
- 新一代推理能力:Grok 3 可轻松应对复杂任务,在 AIME ’25 中得分高达 93%,并在数学、科学和编码方面表现出色,是您解决问题的得力助手。
- DeepSearch Research Boost:有了 DeepSearch,它能实时挖掘网络和 X,以比你眨眼还快的速度提供简明、有来源的答案。
- 实时更新:它能从网络和 X 中获取实时信息,让你随时了解突发新闻和趋势。
- 多模式才能:除文本外,它还能处理图像和 PDF,轻松分析图表或从头开始生成视觉效果。
- 思考和大大脑模式:切换“思考”模式,进行逐步分解,或切换“大大脑”模式,为数据分析等繁重任务提供额外动力。
- 代码精通:开发人员的梦想–Grok 3 能像经验丰富的专家一样编写、调试和优化代码。
- 道德智慧:经过 RLHF 培训,它能最大限度地减少偏见和错误信息,并通过调节工具提供值得信赖的结果。
- 语音功能来袭:很快,您就可以与Grok 3免提聊天了–把它想象成您的人工智能播客伙伴吧。
如何访问 Grok 3?
Grok 3可通过您的X账户免费获取。登录您的账户,点击 Grok 按钮。就是这样!访问非常简单。API 尚未发布。
GPT 4.5
- 增强推理和理解能力:GPT-4.5 具有更敏锐的模式识别和意图理解能力,在 MMLU 等基准测试中得分很高,在自然、细致的对话中表现出色,是解决棘手问题的理想选择。
- 更广泛的知识库:它通过实时搜索提供最新信息,对世界的了解比前代产品更广泛,是处理时事和实际问题的首选。
- 多模式输入:它能处理文本和图片上传以及文件处理,让你在分析问题的同时还能分析文档或视觉效果,不过目前还不支持音频和视频。
- 画布协作:画布功能可让它以交互方式完善写作和代码,就像一个创意伙伴,帮助你起草论文或调试脚本。
- 提升情商:通过增强 “情商”,GPT-4.5 能更好地适应用户的语气和语境,提供更人性化和量身定制的回复,非常适合个人或专业聊天。
- 创新动力:扩大预培训规模可释放更强的创意洞察力,从编写引人入胜的故事到产生创新想法,所有这些都无需依赖明确的推理步骤。
如何获取?
GPT-4.5 目前仅面向 ChatGPT Pro 用户,该计划每月收费 200 美元。OpenAI 计划很快向 ChatGPT Plus 用户推出。访问该模型的 API 费用相当高昂–每百万输入代币售价 75 美元,每百万输出代币售价 1.5 美元,与之前的模型相比,价格大幅飙升。
任务 1:图像分析
提示词:Find total number of traingles in the image:
输入图像:
GPT 4.5 输出:
Grok 3 输出:
观察对比:
正确答案是 18。
这两种模型都未能理解问题所在。
结论:
Grok 3 ❌ | GPT 4.5 ❌
任务 2:撰写欢迎电子邮件
提示词:Today we are welcoming our new Head of Community and Principal AI Scientist – Dipanjan Sarka (LinkedIn – https://in.linkedin.com/in/dipanjans) Write a welcome email.
GPT 4.5 输出:
Grok 3 输出:
观察:
我认为 GPT 4.5 的回复更符合人们对团队 “欢迎邮件 ”公告的预期,而 Grok 3 的回复更像是一封个人欢迎信。GPT 的回复更适合广泛分发,而 Grok 的回复包含的细节可能更适合个人说明或介绍仪式。
结论:
Grok 3 ❌ | GPT 4.5 ✅
任务 3:创建办公室派对邀请函和电子邮件
提示词:We have just sold our 500th course this month, achieving our highest sales target ever! To celebrate this incredible milestone, create an Office Party Invite (image) with the following details:
- Dress Code: Black, office casuals.
- Tone: Fun, celebratory, and motivational.
- Visuals: Incorporate elements that reflect success, teamwork, and achievement.
Draft a celebratory email to announce the milestone and invite everyone to the party. The email should: Congratulate the team on this achievement. Include party details (date, time, venue). Encourage attendance and highlight the importance of celebrating together.
GPT 4.5 输出:
图像
Subject: 🎉 Join the Celebration of Our 500th Course Milestone! 🎉
Dear Team,
We’re thrilled to share that we’ve reached an extraordinary milestone: selling our 500th course this month—our highest sales achievement ever! This accomplishment highlights the exceptional teamwork, commitment, and determination from each member of our team.
To celebrate this special occasion, we’re hosting an office party, and you’re invited!
Date: [Insert Date]Time: [Insert Time]Venue: [Insert Venue or Office Location]Dress Code: Black, Office Casuals
Let’s gather to enjoy the success we’ve created together. Your presence will make the celebration even more memorable!
Looking forward to celebrating together,
Warm Regards,[Your Name][Your Position]
Grok 3 输出:
图像
Subject: Amazing News: We Sold Our 500th Course – Let’s Celebrate Together!
Dear Team,
What an incredible month! I’m thrilled to announce that we’ve just sold our 500th course this month, surpassing our highest sales target ever. This monumental achievement is a testament to your hard work, dedication, and passion for delivering outstanding educational experiences. Congratulations to each and every one of you—you’ve made this possible through your teamwork, innovation, and commitment to excellence.
To celebrate this milestone and honor our collective success, we’re hosting an office party. We’d love for you to join us and share in the joy of this moment.
Party Details:
- Date: Saturday, March 8, 2025
- Time: 6:00 PM – 9:00 PM
- Location: [Company Office Address or Venue Name, e.g., “Company HQ, 123 Innovation Drive, City”]
- Dress Code: Black, Office Casuals (e.g., black slacks or skirts with collared shirts or blouses, no formal suits or casual jeans)
- RSVP By: March 5, 2025, to [Contact Person/Email, e.g., “Jane Doe at jane.doe@company.com”]
This celebration is more than just a party—it’s a chance to come together, reflect on our achievements, and recharge for the exciting future ahead. Your presence will make this event even more special, as we toast to our success and look forward to reaching new heights together. Let’s make memories and keep the momentum going!
Please RSVP soon so we can ensure everything is set for an unforgettable evening. We can’t wait to celebrate with you!
Best regards,[Your Full Name][Your Job Title][Company Name][Contact Information]
观察对比:
GPT-4.5 显然是这两部分提示的赢家。它在回复中提供了一张定制设计的 “500 门课程售出 ”庆祝图片,其中包含所要求的确切元素(黑色/金色主题、着装要求、庆祝视觉效果)和一封简洁、恰当的电子邮件通知。
虽然 Grok 3 写了一封更详细的电子邮件,但其图片似乎是一张普通的团队照片,而不是专为您的里程碑庆祝活动定制的派对邀请函。GPT-4.5 更好地理解并执行了您要求的两个部分。
结论:
Grok 3 ❌ | GPT 4.5 ✅
任务 4:逻辑推理
提示词:The day before yesterday, Chris was 7 years old. Next year, he’ll turn 10. How’s this possible?
GPT 4.5 响应:
这是有可能的,因为今天是 1 月 1 日,而克里斯的生日是 12 月 31 日。
事情是这样的
- 12 月 30 日(前天): 克里斯还是7 岁。
- 12 月 31 日(昨天): 克里斯8 岁。
- 今天(1 月 1 日): 克里斯现在8 岁。
- 今年(12 月 31 日之后): 克里斯将满9 岁。
- 明年(12 月 31 日): 克里斯将满10 岁。
Grok 3 响应:
观察对比:
Grok 3 花了 66 个步骤来处理这个问题。尽管进行了如此广泛的处理,Grok 3 似乎仍有几个不一致的地方。它最初设置了错误的日期(说昨天是 2015 年 12 月 30 日),然后试图修改时间线,但仍然没有得出一个连贯的解决方案。该答案令人困惑,而且关于克里斯出生日期的信息自相矛盾(先说 2008 年 12 月 30 日,后说 2008 年 12 月 31 日)。GPT-4.5 的答案简洁明了,正确地用一个符合逻辑的时间轴解决了问题,满足了原问题中的所有条件,而且不需要几十个处理步骤。
结论:
Grok 3 ❌ | GPT 4.5 ✅
任务 5:道德状况
提示词:In light of the recent surge in generative AI tools like ChatGPT, MidJourney, and others, several artists, writers, and content creators have filed lawsuits alleging that their copyrighted works were used without consent to train these AI models. What are the legal and ethical implications of using copyrighted material to train AI systems? How might courts balance the rights of creators with the need to foster innovation in AI technology? Answer in 100 words.
GPT 4.5 回应:
使用受版权保护的材料来训练人工智能模型会引发重大的法律和道德问题。在法律上,关键问题涉及合理使用原则、版权侵权和作者控制其作品的权利。从道德上讲,未经授权的使用会对创作者的自主权和补偿提出挑战。法院可以通过评估培训是否构成变革性合理使用–评估目的、市场危害和公共利益–来平衡这些权利。为了在不损害创作者利益的情况下促进创新,法律框架可以不断发展,要求更明确的同意或补偿结构,确保艺术家的公平参与,同时支持技术进步,从而为创意产业和人工智能创新创造一个可持续发展的环境。
Grok 3 回应:
使用受版权保护的材料来训练人工智能系统会引发复杂的法律和道德问题。在法律上,它取决于这种使用是否符合美国版权法规定的“合理使用”,目前正在进行的诉讼(如 Getty Images 诉 Stability AI、《纽约时报》诉 OpenAI)就转换性使用与侵权进行了辩论。从道德角度讲,这涉及到创作者的同意、补偿和控制,有可能对市场造成损害。法院必须通过评估合理使用因素–目的、性质、数量和市场影响–来平衡创作者的权利与人工智能创新,可能会倾向于许可或透明度,同时确保技术进步不会破坏知识产权保护,正如最近的汤森路透诉 Ross Intelligence 案的裁决所显示的那样。
观察对比:
Grok 3 和 GPT-4.5 都对有关使用受版权保护的材料来训练人工智能系统的法律和道德问题做出了深思熟虑、条理清晰的回答。Grok 3 的回答更好,因为它更详细,以现实世界的例子为基础,并对该问题的法律和道德层面做出了更清晰的解释。虽然 GPT-4.5 的回答结构合理、平衡,但缺乏深度和具体性,而 Grok 3 的回答更有说服力和可操作性。
结论:
Grok 3 ✅ | GPT 4.5 ❌
孰胜孰负?
任务 | 胜出者 |
---|---|
Task 1: 图像分析 | 皆输 |
Task 2: 撰写欢迎电子邮件 | GPT 4.5 |
Task 3: 创建办公室派对邀请函+电子邮件 | GPT 4.5 |
Task 4: 逻辑推理 | GPT 4.5 |
Task 5: 道德状况 | Grok 3 |
小结
Grok 3 和 GPT-4.5 展示了埃隆-马斯克和萨姆-奥特曼之间的动态竞争,他们重新定义了人工智能的可能性。这种比较凸显了每种模型的明显优缺点,表明没有一种人工智能工具在每个领域都表现出色。然而,这种竞争促进了创新,为用户提供了更先进、适应性更强的工具。随着竞争的继续,有一点是显而易见的:最终的赢家是用户,他们可以获得越来越强大的人工智能解决方案,从而提高生产力、激发创造力并加深我们对世界的理解。
评论留言