
欢迎来到(人工智能)世纪的巅峰对决。两位巨星将在这场头条新闻的对决中正面交锋,角逐人工智能模型领域的真正王者。一方是 OpenAI 的旗舰级成果——GPT-5——它精良、强大且经验丰富;另一方是谷歌的最新力作——Gemini 2.5 Pro——它速度飞快、性能卓越,有望改写规则。
这两款产品都是最近才亮相的,自那以后,观众们的热情就一直高涨。但别误会,我们来这里不是为了礼貌的介绍和粉丝们的最爱。我们来这里是为了“决斗”!一场严肃而血腥的战斗,两款模型都将在四轮高风险的比赛中证明自己的实力。胜者将捧回荣耀!
尊敬的观众们,准备好迎接即将开始的决斗吧。GPT-5 还是 Gemini 2.5 Pro,谁会胜出?
第一轮:内容(文本)
这些模型每天都要面对我们。内容是这些人工智能模型最初带给人类的几项专业知识之一。多年过去了,它们如今比以往任何时候都更加精细、富有表现力,也更加细致入微。
但它们能否接受这位人类专家(我本人)提出的这项艰巨挑战?是时候一探究竟了。
提示词
Hi,
Please give me a 3500-word article on how AI may replace human jobs by 2030.
Take into account, information from the following source – https://www.weforum.org/stories/2025/01/future-of-jobs-report-2025-jobs-of-the-future-and-the-skills-you-need-to-get-them/
Highlight the exact spots where you cite information from this source.
Make sure the article has optimum divisions into subheads. Start it with a super-catchy and funky introduction of 2 paragraphs (150 words max), followed by a section titled “Is AI-Threat Real?” give me support and counter arguments for the same in the section.
Include at least 1 section which mentions the use of AI in distant future (2050), and what we can envision in terms of work being done by humans vs work done by AI at the time.
表现
GPT-5 输出

Gemini 2.5 Pro 输出

得分:第一轮Gemini 2.5 Pro胜出
两款模型的评判标准如下:
| 指标 | GPT-5 | Gemini 2.5 Pro |
|---|---|---|
| 字数 | 965 | 2163 |
| 趣味性引入 | 是 | 有点 |
| 未来支持 | 是 | 是 |
| 高亮功能 | 是 | 是 |
| 响应时间 | 即时 | 大约30秒 |
稳健的Gemini 2.5 Pro击败技艺精湛的GPT-5
尽管 GPT-5 一开始的字数就少得可怜,远远达不到规定的字数限制,但它迅速反弹,在我们评判其表现的四项标准中,有两项达到了要求。它的引言部分是我很久以来见过的最好的 AI 写作,并且对文章中的所有细节都恰到好处。所有这些,都以不到 5 秒的闪电速度完成。不过,它还是远远达不到规定的字数限制。
另一方面,Gemini 2.5 Pro 的表现非常出色,它表现全面,不慌不忙,写出的文章长度是 GPT-5 的两倍。然而,即使是谷歌的宠儿——GPT-5,也未能达到规定的字数,大约花了 30 秒才得出答案。它甚至在引言段落中尝试发挥创意,但远不及 GPT-5 的水平。
GPT-5 的失误之处在于它直接插入了参考链接中的引文。它并没有这样做,而是故意留下了括号,让我根据自己的喜好插入引文。如果我不得不自己浏览内容,那就违背了使用 AI 根据来源总结/撰写内容的初衷。
Gemini 2.5 Pro 在这方面表现得比较保守,只是完成了它被要求做的事情——突出显示你从来源中选择的区域/信息。满分 10 分!
尽管它也有自己的弱点,所以如果以后不谨慎行事,它的领先地位可能只是昙花一现。
Gemini 2.5 Pro 能守住阵地吗?还是 GPT-5 会强势反弹?敬请期待,是时候了……
第二轮:图像生成
在人工智能领域,美感是大脑的一部分,因此我们首先来了解一下它们的图像生成能力。让我们看看这些模型在将提示转化为像素方面表现如何。
提示词
Give me an image
Character – an Indian boy – around 25 years of age, standing on one edge of a busy road. The boy is dressed smartly in formals, a beige suit, but no tie and shirt unbuttoned at the top.
Background setting – the backdrop shows cars zooming on an expansive road, in front of a row of sky-rises made of glass and having neon boards. The tallest building reads “Stark Industries” at the very top.
Action – The boy is watching at his hand in amazement, as sparks fly out of his hands and all around his arm. He is discovering a strange and new superpower that he always had but never knew.
表现
GPT-5 输出

Gemini 2.5 Pro 输出

得分:第二轮比赛获胜者是 GPT-5
两款模型的评判标准如下:
| 指标 | GPT-5 | Gemini 2.5 Pro |
|---|---|---|
| 时间 | 2分18秒 | 43秒 |
| 细节 | 10/10 | 10/10 |
| 质量 | 9/10 | 8/10 |
| 准确性 | 10/10 | 8/10 |
| 表达 | 9/10 | 8/10 |
| 惊艳程度 | 7/10 | 7/10 |
魅力十足的Gemini 2.5 Pro败于冷静的GPT-5
OpenAI 的竞争对手这次凭借精湛的技巧一路过关斩将,最终登顶。出人意料的是,两款模型的输出时间完全相反。GPT-5 这次耗时更长,但输出结果显然更加细腻,视觉效果也更具吸引力。
从图像中可以清楚地看出,GPT-5 的图像质量略优于 Gemini 2.5 Pro,这多少让人有些意外,毕竟后者以其强大的图像生成能力而闻名。GPT-5 的不足之处在于一些细微的技术细节,例如提示中明确提到男孩“站在一条繁忙道路的边缘”,而不是像模型在图像中显示的那样站在道路中央。甚至连图像质量都还有提升空间,因为男孩手中迸发的火花并不令人印象深刻。说实话,这两款模型都未能达到人们在 AI 图像中期待的那种“惊艳”效果。
然而,这场战斗尚未结束。GPT-5 已经是明显的赢家了吗?还是 Gemini 2.5 Pro 会强势回归?让我们拭目以待,稍后再见。
第三轮:互联网研究
我们又回来了,AI 模型面临的最严峻挑战之一——互联网研究。可以说,通过 AI 聊天机器人进行互联网研究是最实际的用例,它可以让你从一开始就在写作/文档方面处于领先地位。我们即将看到一位在这方面表现更胜一筹的 AI 冠军。
提示词
Give me 10 website article/ blog/ research sources (very high credibility) – that talk about the hollow Earth theory and how it might be a possibility
表现
GPT-5 输出

Gemini 2.5 Pro 输出

得分:第三轮至GPT-5获胜
以下是两个模型的评判标准:
| 指标 | GPT-5 | Gemini 2.5 Pro |
|---|---|---|
| 时间 | <10秒 | 32秒 |
| 准确性 | 完全准确 | 非常好 |
| 来源质量 | 辉煌 | 好 |
| 错误 | 无 | 未提供链接 |
GPT-5遥遥领先
GPT-5 似乎已经精通了这一招,它以闪电般的速度、精准的计算和绝对出色的链接质量给出了结果。
Gemini 2.5 Pro 表现不俗,提供了同样优秀的相关文章来源,甚至还分享了一段详细的 YouTube 视频。然而,它的速度太慢了,耗时是 GPT-5 的三倍。此外,它还犯了一个大错误,最终败北——Gemini 2.5 Pro 没有分享任何来源的可点击链接。究竟是缺乏天赋,还是缺乏常识,您自己判断吧。
另一方面,GPT-5 分享了来自知名出版物的高质量内容来源的可点击链接。它更进一步,以易于理解的表格形式总结了其研究结果。它甚至分享了一个总体结论:没有文献“支持”地球空心说,但所有文献都对此进行了非常详细的解释。精准的作业和额外的步骤让它成为了当晚的赢家。
至此,我们进入了今晚的最后一轮。由于 GPT-5 目前处于领先地位,Gemini 2.5 Pro 除了全力以赴之外几乎无事可做。它会成功吗?我们将在……揭晓答案。
第四轮:编码
在对 AI 模型的终极考验中,接下来将考验它们的编码能力。需要注意的是,这两个模型都比前代模型增强了编码能力。但这种进化足以击败竞争对手吗?挑战如下:
提示词
Write an html code for a blog website covering topics on machine learning and artificial intelligence. The first section of the home page should have a carousel with the Main news in a big container, adjacent to a list of small thumbnails of 4 other primary news. Whichever box you click on, expands into the big box of the Main news. The previous Main news story shifts to the side in place of that small thumbnail.
Make 2 more sections following this. One – a horizontal scrolling list with 10 news stories. Another, 6 news stories in 2 columns of 3 thumbnails each. End the page off with a footer showcasing the usual elements, About Us, Contact Us, etc.
Make one more page titled “Share your Writings” The page should have a 2-line appeal to readers to share their write-ups with us. Following this, have a contact form with the fields – Name, Email, and Your Write-up. Keep a word limit of 500 words on the write-up entries.
The theme of the website should be a mix of blue, white, and orange. Make sure it is as appealing as possible. Mandatory – have a logo at the middle of the header space. make a logo of your own
表现
GPT-5 输出

Gemini 2.5 Pro 输出

两者平分秋色
首先,看一下记分牌。
| 指标 | GPT-5 | Gemini 2.5 Pro |
|---|---|---|
| 时间 | 3分30秒 | 少于2分钟 |
| 准确性 | 10/10 | 10/10 |
| 视觉吸引力 | 7/10 | 9/10 |
| 功能性 | 10/10 | 8/10(未提供可下载文件) |
| 创造力 | 9/10 | 9/10 |
Gemini 2.5 Pro开局强劲但后劲不足
两款 AI 模型这次都表现出色,生成了精准无误的结果,所有细节都与提示中提到的完全一致。网站简洁明了,用户友好,功能齐全,每个元素都包含必要的细节。所有部分也都完全按照提示制作和运行。然而,也有一些领域/时间,AI 冠军胜过对手,反之亦然。
例如,Gemini 2.5 Pro 的生成速度非常快,在提示发出后 2 分钟内就生成了完整的代码。它甚至生成的网站(至少在我看来)在两个结果中看起来更好,也更专业,更符合这类主题的博客的风格。然而,由于设计本身就是一个主观问题,我不会在这方面对这两个结果进行过多的区分。
虽然 Gemini 2.5 Pro 开局强劲,但它在一个重要方面再次落后于对手。 GPT-5 能够以可下载文件夹的格式共享完整代码。我可以轻松下载并运行代码来查看网站。而 Gemini 2.5 Pro 则无法提供这样的文件夹,即使我明确要求提供也无济于事。我不得不手动在文件夹中创建新的文本文件,复制/粘贴代码,然后运行它们。实用性大打折扣。
至此,我们以一个显而易见的赢家结束了这场战斗。
结论:GPT-5胜出!
在这场史诗般的激烈 AI 较量中,两大顶级模型都证明了自己的实力。它们速度快、精准,并且适用于各种实际用途,适用于各种场景。不过,两者之间,GPT-5 似乎仍然略占优势。毕竟,它是将 AI 引入我们今天所知世界的元老级聊天机器人。
虽然许多其他模型在最初的 AI 工具和服务浪潮中声名鹊起(例如 Midjourney),但如今它们中的大多数都已湮没于历史的洪流之中。但 ChatGPT 并非如此。ChatGPT 及时更新了其热门聊天机器人(例如 GPT-5),并新增了 Codex 和 GPT 等塑造 AI 技术前沿的服务,确保了其与时俱进。
以下是获胜者对其胜利的评价。



评论留言