AGI 时代 — 正在发生什么，这对我们意味着什么

2017年，谷歌的一支团队发表了一篇题为《Attention is All You Need》的论文。那时没有人知道，这篇论文将改变人类历史的进程。

今天，2025年，我坐在屏幕前，看着模型自我纠正错误、编写复杂代码、进行研究、谈判和设计。“窄域人工智能”和”通用人工智能”之间的界限已经变得模糊——速度远超任何人的预期。

这篇文章是我的个人思考——不是学术报告，也不是末日预言。这是我作为一名工程师和亲历这一时刻的人，脑海中萦绕的思考。

AGI 究竟是什么？

通用人工智能（Artificial General Intelligence）是指能够执行人类所能完成的任何智识任务的系统——并且能够学习未经专门训练的新任务。

这与窄域人工智能（ANI）根本不同。ANI 在单一特定领域表现出色：GPT 会写作但不会开车，AlphaGo 会下围棋但不理解日常对话。

真正的 AGI 能够学习、适应、泛化。就像一个聪明的人，只要给予时间和信息，就能学会任何事情。

我们是如何走到这里的？真实的时间线

2017年 — 起点：Transformer

《Attention is All You Need》引入了 Transformer 架构。核心思想：注意力机制（Attention）——模型不再线性处理信息，而是可以同时”关注”上下文的不同部分。

这看起来是技术性的。但它改变了一切。

2020年 — GPT-3：转折点

OpenAI 的 GPT-3 令人震惊。这个 1750 亿参数的模型写出的文本，往往难以与人类写作区分。所有人都说：“只是统计，没有真正的理解。“也许吧。但实际应用效果非常真实。

2022年 — ChatGPT：大众化爆发

2022年11月 ChatGPT 发布时，五天内达到了100万用户。历史上从未有任何技术做到这一点。不是因为它最聪明——而是因为它最易用。对话式界面让人工智能的获取变得民主化。

2024年 — 推理模型

GPT-o1、o3，Claude 3.5 Sonnet。这些模型不只是回答——它们会思考、审视、验证、自我纠错。

当 o3 接受数学、编程和科学基准测试时，其表现超过了绝大多数人类。不是靠记忆——而是靠推理。

2025年 — 自主智能体（Agents）

当前的质变：智能体。这些模型不只回答问题，而是完成完整的任务：

编写代码、运行代码、修复错误，并部署到生产环境
搜索互联网、汇总信息、撰写报告
管理项目：任务、截止日期、沟通

发展速度超出预期——用真实数据说话

这不只是感觉，有客观指标：

MMLU（大规模多任务语言理解）： 包含57个领域、57,000道题的测试。2020年：最佳模型得分43%。2024年：超过90%。

HumanEval（代码编写）： 2021年：GPT-4 解决67%的问题。2024年：o3 解决96%。

SWE-bench（修复真实 GitHub Bug）： 2023年：1.96%。2024年：49%。一年内增长25倍。

这条曲线不是渐进式的，更接近于垂直上升。

三件令我担忧的事

我不会天真地说这一切都是好事，没有任何隐患。这些担忧是真实的：

1 — 权力集中

拥有这些模型的少数公司现在掌握着巨大的权力。OpenAI、Google、Anthropic、Meta，全都是西方公司，大多数是美国公司。这对消费这项技术但不生产它的世界其他地区意味着什么？

2 — 就业

并非所有工作都面临同等风险。重复性知识工作——撰写特定报告、翻译、客户服务、数据录入——将受到严重影响。

但即使是曾经看似安全的工作也开始动摇：编程、法律、医学，甚至艺术。

3 — 虚假信息

能够在没有人工参与的情况下生成令人信服、个性化内容的模型，是前所未有规模虚假信息传播的完美工具。

三件令我振奋的事

但图景并非全然黯淡：

1 — 知识民主化

也门或印度尼西亚偏远村庄的年轻人，今天可以获取曾经只有大城市富人才能获得的信息和帮助。AI 医生提供指导，AI 律师提供解释，AI 教师提供教育。

这不是人类专家的替代品，但远比什么都没有要好得多。

2 — 科学加速

DeepMind 的 AlphaFold 解决了困扰科学界五十年的蛋白质折叠问题。现在类似的模型正在加速药物发现、气候理解和新材料研究。

曾经需要一代科学家才能解决的问题，将在几年内得到解答。

3 — 个人生产力

就我个人而言：我今天一个人能构建的东西，在五年前需要一个团队。这个新网站就是在 AI 的深度协助下建成的。这不是思考的替代——而是思考的放大。

我的个人立场

我不生活在”AI 将拯救世界”和”AI 将毁灭世界”的非此即彼之中。现实更为复杂。

我知道的是：变革将至。问题不是它是否发生，而是我们如何准备。

对我这个在沙特阿拉伯的工程师而言：

我努力深入理解这些工具。 不是浅尝辄止。理解模型架构、智能体的工作方式、它们在哪里失败、在哪里出色。

我思考机器无法产生的价值。 本地情境、人类判断、个人信任、亲身经历。

我保持好奇而非恐惧。 恐惧使人僵化，好奇推动前进。

最后的话

2022年我在这个博客写下第一篇文章时，我在使用 Hugo，思考如何支持阿拉伯语。今天我在用 Astro 构建网站，谈论 AGI。

技术在加速。而加速本身也在加速。

不变的是：好奇心、理解的渴望，以及知识值得付出努力的信念。

求知不倦。