2017年,谷歌的一支团队发表了一篇题为《Attention is All You Need》的论文。那时没有人知道,这篇论文将改变人类历史的进程。
今天,2025年,我坐在屏幕前,看着模型自我纠正错误、编写复杂代码、进行研究、谈判和设计。“窄域人工智能”和”通用人工智能”之间的界限已经变得模糊——速度远超任何人的预期。
这篇文章是我的个人思考——不是学术报告,也不是末日预言。这是我作为一名工程师和亲历这一时刻的人,脑海中萦绕的思考。
AGI 究竟是什么?
通用人工智能(Artificial General Intelligence)是指能够执行人类所能完成的任何智识任务的系统——并且能够学习未经专门训练的新任务。
这与窄域人工智能(ANI)根本不同。ANI 在单一特定领域表现出色:GPT 会写作但不会开车,AlphaGo 会下围棋但不理解日常对话。
真正的 AGI 能够学习、适应、泛化。就像一个聪明的人,只要给予时间和信息,就能学会任何事情。
我们是如何走到这里的?真实的时间线
2017年 — 起点:Transformer
《Attention is All You Need》引入了 Transformer 架构。核心思想:注意力机制(Attention)——模型不再线性处理信息,而是可以同时”关注”上下文的不同部分。
这看起来是技术性的。但它改变了一切。
2020年 — GPT-3:转折点
OpenAI 的 GPT-3 令人震惊。这个 1750 亿参数的模型写出的文本,往往难以与人类写作区分。所有人都说:“只是统计,没有真正的理解。“也许吧。但实际应用效果非常真实。
2022年 — ChatGPT:大众化爆发
2022年11月 ChatGPT 发布时,五天内达到了100万用户。历史上从未有任何技术做到这一点。不是因为它最聪明——而是因为它最易用。对话式界面让人工智能的获取变得民主化。
2024年 — 推理模型
GPT-o1、o3,Claude 3.5 Sonnet。这些模型不只是回答——它们会思考、审视、验证、自我纠错。
当 o3 接受数学、编程和科学基准测试时,其表现超过了绝大多数人类。不是靠记忆——而是靠推理。
2025年 — 自主智能体(Agents)
当前的质变:智能体。这些模型不只回答问题,而是完成完整的任务:
- 编写代码、运行代码、修复错误,并部署到生产环境
- 搜索互联网、汇总信息、撰写报告
- 管理项目:任务、截止日期、沟通
发展速度超出预期——用真实数据说话
这不只是感觉,有客观指标:
MMLU(大规模多任务语言理解): 包含57个领域、57,000道题的测试。2020年:最佳模型得分43%。2024年:超过90%。
HumanEval(代码编写): 2021年:GPT-4 解决67%的问题。2024年:o3 解决96%。
SWE-bench(修复真实 GitHub Bug): 2023年:1.96%。2024年:49%。一年内增长25倍。
这条曲线不是渐进式的,更接近于垂直上升。
三件令我担忧的事
我不会天真地说这一切都是好事,没有任何隐患。这些担忧是真实的:
1 — 权力集中
拥有这些模型的少数公司现在掌握着巨大的权力。OpenAI、Google、Anthropic、Meta,全都是西方公司,大多数是美国公司。这对消费这项技术但不生产它的世界其他地区意味着什么?
2 — 就业
并非所有工作都面临同等风险。重复性知识工作——撰写特定报告、翻译、客户服务、数据录入——将受到严重影响。
但即使是曾经看似安全的工作也开始动摇:编程、法律、医学,甚至艺术。
3 — 虚假信息
能够在没有人工参与的情况下生成令人信服、个性化内容的模型,是前所未有规模虚假信息传播的完美工具。
三件令我振奋的事
但图景并非全然黯淡:
1 — 知识民主化
也门或印度尼西亚偏远村庄的年轻人,今天可以获取曾经只有大城市富人才能获得的信息和帮助。AI 医生提供指导,AI 律师提供解释,AI 教师提供教育。
这不是人类专家的替代品,但远比什么都没有要好得多。
2 — 科学加速
DeepMind 的 AlphaFold 解决了困扰科学界五十年的蛋白质折叠问题。现在类似的模型正在加速药物发现、气候理解和新材料研究。
曾经需要一代科学家才能解决的问题,将在几年内得到解答。
3 — 个人生产力
就我个人而言:我今天一个人能构建的东西,在五年前需要一个团队。这个新网站就是在 AI 的深度协助下建成的。这不是思考的替代——而是思考的放大。
我的个人立场
我不生活在”AI 将拯救世界”和”AI 将毁灭世界”的非此即彼之中。现实更为复杂。
我知道的是:变革将至。问题不是它是否发生,而是我们如何准备。
对我这个在沙特阿拉伯的工程师而言:
我努力深入理解这些工具。 不是浅尝辄止。理解模型架构、智能体的工作方式、它们在哪里失败、在哪里出色。
我思考机器无法产生的价值。 本地情境、人类判断、个人信任、亲身经历。
我保持好奇而非恐惧。 恐惧使人僵化,好奇推动前进。
最后的话
2022年我在这个博客写下第一篇文章时,我在使用 Hugo,思考如何支持阿拉伯语。今天我在用 Astro 构建网站,谈论 AGI。
技术在加速。而加速本身也在加速。
不变的是:好奇心、理解的渴望,以及知识值得付出努力的信念。
求知不倦。