编者按
当 AI 正在重构科研与产业的底层逻辑,AI for Science 早已不是纸上概念。4月28日,未来光锥联合北京中关村学院AI商学院,共同推出「AI for Science 创变者说:学界 × 产业先锋对话系列沙龙」。首期活动邀请了3 位一线嘉宾。北京中关村学院副教授、中关村学院AI商学院联席院长郑书新,用扎实的数据和一线洞察,回答了三个所有人都关心的问题:AI4S 的 “ChatGPT 时刻” 会来吗?创业者的壁垒在哪?年轻人该如何下注?
大模型的本质:压缩产生智能
这一波大模型的通用智能性,到底从哪来?OpenAI前首席科学家Ilya一句话道破本质:压缩产生智能——模型的智能性,来自于它用相对小的参数空间,去压缩了人类语言产生的海量数据。在这个过程中,模型被逼着提炼数据里的共性结构和内在表征,智能就此涌现。
举个例子,GPT-3 第一个版本 175B(约 1750 亿)参数,要把全人类写下来过的几乎所有文本都装进去。如果它纯靠记忆,那本质上就是一个硬盘,硬盘是不会产生智能的。但当我们要求它用越来越小的参数量、越来越小的体积去把这些数据“记下来”的时候,它就被逼着去提炼共性的结构和内在的表征——智能就是在这个压缩过程中涌现出来的。
这背后还有一个更严格的理论支点,叫 Kolmogorov 复杂度——一段数据的复杂度可以用最短能描述它的程序长度来衡量。比如一段全是数字 0 的数据,用一行 Python 就能压缩它,因为它内在结构极其简单。大语言模型“预测下一个词”的范式,其实就是对 Kolmogorov 程序的一种很好的近似。
但这也注定了它的天花板:人类已知。你跟人学,终究不可能超过人。而AI for Science,走的是一条完全不同的路。
AI4S的两条核心路径
AI4S不碰人类语言,它直接研究物理规律、生物过程、分子构象,它压缩的是自然界本身的数据,而不是“人类如何描述自然界”。
最有代表性的就是 AlphaFold——它是诺贝尔奖级别的工作。它在做什么?也很简单:在自然界数据中找相关性。当 PDB(Protein Data Bank)里积累了几十万条蛋白结构数据时,模型就能从中找到从序列到三维结构的映射,把蛋白结构这件事“求解”出来。
这里有一个核心分析框架,AI4S的两条腿:
- Scientist(科学家):读文献、提假设、设计实验,本质是语言智能 知识整合 逻辑推理。强项是推理与知识,短板是对物理世界没有“直接理解”。代表是 OpenAI、Anthropic、DeepMind 这些 Frontier Labs 的科研模型。
- Simulator(模拟器):用AI数据驱动地拟合物理世界规律,强项是对世界本身建模,不是堆参数能堆出来的,短板是没有显式的知识链条与推理能力。代表是AlphaFold、各类气象大模型。
大模型的终点是AGI,而AI4S的星辰大海,是突破人类认知的边界——宇宙是未知的,只有Simulator这条路,理论上能让AI探索人类还没发现的东西。

本文经授权转载自未来光锥 (ID:lightcone2050),如需二次转载请联系原作者。欢迎转发到朋友圈。
点个“小爱心”吧
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体110310