玩币族移动版

玩币族首页 > 新闻观点 >

王小川:AGI 时代,你在电脑面前坐的时间越长,就越危险

原文来源:中国企业家杂志

作者:赵东山

图片来源:由无界 AI 生成

“坐在电脑前的工作大概率都会被取代,电脑面前坐的时间越长,这个工作就会变得越危险。程序员也是自己的掘墓人,如果只会坐在电脑面前写代码,回头把自己取代了。”8月13日,在《中国企业家》杂志社举办的“2023(第二十三届)中国企业未来之星年会”上,百川智能创始人、CEO王小川这样讲道。今年开年以来,ChatGPT、大模型等持续爆火,王小川被问得最多的,就是什么职业会被取代,什么工作会产生变化。其中提出疑问的,有创始人也有员工,甚至年轻的爸妈在育儿方面也在发问。在王小川看来,今天大模型处于“读万卷书”的阶段,还没有“行万里路”,目前缺少线下的经验。围绕“AI大模型时代的新变局”这一主题,王小川作开幕演讲。演讲中,他从6个方面讲述了自己这半年多的兴奋、忙碌以及思考。他还提到,今年6月,他去了一趟美国,在和OpenAI等众多大模型从业者聊完后,发现当下国内这个行业处于“理想上慢一步,但落地上快三步”的状态。

从今年4月宣布入局到现在,王小川创办的百川智能团队已经达到120人规模,同时在过往的三个月中,百川智能已经发布三款不同参数的大模型,几乎达到了每个月一款。王小川庆幸自己既赶上了互联网大潮,又跑步进入了智能时代。

以下是王小川的精彩观点:1.如今,不管是学术界还是顶尖的企业家,都认为这是一个技术层面到数据层面巨大的变革。因此2023年是大模型元年开始,人类从信息时代走向智能时代,走入新的快车道。2.比尔·盖茨讲到机器的可读、可写、可理解,具有了读写的能力,但黄仁勋讲的不是机器能力,而是延续乔布斯的语言,iPhone来了是什么意思?机器和人是通过iPhone新的交互模式非常自然、自在地跟整个IT文明发生相应的联系。3.信息时代有两个重要工具:一是芯片,在开启信息时代时,很快从门户走到搜索,不管是大型机还是小型机、微机、手机,还是家用电器都要插入芯片驱动信息化。二是搜索,搜索就是入口,帮助用户进入整个信息化互联网的大门。4.简单来讲,坐在电脑前的工作大概率都会被取代,电脑面前坐的时间越长,这个工作就会变得更加危险。5.今天的大模型不是工具,而是人类的伙伴。因为工具是做连接的、做信息的,而这次已经有完整的语言能力,极好的对语言的沟通能力,能够在中间通过部分学习经验,经过产品化以后可以提供服务。

以下为王小川的演讲实录(有删减):2021年,我把创业20多年的公司并给了腾讯,完成了一次互联网生涯。我觉得自己非常幸运,不仅参与到互联网的大潮,今天以大模型代表的智能时代开启,我又重新上路——我觉得这不是弯道超车,不是变道,是重新上路,是新的里程,是正在拥抱和创造新的世界。从今年2月开始,大模型已经把大家轰炸得逐渐疲劳了,但我自己好像处于隔离现实的状态:大家看到的是经济状态怎么样、消费怎么样,但我们做大模型的这帮人还完全沉浸在技术中。这次,我提出几个与大模型相关的问题,也是年初到现在的思考,和大家分享。

思考1:AGI是否已经到来

第一,AGI(通用人工智能)是否已经到来?以前人工智能都是专项,需要一个一个单独的任务。而AGI就像人一样,什么都能干,而且每件事情能够干得比人好。

这是今年2月开始行业技术圈中一个非常大的争论,现在大家已经开始有了阶段性的结论。4月,微软发布了一篇重要技术报告,大概四百多页,认为GPT-4已经开始具有初步的通用人工智能,AGI已经开始来临,这是一个巨大的分界线。

我沿用马化腾在今年5月的一段话,“最开始以为互联网十年不遇的机会,越想越觉得是几百年不遇,类似于发明电的工业革命。”工业时代开始于18世纪60年代,这里提到的“几百年”,就是把历史放到工业革命之前。如今,不管是学术界还是顶尖的企业家,都认为这是一个技术层面到数据层面巨大的变革。因此2023年是大模型元年开始,人类从信息时代走向智能时代,走入新的快车道。

思考2:黄仁勋和比尔·盖茨对大模型的不同理解

第二,黄仁勋和比尔·盖茨对大模型不同的理解。今年年初英伟达的CEO黄仁勋(Jensen Huang)、比尔·盖茨都发表了对大模型不同的理解。比尔·盖茨认为,“人工智能时代已经开启,人工智能与移动电话、互联网一样具有革命性的影响”,但黄仁勋则提到了“AI的iPhone时刻”。从表述来看,两个人好像走的是不同的道路,那实际上二者的理解有什么不同?

后来我们做了更多的分析,查阅了文献。比尔·盖茨讲到机器的可读、可写、可理解,具有了读写的能力,但黄仁勋讲的不是机器能力,而是延续乔布斯的语言,iPhone来了是什么意思?机器和人是通过iPhone新的交互模式非常自然、自在地跟整个IT文明发生相应的联系。比尔·盖茨的讲话,之前就有被乔布斯批评为没品位的说法。当时乔布斯就认为比尔·盖茨这种没品位的人都能成功,让他感到非常焦虑、非常遗憾。而黄仁勋一直在讲大模型将对人会发生的改变。信息时代有两个重要工具:一是芯片,在开启信息时代时,很快从门户走到搜索,不管是大型机还是小型机、微机、手机,还是家用电器都要插入芯片驱动信息化。二是搜索,搜索就是入口,帮助用户进入整个信息化互联网的大门。大模型时代要有Foundation Model,是底层的模型本身,未来所有企业都需要通过私有化部署或者API调用获得智能的能力,上面OpenAI提供ChatGPT的软件,通过这种软件能够很自在地使用新的方式获得更多的信息和知识。在iPhone和iPad等设备上,我已经把搜索放到过去式,更重要的位置留给ChatGPT和百川的引擎。今天会用ChatGPT的人就像当时用搜索一样,谁都不敢想自己不用搜索,人人都得用,未来大家都会用,这能帮助我们更好地理解这个世界发生的事情。我下场时,宣布要做百川智能,当时我问ChatGPT怎样招到领军人物和优秀的人。ChatGPT给了我十个建议,第一个建议就是要把想法总结出来,发布出去,搞一个发布会,让大家知道你要做什么。而我根据这些意见,开启了我的智能旅程。

思考3:为什么AGI的起点是语言模型

第三,为什么AGI的起点是语言模型?Large Language Model(LLM)也是大家听到的词,图像处理成就之前的AI四小龙企业,但从信息时代走向智能时代,开启方反而是语言。为什么是语言?著名的作家兼哲学家路德维希·维特根斯坦在其《逻辑哲学论》一书中提到:“我的语言的界限,意味着我的世界的界限。”对我们而言,承载世界的知识、思考、沟通和文化靠的是语言。我们可以想象一个原始部落可能只有800个单词进行简单的沟通,文明一定不强,因为词汇本身的发明代表着每多一个词汇就让世界多了一个认知的维度,词汇之间建立的逻辑关系和表达代表了我们对世界完整的建模。这个模型不是在图像里面,而是通过语言进行承载,所以语言边界就是世界边界,语言是知识文化的载体;Word Model is World Model,词的模型就是世界的模型。我们今天讲AI For Science,包括创业,核心就是把现实世界的现象翻译成为数学模型,通过语言把物理学或者生命理解到现实世界和数据是什么关系。牛顿开启了科学时代,通过观察、假说和实验建立一套对世界现象的认知体系,最著名的就是提出万有引力和牛顿的力学三大定律,通过一个公式解释或者预测一个真实世界中的现象。我的理论特别简单,一个公式讲完,一个现象能够精确预测,解释过去发生啥、未来发生啥。所以牛顿很自豪地讲苹果是怎么落地的,天上的星星是怎么运动的,一切的规律都浓缩在万有引力定律里面。在牛顿之前其实没有科学,也没有物理学,那会儿牛顿的巨著叫做《自然哲学的数学原理》,牛顿之前是自然哲学,现在变成数学,康德也认为牛顿把物理学变成数学。今天OpenAI代表的技术能力把语言变成数学模型,变成公式已经不太行了,就是用底层不太够。我们这次会议的主题是“涌现”,“涌现”的背后还有一个词是“衍生论”,就是在还原论的体系把世界中微观的原子和分子搞明白就构建起世界的规则。今天从衍生论来讲,不同层次的世界的规则和现象属性是不一样的,一群人和一个人的属性是不一样的。物理学能够解释的世界非常有限,现在用物理学解释超导现象也解释不了,因此不同层次需要不同的描述方法。我们已经走出了原来物理学靠一个公式解释世界的方法,更多是靠暴力的数据在不同层次单独建模,上层建模就是由大量的数据驱动,AI For Science已经从公式导向走向AI模型导向。语言模型如此,生命建模也是如此,2021年最伟大的成就就是DeepMind的AlphaFord系统,针对基因到蛋白质的三维结构建模,通过这个模型预测基因被转录或者表达为蛋白质以后拥有的形态,也是全世界轰动的生命领域的突破,靠的也是数据和AI的驱动。今天的语言模型已经做得非常好了,不是100分也是99分的样子。生命建模到现在进展还很少,基因到蛋白质的结构建模,但人体内不是一个基因,有着两万三千个基因,中间都有相互的作用,二万三千个基因只代表DNA核糖核苷酸的5%,95%的调控网络没有办法理解它交互的作用。即便把基因变成蛋白质被预测到,蛋白质作为PET3怎样构建身体,使得我们更加健康,里面还有很多未知的事情。现在制药还很难,十年时间、十亿美金砸进去,成功率只有10%,所以对生命建模还远没有完成。制药还是用一种小分子、大分子偏还原论的方式去做,甚至未来医学需要提出新的体系,能够在衍生论的指导下从人的整体结构涌现出现象去定义生命背后的规律。

思考4:AGI的世界会变成什么样

第四,AGI的世界会变成什么样?今天大模型在整个世界中处于什么位置?我们走出了物理学的框架,建立语言建模,但生命建模还没有开始,所以语言建模代表的是对世界的认知,不是对生命的认知。

什么行业会被改变?现阶段的共识分为三个领域:1.生产力方面,指给企业本身赋能,调用的时候能够使得知识的推理速度Insight更多。2.智能助理这个领域,不再是简单工具调用,更像是伙伴。可能未来,它是你的私人医生、私人律师、搜索助手、购物达人,就是像人一样能够帮助我们,像L1、L2、L3的无人驾驶,现在是CoPilot辅助决策,未来是智能助理时代。3.如果没有大模型的支持,元宇宙是做不起来的,Word Model is World Model(词的模型是世界的模型),不仅是文生图、文生视频,甚至能够做到世界的驱动引擎,以游戏行业为代表首先会带来新的颠覆。

思考5:什么职业会被取代

第五,大家很关心的一个问题,什么职业会被取代,什么工作会产生变化。这个问题,不管是做老板的还是做员工的,甚至有育儿需求的爸妈都在问。我们知道今天大模型其实处于“读万卷书”的阶段,但没有“行万里路”,还缺少线下的经验。简单来讲,坐在电脑前的工作大概率都会被取代,电脑面前坐的时间越长,这个工作就会变得更加危险。如做平面设计,现在发现几行指令就能够做到,要是出去采风、采点,跟别人交流的工作就会好很多。程序员也是自己的掘墓人,如果只会坐在电脑面前写代码,回头把自己取代了。预测和预言也是这样,今天我们讲的是第二次工业革命,那这次的和过去提到的工业革命有什么本质的区别?工业革命带来了高度的社会分工,社会分工越细效率越高,每个部门专职做一件事情效率最高,但这样也会形成社会的阶层。智能时代有一个词叫“端到端”,原来分得很细的工种现在被一个模型从头到尾取代。技术行业如此,公司内部很多事情也是这样,游戏公司有人做策划,有人做美工,有人做产品,最后变成一个人把一个团队的事情干了。开玩笑地说,一个人就是一个公司,端到端的分工相对减弱,变得更加扁平,有些率先拥抱OpenAI技术的公司里面已经开始出现很多裁员。我们也能看到一个大的变化,今天的大模型不是工具,而是人类的伙伴。因为工具是做连接的、做信息的,而这次已经有完整的语言能力,极好的对语言的沟通能力,能够在中间通过部分学习经验,经过产品化以后可以提供服务。大模型往下很多时候造出来的都是像人一样的助手,可能是个老师,是个医生,是个律师,就是虚拟的角色,这是和产品服务不一样的逻辑。文艺复兴让人变得更厉害了,现在大模型来了以后人可以超越个体,不用大模型的人会被取代。拥抱大模型的人能够使得自己更加自由,你想成为什么样的人就问这个模型,模型会给你一些实现的路径,因此更能够做出你想做的事情。我在这里引用三个方向:怎么做GPT-4、怎么做超级应用、怎么创造健康快乐。健康和快乐,大家特别容易理解,就是有帮助的地方;创造,是使得每个人有根本的诉求,因为它的存在这个世界有所不同,因此机器通过生产率的提升赋能一个人,能使这个人更有改变世界的力量,使其成为一个更有用的人,这个就是创造。这是百川未来在这三个方向引导模型发展的能力。

思考6:理想上慢一步,落地上快三步

发布了第一款模型时,我总结过“在理想上比美国慢半步,落地却比美国快半步”。今年6月,我去了一趟美国,回来以后调整了一下,“理想上慢一步,落地上快三步”。我跟OpenAI的人在聊时得知,他们做GPT-3时,需要4000张卡做训练,GPT-4需要2万张卡做训练,现在是把1000万颗GPU连在一起训练新的模型——这是在以巨大的规模做设计。英伟达作为全球最大的GPU生产公司,一年生产GPU100万颗,设计1000万颗的连接,不计成本、不计代价地做。这在中国是不现实的,我们要考虑投入的现实产出是什么。这样的好处是现在中国落地能力更强,美国这帮工程师推动时,他们对应用导向、产品导向理解得不多,比如对比微信也好、淘宝也好,他们这么好用的软件放在中国其实弱很多。我们现在缺少的一些模型技术与他们还有距离。我们应用能力很好,模型能力要差一些,模型赶上以后在应用上就会有一个快速的反超。搜索和模型的关系是技术上的问题,我们会给大家提供开源的产品,美国OpenAI今年年初让大家都很震撼,他们提供了API调用。但在美国更有颠覆性的事情,就是今年Meta做的一个开源项目叫做Llama 2,使得很多企业不用调用那么昂贵的API,自己就用一个模型把自己公司的数据做得更好,形成开源闭源的两个体系改变竞争格局。我们4月10日宣布入场,6月发布第一款7B参数的开源模型,得到业界最顶尖水平的肯定,英文上能跟Llama对标,中文上达到更好的水平。同时,还能免费用到,能在公司里面自己做相应的部署,在不久的Q3、Q4,我们会做智能助理。7月,我们发布了13B参数,同时达到最好的效果,作为科技强国献礼。8月8日,我们发布53B的模型,尺寸相对比较大,部署起来比较困难,因此我们就没有走开源,而是走了闭源。我们用三个月,发布了三款模型产品,推动中国开源模型的进展。

知识: ChatGPT 大模型