深度|谷歌DeepMind CEO:中国在AI技术能否实现重大突破尚未验证发明新东西比复制难一百倍
日期:2026-02-05 23:48:35 作者:admin 阅读
日期:2026-02-05 23:48:35 作者:admin 阅读
”与“毫无收益”是完全不同的。现在处于两者之间:仍然能获得非常可观的回报,而且这是值得继续投入的方向。迈向AGI也许仍然还需要一两项重大的创新,而不仅仅是对现有理念的规模化提升。
系统能够更好地理解世界的物理规律,从而在脑海中运行模拟来验证自己的假说,这正是顶尖科学家、人类科学家所做的事情。而到目前为止,我们的AI系统还无法做到这一点。
AI可以说是一把双刃剑,最终它将成为人类有史以来最重要的技术。这实际上也是计算机时代的自然发展和延伸。
对于所有AI实验室的领导者来说,这都是一项责任。在我们所处的激烈资本主义竞争环境中,仍需将这一点放在心上,时刻牢记如何引导AGI造福全人类。因此,这两件事情同时成立:既要参与竞争,也要担起更大的责任。
Arjun:大家好,欢迎收看《Tech Download》。我是Arjun Kharpal,常驻伦敦的CNBC高级科技记者。本次我带来了一位非常特别的新嘉宾,一起来聊聊最新的科技动态。
Steve:我是Steve Kovach,在纽约从事科技报道,主要关注Apple和Microsoft。不过说实线年,对整个科技行业的动态和趋势都比较熟悉。能和Arjun一起合作,我真的很兴奋。之前一直都在远方关注他的工作,现在终于有机会真正碰面,这次交流应该会非常有意思。
Arjun:这次一定会很有趣,Steve。我们两个人加起来在科技报道领域差不多有近三十年的经验,但令人兴奋的是,仍有很多东西可以学习。相信在一起制作这档播客的过程中,我们会接触到大量有趣的人物,学到很多新东西。这一季的开篇,我们就从Google DeepMind入手,带来对这一世界顶尖AI实验室的深入解读。给听众和观众简单介绍一下Google DeepMind。这家公司成立于2010年,总部就在伦敦,最初是一家非常小的创业公司,由三位创始人创立:Demis Hassabis、Shane Legg和Mustafa Suleyman——后者现在已经在微软工作了,对吧?
Steve:事实上,我差不多一年前就采访过他。Suleyman基本上在做的事情和Demis在Google做的类似。很有意思的是,Google可以说是一个“孵化器”,汇聚了全球顶尖的AI人才。Demis显然一直留在这里,继续领导DeepMind的工作。
Steve:另外特别有意思的一点在于过去三年里我们经历的这一轮 AI 浪潮本身。三年前,ChatGPT横空出世,当时Google一度被视为面临威胁。他们经历了“红色警报”状态,不得不进行一系列内部重组。最终,Demis脱颖而出,成为AI领域的领导者。而2025年对Google来说,又是AI发展非常关键和引人注目的一年。他们在某种程度上追上了,甚至在某些方面超越了ChatGPT的表现。这非常有趣,因为支撑这一切的核心技术LLM,其实最早就是在Google开发的。外界曾有一种看法,认为Google让ChatGPT把这项技术抢先用起来了。但在我看来,现在的Gemini已经几乎可以和ChatGPT平起平坐,甚至在某些方面表现更好。
Arjun:Google DeepMind在这当中起着核心作用。我之前提到,它成立于2010年,而Google在2014年将其收购。当时我刚刚进入科技报道行业,Google为DeepMind支付了大约4亿英镑,也就是2014年约5.4亿美元。按照现在的估算,这笔投资的价值可能已经达到数百亿,甚至上千亿美元。
Arjun:实际上,DeepMind对Google的AI发展至关重要。以Gemini这个面向消费者发布的聊天机器人为例,它的背后技术很大程度上都来自DeepMind。但早在这些之前,DeepMind就已经有过一些重大突破。几年前,他们推出了名为AlphaGo的系统,引起了全球轰动。这是第一个能够击败围棋世界冠军的计算机程序。围棋是一种非常复杂的棋类游戏,当时被视为AI的重大挑战之一,因为它的变化极其多样,可能的组合数量非常庞大。
Arjun:另一个重大突破当然是AlphaFold。这也是DeepMind开发的AI系统,能够精准预测蛋白质结构的三维模型。它的意义在于,如果能做到这一点,就可能带来医学领域的重大突破,科学上的这一进展也一直是DeepMind核心工作的重点。显然,十多年前Google对DeepMind的投资是一个重要的战略赌注,也正是这项投入帮助Google成为了今天的AI全球领导者。
Steve:这正是我对DeepMind印象最深的地方。多年来一直关注着他们,我发现DeepMind非常扎根于科学。他们当时并不一定想去做面向消费者的产品,而是真正致力于解决科学上的基础性问题,引领AI在药物研发等领域的应用,甚至是应对气候变化等复杂挑战。我知道Demis针对这些话题聊了很多,在接下来的对话中,他也会谈到这些内容。
Arjun:Demis,我们希望在有限的时间里聊到很多内容,但我想先从技术本身开始。我们一直在谈论AI,也在讨论这些系统的能力,以及它们如何在持续进步。在科技圈里,有很多讨论集中在一个问题上:这些模型究竟能达到多高的水平,这些系统的能力究竟能提升到什么程度?关于这一点,其实科技圈有很多讨论,尤其是关于Scaling Laws的概念。给听众解释一下,这个概念指的是:更多的算力、更大的数据量、更大的模型,最终会推动系统能力整体提升。您提到过,我们需要把Scaling Laws推到极限。现在的问题球盟会官方网站是,我们是否在这些Scaling Laws的进展上遇到了瓶颈?模型提升能力的空间是否有上限?就DeepMind目前的开发来看,您观察到的情况是怎样的?
Demis:我觉得Scaling Laws运行得很好。我们确实观察到,通过增加算力、增加数据量以及扩大模型规模,系统能力在不断提升。虽然这个趋势相比几年前可能没有那么快,因此有些人会谈到“收益递减”的问题,但要注意,“收益递减”与“毫无收益”是完全不同的。我认为现在处于两者之间:仍然能获得非常可观的回报,而且这是值得继续投入的方向。如果谈到迈向AGI,也许仍然还需要一两项重大的创新,而不仅仅是对现有理念的规模化提升。
Arjun:我们很快就会正式聊到Gemini,但在您看来,目前还缺少哪些关键环节呢?
Demis:其实如果进行观察,我们都尝试过各种聊天机器人,会发现它们在某些方面确实很出色,但它们的智能是碎片化的。也就是说,它们在特定任务上表现很好,但在其他方面完全做不到。如果你用某种方式提出问题,就会发现它们存在明显缺陷,有些相对简单的事情它们也做不了。而要实现真正的AGI,这种不一致性就不应该存在,智能表现应该在各个方面都保持一致。此外,目前的系统还有一些限制:它们无法持续学习,无法在线获取新知识,也不能真正创造原创内容。所以对于AGI而言,有许多能力在现有系统中仍然缺失,这一点非常有意思。
Arjun:那么要实现那种真正智能的系统,需要解锁哪些关键能力呢?我想顺便分享一下几个月前与Hugging Face联合创始人Thomas Wolf的一次对话。他谈到自己对LLMs的看法,认为它们确实非常出色。比如在使用这些聊天机器人时,它们会回应“好问题”“好主意”,并提供你需要的所有信息。但目前这些系统仍然缺少产生全新创意的能力。尤其是在科学领域,比如利用AI发现新药物或新疾病,LLMs可能无法提出那些足以获得诺贝尔奖的创新性想法,这也许意味着需要某种全新的架构。那么在您看来,目前该如何应对这一局限?
Demis:是的,我对AI的热情,以及我整个职业生涯都投入在这个领域的原因,就是因为我相信,它最终会成为科学的终极工具。当然,我们已经通过AlphaFold,以及过去十年在科学领域的工作,展示了这一点。但在AI是否能够真正自己提出新的假说方面,还有很长的路要走。现在的系统可以解决已经存在的猜想,这本身已经很有用,也很令人印象深刻,但它们还无法自己提出新的猜想,提出关于世界可能如何运作的新想法。到目前为止,这些系统还没有这种能力,所以显然还缺少某些关键东西。有些功能需要长期规划、更强的推理能力,或是所谓的“World Models(世界模型)”的概念——也就是系统能够更好地理解世界的物理规律,从而在脑海中运行模拟来验证自己的假说,这正是顶尖科学家、人类科学家所做的事情。而到目前为止,我们的AI系统还无法做到这一点。
Arjun:能帮我们更详细地解释一下“World Models”这个概念吗?因为对很多人来说,这可能是第一次听到这个词。我也想了解,它和LLMs有什么不同?
Demis:目前我们使用的LLMs主要还是围绕文本。当然,像Gemini这样的基础模型也可以处理图像、视频和音频等不同模态。但它们仍然没有真正理解世界的物理规律,也没有理解因果关系,比如一件事情如何影响另一件事情。它们能否进行长期规划,预测未来的发展?这些都是相互关联的概念。如果真的想完成科学理论所做的事情,理解世界的运作方式,从而可能创造出新的事物,那么就必须拥有一个准确的World Models。从直觉物理开始,理解世界的物理规律,一直到生物学、经济学等更高层次的领域,这都是必不可少的。
Arjun:那么,如果我们实现了所谓的AGI——达到人类水平的智能,您认为会是LLMs和World Models协同工作,还是在某种意义上,World Models会取代LLMs?
Demis:不,这些技术最终会趋向融合。至少我是这么判断的。Foundation Models(基础模型),比如Gemini,依然会是核心组成部分。这一点我几乎毫不怀疑,所以我们必须尽可能地将这些系统扩展得更大、更强。但问题是,它们是否是实现AGI所唯一需要的组成部分?在这方面,我怀疑还需要其他类型的技术和能力。
Demis:我认为这些World Models能力非常重要,我们正在开发自己的版本,叫做Genie。同时,我们还有最先进的视频模型,可以根据文字信息生成视频。你可以把视频模型和像Genie这样的交互式模型看作是早期的“胚胎”World Models。如果一个系统能够生成关于世界的逼真内容,那么从某种意义上,它就理解了世界的运作方式。否则,它又怎么可能生成这些内容呢?
Arjun:正如您提到的关于AGI,我知道这个概念有多种定义。您之前曾表示,自己认为实现AGI可能在5到10年的时间范围内。那么,考虑到我们在2025年看到的一些深远发展,您的看法是否仍然如此?
Demis:是的,我认为我们实际上正走在正确的轨道上。2010年我们创立DeepMind时,就设想这是一个大约20年的长期使命,去构建能够展现我们所有认知能力的AGI系统,包括真正的创新能力、创造力、规划能力、推理能力等等。我认为距离实现这一目标大约还有5到10年时间。但如果想想这项技术的变革性,这已经是非常了不起的了。
Arjun:您提到可能还需要一些技术突破。我们看到模型在不断进步,半导体技术也在快速发展。那么目前是否存在一些瓶颈需要解决?我知道能源问题一直被频繁提及:虽然我们可以不断改进芯片、不断提升模型能力,但总有一天,我们可能没有足够的能源来支撑这些数据中心和AI模型的运行。
Demis:是的,其实存在很多物理上的限制。当然,从来没有人能拥有足够的芯片。幸运的是,我们除了GPU,还有自己的TPU系列,但实际上全球的算力芯片仍然远远无法满足需求。而最终,这又归结到能源问题。随着我们迈向AGI的时代,人们越来越把“能源”视为“智能”的同义概念。
有趣的是,我认为AI本身也能在这方面提供帮助,比如提高现有基础设施的效率,改进材料设计,比如更高效的太阳能材料;甚至推动新的突破性技术的发展,比如核聚变。我们在美国就与Commonwealth Fusion有合作,利用AI来帮助控制等离子体和聚变反应堆的运行。我个人特别关注的一个项目是:能否利用AI发现一种室温超导材料。AI可以带来多个突破,并帮助我们解决能源问题。实际上,这可能是AI最有前景的应用场景之一。
另一方面,随着这些系统不断进步,它们的效率每年也在提升大约10倍。以我们的一系列模型为例,我们有旗舰型号Lighthouse、Gemini的专业版,以及更加高效的Flash版本——这些是用于日常工作的主力模型。它们还采用了一些技术,比如Distillation(蒸馏),即用大模型去“教”小模型,而小模型的效率非常高。类似的创新技术会越来越多,不断推动效率曲线下降,从而每瓦特的计算性能会大幅提升。
Arjun:围绕AGI,外界的讨论始终非常热烈。一方面,这项技术听起来极具突破性和吸引力;但另一方面,人们也普遍对它的广泛应用心存担忧,尤其是它将如何深刻改变普通人的生活方式。从社会影响的角度来看,有哪些关键问题需要被认真考量?无论是对就业岗位和劳动结构的影响,还是在一旦实现这一目标之后,人类将如何重新安排和利用自身时间;与这些讨论并行的,还有一个同样重要的问题——在您看来,这项技术最终可能为人类社会带来哪些实质性的价值和长远益处?
Demis:当然从整体上看,AI很可能成为人类历史上最具深远影响、也最具正向价值的技术之一,这正是其长期投身于这一领域的原因所在。但这一前景并非理所当然就会实现。AI本质上是一种典型的“双用途技术”,其最终走向和影响,取决于人类如何加以引导和应用。理想中的应用场景之一,是将AI用于治疗和攻克疾病。基于数年前在AlphaFold以及蛋白质折叠领域取得的研究成果,团队孵化了名为Isomorphic的衍生公司,致力于将这些技术进一步落地,用于加速药物发现和研发进程,并尝试从根本上解决疾病问题。从当前的发展来看,在未来10-20年内,实现这一目标已不再只是愿景,而是逐步进入可实现的范围。此外,能源问题同样是此前讨论过、并具有巨大潜力的关键应用方向。
AI将带来大量且极具深度的积极影响,但与此同时也伴随着不可忽视的风险。其中一个显而易见的方面是经济层面的冲击与动荡。在这一点上,AI的影响可能类似于工业革命,但无论是在规模还是速度上,都可能达到其数倍,甚至以十倍的幅度加速展开。因此,这一进程既包含前所未有的深刻转型,也必将伴随着显著的冲击和扰动。在这样的背景下,我们需要引入全新的经济模式,才能更好应对随之而来的变化。
至于有关AI应用的担忧,我认为有两个方面值得重视。其一,是不法分子可能将这些通用技术重新用于恶意目的,将AI技术用于有害行为。其二,则是随着我们逐步迈向AGI以及基于智能体的系统,AI自身可能带来的风险。这些系统比现有技术能够更自主地执行任务。关键问题在于,我们需要什么样的安全机制和约束措施?如何确保它们始终按照预期执行任务,而不会偏离或产生意料之外的行为?这就是我所预见的两类主要风险。
Arjun:在您看来,目前正在研发的这些系统,是否仍然处在人类可控与可治理的范围之内?
Demis:我认为在这方面是非常有信心的。实际上,我们从一开始就已经将这些系统的责任、可靠性以及安全性纳入了设计和研发的核心考量。2010年创立Demon时,几乎没有人在从事AI相关研究。但我们一开始就为成功做好了规划,并意识到,我们的成功意味着将会开发出极其强大的系统。与此同时,我们也清楚地认识到这种力量背后的潜在风险。因此从最初阶段起,我们就在研发过程中始终保持谨慎和深思熟虑。我们遵循科学方法和科学化的研究思路,尽可能在部署系统之前充分理解所构建的AI系统。
当然,这并不意味着完全不会犯错——毕竟这是一项发展迅速、变化巨大的技术。但我认为,对AI需要保持一种谨慎的态度,毕竟我觉得自己是那种“谨慎的乐观主义者”。我非常相信人类的创造力,只要给予足够的时间和谨慎对待,作为科学家以及整个社会,我们最终能够把AI的发展做好,但这绝非理所当然。因此,我们不应仓促推进这项技术,而是需要以清醒、审慎的态度去面对,充分认识其中的风险与挑战。
Arjun:我之所以问这个问题,是因为我知道您曾与像Joshua Bengio、Max Tegmark这样的人交流过,而我也和他们谈过。他们属于同一批学者,普遍关注一个问题:我们是否真的需要如此快速地进入AGI和基于智能体的系统时代?也许我们更需要的是针对特定任务的工具型AI,而不是这些通用型、全用途系统。我知道他们曾呼吁可能需要放缓AGI系统的研发步伐。那么在您看来,是否有必要减缓这一进程?
Demis:我和Joshua、Max等人非常熟悉,也进行了很多次讨论,同时也与其他许多人交流过。实际上,我对这种观点是有一定认同的——即在AI的初期阶段,将其构建为工具型AI,把AI视为科学等领域的终极工具,是开发AI的正确方式。当然,这也是我们看待AI的方式,以及我们应用AI的一些方向,比如AlphaFold。但问题在于,我们所处的是一个非常复杂的地缘政治和企业生态系统,这不仅仅是技术问题。
有很多公司在研发这些技术,也有许多国家在推动AI的发展,同时存在一种竞赛动态;而理想情况下,这种竞争本不该如此激烈。理想情况下,AI的发展应当是一项科学探索,每一步都经过仔细评估和考量。但现实世界并非如此,我们必须对现状保持务实态度。因此,我们努力的方向是,尽可能成为良好的示范和榜样。我们在前沿领域不断探索,尽可能快速、广泛地释放这些技术带来的益处,同时也尽量在整个过程中保持高度责任感和深思熟虑。我认为,目前我们在速度与责任之间找到了相对平衡,也希望能够成为整个行业和学术界的榜样。
Arjun:从更个人的角度出发想问一个问题:您当初发起并推动DeepMind这一使命,始终对这项技术充满信念,那么在您的职业生涯中,是否曾经有过某些时刻,让您对自己正在做的事情产生过犹豫,甚至问过自己“我们真的应该这样做吗”?
Demis:从技术本身的潜力来看,我真的认为当今社会面临着太多重大挑战,而这些挑战并不完全来自AI:气候变化、贫困、水资源获取等问题;还有健康、人口老龄化、疾病等等;此外,还有我们之前讨论过的能源问题。如果没有像AI这样具有变革性的技术出现,我会非常担心社会应对这些重大挑战的能力。有趣的是,AI本身也是其中一个挑战,甚至可能是最严峻的挑战之一;但它同时也是一个工具,可以帮助我们应对、缓解甚至解决其他这些重大社会问题。所以这是一个非常有趣的情况——AI可以说是一把双刃剑。我一直以来都相信这一点,也始终认为,最终它将成为人类有史以来最重要的技术。这实际上也是计算机时代的自然发展和延伸。
Arjun:顺便插一句题外话,您最早是从游戏行业起步的,这本身就很了不起,而且您还共同开发过Theme Park这样非常经典、出色的游戏。想问一下,您现在还会玩游戏吗?
Demis:是的,我非常喜欢游戏,这几乎是我唯一、也是最主要的业余爱好。
Demis:最近我主要玩LOL,和我的两个儿子以及兄弟组了一个小队,自疫情居家以来一直在玩。但总之我喜欢各种形式的游戏,从电子游戏到足球等实体运动。
Arjun:在面对如此高强度、高影响力的工作和压力时,这是否成为了一种放松和解压的方式?
Demis:确实可以这么说。而且对我而言,游戏不仅是一种放松方式,同时也是一项极具创造性的活动,过去我也正是通过制作游戏学习了编程以及其他相关技能。
Arjun:我的工作远没有您那么高压,但我放松的方式也是如此——回到家,打开游戏主机,就完全沉浸其中。
Arjun:仅仅在这一小段内容里,就有很多值得深入探讨的点。我想先聚焦于两个当前的热门词汇。第一个是AGI。这个概念有很多不同的定义,但总体来说,它指的是一种智能水平与人类相当甚至超越人类的AI。许多顶尖的AI实验室,包括OpenAI和DeepMind,都在推动并希望最终实现AGI。到目前为止,他们主要通过一种被称为LLM的技术来接近这一目标,这类AI模型以海量数据为训练基础,主要是文本数据。不过,这里还有另一个热门词汇需要提及。World Models(世界模型),指的是那些能够理解物理世界的AI模型。这个概念近年来正变得越来越受关注,也越来越热门。
Steve:是的,我认为这将成为AI在2026年余下时间乃至明年的一个重要主题。因为其核心思想是:LLMs确实已经很好地掌握了语言部分。
Steve:LLM可以模仿人类的说话、书写和表达方式。但当涉及到物理世界时——比如我们经常讨论的机器人、物理AI。这些系统需要理解物理世界的运作规律,比如水的流动、空气的运动等。当你向Demis提出这个问题时,他的回应让我印象深刻:是的,我们确实需要开始更多地探索这一方向。实际上,他设想了一个场景,在这个场景中,LLM和World Models开始融合。他用的词是“Converge”,形成一种更独特、更强大、更具能力的系统。这也是AI领域领导者之间持续讨论的话题。你可以打开X或常用的社交媒体平台,就能看到相关讨论。
令我印象深刻的是,Yann LeCun曾在Meta担任多年AI负责人,最近离开了Meta去创办自己的项目,在去年夏天他被Alexander Wang超越,以及那场大规模人才争夺战也对他产生了影响。他在《Financial Times》的一次采访中提出了一个非常有趣的观点:他并不认为LLM会带领我们走向AGI,这也呼应了你刚才的观点。大家追逐的都是超级智能、AGI,或者怎么称呼都行。但他的观点是,LLM只能带你走一部分路,你还需要World Models以及其他各种技术。他对Meta的批评相当尖锐,认为公司没有跳出LLM框架去思考更广阔的可能性。这似乎也是他选择离开、去创办自己项目的部分原因。
非常有趣的是,Meta的一个主要竞争对手Gemini公开谈论了这个话题,并表示Demis说得对——我们确实需要这么做,需要开始考虑这一方向。这能够推动许多应用的发展,比如机器人、自动驾驶,以及提升我们与AI模型和智能系统交互时的理解,从而获得更准确的答案。
Arjun:Steve,在Chat中输入内容,它就会回应:“嘿,Steve,很好的问题,这是一个非常聪明的想法。”
Steve:一直如此,就像中了各种大奖一样,它会不断地夸你,“哦,你真聪明,问了我这么棒的问题”,完全是这样。
Arjun:没错。我提到这一点,部分是为了呼应目前对LLM的批评:确实,它们很出色,可以提供信息,但作为生成新想法、原创想法的基础,LLM实际上存在一定的局限性。这也是Demis提出的观点的一部分,解释了为什么World Models这一概念正越来越受关注。正如你提到的,这将在AI的下一阶段发挥关键作用,尤其是在机器人、无人驾驶汽车以及许多其他应用场景中,将会非常有趣地看到其发展和落地。
Steve:没错,在播客的后续讨论中,你会注意到,我对这一轮AI热潮中的机器人应用角度持极为怀疑的态度。
Steve:我们正处在这样的阶段:很多我们看到的机器人实际上只是木偶式操作,它们是远程控制的。最典型的例子当然是Tesla Optimist机器人,它最初只是一个穿着人形服装的人在跳舞。现在它确实是一个真正的机器人,但同样,它仍然是远程操作的。实际上,有人在控制室通过互联网控制它,甚至用声音与人交流等等。我和一些机器人领域的专家交流过,就在几周前,我们办公室里就有一位专家。他们表示,最困难的部分不是制造机器人本身,而是训练它。这正是World Models将发挥作用的地方。借助它们,机器人或系统实际上可以实现自主运行,就像我们一直自豪地承诺的那样。
Arjun:Demis,您提到了Playwright和竞争中的一些动态。商业层面当然是其中之一——我们有OpenAI、有Anthropic,还有其他各种AI实验室,竞争非常激烈。而Gemini 3到目前为止反响非常好,但曾经有人质疑Google整体的竞争能力,我会说这是在2025年的某个阶段,而且也不是很久以前的事情。然后,Gemini 3的推出确实给很多人留下了深刻印象,但这个领域变化非常快。那么,您会如何评估目前的竞争环境?
Demis:你感觉如何?嗯,可以说,目前的竞争环境异常激烈。许多在科技行业工作了二三十年的人都告诉我,这是他们见过的最激烈的竞争环境。也许可以说,这是科技行业有史以来最激烈的竞争环境。几乎所有最有能力的参与者——无论是个人科技巨头、大型科技公司,还是最优秀的初创企业,现在都在参与这个领域。因为,每个人都已经意识到了我们二十多年来一直知道的一点:这是迄今为止最重要的技术。
所以这种情况在意料之中,确实很艰难,但同时也令人兴奋。回到游戏的话题,我很小的时候就开始下棋,为英国青少年国际象棋队效力。因此,我从小就在竞争环境中成长,我喜欢竞争,也享受其中的成就感。事实上,从某种意义上说,我的生活很大程度上是为了竞争,因此我很享受这种投入感。但另一方面,我心里清楚,有一件事情比公司之间甚至国家之间的个人竞争更重要,那就是如何为全世界、为整个人类有效管理和引导AGI所创造的财富。
对于所有AI实验室的领导者来说,这都是一项责任。在我们所处的激烈资本主义竞争环境中,仍需将这一点放在心上,时刻牢记如何引导AGI造福全人类。因此,这两件事情同时成立:既要参与竞争,也要担起更大的责任。
Arjun:我提到过,今年早些时候有人质疑Google在AI领域会做什么。那么,您们有没有采取什么不同的策略或行动?
Demis:是的,如果回顾过去十年,其实Google,特别是Google Brain研究部门,以及相对独立运作的DeepMind,几乎发明了当今大家所使用的约90%的技术。无论是Transformers还是AlphaGo,当然Transformers是所有LLM背后的最著名的架构,AlphaGo也在一个非常复杂的问题上大规模引入了强化学习。所以我们发明了所有这些技术,但事后看来,也许在商业化和规模化推广上稍显缓慢,而这正是OpenAI和其他机构做得非常出色的地方。
在过去两到三年里,我们不得不回归几乎像初创公司或创业团队那样的方式,更加灵活、快速,快速推出产品,并在短时间内取得实质性进展。过去几年我们所做的努力,在Gemini系列中得到了体现。正如你提到的,最新版本Gemini 3的表现让我们非常满意,也让我们重新回到了排行榜的前列,回到了我们认为自己理应处于的位置。
Arjun:在这种激烈的竞争环境下,关于AI泡沫的讨论显然非常多,尤其集中在某些公司的估值上。有些公司筹集了天文数字的资金,科技巨头在基础设施上投入数千亿美元,而市场上也有一些公司——坦率地说几乎没有产品,甚至几乎没有盈利,却依然筹集了大量资金。那么,您认为目前关于这一类泡沫的讨论处于什么阶段?您觉得AI行业现在是一种金融泡沫吗?
Demis:关于泡沫的讨论不是非黑即白的。行业的某些部分可能确实存在泡沫,这在我看来是显而易见的,而其他部分可能并非如此。根本上来说,AI将会成为人类历史上最具变革性的技术,所以这也是支撑一切的核心部分。从最终来看,这有点像互联网泡沫时期的情况。互联网证明了其至关重要的地位,并在那个时期诞生了一些具有世代意义的公司。所以我认为,一旦每个人都意识到某项技术具有多么强大的变革性,过度的热情几乎是不可避免的。随后可能会迎来一次清算,而那些真正有价值的事物,将会生存下来并繁荣发展。在我看来,问题出现在私募市场上,比如种子轮融资就达到数十亿美元,而实际上这些项目几乎还没有真正的产品或业务。从长远来看,这种情况似乎有些不可持续。
Demis:从我领导Google和DeepMind的角度来看,我并不太担心泡沫问题。我必须确保无论局势如何发展——无论AI继续保持目前的快速指数式增长,还是出现某种泡沫破裂,我们都处于有利位置,能够在任何情况下获益并抓住机会。考虑到Google的基础业务以及AI与其的契合度,我们已经处于一个有利位置,无论未来局势如何发展,都能够从中受益。
Arjun:我想,您最大的几个竞争对手可能正是那些在私募市场筹集了巨额资金的公司。那么您是否有信心,即便未来某个时候出现某种调整,您们也能挺过去?
Demis:我想是的。这也正是Google资产负债表的意义所在,以及我们所拥有的众多出色产品和平台。我认为,我们拥有数十款拥有数十亿用户的产品,而AI自然可以融入所有这些产品中,无论是Email、Workspace,还是像Gemini App这样的新产品。
Arjun:您也提到了其中的动态。我们谈到竞争,另一个因素是地缘政治,您也提到过——尤其是围绕中国的大量讨论,涉及中美在这一领域的竞争。有一段时间,人们曾低估中国及其企业在开发强AI模型和相关技术方面的能力,但实际我们看到DeepSeek的成果在全球引起了一定的震动。而且更重要的是,一些大型科技公司,比如阿里巴巴,也推出了非常有竞争力的开源模型。因此,中国在这一领域毫无疑问已经加入了这场竞争,对吧?
Demis:一点也不。其实我认为他们比一两年前预想的更接近美国和西方的Frontier Models,现在可能只落后几个月。值得注意的是,他们背后确实有非常强的团队,比如你提到的DeepSeek和阿里巴巴团队。关键问题是,他们能否在Frontier之外实现真正的创新。他们已经展示了自己能够快速追赶,并非常接近Frontier,但他们是否能真正创新出新的东西——比如一种全新的Transformers,超越现有Frontier,我认为这一点尚未得到验证。
Arjun:在您看来,这将会很困难,因为在技术获取方面存在限制,例如前沿芯片的获取。
Demis:不,我认为更多是心态问题。我觉得这是至少西方领先的Frontier labs所培养的一种文化。就我们自己而言,可以把DeepMind看作是试图成为现代版的Bell Labs,鼓励创新和探索性创新,而不仅仅是扩展现有已知的技术。当然,这本身就非常困难,因为要做到这一点,你需要世界级的工程能力,而中国无疑具备这一点。问题在于科学创新部分,真正去发明一些新东西,要比简单复制难上大约一百倍。所以,下一个真正的Frontier问题是,我还没有看到相关证据,但这确实非常困难。
Arjun:对我来说,Steve,这次对话中最引人注目的部分之一是关于中国的讨论。我曾在中国生活了三年多,为CNBC报道当地的科技行业。最近有一种越来越普遍的看法,认为中国在AI方面落后于美国,原因有很多。其中一个原因是,中国可能无法获得最先进的芯片。因此,有人认为中国的产业可能会落后。一种观点是,中国缺乏创新能力,也没有像美国公司那样的资本。但实际上,从Demis的角度来看,他认为中国的AI模型与美国相比,仅落后几个月,因此实际上并不算远。还记得去年DeepSeek曾震惊全球和市场吗?它表明中国已经加入了这场竞赛。虽然自那以后DeepSeek并没有再次引起如此大的轰动,但在它最初推出时,确实掀起了波澜。
阿里巴巴,作为全球最大或中国最大的科技公司之一,一直处于领先地位,开发了一些非常有趣的模型。如果了解开源社区,比如Hugging Face,你会发现阿里巴巴的模型非常受欢迎。我与该领域的一些专家交流过,他们认为这些模型也是全球最先进的之一。所以你可以看到这一点。我可以分享一点个人经历:从在中国生活和工作的观察来看,中国公司动作很快,拥有专业知识,也具备创新能力,因此在这场AI竞赛中不能轻视他们。但同时也要考虑Demis的观点——虽然中国公司正在快速追赶,积极参与竞争,但有一点尚未得到验证,那就是他们是否具备实现重大突破的能力。我觉得这是一个非常有趣且细致入微的观点。另一部分是你注意到的,就是Demis对泡沫以及AI泡沫的评论。
Steve:是的,顺便回到他最初提到的DeepSeek的“几个月落后”观点。一年前,这不仅仅是说中国能够开发出非常出色的LLM或聊天机器人,更重要的是,他们是在没有最强大的Nvidia芯片的情况下做到的,这也震动了市场。这也是我们在美国现在看到的情况。美国正试图限制中国获取那些Nvidia芯片的能力。关于他们可能获得H100芯片有很多讨论——这些芯片虽然不是最顶尖的,但可能比中国现有能获取的芯片要好一些,然后就涉及到整个走私问题。但正如Demis所指出,如果他们在没有完全获取这些芯片的情况下,仅落后几个月,这就提出了关于Nvidia在芯片领域的重要性和主导地位的问题。
不过,刚才关于泡沫的观点也非常有意思,因为你问了他——我们现在是在泡沫中吗?你怎么看?诸如此类的问题。他基本上回答说:我们是Google,我们很富有,这没关系。我们有资金,有自由现金流可以投入,这张资产负债表就是我们的超级力量。如果出于某种原因需要收紧开支,我们也可以做到,而且不会有问题。但猜谁做不到这一点?那就是OpenAI和Anthropic,另外还有xAI也可以算在内。他们的模式是必须不断融资,才能达到最终能够展示收入和收入增长的阶段,从而在无需持续融资的情况下维持自身运转。如果资金开始枯竭,OpenAI和Anthropic就面临极大的风险。Google、Microsoft、Meta都有现金流去投入新的项目。Meta已经在元宇宙上做过这样的转型。这些公司能够非常容易地调整方向,因为它们已经拥有这些高利润的大型业务。
Arjun:Demis,很多人可能忘了,Google现在的AI能力有很大一部分来自DeepMind以及您和您的团队。您们是如何与Google协作的?这方面引起了很多关注。比如Sundar Pichai某天给您打电话说:“Demis,我们需要做这个,或者我们有个关于Gemini或其他AI产品的想法,你能实现吗?”您们之间的这种合作关系是怎样的?
Demis:是的,过去三年,我们把所有东西整合成了Google DeepMind,这个实体汇集了Google所有的AI研究,是Google Research、Google Brain和DeepMind的结合体。我负责这个团队,它就像是Google的发动机室。可以把它这样理解:所有的AI技术都是由这个团队完成的,然后再扩散到Google的各个产品中。在过去几年里,我们一直在打造这一基础架构,不仅是模型,还几乎重构了整个Google的基础设施,使这些模型能够非常快速地部署,几乎能覆盖到所有主要的产品界面。
所以,当我们发布新的Gemini模型时,几乎可以在当天或第二天就直接上线到搜索等核心产品中,这一流程运行得非常顺畅。从Gemini 2.5系列开始,我们真正进入了状态。在过去一年左右的时间里,这一整套发布和落地机制已经变得非常成熟、顺滑。在接下来的12个月里,这种情况会更加明显。因此,我们内部一直把自己视为、也形容为整个体系的“发动机室”。同时,Sundar和我几乎每天都会沟通,讨论战略层面的事情:技术应该往哪个方向发展,以及整个Google在更宏观层面上需要什么。随后,我们会在兼顾长期目标的前提下,对路线图和计划进行日常层面的动态调整——始终牢记一个核心方向:以最快、最安全的方式率先迈向AGI。
Arjun:因此,可以预期在这种协作关系调整之后,推出全新能力、全新AI工具的速度会明显加快,并且能够更快地在Google的整个产品矩阵中完成部署与落地。
Demis:因此,这是一个极其紧密的迭代闭环;而且各团队都运行在同一套Tech Stack之上,形成高度统一的技术体系。
Arjun:您们构建的相当一部分能力都会落地到Google自身的产品中。不过在长期跟踪像Samsung这样的公司时也能看到,您们同样在支持Samsung这类合作伙伴,在其智能手机等终端中构建和集成AI tools,以及相关能力。
Demis:嗯,我们确实与很多合作伙伴在一起工作。正如你提到的,我们很自豪的是,这些合作伙伴选择我们的技术,是因为他们看到了它的能力。实际上,像Samsung等设备上应用我们的技术,我觉得这非常有意思。我对Edge Compute(边缘计算)的概念非常感兴趣,以及这些模型在Edge设备上更快运行的可能性,无论是手机,还是像我们正在开发的智能眼镜这样的新设备。像Warby Parker这样的合作伙伴也在探索智能眼镜的应用。而正如你所知,Google在智能眼镜方面已经研究很长时间了,但我认为真正的“杀手级应用”最终会出现,这种通用助手的概念,能够在日常生活中提供帮助。我认为,所有大型设备厂商都会对这类技术感兴趣。
Arjun:只剩下几分钟时间,但我还是想问一下。我刚开始做科技记者时,Google在2014年收购了DeepMind,当时的交易额大约是4亿英镑。那时很多人都不清楚您们在做什么,也不明白Google为什么要收购这家英国公司。事情是怎么发展的?您有没有回头想过,也许我们当初应该保持独立,还是对现在的发展结果感到满意?
Demis:说来很有意思。当时负责搜索的主管是Alan Eustace,他和Larry一起负责这笔交易。Larry Page当时是CEO,并且是这笔收购的发起人。但具体签约和推动交易的事情,被委托给了搜索部门主管Alan Eustace来完成。我确实跟Alan说过,这将是Google有史以来最重要的一次收购,这可不容易说得出,毕竟他们以前也收购过YouTube、AdWords以及其他一些重要项目。但我当时就意识到了这次收购的重要性,以及它与Google“组织全球信息”的使命有多契合。而AI在这方面非常自然——组织和理解信息,还有比AI更合适的工具吗?所以我很清楚,这将是一个天然的契合。
我们也意识到,这笔交易放到今天来看,价值可能已经是当初出售价格的几百倍、甚至上千倍。但关键在于,那时候更想做的事情,是回到科学本身,继续推动研究向前发展。毕竟在2014年,这些研究仍然处在非常早期、相当原始的阶段。公平地说,Google是当时为数不多真正能够认识到这项技术重要性的公司之一,特别是Larry,他看到了这项技术可能达到的高度,以及我们今天所见的成果。如果没有他们的支持,以及他们能够提供的大规模算力,我们不可能完成AlphaGo、AlphaFold以及所有这些科学研究所取得的卓越成果,所以我完全没有任何遗憾。
Arjun:所以现在科技圈的CEO、AI领域的CEO,几乎成了新一代的“摇滚明星”。我在欧洲见过Nvidia的CEO Jensen Huang,他到哪儿都有人跟随。Jensen最近提到,他和您有过交流,他对Nano Banana和Image Generation 2(新一代图像生成)也有很高评价。您们主要讨论哪些内容?
Demis:我们只是聊聊天。Jensen非常棒,他是令人敬佩的先驱人物,我也很佩服他在过去30多年里一直坚持自己的愿景。其实我最早在90年代就开始用GPU,当然是用于游戏开发,包括图形引擎和物理引擎的编写。很有意思的是,这件事对我来说有一种循环往复的感觉——我早年的游戏经历,甚至当时推动的硬件,如今反而对AI非常有用,颇具讽刺意味。但没错,我们聊得很多,他对科学以及用于科学的AI非常感兴趣,实际上AlphaFold就是在GPU上训练的。他非常喜欢AlphaFold以及我们在药物发现领域所做的工作,所以我们主要讨论的是面向科学的AI应用。
Arjun:我知道很多数据中心都是建立在Nvidia系统上的,但Google也有自己的TPU芯片。那么在这方面是否存在某种竞争性的友好关系呢?
Demis:对,我们确实很幸运能够拥有自己的TPU,也非常认可自己的TPU,通常会在内部用于训练性能最强的模型。事实上我们也发现,来自顶级AI团队的需求非常旺盛——这些团队正在尝试构建大规模模型,或为超大规模AI模型提供服务,而 TPU 本身就是专门为这类任务而设计的。所以TPU相对来说是更专用的,相比之下GPU更通用。比如当我们尝试探索一些新的架构或应用时——像AlphaFold这样的案例,我们可能会使用GPU。但当我们尝试将已知的技术最大化规模化时,定制芯片的效率会高得多。所以我们很幸运,在Google和DeepMind,这两种硬件我们都能使用。
Arjun:Demis,展望未来。您显然非常专注于科学,以及AI在推动新药研发、发现新疾病等方面的潜力。当然,您也有Isomorphic Labs。那么,在AI解锁这些科学突破的路径上,我们目前处于什么阶段?
Demis:我一直认为AlphaFold是迄今为止AI应用于科学的最佳案例。我为这个项目感到非常自豪。我们解决了一个在科学界存在了50年的重大难题——蛋白质折叠问题,揭示了蛋白质的三维结构,而全球超过300万研究人员正在利用它开展关键研究。我无法想象还有比这更具变革性的技术了。希望未来能出现十几个像AlphaFold这样的项目,每一个都能在各自的科学或数学领域引发革命性的变革。我们已经在朝这个方向稳步推进,开展了大约六个类似的研究,涵盖材料科学、物理学、数学以及天气预测等领域。相信如果未来十年AI发展顺利、进展良好,并且使用得当,我们有望开启科学发现的新黄金时代。
Arjun:您觉得2026年AI领域会有哪些重大进展?会出现哪些突破性成果或重要进展?
Demis:能够自主执行任务的Agentic系统将开始变得足够可靠,从而线个月里,机器人领域会出现一些非常有趣的进展。我们正在与Gemini Robotics紧密合作,全力推进一系列极具雄心的项目。最后,还有可能是在设备上的AI Assistant。我认为我们将开始看到它们在现实世界中真正发挥作用。或许最让我兴奋的是进一步推进World Models,使其更高效,从而能够真正用于规划,甚至在General Models(通用模型)中发挥作用。
Arjun:太棒了,Demis。就把刚才的回答当作我们下次交流的预告,希望今年有机会还能再聊。非常感谢您今天的分享。
Arjun:所以,Steve,在谈话的最后部分,我觉得有趣的一点是DeepMind这个实体与整个Google业务之间的关系。Demis提到他几乎每天都会与Google/Alphabet的CEO Sundar Pichai沟通,说明两者的整合越来越紧密。我觉得,从这场AI竞赛来看,这传递出的信号是:Google显然已经找到了快速将AI产品推向市场的方法。同时,也必须考虑到Google的整个产品生态。
无论是Chrome、Gmail,还是其他产品,Google开发的AI都希望能够在这些产品中全面铺开。这赋予了他们一个庞大的用户基础,几乎可以让这些AI产品瞬间触达海量用户。我一直在说,我认为Google的最大优势之一是Android操作系统的规模——全球市场份额约70%。这意味着有海量的用户和设备,Google AI可以迅速部署并高效使用。所以我认为他们在市场推广方面处于有利位置,而且显然,DeepMind与整个Google业务的这种紧密关系,将对Google在长期保持任何成功起到核心作用。
Steve:是的,仅就Android生态而言,像三星这样最大的Android手机制造商,他们已经将Gemini作为主要的聊天机器人,Gemini是他们的核心AI。我总是有点惊讶,三星过去有自己开发AI的历史,但这次他们完全押注在了Gemini上。他们正在与Google合作,包括他们推出的新型现实头显。同时,还有一些即将发布的智能眼镜项目,也是与像Warby Parker这样的公司合作设计的。是的,三星真的全面采用了这套方案,而仅从三星这一角度来看,Gemini就已经拥有了一个巨大的平台。考虑到他们本身就占据如此庞大的市场份额,这对Gemini来说非常有利。
然后再谈谈苹果。Gemini实际上将成为即将在几个月内推出的新版本Siri的核心引擎。他也提到,对看到Gemini在更多设备上应用感到非常兴奋。我认为苹果的这一举措非常聪明——意识到自己无法独立打造这一技术,干脆像三星一样,将这套经过验证的技术整合进自家产品。
我们与Google的合作关系一直很好,而现在看到的Google,实际上与过去我多年所见的有很大不同。过去有太多不同的团队在做类似的事情。在这次大规模重组之前,并且在Demis掌控了整个AI之后,Google内部有多个团队在AI领域各自为战,经常相互碰撞。而Sundar Pichai也非常聪明,他意识到这是一个关键时刻,必须重组一切。他将所有AI团队整合到Demis Hassabis手下,并统一纳入DeepMind。正是这种整合,使得我们目前的布局得以实现,并在2025年通过Gemini 3取得了显著成效。
Arjun:是的,尤其是在AI领域,消费端竞争正变得越来越激烈。正如你之前提到的关于泡沫的讨论,这些竞争者,比如OpenAI,虽然在市场上活跃,但Google拥有强大的资产负债表、稳定的现金流,以及庞大的用户基础,同时持续推动创新。考虑到这次重组以及现在Google展现出的速度,Google无疑会给OpenAI带来巨大的竞争压力,尤其是在2026年的消费端市场上,所以这一切都还有待竞争角逐。
Steve:是的,我预计今年OpenAI会有很多动作。他们会尽可能“试水”,看看哪些能奏效,因为他们给自己施加了巨大的压力,必须产生可观的收入,以兑现此前关于资本支出、建造大型数据中心、与Oracle合作等一系列承诺。但实际上,这些都不可能完全实现。除非OpenAI能更好、更高效地将这些投入变现,否则他们承诺的开支很难实现。但就像你提到的,我们也在Meta身上看到类似情况。Meta拥有庞大的用户基础,也有很大的机会去利用它,只是还没像Google那样完全搞定。目前来看,Google似乎处于领先地位。
请注意,本文编译自文末载明的原始链接,不代表Z Potentials立场。如果您对本文有任何想法或见解,欢迎在评论区留言互动探讨。