观点交锋 黄仁勋对话扎克伯格:抨击闭源 互送夹克 预判下一波AI浪潮
发布时间:2024-08-07 23:01 浏览量:53
转自 智东西
除了商业互吹,还有万字猛料。
编译 | 陈骏达
编辑 | 李水青
智东西7月30日消息,当地时间7月29日下午,英伟达创始人兼CEO黄仁勋(Jensen Huang)与Meta创始人兼CEO马克·扎克伯格(Mark Zuckerberg)在2024年SIGGRAPH大会上展开了一场50分钟的重磅深度对谈!
老黄和小扎的对谈爆点不断,谈及了生成式AI、Agent、AI开源、智能眼镜等前沿技术产业趋势。两人还展开高情商互夸,老黄称Llama 2的开源是去年AI圈最重要的事,而小扎称“我还以为是H100呢。”谈及创业经历,两人罕见流露真情并提及各自的遗憾,最后两人还再次互换了皮夹克。
访谈中,扎克伯格坦言自己开源Llama有私心。开源是一种绝佳的商业策略,他们已经通过开源节省了数十亿美元的成本。
当谈及闭源,扎克伯格更是爆出粗口,吐槽自己在移动平台上开发产品时,屡屡受到苹果公司的限制,这让他想要将下一代技术平台牢牢掌握在自己手中。
黄仁勋分享,英伟达运用Llama微调出了代码AI、Bug处理AI等AI工具。开源Llama系列模型也让不少企业用上了AI,而英伟达的产品与服务也从这一日益发展的AI生态中获益。Llama 3.1 405B的推理成本仅有GPT-4的一半,这是一个十分经济的选择。
扎克伯格剧透道,不久他们将推出具有全息AR显示功能的智能眼镜。他也试图引领时尚潮流,让大家更能接受这种更为厚重的眼镜外形。而在产品端,扎克伯格认为即便基础模型进步停止,至少也可以再做5年的产品创新。
扎克伯格承认自己错判了技术的发展趋势,但是AI的发展和他目前在MR和智能眼镜领域的投资并不冲突,还有相辅相成的作用。他预计300美元的无显示AI眼镜或将大卖,有着数千万乃至上亿台设备的市场。
老黄对扎克伯格给足了牌面,盛赞Meta不断转型,他还后悔自己没像小扎那样辍学创业,小扎在这行干了20年,头发只是变卷了,而自己已经两鬓斑白了。
本场对谈中,扎克伯格还分享了Meta最近发布的AI Studio产品,老黄则分享了英伟达在利用Llama开辟的企业和工业应用。
在对谈的结尾,二人再次上演了互换夹克的环节。当小扎今年年初去老黄家做客时,二人便互换了夹克。本次小扎专门为老黄定制了一套黑色的夹克,而老黄也将妻子刚刚给自己买的皮夹克送给小扎。两人现场脱下外套,展示夹克的上身效果。小扎还称下次要给老黄搞条大金链子。
▲二人互换夹克现场画面(来源:SIGGRAPH)
以下是对黄仁勋和扎克伯格本次对谈的完整编译(为提高可读性,调整了部分问答的顺序,并在不违背原意的前提下进行了一定的增删修改)。
01.
Meta在AI领域早有布局
生成式AI让原有推荐系统更好
黄仁勋:马克,欢迎你参加你的第一届SIGGRAPH。你是计算的先驱之一,驱动了现代计算的发展,我还得出面邀请扎克伯格来参加SIGGRAPH。感谢你专程飞过来参加SIGGRAPH。
这个展会最伟大的一点就是,这是一个计算机图形学、图像处理、AI和机器人技术这四者结合的展会。多年来,一些公司在这里展示并揭示了令人惊叹的事物,比如迪士尼、皮克斯、Adobe、Epic Games,当然还有NVIDIA。我们在这里做了很多工作。
今年,我们发布了20篇关于AI和模拟的跨学科论文。我们正在使用人工智能来帮助模拟变得更大规模,更快。例如,可微分物理。我们正在使用模拟来为人工智能生成合成数据的模拟环境。因此,这两个领域真的正在交汇到一起。我们为这些成就感到自豪
Meta其实在AI方面做了大量的工作。我发现有趣的一件事是,有些媒体说Meta在过去几年才加入AI领域。但是你们很早就成立了Facebook AI研究中心(FAIR)。我们使用的PyTorch就是Meta开发的开源工具,还有你们在计算机视觉方面的研究、语言模型研究、实时翻译等等。这都是些开创性的工作。
▲黄仁勋在SIGGRAPH大会上(图源:英伟达)
我的第一个问题是,你如何看待Meta如今在生成式AI领域的进步,以及你如何应用它来优化你们的运营流程或引入你们正在提供的新的功能?
扎克伯格:是的,有很多事情需要解释一下。首先,非常高兴来到这里。Meta已经做了很多相关研究,我们参与SIGGRAPH已经有八年了,但和你们比起来还是新手。
2018年的时候,我们展示了一些早期的手势跟踪研究,用于我们的VR和MR头显设备。我们还发布了Codec Avatars,希望能在消费级头显上实现逼真的人物形象。我们离实现这一目标越来越接近了。
我们在显示系统上做的一些原型和研究,能使MR设备变得非常薄,还具备集成化系统,包括非常先进的光学堆栈和显示系统。我们以前来SIGGRAPH一般展示的就是这些东西。
今年我来这里不只是要谈元宇宙,还会谈论AI。你也提到了,我们很早就创建了Facebook AI研究中心,那时候公司都还没改名。这是我们创建Reality Labs之前的事情。所以说我们研究AI已经有一段时间了。
生成式AI是一场有趣的革命。我认为生成式AI最终会给我们所有的产品都带来有趣的改变。你现在就可以看到我们产品线上的变化。Instagram和Facebook的推荐流和推荐系统,一开始只是为了和朋友建立联系,显示一些朋友发的贴子。当然了,这种系统也很有价值,但是在过去的几年里,我们也越来越多地加入了公开内容。
在这种情况下,推荐系统就格外重要。因为我们现在处理的不仅仅是成百上千个来自朋友的帖子,而是要处理数以百万计的公开内容。凭借生成式AI系统,我认为很快我们将不只是在推荐系统中使用AI,也有可能利用AI来进行平台内容创作。要么是即时创建的内容,要么是合成内容。这只是一个例子,我们未来的核心业务都有可能因生成式AI而变化。其实在过去20多年里,我们的业务一直在不断变革。
黄仁勋:是的,其实很少有人意识到,世界上有史以来最大的计算系统之一,就是推荐系统。
扎克伯格:这是一条不同的路径,和人们谈论的生成式AI热潮不同。但其中的Transformer架构与构建通用模型很类似,都是将非结构化数据嵌入到特征中。
在过去,每种类型的内容都有不同的推荐模型。我们有专门推荐Reels、专门用于排名、专门推荐长视频的模型。还需要在产品端做一些工作,才能在系统里显示这些内容。但当你创建能够涵盖更多内容的通用推荐模型时,推荐效果只会变得越来越好。不需要从不同的内容池里抽取数据,就不会出现种种效率问题。
我希望有一天,Facebook和Instagram是一个单一的AI系统,统一了所有的类型不同、目标不同、时长不同的内容。因为我们平台上的模型有些只是有趣,而有些则能帮助用户建立人脉网络,推荐一些你有可能想认识的人或者想关注的账户。
黄仁勋:这些多模态系统往往也更擅长识别模式和微弱的信号。
02.
人人可创造自有Agent
个人企业都可受益
黄仁勋:AI已经深度融合到你们公司内部了。你们一直在构建GPU的基础设施,长时间运行大型推荐系统。
扎克伯格:其实我们在使用GPU上还是有点慢。
黄仁勋:我只是想给你说点好话,你毕竟是客人嘛(笑)。你们进入AI领域后的步伐走得很快。当我最近在使用WhatsApp的时候,我觉得我正在和这个软件合作。我很喜欢上面的Imagine功能。我打字的时候它能实时生成图像,我回去改了几个字,它就又生成了新的图像。把我的照片放进去之后,还可以把图像里的人物替换成我自己。这是上周的功能。
扎克伯格:我花了很多时间和我的女儿们一起生成她们是美人鱼的图像,这很有趣。生成式AI的东西既是对我们过去工作流程和产品的一次重大升级,也可以帮助我们创造全新的事物。
Meta AI是一个能辅助你完成不同创造性任务的AI助手。但它也是非常通用的,因此不需要将它限制在创造性工作的范围之中。它可以回答任何问题。
当我们从Llama 3系列模型发展到Llama 4和更高版本时,Meta AI会变得更不像是一个聊天机器人,不是基于你的提示词给反馈。而是你给它一个意图,而模型会去处理这个问题,研究一段时间之后再给你反馈一个结果。最终可能需要花费数周或者数月来进行计算,我认为这种功能会变得很强大。
▲扎克伯格回答黄仁勋提问(图源:英伟达)
黄仁勋:今天的AI是“回合制”的,你问它答。但是当我们思考、当我们承担一个任务、解决一个问题的时候,我们会考虑多种选择。或许我们会想出一个决策树,我们沿着决策树走下去,在脑海中给模拟每个决策的不同结果。这就是计划,而未来AI也能实现同样的事情。当你分享你对创作者AI的看法时,我觉得这个想法真的很不错。和大家谈谈创作者AI和你们即将发布的AI Studio吧。
扎克伯格:我们之前已经讨论过相关的产品了,今天我们将大规模地推出这些产品。我们的愿景是,我们不想只有一个AI模型。行业里有些公司是这么做的,他们创造了一个中央Agent。虽然我们提供了Meta AI助手,但我们希望给使用者权力,让他们去创造自己的Agent。不管是创作者还是小企业,我们最终都希望他们能快速地引入他们的内容,建立自己的商业Agent,与客户互动并提供销售和售后服务。
AI Studio是一套让所有创作者构建自己的AI的工具,比如AI Agent或者能和自己的社群互动的AI助手。对创作者来说,他们总是没有时间和自己的社群进行足够的互动。而如果能创造一个Agent,在你的材料和数据上训练这个Agent,以你自己想要的方式代表你,这也是一项非常有创造性的尝试,几乎就像是你的一件艺术品一样。
当然了,这肯定不是和创作者的直接互动给,但我认为这也是一种很有趣的方式。创作者会在平台上发布内容,而现在我们有了能做到这点的Agent。
同时,我认为人们也会为各种不同的用途创建自己的Agent。有些是某种定制用途的Agent。人们可以微调或者训练出这样的一个Agent。而有些是娱乐目的的,人们可以创造一些有趣的甚至是搞怪的Agent,这些东西在我们平时使用Meta AI助手时是不会出现的。人们对见证和与这些产品互动十分感兴趣。
另一个我们看到的有趣用途就是,人们会使用这些Agent来提供社交支持。我还挺惊讶的,这已经是Meta AI的主要用例之一了。人们会使用Meta AI来模拟各种困难的社交场合。不论是在职场,比如要和领导讨论加薪升职,还是私下里和朋友或者伴侣沟通中,面临的一些困难境地。用户可以和Meta AI模拟这些对话,Meta AI不会有任何评判性的内容,它只会和你模拟对话,然后给出一些反馈。
但很多人不满足于仅仅和一个Agent交流,他们想要创造自己的东西,这就是AI Studio的目标。这对Meta AI和OpenAI的产品来说都是如此。我们认为也不应该只有一个单一的大型AI系统,如果有多样性的话,世界会变得更好、更有趣。
黄仁勋:这也太酷了。如果你是一个艺术家,有自己的风格。你就可以把自己的风格,把自己所有的作品拿去微调一个模型,然后你就可以用这个模型生成你自己风格的作品。甚至还可以让AI给你生成一幅草稿、一幅素描作为灵感。未来每家餐厅、每个网站可能都会有这种AI。
扎克伯格:我认为在未来,就像现在每个企业都有邮箱、网站和社媒账号一样,我觉得未来每个企业都会有一个能与客户交互的AI Agent。这在过去是很难实现的。
在企业里,销售和售后部门一般都是分开的,但是CEO理想中的运营方式不应该是这样的。这些组织现在都是独立的,并分别进行了优化。而最理想的情况就是他们能统一到一起。
从客户的角度来看,他们真的不想要在售前和售后的时候还得去找不同的客服。最简单的方式就是直接去同一个地方咨询,所有的问题都能得到解决,能以多种不同的方式沟通。我认为这也适用于创作者。
黄仁勋:我也觉得,如果能处理好客户的抱怨,真的能让公司变得更好。全面使用这种AI系统还能积累公司的系统性知识,可以进行深入的分析,又能反过来改进这一人工智能系统。
扎克伯格:不过我们面向企业用户的版本还处在比较早期的阶段,但AI Studio能使人们创造自己的UGC Agent。
黄仁勋:这就是创作者的飞轮。那我可以使用AI Studio来微调我自己的图像、图像集吗?可以使用它作为我的草稿本吗,然后每次回去的时候它还能调出之前的内容,继续对话,就像是我从没离开过一样?
扎克伯格:是的,这些都能实现。这些产品还会不断改进。训练工具会变得更好。它不仅能输出你想要的内容,还能避开你不想要的话题。而理想中,我们还能与Agent实现视频聊天那样的交互方式,我认为这离显示并不那么遥远。飞轮旋转得非常快,有很多新东西可以构建。
虽然我不认为基础模型的进展会停止,但即便现在停止了,我们也还至少能做5年的产品创新,让行业明白如何高效利用这些工具。而实际情况是,基础模型的种类数量和基础研究的进展都在快速增加。这是一个非常疯狂的时期。
03.
小扎称开源平台必胜
自己搞开源也有私心
扎克伯格:我感觉咱俩是业内干得最久的两位创始人了。你的头发变白了,而我的变长了。
黄仁勋:我的头发是变白了,你的头发还卷起来了。
扎克伯格:其实我一直是卷发,只是我留长了而已。
黄仁勋:如果我知道要这么久才能成功,我干脆和你一样辍学好了。这样就占据先机了。
扎克伯格:这是我们的性格差异。
黄仁勋:你有12年的领先优势。我很喜欢你的愿景,让每个人、每个企业都可以拥有自己的人工智能。在我们公司,我希望每个工程师和软件开发人员都能拥有一个或者多个自己的AI。
当你开源Llama时,我觉得这很好。我觉得Llama 2的开源可能是去年AI领域最重要的事情。(扎克伯格:我还以为是H100呢。)这是一个先有鸡还是先有蛋的问题(笑)。Llama 2的发布激活了所有的公司、行业,突然之间,所有的医保公司都在构建自己的AI系统,大大小小的公司都开始做AI。
Llama 2的发布让所有研究人员都能重新参与到人工智能中,因为他们有了一个新的起点,可以去做一些尝试。现在我们还有了3.1,我们两家公司合作将其推向世界。你还开源了PyTorch,现在它已经成为AI研究的框架了。你还围绕Llama构建了一个完整的生态系统。你这些想法是从哪里来的呢,和我说说你的开源理念吧。
扎克伯格:说来话长,我们确实逐渐做了很多开源的研究。我认为部分原因就是,我们开始做分布式计算的时候,已经落后于一些其他的科技企业了。正因如此,我们加入这一领域时并没有竞争优势。我们就想,干脆直接公开这些东西好了,然后从开源生态系统中获益。
我们有很多这样的项目,其中一个就是“开放计算”项目。我们发布了我们所有的服务器设计、网络设计、数据中心设计等等。开源也让我们的标准成为行业标准,所有的供应链都围绕这一标准组织起来,这能为所有人省钱。通过开源这个项目,我们已经节省了数十亿美元了。
黄仁勋:开放计算项目也是我们为数据中心设计的NVIDIA HGX成为可能。一下子所有的数据中心都可以使用我们的产品了。
扎克伯格:然后我们用一系列基础设施工具完善了开放计算项目,比如React、PyTorch等。当Llama出现时,我们也想着这么做。
对AI模型来说,我们开源背后有几个原因。一个是,在过去20年我们开发产品的经历真的很有趣,但最困难的是我们必须面临这样一个事实——我们需要在竞争对手的平台上发布我们的应用。一方面,移动平台为我们的行业带来了巨大的发展,但是通过竞争对手的平台提供产品也是颇具挑战的。
在我成长的时候,Facebook一开始是在开源的网络上出现的,当它过渡到移动端时,人人的口袋里都装着台“电脑”,这很不错。但是我们也因此受到很多限制。
最近这几代计算,由于苹果的闭源系统,由于他们赢下了这场平台之战,他们得以设定自己的条款。虽然严格意义上来说安卓手机更多,但苹果几乎拥有了整个市场所有的利润。安卓在开发方面处于追随苹果的状态,我认为苹果在这一代平台上显然是赢家。
但情况并不总是如此。当你回顾上一代平台,看看微软。这虽然不是一家完全开源的公司,但和苹果相比,Windows至少能在所有的OEM和不同的硬件上运行,是一个更加开放的生态系统,同时也是领先的生态系统。在PC时代,开放的生态系统胜出了。
而我希望,在下一代计算中,我们将回到开放生态系统获胜、并成为领导者的时代。当然了,总是会有一个开放和一个封闭的,我认为这也是合理的。但总的来说,对于整个行业的基础性计算平台来说,如果这个软件是开放的,那么它就能创造很多的价值。
这些观点对我影响很深。无论是AI领域的Llama,还是AR/VR领域的Horizon OS开源系统,都有点像是安卓或者Windows系统。这样我们就能与许多不同的硬件公司合作,制作不同的设备。我们只是想让生态系统回归到之前的模样,回到以前开放的样子。我也很乐观,我认为下一代平台的竞争中,开源的平台将会获胜。
对于我们自己来说,也有点私心。我们想要确保自己能一直获取最先进的技术。当公司成立一段时间之后,我接下来10-15年的目标就是确保我们能够打好技术的基础,构建我们想要的社交体验。
过去有许多我们想创造的产品和体验,被平台提供商告知我们不能做。下一代平台里,我们要从头开始完全自主构建这些平台。
扎克伯格:(笑)不好意思,我过去20分钟情绪控制得都很好,但是讨论这些封闭的平台时我真的很生气。
04.
开源是一种商业策略
全生态链共同维护改进
黄仁勋:这是一个很好的愿景。人们致力于构建尽可能好的AI,并将其作为服务提供给整个世界。但是如果你想要构建自己的AI,还是可以自己做的。就好比说,我肯定不想自己做这件皮夹克,我想要别人给我定制好了。所以“开源的皮革”对我来说并没有什么价值,而拥有开源的优质服务,这才是很好的理念。
你们做的Llama 3.1很好的一点是有4050亿参数的,有700亿参数的,也有80亿参数的。你可以用这些模型来生成合成数据,用较大的模型来教授小模型。虽然较大的模型更加通用,但是我们还是可以选择构建合适的小模型,能适配任何的领域和成本要求。
你们还发布了Llama Guard,用于模型的护栏技术,现在模型的构建变成了一个透明的过程。你还有一个世界级的安全团队、伦理团队。我真的很喜欢你们做的事情。
扎克伯格:我先把之前说的内容接上。如果我们不开源,我们的产品就不会运行得那么好,我们需要一个这样的生态系统,它们之间是相辅相成的。我们开源不是因为我们是什么利他主义者,尽管我们认为这确实对行业生态有好处。我们开源的原因就是,开源生态能让我们的产品变成最好的产品。
黄仁勋:看看有多少人给PyTorch做出了贡献,有堆积如山的工程。英伟达内部可能就有几百人,专门在研究如何把PyTorch变得更好、可扩展、性能更强。
扎克伯格:当某些东西成为行业标准的时候,所有人都会一起解决同一个问题。行业里的芯片最终也会针对我们的产品进行优化,以便更好地运行。这将使所有人收益,但它同时也与我们自己的系统配合得很好。开源其实是一种很好的商业战略,我认为很多人现在都还没有意识到这点。
黄仁勋:我们就围绕它建立了一个生态系统,我们构建了AI Foundry。
扎克伯格:是的,每次我们推出产品,你们都是一个发布、优化并使其高效工作的企业。我很感激。
黄仁勋:我能说什么呢?我们不过是有许多优秀的工程师罢了。
扎克伯格:每次发布新东西的时候你们反应都很快。
黄仁勋:我虽然老了,但是我还是很敏捷的。CEO们必须做到这一点。我认为Llama真的很重要。我们利用Llama构建了AI Foundry这个概念,这样就可以帮助所有人搭建自己的AI系统。很多企业都想这么做,想将自己的数据和知识嵌入到人工智能之中。但是他们承担不起将自己的数据放在其他地方的这个风险。而开源的系统让他们能掌握自己的数据。
然而,他们还是不知道怎么创建AI系统,而我们就可以提供这个服务。将他们的数据结合我们的技术、你们的Llama,变成我们所谓的NIM,英伟达推理微服务。他们想在哪里运行都可以。这都是因为Llama才成为可能的。
扎克伯格:我认为帮助企业从大模型中提炼出自己的模型,这一服务是很有价值的。我们在产品上也谈到了,不会只有一个AI Agent。同样的,也不会只有一个模型,适用于所有人。
黄仁勋:我们有芯片设计AI、软件代码AI。我们的代码AI能理解USD,这是我们编程Omniverse的语言。我们还有能理解Verilog语言的AI,也是我们的语言。我们还有软件AI,能理解bug数据库,知道如何分类,并将bug发送给正确的工程师。这些AI都是基于Llama进行微调的,还设置了护栏,能谈论我们需要的内容。
扎克伯格:有一个问题就是究竟有多少人会使用市面上的模型,又有多少人会自己训练模型。但我觉得未来肯定还是会有很多不同的模型的。
黄仁勋:我们用的是最大的Llama 3.1,因为工程师的时间十分宝贵。我们花大价钱雇佣工程师,如果花上几美元就能提高他们的工作效率,这是很有价值的事情。而且Llama 3.1 405B的推理成本大概是GPT-4的一半。
05.
小扎误判技术趋势
雷朋眼镜成意外之喜
黄仁勋:我们来谈谈下一波浪潮吧。我觉得你们在计算机视觉领域做的探索很棒。我们内部经常用的模型是你们的Segment Everything(分割一切)模型。我们会用视频训练AI模型,这样就能创造出世界模型。
我们的用例是在机器人、工业技术、工业数字化领域将这些AI连接到Omniverse,更好地建模和表示物理世界,让机器人更好的在Omniverse中运行。你的应用是雷朋眼镜,你还想把AI带进虚拟世界,和我们说说你的愿景吧。
扎克伯格:你刚才谈到的Segment Everything模型,我们即将会在SIGGRAPH上推出2.0版本。它更快,同时也适用于视频。画面中是我牧场里的牛。
▲Segment Everything模型(图源:SIGGRAPH)
黄仁勋:上次小扎到我家做客的时候,我们一起做了费城芝士牛排。下次来我家做客的时候,你带头牛来(笑)。
扎克伯格:现在画面里正在识别牛,但是还可以用这个制作许多有意思的效果。因为这一模型是开源的,行业里有很多更为高级的应用。科学家会用这些工具来研究珊瑚礁和自然栖息地,还有地貌的演变等等。但是能够在视频中瞬间完成这一分割,并且还能进行互动,比如告诉模型你想追踪什么。这是很酷的研究。
黄仁勋:我们是这么用这个工具的。比如说在仓库里里,有许多摄像头,而背后的AI系统正在观察发生的一切。比方说有箱子掉了,有水撒了等等,或者任何即将发生的事故。AI都能识别出来,生成文本,发送给某人,并给他提供所需的帮助。
这一系统并不会记录一切,而只是记录重要的东西。因为它明白自己看到的是什么。这个视频理解模型对我们的应用来说真的很强大。除了雷朋眼镜之外,你们还打算做些什么呢?
扎克伯格:在考虑下一代计算平台时,我们大致分成MR头显和智能眼镜两个板块。我觉得人们更容易接受眼镜,我认为最终所有戴眼镜的人都会把他们的眼镜升级为智能眼镜,这是一个数十亿人规模的市场。而VR/MR设备对有些人来说可能很有趣,可以打打游戏什么的,但对有些人来说还是不够有吸引力。我认为这两种设备会共存。
智能眼镜会像手机一样,是一个一直在线的下一代计算平台。而MR头显则会更像是工作站或者游戏机,当你需要更沉浸的体验或者更多算力的时候再使用。眼镜确实太小了,因此会受到很多算力上的限制。就像现在手机没办法进行电脑级别的运算那样。
我们正在从两个不同的方向来解决这一问题。一方面,我们在构建我们理想中的全息AR眼镜技术,同时也在开发定制芯片、定制显示系统等等。这一产品毕竟还是个眼镜,但是现在确实还和普通的眼镜有点区别。不像是普通眼镜那么轻薄。但即便是在我们做的雷朋眼镜中,我们也很难集成所有我们需要的技术,因此无法实现全息AR。但我们离实现这个目标越来越近了。可能还是会很贵,但会逐渐成为一种产品。
另一个角度是,我们从开发好看的眼镜的角度出发,我们和世界上最好的眼镜制造商合作Essilor Luxottica(依视路·陆逊梯卡)。他们拥有几乎所有的大品牌眼镜公司。我们一直和他们合作开发眼镜,而目标就是我们首先是要做出一副外形好看的眼镜,然后尽可能多地塞进我们的技术。
我们也理解从技术层面上来说,不会是最理想的,但是最后会是一副好看的眼镜。目前,我们的眼镜里已经有相机,可以拍照和录像,还可以开Ins直播。麦克风和扬声器也不错,因为扬声器是开放的,有许多人觉得比耳机舒服。听音乐的时候还能保持一个比较私人的体验。而后来我们才发现,这也是和AI交谈所需要的传感器包,所以这算是一个意外之喜吧。
五年前如果你问我,我们会在实现AI之前实现全息AR技术吗?我应该会说有可能。因为我们一直在MR、显示领域取得进展。然而LLM领域发生了突破,事实证明,我们现在拥有高质量的AI,并且正在快速改进,速度比AR技术的改进还要快。这个反转我完全没想到。
很幸运的是,我们的处境不算太差,因为我们还在开发其他不同的产品。最终,我们会有不同能力、不同价位、不同技术的一系列眼镜产品,但我觉得按照目前的情况来看,300美元价位的无显示功能AI眼镜将会是一个大卖的产品,或许会有数千万或者上亿人购买。
黄仁勋:这一产品会有强交互式AI、视觉语言理解能力、实时翻译能力等等。
扎克伯格:有全息显示当然也不错,但眼镜肯定会更重更贵。有些人还是会想要这种产品,不过很多人可能还是想要一个轻薄的眼镜。
黄仁勋:对许多工业和工作用途来说,我们可能需要的是有显示功能的版本。
扎克伯格:我认为消费者也会喜欢的。疫情期间很多人都把时间花在开线上会议上了,我觉得这很不错。但如果我们以后能用眼镜开会,以全息影像的形式合作做事情,也是很不错的。我认为这种形式对AI来说也很重要。
黄仁勋:我倒是可以忍受拥有一副不是很经常使用,但具有显示功能的眼镜。
扎克伯格:不过最终我们会有全息显示的眼镜的。目前可能还需要一段时间才能在轻薄的眼睛上实现这一功能,但是将它放在一副时尚的、厚重的眼镜中,可能并不太遥远。
黄仁勋:现在的墨镜都要赶上脸的大小了。
扎克伯格:这是个很好的时尚潮流呀。我正在试图影响时尚潮流,这样我就可以在眼镜正式进入市场前让大家接受这种眼镜的风格。不过现在还没什么效果。
但如果我们未来业务的很大一块是要制造时尚的眼镜,或许我应该多花点时间在这些事情上,我们可能需要下线那个每天穿同样衣服的版本的我了。
眼镜和手表、手机不一样,人们不想要千篇一律的眼镜。最终,这个市场还是会发展成开放的生态,人们需要多样的眼镜外形。千篇一律的设计是行不通的。
06.
创业不易转型艰难
背道而驰终成行业领先者
黄仁勋:我们现在生活的时代里,整个计算堆栈都正在被重塑。现在我们已经进入了软件3.0时代,我们从通用计算走到了生成式神经网络。我们现在可以开发的能力和应用在过去是完全无法想象的。生成式AI影响消费者的速度也很快,同时还走进了千行百业。
我知道建立一家公司不容易,你们还将自己的平台从PC转到移动设备,再转到VR和AI,所有的这些设备,这是个不平凡的成就。
英伟达自己也有很多转型的经历,我完全明白这有多困难。我们两个过去也曾碰壁,但这就是开创新事业的必经之路。我们过去曾经与世界背道而驰,大家都在构建设备端的产品,而我们把计算设备做得越来越大。这确实有点不合时宜了。但是现在大家都在大量使用我们的GPU。当小扎说H100的时候,他谈论的是数据中心。你们是不是要建立60万块H100的算力集群呢?
扎克伯格:我们是很好的客户。这就是能和黄仁勋在SIGGRAPH上进行对谈背后的诀窍。
黄仁勋:你们建立的这些巨型系统实在是太不可思议了。虽然你们进入GPU之旅的时间比他人短,但你们的规模是最大的。这真是难以置信,你现在是不折不扣的偶像了。
扎克伯格:早期阶段,我还在努力呢。