怎么在ps做网站首页建立网站需要什么
语言将主导AI交互界面,同时AI应用正逐步适应人类
AI正创造人为中心和基于代理的未来。
这是 OpenAI 首位投资人 Vinod Khosla 关于 AI 交互与革命的最新洞察。Khosla 对常见术语“AI 硬件”和“小工具”表示怀疑,他主张从一个新的视角来看待这些设备,认为它们是即将到来的时代中不可或缺的组成部分,这个时代的特点是以低延迟语音交互作为主要的用户界面。
Khosla 强调,这不仅仅是关于设备的讨论,而是关于人机交互根本性转变的讨论。他认为 AI 将在我们与技术的关系中引发两个根本性的变化。首先,语音——已经是最自然的人类互动界面——将成为主导的交互界面。
想象一下,延迟时间减少到不到半秒,这与基于触摸的设备的迟缓形成了鲜明对比。甚至“无声语音”也在讨论之中——在公共场合如咖啡厅中,无需发出声音即可发出命令。通过检测这种“无声言语”,技术将允许人们在公共场所私下口述,而不被旁人听见。
第二个变革是应用程序将如何适应我们。不再需要像学习使用 Uber 或 SAP、Oracle 这样的复杂系统一样,去学习如何导航应用程序。
到目前为止,我们总是在适应软件——学习它的复杂性,记住层次化的菜单等等,以此来与机器通信。
现在,AI 正在使软件适应人类。这将导致新类型的硬件的诞生,这些硬件主要设计用于语音互动,计算机学习人类的语言和人类本身。虽然对于某些视觉任务可能仍然需要屏幕,但核心交互将转向语音——无论是无声的还是有声的。
设计师 Jony Ive 和 OpenAI 的 Sam Altman 讨论了一个 AI 硬件项目。多年前开始的 Humane 猜测了这种接口——但早期的热度很快消退了。这些企业家的方向是正确的,但他们的实现没有充分专注于 AI 使能的新用户体验。
Rabbit 凭借其最小化的设备引起了轰动,使得微软 CEO Satya Nadella 称其 R1 发布为“我看过的最令人印象深刻的展示之一,自 Steve Jobs 在 2007 年介绍 iPhone 以来,捕捉到了什么是可能的愿景。”
Khosla Ventures 也是 Rabbit 的投资者之一,有新 Newin 曾在第一时间分享过《【2.1 万字实录】Rabbit 创始人&CEO 吕骋最新对谈|R1 更像是 AI + iPod,而不是 iPhone 杀手》。
Khosla 认为 Rabbit 是重新定义人机交互在强大 AI 世界中的早期尝试。这些设备将围绕着我们应该通过自然语言用声音与计算机(或可以为我们运行应用的代理)对话的理念为中心,而不是通过人造构造。
以 Khosla 个人的生活习惯为例。当他徒步时,他会使用一个叫做 Picture This 的应用来识别我遇到的植物,但这个过程很麻烦:停下来,暂停有声读物,打开应用,拍照,等待答案加载,关闭应用,把手机放回口袋。
有了这项新技术,他只需将设备指向植物并问:“这是什么植物?”便会得到答案,然后我可以说“播放有声读物”并继续听我的书,无需中断或麻烦。
从成本角度看,这种以语音驱动的方法是一个游戏规则的改变者。它比传统的智能手机要便宜得多。形态因素的创新也很可能,尽管配备更大屏幕的手机不会消失。
Rabbit 的大型动作模型(LAM),基于神经符号方法,学会使用软件应用并跨应用工作,因此人类不需要了解其他应用或网站。Rabbit 的代理将与人类交谈并为他们使用这些应用。
语音比打字或触摸屏更简单、更高效。高分辨率图形和触摸界面要求昂贵、复杂的计算。相比之下,驱动 ChatGPT 和其他聊天机器人的非常大的 5000 亿参数大型语言模型试图学习所有曾经发布的内容。
Rabbit 的 LAM 表现得更像是学习如何使用应用和其他 LLM 的人类,因此人类不需要学习它们或掌握提示工程。LAM 学习使用软件的方式就像人类一样,而不是通过应用程序编程接口与应用通信,如传统软件所做的。
想象有人在你滑动手机时偷看你的肩膀并学习那些模式。那就是 LAM——或者未来可能被称为的东西。这是传统范式的完全颠覆,意味着最终我们不必与软件交互,因为 AI 将代表我们这样做。
手机,就像现在这样,被设计来分散我们的注意力。如果 Khosla 在徒步时不得不拿出手机,会看到电子邮件、短信和其他通知;他会被拉进某个社交平台,被广告打扰,甚至可能下陷入一个漩涡,毫不夸张地说。
手机不断争夺我们的注意力,将我们拉入通知和消息的漩涡。这些新设计,如 Rabbit,旨在节省时间并最小化分心。你告诉它要做什么,它就仅仅做那个,没有更多。
初创公司可以如此敏捷和创新!技术的未来不是关于渐进式变化或过去的外推,这不仅仅是关于制造另一个 iPhone 16 或 17——尽管那些将继续非常有价值。这是关于我们与设备互动方式的根本性转变,这是以 AI 为中心的,需要新的设计和新的优先级,硬件支持。初创公司最适合这样的转变。现有的大公司肯定会慢慢跟进。
这就像 Apple 支配手机市场之前的手机市场。在 2006 年,大名鼎鼎的是 Nokia、Motorola,也许还有 Samsung 和 BlackBerry。Apple 当时甚至还没有进入这个画面。
然后它突然推出 iPhone,彻底改变了游戏规则。通过一个创新的以用户为中心的触摸界面,在这个高度便携的计算机中,成为可能的数百万应用。
正因为下一个阶段不是关于硬件或小工具,而是关于人类与计算机互动方式的彻底改造,我们将把像 Rabbit 的 R1 这样的设备添加到我们的装备中。我们将使用一个按钮设备,通过自然语言驱动大多数互动,屏幕如我们所知将成为次要。
这些新设备能够做的很多事情可以通过在传统设备如智能手机上的“代理”应用来完成。但智能手机不提供亚秒级的、无干扰的互动和其他独特功能,这些是人类中心的 AI 将启用的。
新技术将出现以支持这个生态系统,如 植入隐形眼镜和眼镜的显示器 和许多不同的方法来 无声言语,以便在公共场所隐秘地使用设备。
这些设备正在发明一个以人为中心和基于代理的未来,由新的 AI 技术启用。Rabbit 正在对此进行真正的尝试,这不仅仅是一个渐进式的变化。其他人肯定会跟进,创造许多便于携带和使用的设备。
Apple 带给我们“有一个应用可以做到那个”的世界。Rabbit 式的设备将带给我们“有一个 AI 可以做到那个”的世界,通过一个以语音驱动的个人代理访问,可以为你运行应用(END)。
从训练芯片转向推理芯片
英伟达主导的AI芯片大战已经转向了一个新的战线——一个规模更大但也更具竞争力的战线。
英伟达通过提供训练人工智能模型这一极其复杂的工作所必需的芯片,将自己打造成一家价值2万亿美元的公司。随着行业的快速发展,更大的机会将是销售芯片使这些模型在训练后运行的芯片,为快速增长的实际使用生成式人工智能工具的公司和人们生产文本和图像。
目前,这种转变正在增加英伟达的销量。首席财务官科莱特·克雷斯 (Colette Kress) 上周表示,去年Nvidia数据中心业务的40%以上(收入超过470亿美元)用于部署人工智能推理系统,而不是训练。这一百分比是转变正在进行的第一个重要迹象。
克雷斯的评论缓解了一些担忧,即向部署人工智能系统的芯片(即执行所谓“推理”工作的芯片)的转变威胁到了英伟达的地位,因为与制造英伟达的芯片相比,这项工作可以使用功能更弱、成本更低的芯片来完成。
Melius Research分析师Ben Reitzes在给客户的一份报告中表示:“人们认为Nvidia在推理领域的份额将低于训练领域。” “这一发现有助于揭示其从即将到来的推理爆炸中受益的能力。”
许多竞争对手认为,随着推理芯片变得更加重要,他们在人工智能市场上拥有更好的机会。
生产数据中心中央处理器的英特尔公司相信,随着客户专注于降低人工智能模型的运行成本,其芯片将越来越有吸引力。英特尔专门生产的芯片类型已经广泛用于推理,在执行该任务时,拥有Nvidia的尖端且更昂贵的H100 AI芯片并不那么重要。
英特尔首席执行官帕特·基辛格 (Pat Gelsinger) 在去年12月的一次采访中表示:“推理的经济学是,我不会承受40,000美元的H100环境,因为它会消耗太多电量,需要新的管理和安全模型以及新的 IT 基础设施。” “如果我可以在标准 [英特尔芯片] 上运行这些模型,那是理所当然的。”
美国银行分析师Vivek Arya表示,向推理的转变可能是英伟达季度收益报告周三出现的最重要消息,该报告超出了华尔街的预期,导致其股价本周上涨8.5%,推动该公司估值约为2万亿美元。
Arya表示,随着对人工智能模型的训练投资激增,焦点转向从人工智能模型中创收,推理能力将会上升。与英伟达占据主导地位的人工智能训练相比,这可能更具竞争力。
推理增长的速度可能比之前预期的要快。今年早些时候,瑞银分析师估计90%的芯片需求来自训练,而这一推论到明年只会推动20%的市场份额。分析师在一份报告中表示,英伟达大约40%的数据中心收入来自推理,“这个数字比我们预期的要大”。
事实上,英伟达周三的财务业绩表明,其在人工智能芯片领域超过80%的市场份额尚未受到严重挑战。英伟达用于训练人工智能系统的芯片预计在可预见的未来仍将保持旺盛的需求。
在训练人工智能系统时,公司通过模型运行海量数据,教它们以能够实现人类发音表达的方式预测语言。这项工作需要强大的计算能力,非常适合Nvidia的图形处理单元(GPU)。
推理工作是指这些模型被要求处理新的信息并做出响应——更轻松的提升。
除了英特尔和AMD等Nvidia的老牌竞争对手之外,随着推理成为焦点,许多人工智能芯片初创公司也可能获得发展动力。
“我们看到我们的推理用例呈爆炸式增长,”SambaNova 的首席执行官罗德里戈·梁 (Rodrigo Liang) 说,SambaNova是一家初创公司,将人工智能芯片和软件相结合,可以进行推理和训练。“人们开始意识到 80% 以上的成本将用于推理,我需要寻找替代解决方案,”他说。
Groq 是一家由前谷歌人工智能芯片工程师乔纳森·罗斯 (Jonathan Ross) 创立的初创公司,近几个月来,该公司主页上的演示展示了其推理芯片可以如何快速地从大型语言模型中生成响应,因此引起了人们的兴趣激增。罗斯表示,该公司预计今年将部署42,000个芯片,明年将部署100万个芯片,但正在探索将芯片总数今年增加到220,000个,明年增加到150万个。
他说,推动这一转变的一个因素是,一些最先进的人工智能系统正在被调整,以产生更好的响应,而无需重新训练它们,从而将更多的计算工作推向推理。他说,Groq的专业芯片比Nvidia或其他芯片公司的产品运行速度更快、成本更低。
“据此推断,你可以部署什么取决于成本,”他说。“有很多模型可以在谷歌接受训练,但它们中大约80%没有得到部署,因为它们太贵了,无法投入生产。”
大型科技公司——包括 Meta、微软,谷歌和亚马逊——一直致力于内部开发推理芯片,认识到即将到来的转变以及能够更便宜地进行推理的好处。
例如,亚马逊自2018年以来就拥有推理芯片,该公司云计算部门数据和机器学习副总裁斯瓦米·西瓦苏布拉马尼安 (Swami Sivasubramanian) 去年表示,推理占其Alexa智能助手计算成本的40%。
就英伟达而言,它正在寻求在向推理过渡的过程中保持领先地位。去年,一款即将推出的芯片在一项关键的人工智能推理基准测试中取得了行业领先的结果,延续了该公司多年来在竞争中的主导地位。
去年12月,AMD推出了新的人工智能芯片,据称其推理能力优于Nvidia的芯片后,Nvidia在一篇博客文章中予以回击,对这一说法提出质疑。英伟达表示,AMD在宣称其性能时并未使用优化软件,如果这样做,英伟达的芯片速度将是原来的两倍。