发布于:2024-05-16 08:48 阅读次数:
[:外汇EA大师网讯] - OpenAI周一推出了新的人工智能模型和桌面版ChatGPT,以及更新的用户界面,这是该公司扩大其流行聊天机器人用途的最新努力。
技术负责人Mira Murati 在直播活动中表示,此次更新将GPT-4 带给所有人,包括OpenAI 的免费用户。她补充说,新模型GPT-4o“速度快得多”,并且改进了文本、视频和音频功能。 OpenAI 表示,它最终计划允许用户使用ChatGPT 进行视频聊天。
“这是我们第一次在易用性方面迈出一大步,”穆拉蒂说。
由微软支持的OpenAI 已被投资者估值超过800 亿美元。该公司成立于2015 年,面临着保持在生成人工智能市场领先地位的压力,同时寻找赚钱的方法,因为它大力投资处理器和基础设施来构建和训练其模型。
GPT-4o 中的o 代表无所不能。 Murati 表示,新模型允许ChatGPT 处理50 种不同的语言,并提高速度和质量,并且还将通过OpenAI 的API 提供,以便开发人员可以开始使用新模型构建应用程序。
她补充说,GPT-4o 的速度是GPT-4 Turbo 的两倍,成本却是GPT-4 Turbo 的一半。
OpenAI 团队成员展示了新模型的音频功能,例如,要求它在公开演讲前帮助某人冷静下来。 OpenAI 研究员Mark Chen 表示,该模型能够“感知你的情绪”,并补充说该模型还可以处理用户打断它的情况。该团队还要求它分析用户的面部表情,以评论个人可能正在经历的情绪。
“嘿,怎么了?我怎样才能让你的日子过得更好呢?” ChatGPT 的音频模式会在用户打招呼时发出声音。
根据一篇博客文章,该公司计划在未来几周内测试语音模式,付费用户可以提前访问ChatGPT Plus。 OpenAI还表示,新模型可以在“232毫秒内响应用户的音频提示,平均为320毫秒,这与人类在对话中的响应时间相似”。
马克陈(Mark Chen)展示了该模型讲述睡前故事的能力,并要求它改变语调,使其更加戏剧化或机器人化。他甚至让它唱故事。
此外,该公司表示,OpenAI 的新模型甚至可以在音频模式下充当翻译器。 Mark Chen 展示了该工具能够在穆拉蒂说英语时听他们说意大利语,并在他们交谈时将其翻译成各自的语言。
团队成员还展示了该模型解决数学方程和帮助编写代码的能力,将其定位为微软自己的GitHub Copilot 的有力竞争对手。
对于OpenAI 来说,此次发布是该公司自8 月份推出人工智能聊天机器人业务层ChatGPT Enterprise 以来最重大的公告之一。 OpenAI 首席运营官Brad Lightcap 当时告诉CNBC,该工具的开发时间“不到一年”,得到了20 多家不同规模和行业的公司的帮助。
OpenAI、微软和谷歌正在引领一场人工智能淘金热,几乎每个行业的公司都在竞相将人工智能聊天机器人和代理添加到关键服务中,以避免落后于竞争对手。本月早些时候,OpenAI 的竞争对手Anthropic 宣布了其首款企业产品和免费iPhone 应用程序。
根据PitchBook 数据,2023 年近700 笔生成式AI 交易的投资达到创纪录的291 亿美元,较上一年增长超过260%。十年内市场收入预计将超过1 万亿美元。
一些业内人士对未经测试的新服务进入市场的速度表示担忧,学者和伦理学家则担心该技术会传播偏见。
ChatGPT 于2022 年11 月推出后,打破了当时的记录,成为历史上增长最快的消费者应用程序,目前每周活跃用户约为1 亿。 OpenAI 表示,超过92% 的财富500 强公司正在使用该平台。
Mulati 在周一的活动中表示,OpenAI 希望“消除这项技术的一些神秘感”。
“在接下来的几周内,我们将向所有人推出这些功能,”她说。
周一的一篇博客文章称,新模式将于周二首先向ChatGPT Plus 和Team 客户推出,然后再向企业推出。从周一开始,ChatGPT 的免费用户也可以使用它,但有使用限制。 ChatGPT Plus 的用户将拥有比免费用户多五倍的消息容量,而ChatGPT Team 和Enterprise 的客户端将有更大的使用限制。
Mulati 在现场活动结束时感谢Nvidia 首席执行官Jensen Huang 及其公司为OpenAI 技术提供了必要的图形处理单元(GPU)。
“我只想感谢令人难以置信的OpenAI 团队Jensen Huang 和NVIDIA 团队为我们带来了最先进的GPU,使今天的演示成为可能,”她说。