▶ OpenAI 首次展示音频模型
OpenAI 在其官网博客上公布了语音生成模型— Voice Engine,该模型可以根据某人的 15 秒语音片段创建情感丰富且逼真的声音。
该模型于 2022 年底首次开发,并且已经对教育技术公司 Age of Learning、视觉故事平台 HeyGen、健康软件制造商 Dimagi、人工智能通信应用开发商 Livox 和健康系统 Lifespan 等公司开放访问。
Voice Engine 的用途十分广泛,可用于提供阅读帮助、改善偏远地区的基本服务交付,以及为患有影响言语的人士提供治疗应用。
OpenAI 还在博客中表示,「通过开放小规模部署,有助于我们按照现有方法、保障措施等推进产品落地,并在不断磨合、探索过程中思考,如何将 Voice Engine 用于各行各业」。
▶ 微软携手 OpenAI 投入 1000 亿美元打造新 AI 超算
据 The Information 报道,微软将与 OpenAI 计划联手投资 1000 亿美元,打造名为「星际之门」的先进人工智能超级计算机。
「星际之门」的成本比现有的数据中心高出百倍,该项目将包含一台超级计算机,同时还配备有数百万个专用服务器芯片,为 Open AI 的人工智能提供动力。
The Information 媒体还指出该项目的关键之一,是 OpenAI 能否在规定期限内交付 GPT-5 模型,并表示 OpenAI 目前计划在 2025 年初推出 GPT-5 。