开云(中国) OpenAI发布三款语言模子, 聚焦及时交互等场景

发布日期：2026-05-10 12:28 来源：未知作者：admin 浏览次数：

日前，OpenAI方面发布三款全新及时语音模子，分离为GPT-Realtime-2、GPT-Realtime-Translate、GPT-Realtime-Whisper。

其中，GPT-Realtime-2专为及时语音交互计算，高下文窗口由上一代的32K增长至128K，是首款具备GPT-5级推理能力的语音模子，不错在保抓对话当然运动的前提下，及时进行逻辑推理、调用器用，并处置用户的打断或翻新。这就意味着设立者可以借此构建更复杂的语音助手，并实施多递次任务。

况且GPT-Realtime-2还撑抓调遣推理强度，即撑抓设立者可凭据需求启用最低、低、中、高和超高级不同等第的推理能力，从而在苟简交互的较低蔓延和复杂央求的更周至推理之间获取均衡。

OpenAI方面公布的相干信息表示，GPT-Realtime-2在Big Bench Audio中的得分上GPT-Realtime-1.5高15.2%，开云(中国)在Audio MultiChallenge中的得分比GPT-Realtime-1.5高13.8%。

而GPT-Realtime-Translate则聚焦及时语言翻译场景，撑抓70种输入语言和13种输出语言，可自动识别输入语言，并输出翻译后的语音和文本，适用于跨国会议或及时疏通场景。OpenAI方面示意，传统语音翻译常常条款语言东谈主戒指语言节拍，而GPT-Realtime-Translate更接近贯穿口译的景色。

GPT-Realtime-Whisper则专注于低蔓延语音转文本，能在用户语言的同期转灌音频。

现在这三款模子已集成至Realtime API供设立者使用，旨在助力构建更当然、更智能、更及时反应的语音体验。

价钱方面，GPT-Realtime-2的音频输入订价为每百万Token 32好意思元开云(中国)，缓存输入每百万Token 0.4好意思元，音频输出为每百万Token 64好意思。GPT-Realtime-Translate和GPT-Realtime-Whisper则是按使用时长计费，分离为每分钟0.034好意思元和0.017好意思元。

博亚体育中国一站式服务官网

上一篇：上一篇：开云(中国) 一九九一年，东京，刚走出机场的邓丽君与她的男友保罗。此时邓丽君三十八

下一篇：下一篇：开云体育江苏金租的前世今生：钞票欠债率84.14%高于行业平均，毛利率71.15%向上同行24.62个百分点

开云体育中国官方网站入口

开云体育app

开云(中国) OpenAI发布三款语言模子, 聚焦及时交互等场景