OpenAI周四宣布推出开发者全新的语音转语音模型,名为GPT-realtime。
公司指出,该新语音模型在遵循复杂指令、精确调用工具及产生更自然且具表现力的语音方面显示改善。OpenAI又指,正在推出两个新语音Cedar和Marin,并补充指该语音转语音模型在解释系统消息和开发者提示方面表现更佳。
此外,OpenAI表示,正向Realtime API添加新功能,将允许开发者和公司创建可靠的、可生产的语音代理,配备远端模型上下文协议(MCP)伺服器、图像输入和通过会话发起协议(SIP)进行电话通话。(to/s)
AASTOCKS新闻