内媒报道,阿里千问正式发布最新一代全模态大模型Qwen3.5-Omni。该模型在215项第三方性能测试中取得SOTA(当前最优效果),在音视频理解与实时交互等多项核心指标上超越Google Gemini-3.1 Pro。
技术层面上,Qwen3.5-Omni系列包含Plus、Flash及Light三种尺寸的Instruct版本,支持256k长上下文,模型支持超过10小时的音频输入及超过400秒的720P(1FPS)音视频输入。模型在海量文本、视觉以及超过1亿小时的音视频数据上进行原生多模态预训练,该模型展现出卓越的全模态感知与生成能力。相比Qwen3-Omni及Qwen3.5-Omni多语言能力大大增强,能够支持113种语种和方言的语音识别和36种语种和方言的语音生成。
相关内容《大行》花旗:市监局表态标志外卖业竞争开始正常化 料未来数月补贴规模将明显收敛
目前,Qwen3.5-Omni的Plus、Flash、Light三种API已在阿里云百链平台上线。其API调用定价为每百万Tokens输入不足0.8元人民币,不到Gemini-3.1 Pro价格的十分之一。阿里表示,千问目前服务涵盖互联网、金融、消费电子及汽车等行业超过100万家客户,稳居内地企业级大模型调用量首位。(ta/w)
AASTOCKS新闻