<匯港通訊> 小米(01810)發布和全量開源聲音理解大模型 MiDashengLM-7B。
據介紹,MiDashengLM-7B 聲音理解性能在22個公開評測集上,刷新多模態大模型最好成績(SOTA),單樣本推理的首 Token 延遲(TTFT)僅為業界先進模型的四分一,同等顯存下的數據吞吐效率是業界先進模型的20倍以上。
在目前版本的基礎上,小米已著手對 MiDashengLM 模型做計算效率的進一步升級,尋求終端設備上可離線部署,並完善基於用戶自然語言提示的聲音編輯等更全面的功能。(BC)
#小米
新聞來源 (不包括新聞圖片): 滙港資訊