4月20日,阿里通义实验室正式发布语音识别大模型Fun - ASR 1.5,在多方言与多文化理解领域取得重大突破,已通过阿里云百炼平台上线API服务。
Fun - ASR 1.5基于统一架构,单模型就能无缝覆盖30种语言及汉语七大方言体系。典型方言场景字错误率相对下降56.2%,其中5种方言准确率突破90%,这是语音技术的一大飞跃。
该模型实现四大核心升级。深度适配20余种地区口音;支持30种主流语言自由混说识别;专项优化古诗词识别,字符级准确率达97%;强化文本归一化能力,输出规范文本。
目前,Fun - ASR 1.5已通过阿里云百炼平台上线API服务,广泛应用于县域教育、地方政务及跨国协作等场景,展现出强大的实用性。
Fun - ASR 1.5的推出,推动语音识别从“听得清”迈向“听得懂”的工业级新阶段,有望改变行业格局,为更多领域带来新的可能。
编辑观点:Fun - ASR 1.5的发布是语音识别领域的重要里程碑,其多语言和方言处理能力将拓宽应用边界,未来有望在更多场景大放异彩。