近日,钉钉与通义实验室语音团队联合宣布推出新一代语音识别大模型——Fun-ASR。该模型具备出色的语音识别能力,可听懂家居、畜牧等十大行业黑话,并支持根据企业需求进行专用模型定制训练。
Fun-ASR是基于双方深度合作开发的,能够准确转录各类语音信号,具备跨行业术语识别能力,可处理不同语言和口音。此外Fun-ASR通过结合上下文信息,能够实现更精准的语音转录,充分满足企业在特定场景下的需求。为提升使用的灵活性和针对性,企业在使用Fun-ASR模型过程中可以根据自身业务特点定制模型训练,从而更好地适应各自业务环境。
目前,Fun-ASR已成功集成到钉钉的多个功能模块中,包括会议字幕和同声传译、智能纪要和语音助手,为企业提供稳定、高效且可扩展的语音识别基础,特别适用于需要高上下文理解和识别准确性的企业场景。
技术层面看,Fun-ASR 语音识别大模型的核心亮点在于三方面:
1、全面增强了对行业专有词汇的识别能力
Fun-ASR模型经过上亿小时音频数据的训练,并结合钉钉多行业客户的真实场景共创,能够准确理解互联网、科技、家装、畜牧、汽车等十多个领域的专业术语。
实测数据显示,Fun-ASR 在保险行业的准确率较以往提升 18%,在家装、畜牧等行业也实现了 15%-20% 的提升。针对生僻词汇,Fun-ASR 还提供企业自定义热词能力,最多可支持 1000+ 热词导入。
2、结合钉钉带来了更强的上下文感知和理解能力
Fun-ASR 可结合企业在钉钉内的已有信息如通讯录、日程、知识库等,进行推理优化,有效缓解大模型造成的幻觉,提供更可靠的转写结果。该能力需经企业授权后方可生效。
3、针对高阶需求的企业支持定制化语音识别模型训练
基于高效的端到端训练架构,该模型可利用企业提供的真实场景语音数据进一步做算法优化,以提升如品牌名、项目代号、产品名、人名等专属词汇的识别准确率。
以顾家家居与钉钉的合作为例,经过专属训练后,在顾家的门店销售给客户讲解产品时,该模型能够准确识别“比利时进口 Pulse 脉冲乳胶”、“独创 Sonocore 发泡工艺”等专业表述,为后续对客户需求的进一步分析提供可靠依据。
对于此次合作,通义实验室语音团队负责人李先刚表示:“我们很高兴能够与钉钉携手,共同推动语音识别技术在企业场景中的创新和应用。未来,我们将持续扩大 Fun-ASR 的数据和模型规模,不断提升大模型语音智能解决方案的可复制能力,为企业客户带来更高效、智能的产品体验。”
钉钉 CTO 朱鸿也表示,“钉钉和通义团队仅用三个月的紧密协作,就实现了 Fun-ASR 模型的成功落地,并赢得了头部客户的高度认可。这是我们迈向行业领先的一次关键突破,也将为更多钉钉客户企业打造专业定制大模型提供可参考的范例。”
-
广告合作
-
QQ群号:4114653




