近年来,随着端对端合成技术以及神经网络声码器技术的不断创新,人机交互领域至关重要的语音合成(TTS)技术也得到了飞速发展,成为智能金融领域的一大热点。百融云创自成立人工智能金融实验室以来,在语音合成技术方面进行了大量的研发投入,目前自主研发的第一代基于端到端的语音合成系统已经投入商用,推动金融服务智能化加速到来。

语音合成助力金融进入智能交互时代

语音是语言的外部形式,是最直接地记录人的思维活动的符号体系,也是人类赖以生存发展和从事各种社会活动最基本、最重要的交流方式之一。而让机器开口说话,则是人类千百年来的梦想。语音合成(Text To Speech),是人类不断探索、实现这一梦想的科学实践,也是受到这一梦想不断推动、不断提升的技术领域。

如今,业内主要使用两种语音合成技术:单元选择和参数合成。单元选择语音合成技术在拥有足够高质量录音时能够合成最高质量的语音,也因此成为商业产品中最常用的语音合成技术。另外,参数合成能够提供高度可理解的、流畅的语音,但整体质量略低。因此,在语料库较小、低占用的情况下,通常使用参数合成技术。

近年来,随着人工智能加速渗透金融业务全流程,金融科技企业不仅利用语音合成技术为金融机构客服业务提供支撑,还在金融机构的业务端、执行端等多领域提供技术支持,与金融机构共建智慧金融,助力金融进入智能交互时代。

百融云创自主研发语音合成系统落地

据悉,这套由百融云创人工智能金融实验室自主研发的语音合成系统,实现了人机交互,可以实时将文本转换成自然流畅的语音。目前有多种发音人和音频种类可供选择,并提供调节语速、音量、音调、码率等功能。

在技术层面,百融云创基于端到端的深度学习技术,运用业界先进的合成技术,对attention机制、vocoder做了诸多优化升级,使得降低一半训练数据量的情况下,将系统合成音与真人发声的相似度提升到95%,在人工智能领域处于先进水平。

相对于市场上通用的语音合成产品,百融云创语音合成系统专注于金融场景的模型构建,经过优化后的attention技术,对特定场景定制专用话术的语音做训练。在贷后管理场景下,百融云创TTS在发音韵律、多音字准确率、语气等评测方面,效果明显高于市场上主要的通用TTS产品。

目前,百融云创的这套基于端到端的语音合成系统已经在其智能对话机器人“百小融”上使用。相较于传统机器人仅局限于电话呼出,“百小融”集成了目前先进的语音识别(ASR)、自然语言处理(NLP)、语音合成(TTS)和智能语音打断技术,并结合了百融云创庞大的知识图谱,支持超过15-20轮的精准回答交互,应用于智能营销和智能客服,可以迅速为金融机构节约成本,提升效率。


来源:中讯财经网

声明:

1、中国周刊网所有自采新闻(含图片),未经允许不得转载或镜像,授权转载应在授权范围内使用,并注明来源。

2、部分内容转自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

3、如因作品内容、版权和其他问题需要同本网联系的,请在30日内进行。

回复

请输入你的评论!
请在这里输入您的名字