当前位置: www.7727s.com > 中国史 > 正文

国际语言合成大赛13连冠 科大讯飞强势技术领跑

时间:2019-11-27 21:28来源:中国史
人工智能快速发展催生语音合成技术的成熟,让机器不仅能“开口说话”,甚至能够“复刻”我们个性化的声音。 如果你一直把人工智能当作科学幻想,觉得缺乏真实感,恐怕是受到了

人工智能快速发展催生语音合成技术的成熟,让机器不仅能“开口说话”,甚至能够“复刻”我们个性化的声音。

如果你一直把人工智能当作科学幻想,觉得缺乏真实感,恐怕是受到了文学或影视作品的影响。其实人工智能早已在不知不觉中融入我们生产生活各个领域,用来描绘很多东西,例如有形的机器人、无人驾驶汽车、智能音箱……也可以是苹果语音助理Siri、谷歌围棋大师AlphaGo、精通10余种方言30多种外语的主持人“王小言”等等。

日前,科大讯飞宣布其蝉联了国际语音合成大赛13连冠,并且推出了“录制10段话,即可生成专属声音”的黑科技产品。据悉,声音复刻黑科技已落地多个应用场景并获得诸多业内人士好评。

www.7727s.com 1

www.7727s.com,发力c端 有声阅读、生活应用全覆盖

12月29日,央视新闻新年特别报道专题《中国永远在这儿》,坐在央视演播厅内做连线的主持人王言意外发现:有一个和自己极其相似的声音通过电视直播端传过来,此时场外连线的是位于安徽合肥·中国声谷·科大讯飞演示厅内的一台“会说话”的机器。

在手机阅读领域,讯飞语音合成技术已经服务超过1万家的阅读类产品,包括QQ阅读、书旗小说、多看阅读、京东阅读、咪咕阅读、追书神器等,每天提供10亿次以上的听书量。

这台机器正在向演播现场发回报道,“王言你好,我是主持人王小言。今天我会在中国声谷,向大家展示这里的新变化,也欢迎大家来这里参观学习,我会一直在中国声谷等着你们。”这位“王小言”主播不仅用地道的四川话向观众们问好,还用印地语道早安,这让央视演播厅的王言颇感震惊,感叹“就像找到了自己失散多年的亲弟弟。”

以讯飞阅读APP为例,依托科大讯飞全球领先的智能语音合成与个性化技术,可以将自己或亲朋好友的声音应用到有声阅读领域,即能将书城内任意文字转化为个性化的声音,且做到音色高保真还原,朗读的语气、语调、情感也堪比真人。

www.7727s.com 2

而在各类生活应用APP领域,目前包括滴滴打车、高德导航、抖音、美团骑手等在内的互联网大型APP,都在使用讯飞语音合成技术,每天为这些APP提供近19亿次的服务。大众所熟知的高德地图中,甜美的志玲姐姐、耿直的黄晓明、青春洋溢的TFBOYS等明星团,用他们声音的路况播报并不是每字每句提前录好的,而是通过讯飞合成明星个人音库来实现复刻。

据央视记者江凯介绍,主持人“王小言”的声音来自于科大讯飞个性化智能语音合成的黑科技——声音复刻。2018年世界机器人大会上,科大讯飞董事长刘庆峰就曾表示,“我们使用的导航软件里林志玲、郭德纲的声音就都是他们合成的。大量且复杂的语言表达让真人预先录制显然不现实,因此使用机器合成的作用越来凸显。”

赋能媒体 有声报纸、虚拟主播齐上阵

语音“黑科技”三分钟复刻声音

日前举行的第五届世界互联网大会上,科大讯飞董事长刘庆峰在“媒体变革与传播创新”论坛中表示,“通过与媒体携手合作,讯飞的技术可以在媒体采、编、播、审、存整个领域发挥作用,让媒体变得更加智能化、实时化,给人才释放出更多的时间”。

对多数人来说,最常接触到的是语音合成技术,赋予机器“开口说话”的能力。更高级的是,科大讯飞AI赋能使机器摆脱了机械化的发音,像真人拥有情感表现力、抑扬顿挫的声音。目前科大讯飞最新个性化语音合成技术,只需采集十段话语料,训练三分钟时间,即可实现“栩栩如声”的声音复刻,让声音与发音人几乎一样。据悉,本次节目播出前,来自讯飞留声团队通过采集王言平日节目中的声音,实现了声音复刻,最终让主持人“王小言”惊艳出场。

根据科大讯飞官方消息,其已与人民日报海外版、光明日报和央视等多家媒体达成合作,探索人工智能+媒体的多种可能。科大讯飞与光明日报的合作协议显示,双方将在近期推出第一张“智能化有声报纸”,让光明日报“能听会说”。同时,讯飞在虚拟主播应用上也带来重大突破——今年5月,虚拟主持人“康晓辉”与记者在CCTV特别报道《直播长江》现场进行了对话互动;11月的进博会期间,新晋上岗的人工智能虚拟主播“进宝”更是凭借着讯飞定制语音,成为全场焦点。

www.7727s.com 3

在自身技术和产品应用做大做强的同时,科大讯飞秉承开放合作的理念,共享产业资源和技术红利,力图通过更多的合作者,一起把声音复刻所创造的极致体验带到大众身边。

这项“语音黑科技”不仅复刻发音人的普通话,还能根据需求变换口音。据悉,讯飞的声音复刻能让机器“讲”粤语、四川话、河南话等10余种方言和英、日、韩、法等近30种外语。然而这一过程并不需要重新采集发音人的语音,而是通过文本输入就实现了“变声”。

定制专属音库声音复刻的福祉

编辑:中国史 本文来源:国际语言合成大赛13连冠 科大讯飞强势技术领跑

关键词: