站点地图
本网站备案编号:皖ICP备020403号
  首 页  |  关于讯飞  |  新闻中心  |  公司产品  |  在线演示  |  人才招聘  |  投资者关系  |  联系我们
科大讯飞——
全国唯一以语音技术为产业
化方向的:
中文语音交互技术标准工作组
国家863计划成果产业化基地
国家火炬计划骨干软件企业
国家火炬计划重点高新技术企业
国家规划布局内重点软件企业
国家高技术产业示范化基地
全国唯一“开放式语音开发及集中展示中心”承建单位
国家级“面向奥运多语言信息服务系统”语音技术方承担
“中国中文语音创业联盟”发起单位
“中国中文语音技术标准” 牵头制订单位
 
首页 >> 关于讯飞 >> 核心技术 >> 正文
语音合成技术     语音合成技术现状     讯飞语音合成技术     讯飞语音技术的发展
语音合成技术现状
  语音合成技术的研究已有两百多年的历史,但真正具有实用意义的近代语音合成技术是随着计算机技术和数字信号处理技术的发展而发展起来的,主要是让计算机能够产生高清晰度、高自然度的连续语音。在语音合成技术的发展过程中,早期的研究主要是采用参数合成方法,后来随着计算机技术的发展又出现了波形拼接的合成方法。
 
  参数合成:调整灵活,但音质差
 
  在语音合成技术的发展中,早期的研究主要是采用参数合成方法。值得提及的是Holmes的并联共振峰合成器(1973)和Klatt的串/并联共振峰合成器(1980),只要精心调整参数,这两个合成器都能合成出非常自然的语音。最具代表性的文语转换系统当数美国DEC公司的DECtalk(1987)。但是经过多年的研究与实践表明,由于准确提取共振峰参数比较困难,虽然利用共振峰合成器可以得到许多逼真的合成语音,但是整体合成语音的音质难以达到文语转换系统的实用要求。
 
  波形拼接:音质好,自然度高,但受调整算法限制,只能作有限调整
 
  自八十年代末期至今,语言合成技术又有了新的进展,特别是基音同步叠加(PSOLA)方法的提出(1990),使基于时域波形拼接方法合成的语音的音色和自然度大大提高。九十年代初,基于PSOLA技术的法语、德语、英语、日语等语种的文语转换系统都已经研制成功。这些系统的自然度比以前基于LPC方法或共振峰合成器的文语合成系统的自然度要高,并且基于PSOLA方法的合成器结构简单易于实时实现,有很大的商用前景。
 
  国内的汉语语音合成研究起步较晚些,但从八十年代初就基本上与国际上研究同步发展。大致也经历了共振峰合成、LPC合成至应用PSOLA技术的过程。在国家863计划,国家自然科学基金委,国家攻关计划,中国科学院有关项目等支持下,汉语文语转换系统研究近年来取得了令人举目的进展,其中不乏成功的例子:如中国科学院声学所的KX-PSOLA(1993), 联想佳音(1995);清华大学的TH_SPEECH (1993);中国科技大学的KDTALK(1995)等系统。这些系统基本上都是采用基于PSOLA方法的时域波形拼接技术,其合成汉语普通话的可懂度、清晰度达到了很高的水平。然而同国外其它语种的文语转换系统一样,这些系统合成的句子及篇章语音机器味较浓,其自然度还不能达到用户可广泛接受的程度,从而制约了这项技术的大规模进入市场。 
 

皖ICP备05001217号 © 版权所有 安徽科大讯飞信息科技股份有限公司