产业预言:明年爆发首次激战
国内的语音产业由于多方面的原因,刚刚开始步入实用领域。但是国内语音产业的拓荒者科大讯飞却大胆预言:明年上半年将迎来语音产业的第一波高潮。日前,该公司刘庆峰总裁接受了记者的采访。这位自1995年起就是国家863项目语音合成技术的主攻人员年轻而锐气,他说,这个判断有赖于我们核心技术的进步,也有赖于整个产业的进步。
首先,在技术方面,语音合成技术已经日趋成熟,正处在由实验室走向产业化的转折点上,极有希望在近期内形成一个全新的产业。语音识别技术虽然还处于大规模产业化的前夕,但现行的语音系统已能支持口语中的常用短语。尤其在受限领域内,如股票买入卖出、固定名称等,数字识别的准确率基本可以达到实用。
科大讯飞的工作人员为记者现场演示了讯飞证券委托交易系统。除初始拨号和输入密码用按键操作外,所有大盘走势、个股查询、实时股评、委托交易等,都由人机对话直接完成,其间工作人员还常常打断正在播出的内容,提出另外的要求。自始自终,电话系统反应与真人相仿,并无一差错,让人感觉对方好像真的是一个恭谦而敬业的业务员。
当然,仅仅能够在受限领域内应用是远远不够的,将来发展中更大的应用应该是不受限的,在任何场面都能够运转。据科大讯飞所做的不完全市场分析,未来几年中,仅在电信、电脑终端、移动通信、车载GPS、儿童玩具等领域的应用,至少会有360亿元的市场。但是现在的技术只能解决其中20、30%的问题。本着互补研发原则,科大讯飞将与Nuance合作,把其在语音合成方面的丰富经验和对汉语语音学的经验拿出来共享,共同把电话语音识别技术做得更成熟。
除了技术,刘庆峰对于发展战略也自成一套,走的是一条语音平台战略。不做具体的产品,不与开发伙伴直接竞争,而是通过提供一个广泛的应用平台,积极推动与各行各业的密切合作,以快速启动语音产业。
刘庆峰也坦言,虽然有这么大的一个产业空间,但科大讯飞现在的销售收入还没有达到1个亿,说明产业现在还是初期阶段,最激烈的争夺战没有开始。他认为,明年上半年会迎来争夺战的第一波高潮。
最直观的判断是因为科大讯飞的二次开发厂商,已经有十几个都推出了稳定的产品,并开始持续地、不断上升地从讯飞购买授权。据悉,目前基于科大讯飞语音平台的二次开发商已近300家。华为、新太等十多家开发伙伴已开始稳定地向科大讯飞支付License费用。如果近300家里有一半那怕三分之一,能够推出比较成功的应用产品,那么整个产业形势就起来了。
另外,科大讯飞在过去的二、三年中,一直呈爆发性的增长,每年的增长率都达到100%。随着其对电信、证券等领域的越来越了解,已经越来越清楚怎样才能够为他们创造价值。近期,科大讯飞开始在电信应用领域提供语音应用整体解决方案,已在上海、北京、深圳、安徽、辽宁等20个省市开通智能语音信息服务,将渐渐形成示范效应。
价值预测:给语音应用排排座
记者请刘庆峰根据现有的应用及国内运营商的关注点来推测,电信级语音应用将成功于何处?他分析,与国外运营商情况不同,国内有两个因素不得不考虑,一是中国的人工成本比较低,可能是美国的十分之一,所以运营商对节约人工成本并没有那么迫切;第二个是消息者使用习惯的问题,比如说,国内很多人到现在也表示,就是不喜欢留言电话,因为对着一台机器说话感觉有点怪。
他认为,第一大应用是语音合成在声讯领域的应用。由于社会发展要求信息及时、大量,原来声讯电话的人工录音有极大的限制。利用语音合成系统,能准确地将动态的文字信息转换成语音文件。而且,现在的语音合成技术业已成熟,词组清晰度已达96%,自然度达4.3(普通人发音为自然度4.0)。