![]() |
|
|---|
|
![]() |
| InterPhonic系列简介: |
|---|
InterPhonic语音合成系统是由安徽科大讯飞信息科技股份有限公司自主研发的中英文混读语音合成系统。该系统以先进的大语料语音合成技术为基础,能够实 时动态的将文本信息转换为自然、流畅的语音数据,是一种能够在任何时间、任何地点,向任何人提供语音信息服务的高效便捷手段,非常符合信息时代海量数据、动态更新和个性化查询的需求。 |
InterPhonic 5.0产品是科大讯飞公司基于深厚的研究积累和长期广泛深入的应用实践,在多项关键技术上有重大创新突破的一款产品,作为科大讯飞引领语音技术与市场发展的新一代主流语音合成产品,将为自助语音服务提供源源不断的核心动力。 高质量的语音合成效果 ◆多语种,适应不断发展的业务需求 提供普通话、广东话、英语等上十个语种,包含业界创新的普通话与英语同音混读、广东话与英语同音混读,适应不同语音应用业务的需求。多引擎管理接口可不同语种的系统提供一致化的访问界面,应用层可以灵活透明的选择所需的语音合成语种,并支持实时语种切换。 主导个性化语音服务新潮流,提供丰富、风格多样化的音色选择,如浑厚淳正的男声,成熟稳重、轻快活泼、或温柔甜美的女声,标准地道的英语女声,甚至童声,少男、少女,老年人等等,所有音色库均继承科大讯飞语音合成技术一贯的优良品质。用户可供根据不同应用业务需要,选择最适合应用场景的语音风格,并支持实时动态的音色切换。 新一代的InterPhonic 5.0产品拥有更高智能的自然语言理解能力,自动进行文本分析和韵律描述,可以表现出典型的语气,如疑问和感叹等,合成效果更富表现力。语音合成效果对于语气的表现能力,是科大讯飞语音技术又一项重要的创新性突破,将帮助自动语音服务以更加人性化的语音用户界面提升客户体验。 InterPhonic语音合成产品所拥有的高准确度智能文本分析与预处理技术,有效保障语音合成准确、流畅、自然。得益于科大讯飞在语言学上的深厚积累、与相关权威科研机构的紧密合作,以及通过宽广的应用实践平台所积累的海量专业知识库,通过不断训练和优化,InterPhonic即使在面对针对语言分析处理的难点,如多音字、特殊符号、韵律短语、未登录词(如地名、人名)等等,也能保障得到高度准确的自动处理结果。 针对主流应用环境的普遍需求,科大讯飞广泛收集实际应用的语料,并进行细致分析和专业的优化,InterPhonic 5.0在数字数值、短语短句等最常见应用下效果提升显著,合成效果更加清晰准确、节奏感更强。 全面完善的功能特性 ◆合理的架构 采用基于TCP/IP的高效网络语音合成服务和集中式的资源管理机制,形成客户端-资源管理器-服务器有机结合的体系架构,构建可灵活伸缩的方案,其高可用性历经众多重点行业大规模关键业务的应用检验,确保提供值得信赖的7×24小时不间断自动化语音服务。 InterPhonic SDK针对不同开发工具,不同集成要求和方案,提供多种形式的开发接口,包括:标准开发接口(DLL),简单开发接口,COM组件,SAPI开发接口,开发者可以根据实际需要灵活选择。提供丰富的开发例程和文档,帮助加速语音应用开发过程。 丰富完善的参数设置与调节功能和工具,帮助用户对语音合成效果进行灵活高效的控制与管理。提供对全局参数(如音量、语速、音高等)、用户词典、用户规则、定制资源包统一进行配置和管理的工具;数字、标点符号、英文发音方式的设定;中英文加词功能,可以指定每个字词的拼音或音标等等;提供统一的简单易用图形化用户界面进行操作设定,并可通过API参数进行动态设置和调整,还支持以CSSML(中文语音合成标记语言)进行标记、描述和控制。 InterPhonic的增强工具集套件包括了使用便捷的高效组件,如离线语音应用工具、CSSML可视化编辑工具、DOC/XLS文本格式转换工具等。 能够解析普通文本格式、MIME格式和html格式的Email,合成邮件主题、发件人、收件人、信件内容和文本附件,根据语境自动判断读法。 增加了URI合成功能。自动获取用户指定的网络URI文本,方便使用网络上的信息资源。 全面支持GB2312、GBK、BIG5、GB18030、UTF-8和UNICODE编码字符集,自动识别UNICODE文本;支持直接输出多种采样率的语音数据格式(包括 服务器端支持Windows、Unix、Linux等主流操作系统,客户端支持Microsoft Windows、SUN Solaris、REDHAT Linux、SUSE Linux、HP TRUE64 UNIX、IBM AIX UNIX、VxWork等操作系统。 与业内知名的相关平台和设备商均有过成功的集成案例。通过与众多平台和设备提供商、系统集成商及软件开发商的紧密合作,能够保证向用户提供围绕语音应用全程的专业服务。 细致周到的优化方案 ◆优化定制,高效的应用效果方案 提供以定制资源包(加载于合成引擎之上,有效提升既定应用领域语音效果的资源集合)和、CSSML和虚拟不定长工具为代表的主流应用环境进行效果优化的高效解决方案,显著提升实际应用效果。科大讯飞专业服务体系提供高效的定制与优化方案,提升客户体验,帮助客户获得语音自助服务的持续成功。 CSSML(Chinese Speech Synthesis Markup Language)是由科大讯飞提出并牵头制订的中文语音数据描述规范。该标准得到了国家863专家组、国家信标委和国家技术监督局的大力关注与支持,2005年正式通过国家标准化组织的评审,成为中文语音合成技术标准与规范的重要内容。CSSML针对中文语音应用设计和扩展,可以对多种特性进行灵活标注与控制,并与SSML兼容。 InterPhonic提供业界首创的背景音功能,通过系统提供的简单易用工具,可以便捷高效的添加背景音乐,调整背景音乐和合成语音的音量对比,并可直接试听实际效果,使语音服务更加亲切自然。 语音市场新一代动力引擎InterPhonic 5.0,为您带来如下收益: 降低成本:高质量的效果、灵活的应用、经过应用验证的稳定性,可使您放心自如地应用自助语音服务来取代传统的人工服务。更高的自动化程度,意味着您将以更低的成本提供更高质量的服务。 |
![]() |
|