一. 简介:
为惠普iPAQ掌上电脑提供语音软件服务的科大讯飞公司针对嵌入式语音合成的需求开发出了InterSound Embedded Edition2.0.这款产品是一个完整的实现语音合成功能的软件平台.基于此平台可以开发很多语音方面的应用.另外,平台提供开放的开发接口.应用软件开发商可以据此进行开发.以实现应用软件运行过程中调用语音合成的功能.'
合成流程
平台特性
| 项目 | 指标 | 备注 |
| 支持操作系统* | Microsoft Windows CE;Linux等 | 现可提供基于WinCE版本的开发包,对于其他的情况可以根据用户的需求定制 |
| 安装包尺寸 | 1.4M | |
| 首库尺寸(16K) | 782k | |
| 支持语种 | 汉语普通话 | 英文字符串按字母发音
|
| 支持字符集 | GB2312,GBK,BIG5,UNICODE
| |
| 单线程内存占用 | 150k Bytes | |
| 最低配置 | 20MIPS;150KRAM | |
| 最佳配置 | MIPS R4000(16Mrom/16Mram) 或SA1110(32Mrom/32Mram) | |
| 基准配置 | SA1110(32Mrom/32Mram) | |
合成效果
该语音合成平台的合成自然度达到了3.6分(五分制;播音员的标准语音为S分,普通人的普通话发音为4分,刚好能听懂得语音为3分).在很小的资源消耗情况下(见平台特性)实现了较好的语音合成效果,是目前最好的嵌入式语音平台产品.该平台的合成效果得到了各界人士的广泛认同.科大讯飞公司可以向感兴趣的客户提供语音平台演示版和相应的语音文件以供参考.
二、定位
信息功能是掌上电脑产品的一个重要功能,而对于大量的文本信息来说,通过显示屏来浏览是一个从PC引申过来的普遍方式.但对于便携式产品来说 , 方便易用是其显著的特点,而屏幕浏览大量文本信息却使该特点无法充分发挥.对于这个矛盾,我们可以通过语音合成的方式来解决.用户可以象听WalkMan,听MP3一样“听掌上电脑”,这样就使用户可以更随意更方便的使用掌上电脑。因此该平台为掌上电脑增加了更人性化的应用方式。开拓了更广阔的应用空间.
三、目标用户:
随着社会的发展,节奏逐渐加快对于商务人士来说.时间就是机会,时间就是效益.越来越多的商务人士希望充分的利用自己的时间 , 而商务人士却是流动性最大的人群.对于他们来说。非常多的时间是在路上、车上而非办公室.因此.充分利用各种感官来获取信息对他们来说是一个很强烈的需求,而掌上电脑的语音功能切实的解决的这个问题.同样.在其他各种行业中(交通、军队、公安、教育、证券、餐饮服务。旅游等)语音功能也有广泛的需求.可以预见语音功能将是未来掌上电脑产品的一项必不可少的重要功能.
四.平台调用方式
五.功能及优势:
应用软件开发商可以依据科大讯飞公司公布的iFly TTS SDK进行二次开发 以实现在应用软件中调用语音合成功能,在办公软件中可以读文档 在邮件软件中可以读EmaiI 在浏览器中可以读新闻.读小说,在电子地图软件中可以读地名以及相关信息。在股票分析软件中可以读数据,读股评等.
Intersound Embedded Edition 2. O采用了简单有效的文本处理模型.先进的语音学层次结构体系,优化精简的系统库资源等先进的技术,并具有简单的开发接口.灵活的可定制性,在很小的资源占用下达到了较好的效果.是业界公认的性能最好的嵌入式语音合成软件平台.
公司背景
为惠普iPAQ掌上电脑提供语音软件服务的安徽中科大讯飞信息科技有限公司是专门从事语音技术方面的基础研究、软件应用、系统集成、硬件产品生产、销售并提供全程技术支持和售后服务的高新技术企业;公司于1999年6月在国家智能计算机的研究开发中心、中国科技大学人机语音通信实验室的基础上组建,现已发展到注册资本7000万元、市值2.2亿元的规模。公司先后被评为国家863计划成果产业化基础和火炬计划国家级骨干软件企业。