什么是语音库

2018-03-25
1875

语音音库

语音库:语音库属后台数据库。就某种语言最基本单词和词组一个语言声音集合。比如英语,那就是英语目前全部单词发音声音的集合。遇到不收录在语音库里的单词,那就按自然读音规则进行发音。打个比方吧,就象在一个广播电视台,一个语音库就是一个主播,你要选什么语言,就要找会这种语言的主播,会这种语言的主播有很多个,每一个主播的声音音色都不一样,所以就会有不同的语音库,语音公司在设计录制合成时就把不同音色的语音库命了名,比如你会看到会读英语的就有:

IVONA 2 Brian OEM

IVONA 2 Amy OEM

IVONA 2 Emma OEM

IVONA 2 Eric OEM

IVONA 2 Ivy OEM

IVONA 2 Joey OEM

IVONA 2 Justin OEM

IVONA 2 Kendra OEM

IVONA 2 Kimberly OEM

IVONA 2 Salli OEM

Microsoft Zira Desktop - English (United States)

Vocalizer Expressive Allison Harpo 22kHz

Vocalizer Expressive Ava Harpo 22kHz

Vocalizer Expressive Karen Harpo 22kHz

Vocalizer Expressive Daniel Harpo 22kHz

Vocalizer Expressive Kate Harpo 22kHz

Vocalizer Expressive Karen Harpo 22kHz

Vocalizer Expressive Lee Harpo 22kHz

Vocalizer Expressive Nathan Harpo 22kHz

Vocalizer Expressive Rishi Harpo 22kHz

Vocalizer Expressive Samantha Harpo 22kHz

Vocalizer Expressive Serena Harpo 22kHz

Vocalizer Expressive Tom Harpo 22kHz

VW Bridget

VW Julie

这些语音语音库的音色都是不一样的。每一个代表着一个主播。这些英文语音库里有英国调的,美国调的,澳洲调的,非洲调的,印度调的等。。。。。,有男的,有女的,有儿童的等。语音库是分高质量语音库与低端语音库。象IVONA, Neospeech, Nuance等语音库公司提供的是高质量的语音库,在朗读时已接近人的自然朗读。以后,有trainable神经网络学习语音库出来后,语音库将附上感情,这就更加逼真,随着智能科技的不断发展,这只是时间问题了。

请中文的语音有:

VW Hui

VW Liang

Microsoft Huihui Desktop - Chinese (Simplified)

Microsoft Hanhan Desktop - Chinese (Taiwan)

中文语音库目前还是国产的较好,比如科大的,捷通的。

除了系统自带外,大部分的语音库都要到语音库公司官网下载,然后安装注册才能使用。有些语音库公司不提供直接下载,要进行注册并有购买意愿后才提供下载地址。有些语音库公司的语音库不提供给个人用户。就是有个人用户也是很昂贵,一般人买不起。

朗读机:朗读机就是负责调用语音库来朗读文本的一个前端软件。朗读机的功能一般由朗读机的开发者按自己的思路来设计开发,最常用的朗读功能就是朗读全文,朗读选择内容,朗读剪切板内容,从光标处朗朗读。

比较强的朗读功能就是多角色多语种自动识别朗读、中英自动混读、一键制作中高考听力试卷声音等。

附加功能有电子字典查询、单词统计生成、复读、声音转成MP3并生成歌词、直接朗读网页内容等。。。