一、基于数据挖掘算法的汉语合成韵律参数预测方法(论文文献综述)
王向东[1](2017)在《面向语音合成的傣语韵律预测模型研究》文中研究表明作为机器智能的重要组成部分,语音合成技术有广泛的应用需求,而合成语音的自然度是影响推广应用的关键因素。本文以提高傣语语音合成自然度为目的,分别采用决策树、支持向量机等机器学习模型,探索提高韵律预测效果的途径和方法。论文的主要工作包括:1.论文先介绍了语音合成技术的背景,并说明了研究傣语语音合成的意义,然后简要地介绍了语音合成的各个模块,即文本分析模块、韵律处理模块和语音合成模块。在论文的第二章中,结合傣语的特点,分析它的韵律结构,将其分为韵律词、次韵律短语和主韵律短语三个层级,并对其中的主韵律短语(L3)进行预测。通过研究和对比两大类韵律结构预测方法,论文决定采用性能更好的基于统计模型的机器学习方法。2.针对傣语韵律的特点,论文分别采用决策树和支持向量机(SVM)模型来对傣语L3进行预测。详细地描述了决策树模型中C4.5和CART两种算法,并介绍了基于决策树的韵律结构预测方法。同时论文也详细地描述了 SVM算法,并介绍了该算法进行韵律结构预测的流程。3.论文为了增强用户的体验设计出一个韵律预测的平台,在该实验平台上分别测试出几个不同模型的预测效果,通过不同的算法模型我们可以得到一个直接的数据结果。结果显示,论文所使用的决策树和SVM模型能够有效地对傣语L3进行预测标注,可以满足提升傣语语音合成系统自然度的基本要求。4.论文对实验结果进行总结,指出在属性集和算法上仍待优化的几个部分,并对语音合成的韵律预测模块提出了一些建议和展望。
才让卓玛[2](2016)在《基于混合基元的藏语语音合成技术研究》文中认为语音合成是人机交互的核心技术之一,也是中文信息处理中的一个难题。语音合成的目标是将文字信息自动转换为清晰、流畅的语音,它的研究对自动控制、智能机器人和人机语音通讯系统等的研制具有重要的理论意义和实用价值。随着计算机技术和通信技术的发展,基于语料库的语音合成技术越来越引起社会的关注。藏文信息处理作为中文信息处理的重要组成部分,经过二十多年的发展,在分词、标注及词频统计等方面得到了长足进展,但藏语语音合成技术研究才刚刚起步。目前对藏语语音合成有价值的许多属性未能被挖掘和描述,对藏语本体的研究也不够深入。例如,现有系统还不能对藏语的韵律特征进行定性与定量分析,也不能通过文本分析为系统提供必要的控制信息等。本文立足于藏语言文字本体,从语言学和语音学角度研究藏文的文本特征和藏语韵律特征,并基于语料库语音合成技术,设计实现了一个实用的基于混合基元的藏语语音合成系统。文章的主要工作包括以下几个方面:(1)从藏语文本入手,研究了非藏文字符和句子边界识别等语音合成的预处理问题,并根据藏语语音合成的实际需要,提出了基于词性约束的藏文分词算法。相对于传统分词算法,该算法通过词性搭配规则避免了大多数交集型和包孕型歧义的产生,改进紧缩词和未登录词的识别策略,使分词的效率得到了明显改善。另外,为了解决未登录词的语音合成问题,给出了藏文字构件分解算法,并通过开发藏文字构件分析系统验证了算法的性能。同时,将该系统从大规模语料中统计的构件分布信息用于指导基元的选取与语料库的构建。该内容见第二章。(2)从声学及语法特征入手,统计分析安多藏语的韵律层级结构、重音模式及语调现象,研究了藏语的韵律控制规则。首先,提出了藏语的韵律层级结构预测算法,该算法综合运用虚词频度与韵律短语长度信息动态地标记韵律单元边界,避免了韵律层级结构划分过分依赖于分词结果的现象,保证了韵律层级结构的完整性。其次,计算出各级重音的相对系数。合成时先分配韵律词、韵律短语和语调短语的语法重音,然后根据各级韵律单元重音的相对系数计算目标语句的强调重音。最后,给出陈述句、疑问句、祈使句和感叹句的语调特征及语调规则。实验数据证明,本文的韵律规则对语音的韵律表达起到了重要作用,语音的自然度得到较大的改善。该内容见第三章。(3)基元选择是建立结构合理、规模适中的语料库的基础,也是基于语料库语音合成的关键。为了提高系统的韵律表现并兼顾基元的搜索空间,提出混合基元库构建策略,并给出相应的基元选择算法。主、客观实验数据表明,混合基元库策略与算法有效地保留了大基元的完整性与小基元的灵活性及鲁棒性。为了避免语音合成时对基元做过多的算法调整,文章基于混合基元库采用多样本波形拼接策略,即一个(文本)基元在语音库对应多个候选样本。同时研究了多样本语音库的组织策略与搜索算法。实验证明,与传统算法相比,该算法提高了合成速度,增强了系统的实时性。该内容见第四章。(4)以安多藏语语音合成系统为代表介绍了藏语语音合成系统的设计思想、目标、功能特色及性能评测结果。该系统在文本分析、韵律控制方面都比较有特色,为我们继续研究语音合成技术提供了实验平台。该内容见第五章。
胡洋[3](2014)在《汉语韵律结构预测模型的研究与实现》文中认为语音合成是一种能够将文字转换成语音的技术。当前,语音合成技术已成为人机交互的重要手段之一,并且在很多领域里得到日益广泛的应用。一般来说,把文字变成语音要大致经过这样几个步骤:文本分析—>韵律控制—>语音生成。文本分析主要是对输入的文本进行分析,提取出后面所需要的信息。人说话都有一定的语调、语气、停顿及发音长短,这些被称为语音韵律。语音生成主要是根据前两阶段分析得到的各项参数进行波形拼接。要使得合成语音能充分表达出文本语言所含的情感,使之更贴近人的语音,就必须对文本语言做韵律分析,它是影响语音合成自然度的重要因素,所以韵律结构预测是语音合成技术中非常重要的一环。韵律结构预测已由最初的基于人工规则的方法发展到利用统计模型的方法。目前,它已成为信息科学领域中的一个活跃的研究分支。本文在对几种主要的韵律结构预测算法进行分析和比对的基础上,着重研究了基于最大熵原理的韵律结构预测方法,并且从人工规则和统计模型的结合以及统计模型训练这两个方面做了一些的探讨。文中阐述了最大熵的原理、参数估计、特征模板的制定和特征选择等相关内容,设计了基于最大熵原理的韵律结构预测模型。尝试了通过将人工语法分析引入统计模型中的办法来提高韵律结构预测模型的性能。为了改进在小规模样本集下的训练效果,在韵律结构预测模型训练中导入了半监督学习算法,使所设计的韵律结构预测模型具有了一定的自主学习能力。最后,通过实验对比,验证了这种改进的可行性。
朱玲[4](2013)在《基于句法特征的汉语韵律边界预测的研究》文中指出随着科学与技术的发展,高自然度的语音合成成了人工智能、语音信号处理以及人机交互领域一个重要的研究课题。现阶段的语音合成技术研究重点是实现汉语文语转换系统(CTTS),将输入的文本按语音处理规则自动地转换为声学信号输出。为了更准确预测出输入文本的韵律边界信息,提高输出语音的自然度,本文建立了文本语料库,统计分析了语法特征、句法特征和韵律结构的关系,对比分析了词性、词长和邻接度等各个参数对韵律边界预测的影响,最终利用TBL算法来实现对汉语韵律边界的预测。论文的研究结果对于揭示文本与语音之间的关系、提高合成语音的自然度具有重要的理论意义和应用价值。论文的主要研究成果和创新如下:1.设计并建立了一个含句法信息的大规模的汉语文本语料库。本文利用面向web基于XML的中文信息处理平台——语言技术平台LTP,对句子进行句法结构拆分;语料信息标注结果均通过了专家的抽样检查,达到了科研要求,可用于韵律边界的预测。该语料库包含约10000句标准语法的汉语文本语料,平均句长为52字。2.统计分析了语法特征、句法特征和韵律结构的关系,提出了一个用于汉语韵律边界预测的新特征——邻接度。对文本信息的统计分析表明:文本语料中语法词在该句子中的句法层级和韵律结构有很大的相关性。本文提出用邻接度(Adjacent Degree,AD)这一概念来描述文本语料中语法词在该句子中的句法层级,并将它作为新的韵律结构的预测参数,反映句法结构和韵律结构的关系。因此,标注汉语语料时追加了邻接度这一反映句法特征的信息。3.提出将词性、词长和邻接度等特征作为韵律预测的参数,并对比分析了词性、词长和邻接度等特征对韵律边界预测的影响。本文对汉语语料库的文本信息进行了统计分析,根据分析结果选用了词性、词长和邻接度等特征作为韵律边界预测的重要参数。4.提出了一种能有效预测韵律边界的统计学习算法——TBL算法。TBL算法是一种基于转换的错误驱动学习算法,它能在人工规则模板不适用时自动地从实例中学习新规则,并将新规则添加到已有的规则模板中。实验结果表明,该方法在测试集上韵律词的预测精度达到了98.4%,韵律短语的预测精度达到了82.7%,均优于现有的同类研究结果。
贾志浩[5](2012)在《汉语语音合成系统的改进与实现》文中提出语音作为人机交互手段这一趋势已经初见倪端,语音作为人机交互手段包含两个方面:语音合成和语音识别。通常语音合成指的是文本转语音,即把文字按语音处理规则转换为声音并输出。一般来说语音合成系统包含三个模块:文本处理模块、韵律处理模块、声音合成模块。文本处理模块处于语音合成系统的前端,其内容有文本分词、非标准词正则化、字音转换。韵律处理模块的主要工作是从文本中提取韵律结构、重音和语调等与韵律有关的信息。声音合成模块是语音合成系统的后端模块,主要工作是合成声音并对其进行修改与输出。为了提高汉语语音合成系统合成语音的可懂度以及自然度,本文重点研究了文本处理模块和韵律处理模块,所做具体工作如下:(1)分析了语音合成系统的整体框架,理解了系统各个模块的主要作用以及工作原理。鉴于PSOLA在语音合成模块中的重要作用,重点研究了PSOLA的分类以及实现过程,并将它应用到语音合成原型系统中。(2)针对文本处理模块做了研究,并对多音字处理方法做了改进与实现。本文一共实现了两种多音字处理方法:一种是静态的依词判音法,一种是动态的词性规则判音法。依词判音法是基于词库匹配的判音法,词性规则判音法是基于C4.5的决策树判音法。(3)针对韵律处理模块做了研究,并对韵律结构预测方法做了改进。改进后的韵律结构预测方法用HTK对一定规模标注好的韵律词或韵律短语的词性词长序列进行训练,得到对应的隐马尔科夫模型。然后用训练好的隐马尔科夫模型进行韵律结构预测。在模型训练过程中采用Good Turing法对模型进行参数平滑。(4)搭建语音合成原型系统,并对原型系统进行评测。评测数据表明本文工作的确能够帮助提高汉语语音合成系统合成语音的可懂度与自然度。
达哇彭措[6](2010)在《基于优化Apriori算法的藏语音韵律规则研究》文中进行了进一步梳理韵律规则对于语音识别和语音合成具有重要意义,韵律特征参数的描述正确与否直接影响合成系统的输出。为了提高藏语语音合成中语音的自然度,本文研究了基于数据挖掘中的关联规则来发现韵律参数之间的相互关系,给出了Apriori算法采用敏捷设计原则设计算法的UML类图和Java实现过程,并基于该算法获得藏语韵律参数中基频参数的变化规则,这些规则可以为藏语语音合成系统的选音提供帮助。
王亮[7](2010)在《汉语文语转换系统中韵律调节算法的研究与实现》文中研究指明文语转换技术是一种应用广泛的语音技术。目前,以波形合成为基础的文语转换技术已经可以合成清晰度、可懂度较好的语音,然而在合成语音的自然度方面仍需进一步提高。韵律调节是改善合成语音自然度最有效的手段之一。本文的主要工作是围绕汉语文语转换系统的韵律调节技术进行的。本文对相关的算法进行研究,并开发一种汉语普通话文语转换系统。本文首先对韵律理论和汉语的语音特点进行了分析,并对文语转换系统现有的技术路线进行了讨论,并在此基础上提出了一种基于韵律规则的波形合成法。接下来,本文对PSOLA、Fujisaki基频曲线预测算法、音节与停顿时长预测算法等韵律调节的关键算法进行了深入的研究,并在对Fujisaki模型进行部分修改的基础上,提出了一种充分考虑语音库中语音基频特性的语调曲线预测算法,这种方法能够比较准确的模拟句子的语调曲线趋势,同时对合成基元频率特性的修改较小。然后,本文从系统构成的角度介绍了系统中各个模块的功能和设计方案;同时,本文介绍了构建语音库的方法,为了提高合成语音的自然度,本文同时构建了音节语音库和汉语中高频词语音库。最后,本文从程序实现的角度介绍了代码中主要函数的功能和输入输出,并对程序设计时需要考虑的关键问题进行了分析。另外,本文还运用平均意见分的方法对开发的汉语文语转换系统的性能进行了评估,测试结果表明系统合成的语音具有比较好的自然度。
包森成[8](2009)在《基于统计模型的韵律结构预测研究》文中研究指明随着计算机技术的进步和其他相关学科的发展,在过去的几十年间,语音合成技术有了迅猛的发展,涌现出了大量的新理论和新技术。在现阶段,语音合成技术主要是以文语转换系统(Text To Speech,TTS)为研究重点,这是一种将输入的文本转换为语音输出的技术。TTS系统一般由文本分析、韵律处理、语音合成三个模块组成。这三个模块并不是相互孤立的,每一个模块的性能都对最终输出语音的质量有很大的影响。对合成系统输出语音音质的评价是多方面的,但主要集中在输出语音的可懂度和自然度两个方面。当前,TTS系统的输出语音在可懂度方面已经达到了比较高的水平,而在语音的整体自然度方面还有待提高,其根本问题就是不能对自然语流中的韵律进行有效的模拟。韵律处理的研究主要有以下几个方面:韵律预测,韵律规则,韵律描述和韵律建模。本文主要研究了韵律结构预测模板,希望通过对此模块的研究与改进来提高合成语音的自然度。韵律预测与文本分析之间有着紧密的联系,这是因为TTS系统的输入是无限制的文本,从文本中只确定读音是远远不够的。为了提高语音的自然度,还需要从文本中提取更多的与韵律相关的信息,其中包括文本的韵律结构、重音和语调等信息。研究表明,在TTS系统中引入韵律层级结构可以显着提高合成语音的质量,特别是合成语音的自然度。如何提高韵律结构预测的正确率是本文研究的重点。本文从汉语的声学特点和韵律特征出发,分析和研究了汉语的韵律特征、停顿、重音以及韵律边界之间的关系,分析并对比了汉语韵律层级结构,同时分析了韵律边界的声学特征。对传统的韵律结构预测的方法进行了综述和比较,指出传统韵律结构预测方法的优缺点,然后重点研究了基于统计机器学习的韵律结构预测,特别是条件随机场(CRFs)和最大熵(ME)模型在韵律结构预测中的应用。在基于条件随机场的韵律结构预测系统的研究中,理论上,本文详细阐述了条件随机场的定义,条件分布以及参数估计。在应用上,本文重点研究了条件随机场的特征模板,并讨论了窗长的选取,复合特征的作用等问题。在基于最大熵模型的韵律结构预测系统的研究中,在理论上,本文详细阐述了最大熵模型模型的定义,条件分布以及参数估计。在应用上,本文重点研究了最大熵模型的特征模板,并讨论了窗长选取和动态特征的作用等问题。此外,本文提出了基于最大熵模型的多遍韵律结构预测系统,并和基于CRFs的预测系统进行了性能上比较和分析。在韵律短语预测上,前者的性能好于后者。
吕斌[9](2009)在《嵌入式语音合成及其关键算法的研究与实现》文中认为随着科学与技术的发展,语音合成已经广泛应用于社会的各个方面,并且成为人工智能、语音信号处理以及人机多媒体交互研究领域的热点之一。嵌入式语音合成系统是语音合成技术应用的一个重要分支。基于嵌入式的两大特点,即资源有限性和平台多样性,以及语言的语法结构、语法规则、声学特性和韵律特征,解决嵌入式语音合成的关键技术成为该领域的重要研究课题。本文从汉语的声学特点和韵律特征出发,诸如汉语的声调及特点、汉语的语调及模式,分析和研究汉语的韵律特征(基频、时长、幅度)、重音、停顿以及韵律边界之间的相互关系,研究了适用于汉语语音合成的韵律控制规则。在韵律特征与韵律边界的声学分析的基础上,提出了韵律分层建模、韵律边界预测和韵律分层控制的思想。确定了以音节作为拼接的语音基元,并基于数据驱动的统计模型和规则相结合的方法,实现了韵律建模及其韵律控制。同时,采用PSOLA算法,针对嵌入式系统的实现条件,分析了合成语音音质的影响,优化了语调曲线的合成及其控制方法,使合成算法更适用于ARM系统。对研究成果进行了汉语文语转换实验。结果表明,本文的语音合成与韵律控制算法是行之有效的,达到了课题研究要求。
陈龙[10](2008)在《基于语法信息的汉语韵律结构预测》文中研究说明高自然度的语音合成是人机交互领域的一个重要研究课题。为提高合成语音的自然度,需要知道准确的合成文本的韵律结构。为此,论文分析了汉语文本的语法结构与韵律结构之间的关系,重点研究了韵律词和韵律短语的预测。论文的研究结果对于揭示文本与语音之间的关系、提高合成语音的自然度具有重要的理论意义和应用价值。论文的主要研究成果和创新点如下:1.建立了一个大规模的文本语料库。该语料库包含20000句文本语料,标注了语法信息和韵律信息。韵律信息在语言学专家的指导下手工标注。完成的语料库经过了语言学专家的抽查,并与语言学专家标注结果进行了对比。结果表明,手工标注的韵律词和韵律短语的综合参数得分分别达到了98%和85%,可用于韵律结构预测的研究中。2.提出了一种以相邻语法词词长和词性为特征,利用TBL算法进行韵律词预测的方法。通过对手工标注过的语料库进行统计分析,发现相邻语法词长和相邻语法词词性是从语法词映射到韵律词的主要特征。基于这一特征,利用TBL转换学习算法进行了韵律词的预测。结果表明,该方法在测试集上分别得到了97.5%的精确率、召回率以及综合参数,优于现有的研究结果。3.提出了一种新的用于韵律结构预测的语法结构描述特征——邻接度(Adjacent Degree, AD),利用邻接度描述了语法结构和韵律结构之间的关系。基于邻接度这一新特征,利用TBL算法进行了韵律短语的预测。测试集上的结果表明,该方法在韵律短语的预测上,精确率达到了75.2%,召回率达到了77.1%,综合参数达到了76.1%。4.提出了一种基于邻接度的韵律结构描述方法,该方法结合了基于邻接度的语法结构描述方法和原有的三层韵律结构的描述方法,并从韵律停顿边界长度与邻接度的关系、韵律停顿边界位置与语速的相关性、韵律停顿与重音的关系三个方面对原有的韵律结构描述方法进行了扩充。
二、基于数据挖掘算法的汉语合成韵律参数预测方法(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、基于数据挖掘算法的汉语合成韵律参数预测方法(论文提纲范文)
(1)面向语音合成的傣语韵律预测模型研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 引言 |
1.2 傣语语音合成现状 |
1.3 语音合成概述 |
1.3.1 文本分析模块 |
1.3.2 韵律处理模块 |
1.3.3 语音合成模块 |
1.4 研究思路以及主要工作 |
1.5 论文的组织结构 |
第二章 傣语韵律分析 |
2.1 傣语的特点 |
2.2 韵律层次的概念 |
2.2.1 韵律词 |
2.2.2 次韵律短语 |
2.2.3 语调短语 |
2.2.4 韵律结构预测 |
2.3 韵律结构预测方法 |
2.3.1 基于规则和知识的预测方法 |
2.3.2 基于统计模型的机器学习预测方法 |
2.3.3 其他韵律结构预测的方法 |
2.4 本章小结 |
第三章 基于决策树的韵律结构预测方法 |
3.1 数据挖掘概述 |
3.2 基于C4.5的韵律结构预测方法 |
3.2.1 ID3模型 |
3.2.2 C4.5模型 |
3.2.3 ID3算法与C4.5算法的比较 |
3.3 基于CART的韵律结构预测方法 |
3.3.1 CART模型 |
3.3.2 ID3、C4.5算法与CART算法的比较 |
3.4 韵律结构预测方法 |
3.5 本章小结 |
第四章 基于SVM的韵律结构预测方法 |
4.1 机器学习 |
4.2 统计学习 |
4.3 SVM模型 |
4.4 韵律结构预测方法 |
4.5 本章小结 |
第五章 傣语韵律结构预测的实现 |
5.1 傣语语料库数据准备 |
5.2 实验系统 |
5.2.1 系统功能介绍 |
5.2.2 系统展示 |
5.3 实验方案与评价方法 |
5.3.1 采用C4.5的韵律结构预测 |
5.3.2 采用CART的韵律结构预测 |
5.3.3 采用SVM的韵律结构预测 |
5.3.4 实验评价方法 |
5.4 实验结果与分析 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
(2)基于混合基元的藏语语音合成技术研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 语音合成概述 |
1.1.1 语音合成 |
1.1.2 语音合成研究历史 |
1.2 语音合成技术 |
1.2.1 源-滤波器合成技术 |
1.2.2 波形编码/编辑合成技术 |
1.2.3 统计参数语音合成 |
1.2.4 基于语料库的语音合成技术 |
1.2.5 语音合成技术比较 |
1.3 藏语语音合成的背景与现状 |
1.3.1 藏语言文字概述 |
1.3.2 藏语语音合成现状分析 |
1.3.3 本文组织结构 |
第二章 藏语文本分析 |
2.1 非藏文字符处理 |
2.2 句子边界识别 |
2.3 藏文分词 |
2.3.1 藏文分词方法概述 |
2.3.2 藏文分词难点 |
2.3.3 分词策略 |
2.3.4 分词算法 |
2.3.5 实验及数据分析 |
2.4 藏文字构件分解 |
2.4.1 构件分解模型 |
2.4.2 构件分解形式化描述 |
2.4.3 构件分解算法 |
2.4.4 实验及数据分析 |
2.5 本章小结 |
第三章 安多藏语韵律特征分析 |
3.1 韵律概述 |
3.2 安多藏语韵律层级结构分析 |
3.2.1 韵律层级结构预测现状 |
3.2.2 韵律层级结构边界声学特征 |
3.2.3 韵律层级结构语法特征 |
3.2.4 韵律层级结构预测 |
3.3 安多藏语重音分析 |
3.3.1 重音概述 |
3.3.2 重音的声学特征 |
3.3.3 重音的语法特征 |
3.3.4 重音规则描述 |
3.4 安多藏语语调分析 |
3.4.1 语调概述 |
3.4.2 安多藏语语调声学特征 |
3.4.3 安多藏语语调语法特征 |
3.4.4 安多藏语语调规则描述 |
3.5 实验及数据分析 |
3.6 本章小结 |
第四章 混合基元库构建 |
4.1 藏文混合基元库构建 |
4.1.1 混合基元选择策略 |
4.1.2 混合基元选择算法 |
4.1.3 实验及数据分析 |
4.2 藏语语音库 |
4.2.1 语音数据来源 |
4.2.2 语音库构建 |
4.2.3 语音库组织 |
4.3 样本搜索算法 |
4.3.1 样本搜索算法 |
4.3.2 实验及数据分析 |
4.4 本章小结 |
第五章 安多藏语语音合成系统的设计 |
5.1 系统设计 |
5.1.1 系统设计思想 |
5.1.2 系统结构 |
5.1.3 知识库组织 |
5.2 系统功能与特色 |
5.2.1 系统功能模块 |
5.2.2 AT-3S系统特色 |
5.3 系统性能评测 |
5.4 本章小结 |
第六章 总结与展望 |
参考文献 |
致谢 |
攻读博士学位期间的科研成果 |
(3)汉语韵律结构预测模型的研究与实现(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究的背景和意义 |
1.2 语音合成技术 |
1.2.1 文本分析 |
1.2.2 韵律控制 |
1.2.3 语音生成 |
1.3 韵律结构的相关概念 |
1.3.1 语法词 |
1.3.2 韵律词 |
1.3.3 韵律短语 |
1.3.4 语调短语 |
1.4 论文的主要内容和主要特色 |
1.4.1 论文的主要内容 |
1.4.2 论文的主要特色 |
1.4.3 论文的章节安排 |
1.5 本章小结 |
第2章 韵律结构预测综述 |
2.1 基于手工规则的预测方法 |
2.1.1 规则预测方法简介 |
2.1.2 规则预测方法的缺陷 |
2.2 基于统计模型的预测方法 |
2.2.1 基于二叉树模型的方法 |
2.2.2 基于决策树模型的方法 |
2.2.3 基于相似句模型的方法 |
2.2.4 基于隐马尔科夫模型的方法 |
2.2.5 基于最大熵模型的方法 |
2.3 各种方法的比较 |
2.4 本章小结 |
第3章 基于最大熵原理的韵律结构预测模型 |
3.1 最大熵的基本概述 |
3.1.1 熵的相关理论基础 |
3.1.2 统计量、特征和约束 |
3.1.3 最大熵原则 |
3.1.4 模型重建 |
3.1.5 最大熵与对数似然估计的关系 |
3.2 参数求解 |
3.2.1 GIS 算法 |
3.2.2 IIS 算法 |
3.2.3 本文所采用的算法 |
3.3 特征提取 |
3.3.1 特征模板的选择 |
3.3.2 根据特征模板提取特征 |
3.4 特征的选择 |
3.4.1 频数阈值特征选择 |
3.4.2 对 CCFS 算法的改进 |
3.4.3 特征增量选择 |
3.4.4 本文所采用的算法 |
3.5 手工规则法和最大熵原理的韵律结构预测模型的结合 |
3.5.1 韵律词预测的规则 |
3.5.2 韵律短语预测的规则 |
3.6 本章小结 |
第4章 基于半监督学习的韵律结构预测模型 |
4.1 半监督学习算法概述 |
4.1.1 自训练算法 |
4.1.2 互训练算法 |
4.2 半监督学习的最大熵原理的韵律结构预测模型 |
4.3 本章小结 |
第5章 韵律结构预测系统的设计及实验 |
5.1 语料准备 |
5.2 评测标准 |
5.3 系统模块组成 |
5.3.1 预处理模块 |
5.3.2 模型训练模块 |
5.3.3 韵律结构预测模块 |
5.4 基于最大熵原理的韵律结构预测模型的实验 |
5.4.1 特征模板窗长的选择 |
5.4.2 动态特征对韵律结构预测的影响 |
5.4.3 词面信息对韵律结构预测的影响 |
5.4.4 手工规则后处理对韵律结构预测的影响 |
5.5 半监督学习的韵律结构预测模型的实验 |
5.5.1 自训练和互训练的对比实验 |
5.5.2 不同规模的未标注样本集对韵律结构预测的影响 |
5.6 本章小结 |
第6章 结论与展望 |
致谢 |
参考文献 |
附录 |
附录 A 韵律结构预测的部分源码 |
附录 B 本文所用的部分训练语料 |
(4)基于句法特征的汉语韵律边界预测的研究(论文提纲范文)
摘要 |
Abstract |
目录 |
第1章 引言 |
1.1 研究背景及意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 韵律边界预测的研究现状 |
1.2.1 韵律预测的研究现状 |
1.2.2 汉语韵律边界的研究现状 |
1.3 本文工作介绍 |
1.4 论文内容安排 |
第2章 研究基础 |
2.1 文-语转换语音合成系统 |
2.1.1 文本分析 |
2.1.2 韵律生成 |
2.1.3 语音生成 |
2.2 汉语韵律结构的研究 |
2.2.1 汉语的韵律特征 |
2.2.2 汉语的韵律结构 |
2.3 汉语韵律结构与语法结构 |
2.3.1 汉语的语法特征的研究成果 |
2.3.1.1 韵律结构与词性的关系 |
2.3.1.2 韵律结构和词长的关系 |
2.3.2 韵律结构与语法结构的相互关系 |
2.3.3 韵律结构和语法结构相互关系的研究现状 |
2.4 汉语韵律结构与句法结构研究 |
2.4.1 韵律的句法特征的研究成果 |
2.4.2 韵律结构与句法结构相互关系 |
2.4.3 韵律结构与句法结构相互关系的研究现状 |
2.5 句法分析 |
2.5.1 汉语自动分词及词性标注 |
2.5.1.1 自动分词方法 |
2.5.1.2 自动分词的算法 |
2.5.1.3 词性标注 |
2.5.2 基于规则表示的句法分析 |
2.5.3 基于统计方法的句法分析 |
2.6 讨论与小结 |
第3章 汉语语料库的构建 |
3.1 文本语料的准备 |
3.2 制定语料标注的规范 |
3.3 按规范标注语料 |
3.3.1 标注流程 |
3.3.2 标注工具 |
3.3.3 标注经验 |
3.4 标注评价函数及评测结果 |
3.5 讨论与小结 |
第4章 基于语法特征和句法特征的汉语韵律边界预测 |
4.1 语法特征与韵律结构的相互关系 |
4.1.1 语法特征和韵律词的相互关系 |
4.1.2 语法特征和韵律短语的相互关系 |
4.1.3 统计分析结果 |
4.1.3.1 语法词词性特征和韵律特征的统计结果 |
4.1.3.2 语法词词长特征和韵律特征的关系 |
4.2 句法特征与韵律结构的相互关系 |
4.2.1 邻接度和韵律结构的相互关系 |
4.2.2 统计分析结果 |
4.3 韵律词和韵律短语的预测 |
4.3.1 算法介绍 |
4.3.2 实验介绍 |
4.3.3 实验特征选择 |
4.3.4 实验结果分析 |
4.4 讨论与小结 |
第5章 总结与展望 |
5.1 工作总结 |
5.2 工作展望 |
参考文献 |
攻读硕士期间发表的学术论文与主要成果 |
致谢 |
(5)汉语语音合成系统的改进与实现(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 语音合成的发展历史和研究现状 |
1.2 语音合成系统面临的问题以及发展方向 |
1.3 本文的研究内容 |
1.4 论文的结构安排 |
2 语音合成系统的整体框架 |
2.1 文本处理模块 |
2.2 韵律处理模块 |
2.3 声音合成模块 |
2.3.1 声音合成模块中用到的算法 |
2.3.2 PSOLA算法 |
2.4 本章小结 |
3 文本处理模块的实现 |
3.1 文本分词 |
3.1.1 汉语分词的困难 |
3.1.2 基于字符串匹配的分词方法 |
3.2 非标准词正则化 |
3.2.1 歧义非标准词的消歧 |
3.2.2 标准词的生成 |
3.3 字音转换中的多音字问题 |
3.3.1 字音转换模块简介 |
3.3.2 多音字给汉语语音合成带来的困难 |
3.4 基于BOYER-MOORE匹配的依词判音法 |
3.4.1 依词判音的原理 |
3.4.2 Boyer-Moore算法 |
3.4.3 依词判音实验 |
3.5 基于C4.5的词性规则判音法 |
3.5.1 词性规则判音法原理 |
3.5.2 C4.5算法 |
3.5.3 特征的选取 |
3.5.4 词性规则判音法实验 |
3.6 本章小结 |
4 汉语韵律结构预测的实现 |
4.1 汉语韵律特征与韵律结构 |
4.1.1 韵律词 |
4.1.2 韵律短语 |
4.1.3 语调短语 |
4.2 中文韵律结构预测方法 |
4.2.1 中文韵律结构预测 |
4.2.2 中文韵律结构预测方法 |
4.3 基于隐马尔科夫模型的韵律层级结构预测 |
4.3.1 隐马尔科夫模型 |
4.3.2 特征的选取 |
4.3.3 模型的选用 |
4.3.4 实验 |
4.4 本章小结 |
5 基于本文工作的语音合成原型系统 |
5.1 构建系统 |
5.2 系统测试 |
5.2.1 测试语料 |
5.2.2 评测标注 |
5.2.3 评测步骤 |
5.2.4 评测结果 |
5.2.5 结果分析 |
5.3 本章小结 |
6 总结与展望 |
6.1 工作总结 |
6.2 工作展望 |
致谢 |
参考文献 |
(6)基于优化Apriori算法的藏语音韵律规则研究(论文提纲范文)
引言 |
1 韵律参数选取 |
2 数据挖掘模型及算法选取 |
3 优化的Apriori算法的Java实现: |
3.1 敏捷设计的原则 |
3.2 根据敏捷设计原则1) :设计了一个抽象类Associator类 |
3.3 根据敏捷设计原则2) 、3) :设计了Apriori类。 |
3.4 根据敏捷设计原则1) 、4) :设计了AprioriInterface接口和ItemSet类 |
4 实验研究 |
4.1 实验数据获取及处理 |
4.2 实验结果 |
5 结束语 |
(7)汉语文语转换系统中韵律调节算法的研究与实现(论文提纲范文)
摘要 |
ABSTRACT |
缩略语表 |
目录 |
第一章 绪论 |
1.1 语音合成与文语转换概述 |
1.2 文语转换研究发展历史 |
1.3 多语种文语转换研究现状 |
1.4 汉语文语转换现有的韵律控制方法 |
1.5 汉语文语转换韵律调节方法的研究意义 |
1.6 本文的研究背景 |
1.7 本文内容安排 |
第二章 相关韵律理论与文语转换系统的基本技术路线 |
2.1 概述 |
2.2 本文涉及到的韵律理论 |
2.2.1 语音特征的分类 |
2.2.2 声学物理量与听觉心理量 |
2.3 汉语普通话语音特点分析 |
2.3.1 汉语普通话的基本特点 |
2.3.2 汉语音节的结构与声调 |
2.3.3 汉语普通话中的协同发音现象 |
2.4 文语转换系统的基本技术路线 |
2.4.1 参数合成法 |
2.4.2 波形合成法 |
2.4.3 规则合成法 |
2.4.4 合成方法的比较与技术方案的选取 |
2.5 小结 |
第三章 汉语韵律调节若干关键算法的分析与讨论 |
3.1 概述 |
3.2 语音超音段参数调节算法 |
3.2.1 语音超音段参数调节算法概述 |
3.2.2 TD-PSOLA 算法介绍 |
3.2.3 TD-PSOLA 算法仿真与结果分析 |
3.3 Fujisaki 韵律模型与语调预测算法 |
3.3.1 韵律预测模型概述 |
3.3.2 Fujisaki 模型 |
3.3.3 修改的Fujisaki 模型 |
3.3.4 实验设计与实验结果 |
3.4 音节与停顿时长预测算法 |
3.4.1 准确预测音节与停顿时长的重要意义 |
3.4.2 一种基于规则的音节时长预测算法 |
3.4.3 汉语中停顿的规则 |
3.5 小结 |
第四章 汉语文语转换系统的总体设计 |
4.1 汉语文语转换系统的设计思路 |
4.2 语音库的构建 |
4.3 文本正则化模块 |
4.4 分词模块 |
4.5 韵律预测模块 |
4.6 语音超音段参数调整模块 |
4.7 拼接模块 |
4.8 小结 |
第五章 汉语文语转换系统的程序设计与结果评估 |
5.1 概述 |
5.2 汉语文语转换系统的程序设计 |
5.2.1 分词函数 |
5.2.2 韵律预测函数 |
5.2.3 TD-PSOLA 算法函数 |
5.2.4 wav 文件的拼接函数 |
5.2.5 wav 文件的播放函数 |
5.2.6 其它基本函数 |
5.3 TD-PSOLA 模块的重点分析 |
5.3.1 TD-PSOLA 算法函数的用法 |
5.3.2 TD-PSOLA 算法函数用于情感参数的调节 |
5.4 汉语文语转换系统的性能评估 |
5.5 小结 |
第六章 总结与展望 |
6.1 全文总结 |
6.2 展望 |
参考文献 |
致谢 |
攻读硕士学位期间已发表或录用的论文 |
(8)基于统计模型的韵律结构预测研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 引言 |
1.2 语音合成技术 |
1.2.1 文本分析 |
1.2.2 韵律处理 |
1.2.3 语音合成 |
1.3 本文研究的内容和意义 |
1.3.1 本文研究的内容 |
1.3.2 本文研究的意义 |
1.4 论文的内容安排 |
第二章 汉语的韵律分析 |
2.1 汉语的韵律特征 |
2.2 汉语的韵律层次结构 |
2.2.1 韵律词 |
2.2.2 韵律短语 |
2.2.3 语调短语 |
2.2.4 停顿及其作用 |
2.2.5 韵律结构的预测 |
2.3 韵律层次结构边界的声学特性 |
2.4 重音、语调对韵律特征参数的影响 |
2.4.1 重音对音高、音长和音强的影响 |
2.4.2 语调对音高的影响 |
第三章 韵律结构预测方法综述 |
3.1 基于规则和知识的方法 |
3.2 基于统计学习的方法 |
3.3 其它韵律结构预测的方法 |
第四章 基于条件随机场的韵律结构预测 |
4.1 条件随机场模型 |
4.1.1 条件随机场的定义 |
4.1.2 条件分布 |
4.1.3 参数估计 |
4.1.4 优化的参数估计 |
4.1.5 较其他模型的优越性 |
4.2 特征模板 |
4.2.1 CRF特征模板 |
4.2.2 本文选用的特征模板 |
4.3 实验 |
4.3.1 训练及测试语料 |
4.3.2 实验设置 |
4.3.3 实验指标 |
4.3.4 实验结果及分析 |
第五章 基于最大熵的韵律结构预测 |
5.1 最大熵模型 |
5.1.1 相关定义 |
5.1.2 约束 |
5.1.3 最大熵原理 |
5.1.4 参数估计 |
5.2 特征模板 |
5.2.1 韵律词模型特征 |
5.2.2 韵律短语模型特征 |
5.2.3 本文所使用的特征模板 |
5.3 多遍预测系统 |
5.4 实验 |
5.4.1 训练及测试语料 |
5.4.2 实验设置 |
5.4.3 实验指标 |
5.4.4 实验结果及分析 |
5.5 方法比较 |
第六章 总结与展望 |
参考文献 |
致谢 |
攻读硕士学位期间发表的论文 |
(9)嵌入式语音合成及其关键算法的研究与实现(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 语音信号处理技术与语音合成 |
1.2 语音合成技术与汉语语音合成技术的发展现状 |
1.2.1 共振峰模式 |
1.2.2 LPC 合成 |
1.2.3 基音同步叠加方法(PSOLA) |
1.3 语音合成的发展方向 |
1.3.1 提高合成语音的自然度 |
1.3.2 丰富合成语音的表现力 |
1.3.3 降低语音合成技术的复杂度 |
1.3.4 多语语音合成技术 |
1.4 嵌入式语音合成技术 |
1.5 本文研究的内容 |
1.6 本文研究的意义 |
第二章 嵌入式语音合成系统方案 |
2.1 嵌入式技术发展现状及趋势 |
2.2 ARM 系统的语音合成实现方案 |
2.3 嵌入式系统设计的瓶颈 |
2.4 本章小结 |
第三章 汉语的韵律分析 |
3.1 汉语的韵律特征 |
3.1.1 汉语的韵律层级结构 |
3.1.2 韵律短语 |
3.1.3 语调短语 |
3.2 汉语韵律层级边界感知特征的声学体现 |
3.2.1 韵律层级边界的时长分析 |
3.2.2 韵律层级边界的音高分析 |
3.2.3 韵律层级边界的无声段 |
3.3 基于CART 模型的韵律短语预测 |
3.3.1 决策树算法 |
3.3.2 C4.5 决策树算法 |
3.3.3 C4.5 程序集 |
3.4 汉语语调的合成及控制方法的研究 |
3.4.1 伪谐波基音周期变换法 |
3.4.2 汉语的语调模型 |
3.5 本章小结 |
第四章 嵌入式变速率语音编码中的线性预测分析与量化 |
4.1 以往嵌入式语音编码器中的自适应码书结构及其更新方法 |
4.2 新算法中的自适应码书结构及其更新方法 |
4.3 码流的嵌入式结构及比特分配 |
4.4 算法延时 |
4.5 嵌入式变速率语音编码器中的线性预测分析与量化 |
4.6 本章小结 |
第五章 韵律控制参数调整范围的研究 |
5.1 PSOLA(Pitch Synchronous Overlap Add)算法 |
5.2 TD-PSOLA 时域基音同步叠加工作原理 |
5.2.1 基音同步分析 |
5.2.2 基音同步调整 |
5.2.3 基音同步叠加 |
5.3 韵律控制参数的调整 |
5.3.1 基频调整 |
5.3.2 时长调整 |
5.3.3 窗长的选择 |
5.4 TD-PSOLA 算法对合成语音音质的影响 |
5.5 关于PSOLA 算法调整受限的研究 |
5.6 结论 |
5.7 解决办法 |
5.8 本章小结 |
第六章 语音合成试验 |
6.1 主观听辩实验结果 |
6.2 计算机合成语音的实验结果 |
6.3 拼接损失函数与自然度的相关性 |
结论 |
致谢 |
参考文献 |
附录 |
(10)基于语法信息的汉语韵律结构预测(论文提纲范文)
摘要 |
Abstract |
第1章 引言 |
1.1 研究背景及意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 韵律结构预测的研究现状 |
1.2.1 韵律预测的研究现状 |
1.2.2 汉语韵律结构预测的研究现状 |
1.3 本文工作介绍 |
1.4 论文内容安排 |
第2章 研究基础 |
2.1 文-语转换语音合成系统 |
2.1.1 文本分析 |
2.1.2 韵律生成 |
2.1.3 语音生成 |
2.2 汉语韵律结构的研究 |
2.2.1 汉语的韵律研究 |
2.2.2 韵律结构与语法结构 |
2.3 句法分析 |
2.3.1 汉语自动分词及词性标注 |
2.3.2 基于规则的句法分析 |
2.3.3 基于统计方法的句法分析 |
2.4 讨论与小结 |
第3章 韵律语料库的建立 |
3.1 语料的准备 |
3.2 标准标注语料 |
3.2.1 标注流程 |
3.2.2 标注工具 |
3.2.3 经验总结 |
3.3 标注评价函数及评测结果 |
3.4 讨论与小结 |
第4章 基于词长和词性的汉语韵律词预测 |
4.1 语法词与韵律词的相互关系 |
4.1.1 语法词与韵律词关系的定性分析 |
4.1.2 统计分析结果 |
4.2 韵律词预测 |
4.2.1 算法介绍 |
4.2.2 实验 |
4.3 讨论与小结 |
第5章 基于语法结构的韵律短语预测 |
5.1 韵律层级结构和语法结构的分析 |
5.2 邻接度 |
5.3 基于邻接度的语法结构和韵律结构关系的统计分析 |
5.4 韵律短语预测 |
5.4.1 实验介绍 |
5.4.2 实验特征选择 |
5.4.3 实验结果分析 |
5.5 讨论与小结 |
第6章 基于邻接度的韵律结构描述方法 |
6.1 基于邻接度的韵律结构描述方法 |
6.2 韵律边界停顿的描述扩充 |
6.2.1 基于邻接度的边界停顿长度统计 |
6.2.2 边界停顿位置与语速的相关性 |
6.3 边界停顿与重音的关系 |
6.4 讨论与小结 |
第7章 总结及展望 |
7.1 工作总结 |
7.2 工作展望 |
附录 |
参考文献 |
攻读硕士期间发表的学术论文与主要成果 |
致谢 |
四、基于数据挖掘算法的汉语合成韵律参数预测方法(论文参考文献)
- [1]面向语音合成的傣语韵律预测模型研究[D]. 王向东. 云南大学, 2017(05)
- [2]基于混合基元的藏语语音合成技术研究[D]. 才让卓玛. 陕西师范大学, 2016(06)
- [3]汉语韵律结构预测模型的研究与实现[D]. 胡洋. 南昌大学, 2014(02)
- [4]基于句法特征的汉语韵律边界预测的研究[D]. 朱玲. 西北师范大学, 2013(06)
- [5]汉语语音合成系统的改进与实现[D]. 贾志浩. 南京理工大学, 2012(07)
- [6]基于优化Apriori算法的藏语音韵律规则研究[J]. 达哇彭措. 微计算机信息, 2010(18)
- [7]汉语文语转换系统中韵律调节算法的研究与实现[D]. 王亮. 上海交通大学, 2010(11)
- [8]基于统计模型的韵律结构预测研究[D]. 包森成. 北京邮电大学, 2009(03)
- [9]嵌入式语音合成及其关键算法的研究与实现[D]. 吕斌. 西安电子科技大学, 2009(01)
- [10]基于语法信息的汉语韵律结构预测[D]. 陈龙. 西北师范大学, 2008(S2)