语谱图
- 窄带语谱图和宽带语谱图
文章图片
图1是一条语音及其窄带语谱图。上图是语音时间波形,下图是上图的窄带语谱图
文章图片
图2同一条语音及其宽带语谱图。上图是语音时间波形,下图是上图的宽带语谱图
图1虚框框住的部分就是一条横条纹,整个谱图中有非常多的这种横条纹。图2虚框框住的部分,在小图中清晰的显示出了一条一条的“竖线”,被框住的有27条竖线。
- 从窄带语谱图和宽带语谱图看基音频率和共振峰
- 从语音时域波形上估计基音周期、频谱曲线上估计基音频率
文章图片
图3 0.5s处语音片段时域波形及其频谱
图3左图,用红圈圈示的尖峰用于估计基音周期,双向箭头表示时间范围内5个圈共4个相似的波段,这4段就表示4个基音周期,则可估计基音周期约为4.25ms,则基音频率约为235.2941Hz。图3右图,频谱具有明显小尖峰,这些尖峰在低频部分(可认为语音频率3400Hz内)比较有规律且平滑,高频出现小幅度的“杂乱”,这些“杂乱”表示噪声,来源有录音设备及量化噪声等(虽然幅度很小,甚至根本就“听”不出来,但存在是事实)。这些尖峰就是各次谐波,从左往右一次是1次、2次、3次……谐波。其中最左边的尖峰对应基音频率,其横坐标对应的值表示基音频率,从小图可看到大约为234.83Hz。利用各次谐波可以得到更精确的估计,图中用红圈表示用于估计基频的谐波,共选取了15个,估计出基频为234.8337Hz。
- 从语音频谱曲线上看共振峰
文章图片
图4语音片段时域波形及其源、声道和语音频谱。
文章图片
图5语音片段时域波形及其源、声道和语音频谱。去掉小图(小图遮挡了部分信息)
基音频率和共振峰是能从谱图、频谱上看出来的语音的最基本的信息,当然可以看出其他更多的信息。比如,窄带语谱图上基本上可以发现,低频部分,横条纹比较直,而高频部分,条纹变“弯”了,这表示什么?图1小图可明显看到,基音频率也不是不变的,其也具有波动,我们可以人为的将基频线连接起来为一条曲线,这称为基音跟踪。共振峰表示“谐振”,频谱上表示为频谱包络(其实是上包络)的峰值,那么频谱下包络的谷值点就表示“反谐振”。频谱的“尖峰”显示的是源的信息,小尖包突起是周期性的,是有用的,那么“杂乱”的源头是非周期性的,这在语音转换中是一种很重要的信息。
PS:1、源-系统信息分离和提取参考论文:
“Glottal wave analysis with pitchsynchronous iterative adaptive inverse filtering” Paavo Alku. SpeechCommunication 11(2-3): 109-118 (1992)
2、源-系统分离代码链接:http://users.tkk.fi/~traitio/research.html
【语谱图】找不到原始地址了,是从这里粘贴过来的https://blog.csdn.net/lzrtutu/article/details/78882715
推荐阅读
- 夜游宫|夜游宫 心语
- 跌跌撞撞奔向你|跌跌撞撞奔向你 第四章(你补英语,我补物理)
- 考研英语阅读终极解决方案——阅读理解如何巧拿高分
- 子龙老师语录
- 标签、语法规范、内联框架、超链接、CSS的编写位置、CSS语法、开发工具、块和内联、常用选择器、后代元素选择器、伪类、伪元素。
- 【生信技能树】R语言练习题|【生信技能树】R语言练习题 - 中级
- 小学英语必考的10个知识点归纳,复习必备!
- 六步搭建ES6语法环境
- 一起来学习C语言的字符串转换函数
- C语言字符函数中的isalnum()和iscntrl()你都知道吗