Monografias.com > Sin categoría
Descargar Imprimir Comentar Ver trabajos relacionados

Análisis de la voz – Parametrización (página 4)




Enviado por Pablo Turmero



Partes: 1, 2, 3, 4

Monografias.com
Filtros LPC y LPC inverso:

Al pasar s[n] por el filtro LPC inverso obtenemos e[n]
e[n] además de ser la señal de error es la señal de excitación del modelo de producción de voz

Monografias.com
Método SIFT, estimación del Pitch
Simplified Inverse Filtering Technique, Markel 1972.
(Gp:) F. Paso Bajo
0-900 Hz
(Gp:) Diezmado
5:1
(Gp:) Análisis LPC
P=4
(Gp:) Filtro LPC
Inverso
(Gp:) Autocorrelación
(Gp:) Localizar
Máximo
(Gp:) Interpolación
(Gp:) ¿Sonoro / sordo?
Estimar F0
(Gp:) x[n]
(Gp:) e[n]
(Gp:) S[n]
Fs = 10 kHz

Monografias.com
Filtrar paso bajo con fc = 900Hz.
Esto nos permite reducir Fs de 10 kHz a 2 kHz.
Desechamos 4 de cada 5 muestas.
Realizamos un análisis LPC de orden 4.
No es necesario más: hasta 1000Hz como máximo 2 formantes.
Procesamos x[n] con el filtro inverso LPC.
Obtenemos e[n] que será la señal de excitación.
Calculamos la autocorrelación de e[n].
Localizamos el mayor valor dentro del rango de pitch probables.
Para obtener mayor resolución en la estima del pitch, interpolamos la autocorrelación en la región del máximo.
Si el máximo obtenido (normalizado por R[0]) no supera un umbral, suponer que el segmento es sordo.

Monografias.com
Análisis espectral localizado
3.5.1.- Conceptos de percepción auditiva

MEL: Escala de frecuencias de distribución no lineal que responde al mecanismo de percepción auditiva

Con esta escala medimos la frecuencia en MELs, es la frecuencia percibida aparente.

Conversión de Hz a MELs

Monografias.com
MEL-Frequency Cepstrum (MFCC)
Coeficientes cepstrales derivados del análisis sobre la escala MEL
Calculamos el espectro
Calculamos el Log del módulo (cepstrum real)
Aplicamos la escala MEL
Agrupamos frecuencias en bandas críticas
Calculamos la DCT

(Gp:) FFT
(Gp:) DCT
(Gp:) Escala MEL
(Gp:) Log

Monografias.com

Monografias.com
0
1000
2000
3000
4000
5000
6000
7000
0
0.2
0.4
0.6
0.8
1
[Hz]
0
2
4
6
8
10
12
14
16
18
-10
-8
-6
-4
-2
0
Banco de
filtros
Espectro
suavizado

Monografias.com
Cepstrum obtenido:
El número de coeficientes resultante es muy inferior
El cepstrum obtenido es una aproximación
(Gp:) 0
(Gp:) 2
(Gp:) 4
(Gp:) 6
(Gp:) 8
(Gp:) 10
(Gp:) 12
(Gp:) 14
(Gp:) 16
(Gp:) -0.5
(Gp:) 0
(Gp:) 0.5
(Gp:) 1

Monografias.com
Cepstrum LPC (LPCC)
Es posible obtener los coeficientes cepstrales a partir de los coeficientes LPC
Obtendremos el cepstrum de una señal suavizada
No es necesario calcular el espectro

Monografias.com
Otros parámetros
Existen multitud de representaciones distintas de los parámetros vistos

Unos parámetros se pueden obtener a partir de los otros

El empleo de unos u otros parámetros es indistinto en cuanto a mejoras en la síntesis/reconocimiento

La elección entre unos u otros se debe principalmente a:
Robustez que ofrecen frente a fallos
Tasa binaria mínima requerida

Monografias.com
Coeficientes PARCOR:
PARtial autoCORrelation coefficients.
Se calculan como paso intermedio en el algoritmo de durbin.
Son los coeficientes de Reflexión ya vistos.

Relación de áreas / Coefs. PARCOR

LAR: Log Area Ratios

Monografias.com
Coeficientes LSF / LSP:
Line Spectral Frequencies / Line Spectral Pairs
Permiten una representación distinta de los coeficientes LPC
El filtro inverso LPC, A(z), se puede descomponer en:

Donde P(z) representa la respuesta del tracto vocal con la glotis cerrada, y Q(z) con la glotis abierta.

Monografias.com
A(z) tiene raíces dentro de la circunferencia unidad
P(z) y Q(z) sólo tienen raíces sobre la circunferencia
P(z) es un polinomio simétrico y Q(z) antisimétrico
Las raíces de P(z) y Q(z) se encuentran de forma alternada en frecuencia
Cálculo de las raices:
Tomar z = exp(jw) y evaluar P(z) y Q(z) en una malla de puntos entre 0 y pi.

Recuperación de A(z):

Monografias.com
Problemas de usar los coeficientes LPC:
El error de cuantificación es problemático, el filtro se puede hacer inestable
Se comportan muy mal al intentar interpolarlos

Ventajas de usar LSF/LSP:
Son más robustos en cuanto a errores de cuantificación
El filtro permanece estable
Al ser una representación en frecuencia, un error solo altera un pequeño rango de frecuencias

Monografias.com
Proceso de obtención de parámetros
Pasos a realizar:
Pre-énfasis de la trama
Enventanado con solapamiento
Cálculo de la autocorrelación
Análisis LPC, obtención de los coeficientes
Cálculo del cepstrum a partir de la LPC
Análisis de los parámetros obtenidos

Partes: 1, 2, 3, 4
 Página anterior Volver al principio del trabajoPágina siguiente 

Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.

Todos los documentos disponibles en este sitio expresan los puntos de vista de sus respectivos autores y no de Monografias.com. El objetivo de Monografias.com es poner el conocimiento a disposición de toda su comunidad. Queda bajo la responsabilidad de cada lector el eventual uso que se le de a esta información. Asimismo, es obligatoria la cita del autor del contenido y de Monografias.com como fuentes de información.

Categorias
Newsletter