Parametrización en el Análisis de la voz (página 2)

Partes: 1, 2, 3

2.5.- Autocorrelación
Para desplazamientos de k igual al periodo de la señal la autocorrelación tiene máximos locales
La autocorrelación de una señal periódica es periódica

Monografias.com

2.5.- Autocorrelación
En una señal de voz:
Los máximos locales de la autocorrelación corresponden con el pitch (frecuencia fundamental, f0) y los formantes del tracto vocal.

Monografias.com

2.6.- Estimación del Pitch
A partir de la correlación
Es el mayor máximo local de la autocorrelación (excluyendo el máximo global)
Segmento
Sonoro
Segmento
Sordo

Monografias.com

2.6.- Estimación del Pitch
Problema:
No siempre el mayor máximo local corresponde con el pitch

Para facilitar su localización emplearemos una función de recorte

Esta función eliminará toda la señal de entrada que no sobrepase un determinado umbral

Monografias.com

2.6.- Estimación del Pitch
Función de recorte:

Monografias.com

2.6.- Estimación del Pitch
Autocorrelación de la señal recortada

Monografias.com

2.6.- Estimación del Pitch
AMDF, Average Magnitude Difference Function
Estima del pitch empleando la Magnitud en vez de la correlación
Menor complejidad y coste computacional
En este caso en vez de buscar máximos se deben buscar mínimos

Monografias.com

2.6.- Estimación del Pitch
AMDF, Average Magnitude Difference Function

Monografias.com

3.- Análisis localizado en frecuencia
Para realizar un análisis localizado en frecuencia basta con calcular la TF de un segmento de señal enventanado.

Monografias.com

3.1- Espectrogramas
También denominados Sonogramas
Representan la evolución del espectro con el tiempo
Estas variables son inversas
Al ganar resolución en una de ellas, la perdemos en la otra

Tipos de espectrogramas:
Banda ancha
Banda estrecha

Monografias.com

3.1- Espectrogramas
Banda ancha (poca resolución en frecuencia)
Ventanas temporales cortas

Monografias.com

3.1- Espectrogramas
Banda estrecha (poca resolución en el tiempo)
Ventanas temporales largas

Monografias.com

3.2- Análisis Homomórfico: Cepstrum
Utilidad:
Permite separar la señal de excitación de la respuesta del filtro del tracto vocal

Un segmento sonoro es la convolución entre:
La señal de excitación glotal e[n]
El filtro del tracto vocal h[n]

La convolución en el tiempo es una multiplicación en frecuencia

Monografias.com

3.2- Análisis Homomórfico: Cepstrum
Aprovechando las propiedades de los logaritmos:

Si ahora regresamos al “tiempo”: Cepstrum
(Gp:) s[n]
(Gp:) FFT
(Gp:) Log
(Gp:) IFFT
(Gp:) c[n]

Monografias.com

3.2- Análisis Homomórfico: Cepstrum
El cepstrum puede ser real o complejo:
Cepstrum complejo: tomamos logaritmos del espectro completo (con la fase desenrollada, unwrapped)

Cepstrum real: sólo aplicamos el logaritmo al módulo del espectro

El cepstrum complejo se puede deshacer, el real no al no contener información de fase

Para voz se suele emplear el cepstrum real

Monografias.com

3.2- Análisis Homomórfico: Cepstrum
La convolución se ha convertido en una suma:
(Gp:) Periodo Fundamental

ce y ch son separables

Monografias.com

3.2- Análisis Homomórfico: Cepstrum
Obtención de la envolvente espectral:
Una vez calculado el cepstrum
Extraemos ch con una ventana
El espectro de ch es la envolvente espectral
0
1
2
3
4
5
6
7
8
-70
-60
-50
-40
-30
-20
-10
0
Frecuencia(KHz)
Amplitud(dB)

Monografias.com

3.2- Análisis Homomórfico: Cepstrum
Terminología empleada:

Spectrum ? Cepstrum
Frecuency ? Quefrency
Filtering ? Liftering
Analysis ? Alanysis

Monografias.com

4.- Análisis de predicción lineal
Modelo del tracto vocal:
Suponemos que el tracto vocal es una serie de tubos de sección variable sin pérdidas
Suponemos que el sonido se propaga como una onda plana a través de los tubos
(Gp:) A1
(Gp:) A2
(Gp:) …
(Gp:) AN
(Gp:) Glotis
(Gp:) ALabios

Monografias.com

Modelo del tracto vocal

Estructura de filtro en celosía (lattice)
? tiempo de propagación para atravesar una sección
4.- Análisis de predicción lineal
(Gp:) A1
(Gp:) A2
(Gp:) AN
(Gp:) Glotis
(Gp:) ALabios??

(Gp:) ?
(Gp:) ?
(Gp:) ?
(Gp:) ?
(Gp:) ?
(Gp:) ?
(Gp:) Ug
(Gp:) -1
(Gp:) ULabios
(Gp:) 1-kN
(Gp:) kN

Monografias.com

4.- Análisis de predicción lineal
Coeficientes de reflexión:
(Gp:) -km
(Gp:) km
(Gp:) 1-km
(Gp:) 1+km
(Gp:) Am
(Gp:) Am+1
(Gp:) Um
(Gp:) Um
(Gp:) +
(Gp:) –
(Gp:) Um+1
(Gp:) Um+1
(Gp:) +
(Gp:) –

Interconexión
de secciones:
Cálculo de los coeficientes
de reflexión:

Monografias.com

4.- Análisis de predicción lineal
Trabajando en tiempo discreto:

Si el periodo de muestreo T = 2 ? se puede demostrar que la respuesta en frecuencia del tracto vocal es un filtro todo polos

Los coeficientes ak del filtro se pueden obtener a partir de los coeficientes de reflexión km (Durbin)

Monografias.com

4.- Análisis de predicción lineal
Predicción lineal:
Vamos a intentar predecir el valor de s[n] a partir de sus valores anteriores s[n-1], s[n-2], …, s[n-M]

Es decir, s[n] se puede calcular en función de sus muestras anteriores (podemos predecir su valor):

Si la función f es lineal: predicción lineal

Monografias.com

4.- Análisis de predicción lineal
Cálculo de la predicción de s[n]:

Coeficientes de predicción:

Error de predicción:

Partes: 1, 2, 3

Página anterior

Volver al principio del trabajo

Página siguiente