2.5.- Autocorrelación
Para desplazamientos de k igual al periodo de la señal la autocorrelación tiene máximos locales
La autocorrelación de una señal periódica es periódica
2.5.- Autocorrelación
En una señal de voz:
Los máximos locales de la autocorrelación corresponden con el pitch (frecuencia fundamental, f0) y los formantes del tracto vocal.
2.6.- Estimación del Pitch
A partir de la correlación
Es el mayor máximo local de la autocorrelación (excluyendo el máximo global)
Segmento
Sonoro
Segmento
Sordo
2.6.- Estimación del Pitch
Problema:
No siempre el mayor máximo local corresponde con el pitch
Para facilitar su localización emplearemos una función de recorte
Esta función eliminará toda la señal de entrada que no sobrepase un determinado umbral
2.6.- Estimación del Pitch
Función de recorte:
2.6.- Estimación del Pitch
Autocorrelación de la señal recortada
2.6.- Estimación del Pitch
AMDF, Average Magnitude Difference Function
Estima del pitch empleando la Magnitud en vez de la correlación
Menor complejidad y coste computacional
En este caso en vez de buscar máximos se deben buscar mínimos
2.6.- Estimación del Pitch
AMDF, Average Magnitude Difference Function
3.- Análisis localizado en frecuencia
Para realizar un análisis localizado en frecuencia basta con calcular la TF de un segmento de señal enventanado.
3.1- Espectrogramas
También denominados Sonogramas
Representan la evolución del espectro con el tiempo
Estas variables son inversas
Al ganar resolución en una de ellas, la perdemos en la otra
Tipos de espectrogramas:
Banda ancha
Banda estrecha
3.1- Espectrogramas
Banda ancha (poca resolución en frecuencia)
Ventanas temporales cortas
3.1- Espectrogramas
Banda estrecha (poca resolución en el tiempo)
Ventanas temporales largas
3.2- Análisis Homomórfico: Cepstrum
Utilidad:
Permite separar la señal de excitación de la respuesta del filtro del tracto vocal
Un segmento sonoro es la convolución entre:
La señal de excitación glotal e[n]
El filtro del tracto vocal h[n]
La convolución en el tiempo es una multiplicación en frecuencia
3.2- Análisis Homomórfico: Cepstrum
Aprovechando las propiedades de los logaritmos:
Si ahora regresamos al “tiempo”: Cepstrum
(Gp:) s[n]
(Gp:) FFT
(Gp:) Log
(Gp:) IFFT
(Gp:) c[n]
3.2- Análisis Homomórfico: Cepstrum
El cepstrum puede ser real o complejo:
Cepstrum complejo: tomamos logaritmos del espectro completo (con la fase desenrollada, unwrapped)
Cepstrum real: sólo aplicamos el logaritmo al módulo del espectro
El cepstrum complejo se puede deshacer, el real no al no contener información de fase
Para voz se suele emplear el cepstrum real
3.2- Análisis Homomórfico: Cepstrum
La convolución se ha convertido en una suma:
(Gp:) Periodo Fundamental
ce y ch son separables
3.2- Análisis Homomórfico: Cepstrum
Obtención de la envolvente espectral:
Una vez calculado el cepstrum
Extraemos ch con una ventana
El espectro de ch es la envolvente espectral
0
1
2
3
4
5
6
7
8
-70
-60
-50
-40
-30
-20
-10
0
Frecuencia(KHz)
Amplitud(dB)
3.2- Análisis Homomórfico: Cepstrum
Terminología empleada:
Spectrum ? Cepstrum
Frecuency ? Quefrency
Filtering ? Liftering
Analysis ? Alanysis
4.- Análisis de predicción lineal
Modelo del tracto vocal:
Suponemos que el tracto vocal es una serie de tubos de sección variable sin pérdidas
Suponemos que el sonido se propaga como una onda plana a través de los tubos
(Gp:) A1
(Gp:) A2
(Gp:) …
(Gp:) AN
(Gp:) Glotis
(Gp:) ALabios
Modelo del tracto vocal
Estructura de filtro en celosía (lattice)
? tiempo de propagación para atravesar una sección
4.- Análisis de predicción lineal
(Gp:) A1
(Gp:) A2
(Gp:) AN
(Gp:) Glotis
(Gp:) ALabios??
(Gp:) ?
(Gp:) ?
(Gp:) ?
(Gp:) ?
(Gp:) ?
(Gp:) ?
(Gp:) Ug
(Gp:) -1
(Gp:) ULabios
(Gp:) 1-kN
(Gp:) kN
4.- Análisis de predicción lineal
Coeficientes de reflexión:
(Gp:) -km
(Gp:) km
(Gp:) 1-km
(Gp:) 1+km
(Gp:) Am
(Gp:) Am+1
(Gp:) Um
(Gp:) Um
(Gp:) +
(Gp:) –
(Gp:) Um+1
(Gp:) Um+1
(Gp:) +
(Gp:) –
Interconexión
de secciones:
Cálculo de los coeficientes
de reflexión:
4.- Análisis de predicción lineal
Trabajando en tiempo discreto:
Si el periodo de muestreo T = 2 ? se puede demostrar que la respuesta en frecuencia del tracto vocal es un filtro todo polos
Los coeficientes ak del filtro se pueden obtener a partir de los coeficientes de reflexión km (Durbin)
4.- Análisis de predicción lineal
Predicción lineal:
Vamos a intentar predecir el valor de s[n] a partir de sus valores anteriores s[n-1], s[n-2], …, s[n-M]
Es decir, s[n] se puede calcular en función de sus muestras anteriores (podemos predecir su valor):
Si la función f es lineal: predicción lineal
4.- Análisis de predicción lineal
Cálculo de la predicción de s[n]:
Coeficientes de predicción:
Error de predicción:
Página anterior | Volver al principio del trabajo | Página siguiente |