Historia de los codificadores de voz
Primera reseña histórica, 1779:
C. G. Kratzenstein.
Profesor de la Universidad de Copenhague.
Fue capaz de producir vocales uniendo cavidades de resonancia a los tubos de un órgano.
Historia de los codificadores de voz
Wolfgang von Kempelen, 1791:
Primer sintetizador de voz
Máquina que reproducía fielmente la anatomía del aparato fonador humano
Historia de los codificadores de voz
Joseph Faber, 1835:
“Euphonia”, permite (además) generar voz cantada.
En el siguiente enlace se puede ver un dibujo de la máquina en cuestión.
Historia de los codificadores de voz
Homer Dudley, 1939:
“Voder” – Primer sintetizador electrónico
Bell telephone
Emplea:
Oscilador
Generador de ruido blanco
Banco de filtros paso banda
Teclas para consonantes
Historia de los codificadores de voz
En la década de los 40 se empezó a trabajar intensamente el los codificadores de voz
Codificador de voz: Vocoder (Voice Coder)
Un vocoder analiza la voz y la convierte en una serie de parámetros característicos que posteriormente se vuelven a convertir en voz audible en el receptor.
Su principal ventaja es la reducción del ancho de banda necesario.
Muy útil en telefonía móvil
Muestreo y cuantificación
Muestreo:
Nyquist:
Si no se cumple este requisito se produce aliasing.
Cuantificación uniforme
Cuantificación:
Expresar una cantidad que representa una variación continua dentro de un rango limitado de valores.
Cuantificación uniforme (PCM):
(Gp:) Vout
(Gp:) Vin
Cuantificación uniforme
La señal de voz y la cuantificación PCM:
La voz no es estacionaria.
La amplitud de la señal de voz tiene una distribución Gamma, se aproxima por una Laplaciana.
Las muestras de voz están correladas.
El cuantificador uniforme está adaptado para funciones de densidad de probabilidad uniformes.
Es posible cuantificar la señal de forma más eficiente.
Cuantificación no uniforme
Si la FDP no es uniforme podemos aplicarle una transformación para minimizar el error de cuantificación.
Equivalente a modificar el tamaño de los escalones:
Escalones pequeños para niveles bajos de señal.
Escalones grandes para niveles altos.
Cuantificación no uniforme
Sistemas Compresores / Expansores:
También conocidos como cuantificadores logarítmicos (LogPCM)
Ley A:
Ley µ:
µ: 255
A: 87.56
Expansor
Compresor
Cuantificador
n-bits
Cuantificación no uniforme
Sistemas Compresores / Expansores:
x(n)
y(n)
yq(n)
xq(n)
Transmisor
Receptor
Estándar G.711 64 Kbps (4KHz, 8000 muestras/seg)
Ley-µ 14-bit linear PCM a 8-bit log.
Ley-A 13-bit linear PCM a 8-bit log.
Equivalente a PCM 11 bits * 8000 m/seg, 88 Kbps
Cuantificación vectorial
Vector Quantization, VQ
La cuantificación se realiza por grupos de muestras o parámetros
Un grupo de N muestras se trata como un vector N dimensional
Representamos los vectores por un conjunto pequeño de representantes (codebook)
Posteriormente se debe buscar el mejor representante para un vector (codevector)
Cuantificación vectorial
Tiene múltiples aplicaciones, entre ellas:
Clasificador
Reducción de datos (compresión)
Cálculo del codebook:
Algoritmo LBG o de las k-medias
Se calculan iterativamente:
ci: centroide de cada región
Si: particiones de los vecinos más cercanos a cada centroide
D: distancia media.
Si no se modifica sustancialmente , desdoblar el número de centroides .
Muestreo y cuantificación
La cuantificación vectorial es eficiente porque:
El codebook se adapta a la distribución estadística de la señal, sea esta cual sea.
Se tiene en cuenta la correlación entre muestras y las posibles no linealidades.
La búsqueda en el codebook debe hacerse de forma eficiente: Árboles de búsqueda
En voz se suelen emplear los parámetros LPC, PARCOR, LSP, etc y se representan por un código.
Página siguiente |