miércoles, 31 de agosto de 2016

Tabla resumen de codecs

La comunicación de voz es analógica, mientras que la red de datos es digital. El proceso de convertir ondas analógicas a información digital se hace con un codificador-decodificador (el CODEC). Hay muchas maneras de transformar una señal de voz analógica, todas ellas gobernadas por varios estándares. El proceso de la conversión es complejo. Es suficiente decir que la mayoría de las conversiones se basan en la modulación codificada mediante pulsos (PCM) o variaciones.
Además de la ejecución de la conversión de analógico a digital, el CODEC comprime la secuencia de datos, y proporciona la cancelación del eco. La compresión de la forma de onda representada puede permitir el ahorro del ancho de banda. Esto es especialmente interesante en los enlaces de poca capacidad y permite tener un mayor numero de conexiones de VoIP simultaneamente. Otra manera de ahorrar ancho de banda es el uso de la supresión del silencio, que es el proceso de no enviar los paquetes de la voz entre silencios en conversaciones humanas.
A continuación se muestra una tabla resumen con los códecs más utilizados actualmente:

- El Bit Rate indica la cantidad de información que se manda por segundo.
- El Sampling Rate indica la frecuencia de muestreo de la señal vocal.(cada cuanto se toma una muestra de la señal analógica)
- El Frame size indica cada cuantos milisegundos se envia un paquete con la información sonora.
- El MOS indica la calidad general del códec (valor de 1 a 5)

Para entender mejor la formación de un codec y los parametros expresados en la tabla recomendamos leer el apartadofuncionamiento de un codec donde se puede aprender como funciona detallamente el codec G.711 y que significan en su caso los parametros de la tabla.
NombreEstandarizadoDescripciónBit rate (kb/s)Sampling rate (kHz)Frame size (ms)Observaciones
MOS (Mean Opinion Score)
G.711 *ITU-TPulse code modulation (PCM)648MuestreadaTiene dos versiones u-law (US, Japan) y a-law (Europa) para muestrear la señal
4.1
G.711.1 *ITU-TPulse code modulation (PCM)80-96Kbps8MuestreadaMejora del codec G.711 para abarcar la banda de 50 Hz a 7 Khz. Mas info
G.721ITU-TAdaptive differential pulse code modulation (ADPCM)328MuestreadaObsoleta. S e ha transformado en la G.726.
 
G.722ITU-T7 kHz audio-coding within 64 kbit/s6416MuestreadaDivide los 16 Khz en dos bandas cada una usando ADPCM
 
G.722.1ITU-TCodificación a 24 y 32 kbit/s para sistemas sin manos con baja perdida de paquetes24/321620 
 
G.722.2 AMR-WBITU-TAdaptive Multi-Rate Wideband Codec (AMR-WB)23.85/ 23.05/ 19.85/
18.25/ 15.85/ 14.25/
12.65/ 8.85/ 6.6
1620Se usa principalmente para compresíon de voz en tecnología movil de tercera generación. Mas info
 
G.723ITU-TExtensión de la norma G.721 a 24 y 40 kbit/s para aplicaciones en circuitos digitales.24/408MuestreadaObsoleta por G.726. Es totalmente diferente de G.723.1.
 
G.723.1ITU-TDual rate speech coder for multimedia communications transmitting at 5.3 and 6.3 kbit/s5.6/6.3830Parte de H.324 video conferencing. Codifica la señal usando linear predictive analysis-by-synthesis coding. Para el codificador de high rate utiliza Multipulse Maximum Likelihood Quantization (MP-MLQ) y para el de low-rate usa Algebraic-Code-Excited Linear-Prediction (ACELP).
3.8-3.9
G.726ITU-T40, 32, 24, 16 kbit/s adaptive differential pulse code modulation (ADPCM)16/24/32/408MuestreadaADPCM; reemplaza a G.721 y G.723.
3.85
G.727ITU-T5-, 4-, 3- and 2-bit/sample embedded adaptive differential pulse code modulation (ADPCM)var. MuestreadaADPCM. Relacionada con G.726.
 
G.728ITU-TCoding of speech at 16 kbit/s using low-delay code excited linear prediction1682.5CELP.
3.61
G.729 **ITU-TCoding of speech at 8 kbit/s using conjugate-structure algebraic-code-excited linear-prediction (CS-ACELP)8810Bajo retardo (15 ms)
3.92
G.729.1ITU-TCoding of speech at 8 kbit/s using conjugate-structure algebraic-code-excited linear-prediction (CS-ACELP)8/12/14/16/
18/20/22/24/
26/28/30/32
810Ancho de banda desde 50Hz a 7 Khz Mas info
GSM 06.10ETSIRegular­Pulse Excitation Long­Term Predictor (RPE-LTP)13822.5Usado por la tecnología celular GSM
 
LPC10Gobierno de USALinear-predictive codec2.4822.510 coeficientes.La voz suena un poco "robotica"
 
Speex  8, 16, 322.15-24.6 (NB)
4-44.2 (WB)
30 ( NB )
34 ( WB )
 
 
iLBC  813.330 
 
DoD CELPAmerican Department of Defense (DoD) Gobierno de USA 4.8 30 
 
EVRC3GPP2Enhanced Variable Rate CODEC9.6/4.8/1.2820Se usa en redes CDMA
 
DVIInteractive Multimedia Association (IMA)DVI4 uses an adaptive delta pulse code modulation (ADPCM)32VariableMuestreada 
 
L16 Uncompressed audio data samples128VariableMuestreada 
 
SILKSkypeUncompressed audio data samplesDe 6 a 40 kbit/sVariable20El codec Harmony está basado en SILK
 


* El codec g711 tiene dos versiones conocidas como alaw (usado en Europa) y ulaw (usado en USA y Japón). U-law se corresponde con el estandar T1 usado en Estados Unidos y A-law con el estandar E1 usado en el resto del mundo. La diferencia es el método que se utiliza para muestrear la señal. La señal no se muestrea de forma lineal sino de forma logaritmica. A-law tiene un mayor rango. Para mas información de las diferencias ver G.711 Ley A vs Ley u

** existen varias versiones del codec g729 que es interesante explicar por su extendido uso
G729: es el códec original 
G729A o anexo A: es una simplificación de G729 y es compatible con G729. Es menos complejo pero tiene algo menos de calidad. 
G729B o anexo B: Es G729 pero con supresion de silencios y no es compatible con las anteriores. 
G729AB: Es g729A con supresión de silencios y sería compatible solo con G729B.
Aparte de esto G729 (todas las versiones) en general tienen un bit rate de 8Kbps pero existen versiones de 6.4 kbps (anexo D) y 11.4 Kbps (anexo E). 

No hay comentarios:

Publicar un comentario