La comunicación de voz es analógica, mientras que la red de datos es digital. El proceso de convertir ondas analógicas a información digital se hace con un codificador-decodificador (el CODEC). Hay muchas maneras de transformar una señal de voz analógica, todas ellas gobernadas por varios estándares. El proceso de la conversión es complejo. Es suficiente decir que la mayoría de las conversiones se basan en la modulación codificada mediante pulsos (PCM) o variaciones.
Además de la ejecución de la conversión de analógico a digital, el CODEC comprime la secuencia de datos, y proporciona la cancelación del eco. La compresión de la forma de onda representada puede permitir el ahorro del ancho de banda. Esto es especialmente interesante en los enlaces de poca capacidad y permite tener un mayor numero de conexiones de VoIP simultaneamente. Otra manera de ahorrar ancho de banda es el uso de la supresión del silencio, que es el proceso de no enviar los paquetes de la voz entre silencios en conversaciones humanas.
A continuación se muestra una tabla resumen con los códecs más utilizados actualmente:
- El Bit Rate indica la cantidad de información que se manda por segundo.
- El Sampling Rate indica la frecuencia de muestreo de la señal vocal.(cada cuanto se toma una muestra de la señal analógica)
- El Frame size indica cada cuantos milisegundos se envia un paquete con la información sonora.
- El MOS indica la calidad general del códec (valor de 1 a 5)
Para entender mejor la formación de un codec y los parametros expresados en la tabla recomendamos leer el apartadofuncionamiento de un codec donde se puede aprender como funciona detallamente el codec G.711 y que significan en su caso los parametros de la tabla.
A continuación se muestra una tabla resumen con los códecs más utilizados actualmente:
- El Bit Rate indica la cantidad de información que se manda por segundo.
- El Sampling Rate indica la frecuencia de muestreo de la señal vocal.(cada cuanto se toma una muestra de la señal analógica)
- El Frame size indica cada cuantos milisegundos se envia un paquete con la información sonora.
- El MOS indica la calidad general del códec (valor de 1 a 5)
Para entender mejor la formación de un codec y los parametros expresados en la tabla recomendamos leer el apartadofuncionamiento de un codec donde se puede aprender como funciona detallamente el codec G.711 y que significan en su caso los parametros de la tabla.
Nombre | Estandarizado | Descripción | Bit rate (kb/s) | Sampling rate (kHz) | Frame size (ms) | Observaciones |
MOS (Mean Opinion Score)
|
---|---|---|---|---|---|---|---|
G.711 * | ITU-T | Pulse code modulation (PCM) | 64 | 8 | Muestreada | Tiene dos versiones u-law (US, Japan) y a-law (Europa) para muestrear la señal |
4.1
|
G.711.1 * | ITU-T | Pulse code modulation (PCM) | 80-96Kbps | 8 | Muestreada | Mejora del codec G.711 para abarcar la banda de 50 Hz a 7 Khz. Mas info | |
G.721 | ITU-T | Adaptive differential pulse code modulation (ADPCM) | 32 | 8 | Muestreada | Obsoleta. S e ha transformado en la G.726. | |
G.722 | ITU-T | 7 kHz audio-coding within 64 kbit/s | 64 | 16 | Muestreada | Divide los 16 Khz en dos bandas cada una usando ADPCM | |
G.722.1 | ITU-T | Codificación a 24 y 32 kbit/s para sistemas sin manos con baja perdida de paquetes | 24/32 | 16 | 20 | ||
G.722.2 AMR-WB | ITU-T | Adaptive Multi-Rate Wideband Codec (AMR-WB) | 23.85/ 23.05/ 19.85/ 18.25/ 15.85/ 14.25/ 12.65/ 8.85/ 6.6 | 16 | 20 | Se usa principalmente para compresíon de voz en tecnología movil de tercera generación. Mas info | |
G.723 | ITU-T | Extensión de la norma G.721 a 24 y 40 kbit/s para aplicaciones en circuitos digitales. | 24/40 | 8 | Muestreada | Obsoleta por G.726. Es totalmente diferente de G.723.1. | |
G.723.1 | ITU-T | Dual rate speech coder for multimedia communications transmitting at 5.3 and 6.3 kbit/s | 5.6/6.3 | 8 | 30 | Parte de H.324 video conferencing. Codifica la señal usando linear predictive analysis-by-synthesis coding. Para el codificador de high rate utiliza Multipulse Maximum Likelihood Quantization (MP-MLQ) y para el de low-rate usa Algebraic-Code-Excited Linear-Prediction (ACELP). |
3.8-3.9
|
G.726 | ITU-T | 40, 32, 24, 16 kbit/s adaptive differential pulse code modulation (ADPCM) | 16/24/32/40 | 8 | Muestreada | ADPCM; reemplaza a G.721 y G.723. |
3.85
|
G.727 | ITU-T | 5-, 4-, 3- and 2-bit/sample embedded adaptive differential pulse code modulation (ADPCM) | var. | Muestreada | ADPCM. Relacionada con G.726. | ||
G.728 | ITU-T | Coding of speech at 16 kbit/s using low-delay code excited linear prediction | 16 | 8 | 2.5 | CELP. |
3.61
|
G.729 ** | ITU-T | Coding of speech at 8 kbit/s using conjugate-structure algebraic-code-excited linear-prediction (CS-ACELP) | 8 | 8 | 10 | Bajo retardo (15 ms) |
3.92
|
G.729.1 | ITU-T | Coding of speech at 8 kbit/s using conjugate-structure algebraic-code-excited linear-prediction (CS-ACELP) | 8/12/14/16/ 18/20/22/24/ 26/28/30/32 | 8 | 10 | Ancho de banda desde 50Hz a 7 Khz Mas info | |
GSM 06.10 | ETSI | RegularPulse Excitation LongTerm Predictor (RPE-LTP) | 13 | 8 | 22.5 | Usado por la tecnología celular GSM | |
LPC10 | Gobierno de USA | Linear-predictive codec | 2.4 | 8 | 22.5 | 10 coeficientes.La voz suena un poco "robotica" | |
Speex | 8, 16, 32 | 2.15-24.6 (NB) 4-44.2 (WB) | 30 ( NB ) 34 ( WB ) | ||||
iLBC | 8 | 13.3 | 30 | ||||
DoD CELP | American Department of Defense (DoD) Gobierno de USA | 4.8 | 30 | ||||
EVRC | 3GPP2 | Enhanced Variable Rate CODEC | 9.6/4.8/1.2 | 8 | 20 | Se usa en redes CDMA | |
DVI | Interactive Multimedia Association (IMA) | DVI4 uses an adaptive delta pulse code modulation (ADPCM) | 32 | Variable | Muestreada | ||
L16 | Uncompressed audio data samples | 128 | Variable | Muestreada | |||
SILK | Skype | Uncompressed audio data samples | De 6 a 40 kbit/s | Variable | 20 | El codec Harmony está basado en SILK |
* El codec g711 tiene dos versiones conocidas como alaw (usado en Europa) y ulaw (usado en USA y Japón). U-law se corresponde con el estandar T1 usado en Estados Unidos y A-law con el estandar E1 usado en el resto del mundo. La diferencia es el método que se utiliza para muestrear la señal. La señal no se muestrea de forma lineal sino de forma logaritmica. A-law tiene un mayor rango. Para mas información de las diferencias ver G.711 Ley A vs Ley u
** existen varias versiones del codec g729 que es interesante explicar por su extendido uso
G729: es el códec original
G729A o anexo A: es una simplificación de G729 y es compatible con G729. Es menos complejo pero tiene algo menos de calidad.
G729B o anexo B: Es G729 pero con supresion de silencios y no es compatible con las anteriores.
G729AB: Es g729A con supresión de silencios y sería compatible solo con G729B.
Aparte de esto G729 (todas las versiones) en general tienen un bit rate de 8Kbps pero existen versiones de 6.4 kbps (anexo D) y 11.4 Kbps (anexo E).