Diferencia entre revisiones de «Context-Adaptive Variable Length Coding»
Cambio en la redacción de la correspondencia color-valor codificado |
Corrección pie de la primera figura |
||
Línea 19: | Línea 19: | ||
{| class=wikitable |
{| class=wikitable |
||
|- |
|- |
||
|<!--Col1-->[[Image:Ejemplo_de_coeficientes_de_un_bloque_de_luminancia_sin_transformar_4x4.png|thumb|200px|center| |
|<!--Col1-->[[Image:Ejemplo_de_coeficientes_de_un_bloque_de_luminancia_sin_transformar_4x4.png|thumb|200px|center|Bloque de luminancia 4x4 sin aplicar transformación alguna]] |
||
|<!--Col2-->Secuencia resultante: 120,64,12,24,110,8,43,10,0,11,33,98,55,12,21,0 |
|<!--Col2-->Secuencia resultante: 120,64,12,24,110,8,43,10,0,11,33,98,55,12,21,0 |
||
|} |
|} |
Revisión del 22:21 30 nov 2008
Resumen
Las siglas CAVLC corresponden a las iniciales de Context-Adaptive Variable Length Coding, que traducido del inglés significa codificación adaptativa según el contexto de longitud variable.
CAVLC es un método de codificación de fuente, que pertenece a la familia de los codificadores entrópicos. Un código entrópico es aquél que sustituye las palabras código de una fuente de información por otras cuya longitud es proporcional a la frecuencia con la que aparece dicha palabra. El objetivo de los códigos de fuente es tratar de eliminar toda aquella información que sea redundante para reducir al máximo la cantidad de datos a transmitir. Un ejemplo de este tipo de códigos es la Codificación Huffman o la codificación VLC.
La codificación CAVLC se emplea en el estándar de codificación de video MPEG-4 (parte 10), para codificar la información que resulta de la aplicación de la transformación y cuantificación de un bloque de luminancia de tamaño 4x4 píxels.
Características de la información a codificar
Un bloque de luminancia puede considerarse una subdivisión de una imagen en escala de grises. En este caso consideraremos, de manera muy simplificada, que la imagen se ha dividido muchos en bloques de tamaño 4x4 píxeles, con lo cual cada uno de los bloques que componen la imagen estará formado por 16 píxeles. Cada uno de estos píxeles tendrá asignado un valor comprendido entre 0 y 255 de forma que:
- si el píxel es de color negro se le asignará el valor 0
- si es de color blanco se le asignará el valor 255
- si el color del píxel es un tono de gris, se le asignará un valor comprendido entre 1 (gris más oscuro) y 254 (gris más claro).
Si fuéramos a transmitir estos valores tal cual, podríamos enviarlos, por ejemplo, uno detrás de otro leyendo el bloque por filas. La secuencia de bits resultante sería la siguiente:
Secuencia resultante: 120,64,12,24,110,8,43,10,0,11,33,98,55,12,21,0 |
Esta codificación resulta muy poco conveniente para ser transmitida, porque no presenta redundancia alguna y a causa de ello nos veríamos forzados a transmitir los 16 valores. Es aquí donde entra en juego la transformación: el objetivo de la misma es tratar de representar la información contenida en el bloque 4x4 de una forma que nos permita no tener que transmitir todos los valores de los píxeles que componen el bloque. Si la aplicamos, los valores del bloque de tamaño 4x4 anterior tendrán este aspecto:
La diferencia más clara entre ambos es la aparición de un elevado número de píxels cuyo valor ahora es cero y que además los valores que no son nulos han quedado agrupados en la esquina superior izquierda. A partir de ahora emplearemos la palabra coeficiente para referirnos a cada uno de los valores una vez se les ha aplicado la transformación.
Si ahora quisiéramos transmitir estos coeficientes, podríamos hacerlo enviando únicamente los que son distintos de cero, asumiendo que aquellos que no enviamos valdrán cero. Esta es la idea básica del CAVLC.
El orden en el que se transmiten los coeficientes es el que indican las flechas de color rojo. Esta forma tan peculiar de ordenarlos va a permitir agrupar al inicio de la secuencia los coeficientes distintos de cero y al final los coeficientes que valen cero. Así pues, la secuencia que transmitiríamos sería la siguiente:
Secuencia resultante: 7,6,-2,0,-1,0,0,1,0,0,0,0,0,0,0,0 |
Elementos de la CAVLC
En la codificación CAVLC se pueden distinguir dos partes diferenciadas:
- La codificación en sí de los valores obtenidos tras la transformación.
- Parámetros auxiliares que permitirán reducir aún más la cantidad de datos que vamos a transmitir.
Debe tenerse en cuenta que CAVLC no no hace uso en ningún momento de los coeficientes de valor cero que quedan agrupados al final de la secuencia. Es por este motivo que puede considerarse que la secuencia que se va a transmitir será en realidad:
Secuencia que considerará el codificador: |
7,6,-2,0,-1,0,0,1 |
Nótese que, en este ejemplo, de entrada nos ahorramos tener que transmitir la mitad de los coeficientes. En general, los parámetros auxiliares están diseñados para intentar transmitir todavía menos coeficientes. Las características que van a intentar explotar son los coeficientes de valor cero que han quedado entre otros coeficientes de valor distinto de cero y los coeficientes de valor 1 y -1.
Número de coeficientes no nulos (N) y número de coeficientes con valor 1 en la cola de la secuencia (T1).
Con estos parámetros se trata de indicar cuántos coeficientes tienen valores distintos de cero y cuántos tienen valor absoluto -ya que los valores adoptados por los coeficientes tras la transformación pueden ser tanto positivos como negativos- igual a uno al final de la secuencia. Este segundo parámetro tiene interés en tanto que es bastante frecuente que tras los coeficientes iniciales haya cierto número de coeficientes cuyos valores se alternan entre 1, -1 y 0. Para el caso del ejemplo N=5 y T1=2.
Información de signo
Para los coeficientes que tengan valor absoluto igual a uno, se codifica su signo con un solo bit, mientras que el signo del resto de coeficientes distintos de cero queda integrado en la codificación que se emplee.
Ahora sólo queda especificar cuántos coeficientes de valor cero hay antes de cada coeficiente de valor distinto de cero. Esto se hace a través de los parámetros Número total de ceros y Run before:
Número total de ceros
Con este parámetro se especifica el número de coeficientes de valor cero que han quedado comprendidos entre valores no nulos. En el ejemplo, el número total de ceros es 3.
Run before
A través de este parámetro se define cómo se distribuye el número total de ceros antes indicado. Así pues, en el ejemplo se establece que antes del último coeficiente de la secuencia hay 2 ceros y antes del penúltimo hay 1 cero. Puesto que especificando estos dos valores ya se ha alcanzado el número total de ceros, ya no es necesario indicar nada más para el resto de coeficientes. Los valores Run before se codifican empleando la técnica VLC.
Codificación del valor de los coeficientes
Finalmente, los valores distintos de cero y de uno se codifican en orden inverso empleando una codificación VLC. El motivo de seguir el orden inverso de codificación al que se muestra en la figura se debe a que es el más adecuado a la estadística que presentan los valores de los coeficientes. Puesto que los coeficientes de tipo T1 sólo pueden valer 1 o -1 sólo se codifica su signo.
Así pues, el primer valor que se codificará será el -2 e irá después de la codificación de +, - que representarán a los coeficientes de valor 1 y -1 respectivamente. Estos dos últimos tendrán además las indicaciones pertinentes del parámetro Run before.
Sabiendo que el número total de coeficientes es 16, será posible reconstruir el bloque por completo empleando los parámetros que se acaban de definir.
Conclusión
Mediante el empleo de la codificación CAVLC se logra explotar la redundancia existente en los coeficientes transformados reduciendo en gran medida el número de datos que deben ser transmitidos, ahorrando ancho de banda o espacio de almacenamiento sin pérdida alguna de información.
Véase también
Referencias
- Wiegand, T; Sullivan, G; Bjøntegaard, G; Luthra, A: "Overview of the H.264/AVC Video Coding Standard", IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, VOL 13., NO. 7, páginas 571 y 572, 2003.