Você está na página 1de 1

Esquema de compresin para transmisin

segura de datos
Teora de la informacin y mtodos de codificacin
M.C Said Zamora
Participantes:
Constantino Mora Martnez
Vctor Emanuel Ros Martnez
Daniel Alejandro Domnguez
Meza

INTROD
UCCIN

La compresin de datos es el proceso mediante en el cual la informacin es codificada usando menos cantidad de bits que la representacin original sin codificar. El componente unido a este proceso es
el algoritmo decodificador que reconstruye el mensaje original o una aproximacin a partir de la versin ya comprimida.
La encriptacin es el proceso mediante el cual se codifican los mensajes para hacerlos no- legibles por un intruso web. Por lo tanto, en la mayora de los casos, se utiliza encriptacin despus de la
compresin.
Antes de aplicar algn tipo de algoritmo de compresin se realiza un preprocesamiento en el archivo fuente. La transformacin est diseada para hacer ms fcil la compresin. Generalmente se utiliza
codificacin basada en diccionario para este tipo de transformacin de procesamiento del texto fuente. El diccionario se crea a partir de las palabras ms comunes en el texto. El diccionario debe ser
preparado con anticipacin y debe ser conocido por la fuente y el destinatario. Cada palabra en el diccionario tiene que ser reemplazada por un carcter ASCII. El multidiccionario incrementa la velocidad
de codificacin y decodificacin, porque el acceso a las palabras es muy fcil y rpido. Por otra parte, la codificacin basada en diccionario es dbil y vulnerable a ataques, pero la encriptacin basada en
diccionario proporciona la seguridad requerida.

METODOLOGA

Los cuatro pasos principales de esta tcnica son compresin basada en multi--diccionario,
compresin basada en BWT con RLE, algoritmo de encriptacin basado en arreglo reducido y
compresin basada en proceso de codificacin Huffman. Las palabras son extradas de los
archivos de entrada y formadas como entradas de diccionario.

Multi-diccionario
Las palabras son extradas de los archivos de entrada y ordenadas como entradas de
diccionario basado en el cdigo ASCII. Este mtodo multidiccionario incrementa la velocidad de
codificacin y decodificacin.Los cdigos ms cortos son asignados a las palabras ms
frecuentemente usadas. Los cdigos ms largos son asignados a las palabras menos usadas.

Algoritmo de codificacin
Transformada de Burrows-Wheeler y Run-Length Encoding
Los archivos de entrada son codificados (en caracteres ASCII) usando la compresin basada en
multi-diccionarios. Este cdigo es la entrada al BWT. La salida de BWT es proporcionada como
entrada al RLE. RLE es un algoritmo de compresin simple en el cual secuencias de caracteres
con el mismo valor consecutivo son guardados como un solo valor con su respectivo nmero de
repeticiones antecediendo al carcter.

RESULTADOS

En el estado actual del proyecto hemos obtenido un buen radio de compresin, el tamao de un
mensaje se puede reducir ms de tres veces, dependiendo del mensaje, del nmero de palabras
Seen
tiene
objetivo que el juego sea lo mejor posible dejando atrs los detalles que
repetidas
todocomo
el texto.
causan una mala imagen.
Esperamos que an con el texto cifrado el tamao del mensaje no incremente y que, por el
Uno
de los detalles
principales
es el problema que cuando un jugador es atacado puede
contrario,
el tamao
sea reducido
an ms.
volver a colocar una nueva coordenada en el lugar ya atacado, esto se puede arreglar
bloqueando
la matrizgrandes
de posicin
una
vez posicionadas
las de
piezas
correspondientes
Con textos
suficientemente
hemos
comprobado
la eficacia
utilizar
en conjunto los para
cada
nivel.
mtodos BWT y RLE despus del diccionario.
Otro detalle en el que se tiene que trabajar es que al momento de atacar un nivel y este se
Implementacin

encuentra vaco pero debajo de este (misma posicin distinto nivel) se encuentra algn
otra pieza esta debe de ser afectada por el ataque ya que se supone que el ataque va de
Texto original:
una manera
vertical cayendo
hasta tocar
algn
blanco.
Sistema
de Transmisin
de compresin
segura
depunto
datos:
En este proyecto se implementa un
algoritmo de compresin con encriptacin y compresin (CEC). Este algoritmo inicialmente
Tambin
tiene para
que checar
la posicin
las piezas
donde los barcos
y aviones y
comprime
lossedatos
reducir losudelongitud.
Losdedatos
ya comprimidos
son encriptados
pueden
estar
vertical
o
horizontalmente,
los
submarinos
pueden
colocarse
de tres
despus nuevamente comprimidos usando un nuevo algoritmo de compresin sin comprometer
maneras
posibles
(vertical
,horizontal
y
de
una
forma
inclinada).
la eficiencia de compresin y la seguridad de la informacin.
Se estima que el proyecto pueda estar terminado superando estos detalles.

Algoritmo de encriptacin y compresin de Begum-Venkataramani


La salida de la codificacin run-length es dada como entrada al algoritmo de encriptacin con
compresin. En los algoritmos de encriptacin generales, el texto plano es convertido en texto
cifrado con el mismo tamao o ms grande. Este algoritmo no slo ha hecho la encriptacin,
tambin ha reducido el tamao del arreglo de entrada por 3 veces.
Codificacin de Huffman
La salida cifrada del algoritmo anterior es pasada al codificador de Huffman para compresin
adicional. El cdigo de Huffman es generado usando un rbol binario.
El cdigo de Huffman est basado en dos observaciones primordiales:
1) Los smbolos que ocurren con ms frecuencia tendrn cdigos ms cortos que los smbolos
que ocurren menos frecuentemente.
2) Los dos smbolos que ocurren menos frecuentemente tendrn la misma longitud.

Algoritmo de decodificacin
Los datos desencriptados son proporcionados al decodificador de RLE y posteriormente al
procedimiento inverso de BWT. De esta forma, el string vuelve al estado original antes de aplicar
RLE y el BWT puede devolver el valor despus de haber aplicado el diccionario para
codificacin la primera vez. El diccionario es obtenido desde el mensaje y se utiliza para
regresar el resto del mensaje a su estado original.

Figura 3. Salida de la ejecucin del programa CEC.


Texto codificado:
6 ! > ! " C ! 2 B ) G H F ' $ ! " I * % " 8A$ + @ 4 ( : D E 1 - ( < & , . % ? 7 & / ' = $ ! " 9 3 # 5 ! " % # ;
!#0
BWT:
05$>$;C6!%!!!!3%='A*".<7F/4-BI$&1,&#E!9@#?""(#('!%+82":DH)G"
RLE:
110151$1>1$1;1C161!1%4!131%1=1'1A1*1"1.1<171F1/141-1B1I1$1&111,1&1#1E1!191@1#1?2"1
(1#1(1'1!1%1+18121"1:1D1H1)1G1"40 1
Tamao del texto original: 423 Bytes
Tamao del texto comprimido: 119 Bytes
Radio de compresin: 3.5546
Tiempo de ejecucin: 0.00287103652954
segundos

El texto original recuperado:


Sistema de Transmisin de compresin segura de datos: En este proyecto se implementa un
algoritmo de compresin con encriptacin y compresin (CEC). Este algoritmo inicialmente
comprime los datos para reducir su longitud. Los datos ya comprimidos son encriptados y
despus nuevamente comprimidos usando un nuevo algoritmo de compresin sin comprometer
la eficiencia de compresin y la seguridad de la informacin.
Figura 1. Diagrama de bloques del algoritmo CEC.

DISCUSIN

CONCLUSIONES

El proyecto an se encuentra en desarrollo, sobre todo en las secciones de cifrado con el nuevo
algoritmo y en la creacin de sus claves para la encriptacin.

La compresin es parte de nuestra vida cotidiana, es muy til al transmitir datos ya que es
importante hacerlo de la forma ms rpida posible y entre ms pequea sea la longitud de los
datos, ms rpida es la transmisin total, pero es de suma importancia hacerlo sin dejar a un lado
la seguridad.

Uno de los puntos clave de la implementacin de los algoritmos de compresin y cifrado


utilizados, es el tiempo que toma el cifrado con compresin, y posteriormente, la descompresin
y descifrado. Por ahora, el tiempo se ha mantenido bajo, sin embargo, esperamos que despus
de la implementacin de los algoritmos restantes el tiempo se incremente considerablemente.
Un escrito de 423 bytes con radio de compresin poco mayor a 3.55 logra un tiempo
aproximado de 0.002871 segundos desde la codificacin por diccionario hasta su decodificacin
al texto original (sin contar el tiempo requerido para su transmisin).

El algoritmo CEC provee mejores resultados que otros algoritmos debido a que tiene un
rendimiento muy viable y porque alcanza un radio de compresin muy alto tras codificar y
comprimir al mismo tiempo. Sin embargo, el radio de compresin depende del nmero de palabras
en el archivo, tamao del archivo, y las frecuencias y distribucin de las palabras dentro del
archivo.
En este proyecto hemos implementado hasta el momento la compresin y descompresin por
multi-diccionario, seguido por BWT y RLE. El enfoque de este proyecto es asegurar el mensaje
usando la tcnica CEC, pero contemplamos para trabajo futuro, encriptar usando el nuevo
algoritmo de encriptacin Begum--Venkataramani basado en arreglo reducido, seguido por
codificacin Huffman. Adems, como segunda fase del proyecto, trabajar con el rendimiento en
archivos multimedia para mejor diversidad en su implementacin.

BIBLIOGRAFA
[1] Begum, M., & Venkataramani, Y. (n.d.). A New Compression Scheme for Secure Transmission. International Journal of Automation and Computing Int. J. Autom. Comput., 578-586 [2]
Hankerson, D., Harris, G., & Johnson, P. (2003). Introduction to Information Theory and Data Compression, Second Edition (Second Edition ed., p. 384). Chapman and Hall/CRC. [3] K.
Sayood. Introduction to Data Compression, 2nd ed., San Francisco: Morgan Kaufmann Publishers, pp. 3961, 149-154, 2000