Eligiendo un buen compresor
Introducción
Tarde o temprano todos los que nos “movemos” en el mundo de las computadoras nos
vemos en la necesidad de utilizar un programa para comprimir o compresor. Éste consiste en un
programa que aplica ciertos algoritmos con el fin de que determinado archivo ocupe menos espacio.
Al parecer hoy en día no tendrían ninguna utilidad dada la existencia de los gigantescos discos
duros, sin olvidarnos de las memorias flash USB (que cada vez crecen más) y los discos duros
portátiles, pero hay un elemento que todos utilizamos de manera rutinaria: Internet. Internet es una
gigantesca red y si necesitamos enviar información a través de ella lo mejor es comprimirla, de esta
manera se envía la misma cantidad de información pero en menos tiempo: por ejemplo una hoja de
cálculo con datos meteorológicos que ocupa 1 MB puede ser comprimida a 500 KB. Ni que decir de
las memorias flash USB de menor capacidad (inferior a 512 MB) que lejos de desaparecer se les
puede exprimir un poco más si solo nos dedicamos a guardar en ellas (respaldar) documentos de
texto u hojas de cálculo comprimidas.
En el mercado actual existen multitud de programas para comprimir, algunos de ellas son
gratuitos (freeware o software libre), la gran mayoría son de paga (shareware) e incluso uno ya
viene incluido en el sistema operativo Windows a partir de la versión ME. Recuerden que no hay
que pensar que porque un programa sea gratuito es sinónimo de mala calidad, siempre es preferible
utilizar uno gratuito que haga bien su trabajo (aunque su interfaz sea algo feita) que “piratear” uno
de marca propietaria. Sean de paga, gratuitos o incluidos en el sistema operativo todos tienen algo
en común: todos son capaces de comprimir/descomprimir en el formato zip y el número de
formatos que es capaz de descomprimir siempre es mayor al número de formatos que es capaz de
comprimir.
Nota MundoPC.NET:
Recuerda que puedes conseguir compresores/descompresores gratuitos y un montón de utilidades relacionadas en nuestra sección Freeware (programas gratis).
Zip es el estándar al momento de comprimir información y puede ser utilizado en
cualquier sistema operativo sin ningún problema. Obviamente los compresores también tienen su
formato nativo de compresión que por lo regular brindan una mejor tasa de compresión que zip. El
problema de estos formatos nativos de compresión es que no todos los programas son capaces de
abrirlos.
Objetivo
El objetivo de este artículo es probar un grupo de compresores utilizando su formato nativo
para comprobar cuál es que brinda la mejor tasa de compresión. Los elegidos son los ya clásicos:
WinZip 10.0 (http://www.winzip.com/), WinAce 2.2 (http://www.winace.com) y WinRar 3.51
(http://winrar.com.es) en sus versiones shareware y Carpetas comprimidas que está incluido en
Windows ME y XP. Este último solo comprime y descomprime en formato zip.
Metodología
Se va a tomar un conjunto de 333 archivos en formato rtf sin ningún tipo de imágenes y a
partir de ellos se va a construir una tabla de frecuencias para darle al lector una vista resumida del
tamaño de los archivos antes de comprimirlos. Posteriormente se les va a comprimir con el formato
nativo de cada compresor: zip corresponde a WinZip y Carpetas comprimidas, ace a WinAce y rar a
WinRar con las opciones de compresión máxima activadas en todos los programas y si presentan la
opción de agregar un registro de recuperación (que permite reparar un archivo dañado) también va a
estar activado al momento de comprimir. Toda esta información va a ser vaciada en una hoja de
cálculo para darle un tratamiento estadístico y así tener una mejor comprensión de que tan bien
comprimen. Los parámetros estadísticos a tener en cuenta son:
- Número de muestras (archivos).
- Promedio de compresión (porcentaje).
- Compresión mínima (porcentaje).
- Compresión máxima (porcentaje).
- Desviación estándar poblacional (porcentaje). Nos indica que tanto se desvían los datos de
forma general por arriba y por abajo del promedio, entre más pequeña sea la desviación
estándar quiere decir que la compresión de los archivos es más uniforme.
- Tamaño del archivo antes de comprimir (MB).
- Tamaño del archivo después de aplicar la compresión (MB).
Toda esta información la incluyo en dos hojas de cálculo con los nombres de Anexo A y
Anexo B. Anexo A corresponde a la hoja de cálculo Calc de OpenOffice.org, mientras que Anexo B
es la hoja de cálculo de MS Excel.
Descargar Anexo A
Descargar Anexco B
Debido a que hubo un cambio en el formato nativo de
OpenOffice.org a partir de la versión 2.0 (la que utilizo actualmente) la hoja de Calc se presenta con
la extensión sxc (el formato nuevo es ods para Calc 2.0) para los usuarios que sus distribuciones
GNU/Linux presenten una versión de OpenOffice.org anterior a la 2.0 puedan examinar mi trabajo
sin ningún tipo de problemas. Por cierto, este mismo archivo lo pueden abrir sin problemas los
usuarios de Windows que tengan OpenOffice.org instalado.
Se decidió usar el formato rtf debido a que es un formato que puede verse desde cualquier
procesador de textos sin ningún problema y en cualquier sistema operativo. Para los usuarios de
Windows no necesitan de MS Word para abrir archivos rtf, solo necesitas WordPad que se instala
junto con el sistema operativo. Para los usuarios de GNU/Linux que utilizan suites de oficina que
no puedan abrir ni guardar archivos doc deberían de utilizar el formato rtf.
Ahora bien, ¿porqué utilice 333 archivos? Por nada en especial, solo los tomé al azar aunque
pude haber escogido 230 ó 100 ó 278 archivos.
Desarrollo
Antes de empezar con el tratamiento estadístico sería conveniente que el lector viera la hoja
de cálculo para que se forme una idea de la información que voy a explicar. Recuerden que Anexo
A es para lo usuarios de OpenOffice.org y Anexo B para los de MS Excel. Una vez abierta la más
conveniente se darán cuenta de que esta formada por tres hojas de trabajo:
- Tabla de frecuencias: aquí esta vaciada toda la información concerniente a los archivos que
van a ser comprimidos. En Tamaño de los archivos van a encontrar los archivos divididos en
intervalos de tamaño (por ejemplo 3 – 8 KB), en Número de archivos dará el número de
archivos que corresponden a ese intervalo y Porcentaje de archivos nos avisa el porcentaje
de determinado intervalo. Por ejemplo el intervalo de 3 – 8 KB contiene 111 archivos y por
tanto ocupan un 33.33 % de la totalidad de los archivos. En Número de archivos acumulados
y Porcentaje de archivos acumulados van a obtener, respectivamente, el número de archivos
y porcentaje de la suma de los intervalos anteriores. Por ejemplo el intervalo 3 tiene 286
archivos correspondientes a la sumatoria del intervalo 1 (111), 2 (286) y 3 (49) y la misma
lógica rige para el Porcentaje de archivos acumulados.
- Tasa de compresión: es la parte más “ruda” del trabajo y en donde se puede observar con
lujo de detalles el tamaño de los archivos utilizados. También podrán encontrar el porcentaje
de compresión de cada uno de los programas analizados para cada uno de los 333 archivos.
Como ya se habrán dado cuenta en la columna WinRar no aparece nada esto es debido a que
este programa solo ofrece información del porcentaje general y no individual como sucede
con los otros programas (o al menos yo no pude hallar una opción para que mostrara
información más detallada), a excepción de Carpetas comprimidas. Entre más grande sea la
tasa de compresión quiere decir que el archivo se halla más comprimido y por tanto
ocupando menos espacio. Como también ya se habrán dado cuenta extrañamente todos los
archivos tienen un tamaño exacto en vez de uno fraccionado que es lo más común, esto es
debido a que utilice la Vista de archivos en modo Detalle que redondea el tamaño de los
archivos.
- Estadísticas: es la parte ya digerida de toda la información que se mostró en la hoja Tasa de
compresión y por tanto la de mayor interés para todos.
Ustedes perdonaran lo burdo de la presentación de la hoja de cálculo pero es que no soy muy
ducho embelleciéndolas.
Página siguiente
|