18 de enero de 2013

Desnudando documentos con exiftool

Hoy les quiero recomendar una herramienta que estoy seguro que les va a llamar la atención tanto como a mi. Se trata de un programa desarrollado en Perl llamado exiftool y que tiene la particularidad de leer y escribir metadatos en muchos de los formatos especificados de archivos.



Hace muy poco les presenté extract otro excelente comando para Linux con cualidades similares, pero exiftool sin nos muestra mucha más información oculta en los archivos de imágenes, documentos de ofimáticas, pdf, etc.

Lo primero que vamos a hacer es instalar la herramienta de la siguiente manera:

$ apt-get install libimage-exiftool-perl

con lo cuál al cabo de unos minutos ya vamos a tener nuestra herramienta instalada y lista para comenzar a utilizarla.


Para obtener más información de como hacer uso de sus opciones y flags visiten las páginas de su manual.

$ man exiftool

En esta documentación están especificada cuales formatos pueden leer los metadatos y cuáles se pueden setear con el fin de actualizar o eliminar los metadatos originales.

Visto esto, ya podemos comenzar a jugar con exiftool para recopilar toda la información en los metadatos de los archivos.

Seguramente de este post podríamos hacer más comentarios y review que les prometo ir publicando como sacar partido de esta herramienta pero como primer ejercicio les propongo que extraigan la información de archivos odt, doc, docx, xls y jpg

$ exiftoll -all < archivo | archivo >

Comiencen a familiarizarse con los campos que esconden estos metadatos que luego lo vamos a utilizar para analizar estos datos.

Saludos!

No hay comentarios.:

Publicar un comentario

Entradas populares