miércoles, 10 de octubre de 2012

¿Qué son los metadatos?


Los metadatos (metadata) son campos de texto que van incrustados en casi todos los tipos de ficheros que añaden información adicional como la fecha de creación, resolución, tamaño, fecha de modificación, autor, etc.
Estos metadatos a menudo plantean riesgos de seguridad, porque quizá estemos dando información sensible como nombres, teléfonos, direcciones de correo o rutas a personas malintencionadas.  Esto es muy común si publicamos, compartimos o enviamos archivos a través de Internet.
Por eso conviene dar un repaso a los metadatos que estamos compartiendo, o quizá obtenerlos para realizar tareas de ordenación o clasificación de ficheros. Para estas tareas contamos con la excentente librería libextractor:
$ sudo aptitude install extract
Tras esto podemos extraer los metadatos de multitud de ficheros, entre los que se incluyen los rpm, deb, png, doc, odf, xls, ppt, html, pdf, ps, flac, mp3, ogg, wav, jpg, tif, tar, zip, flv, mpg…
Ejemplo de metadatos obtenidos de un fichero de Word (.doc):
mimetype - application/msword
language - U.S. English
paragraph count - 11
line count - 40
title - SUMMARY
word count - 858
page count - 2
creator - Sales Account Company, S.L.
date - 2008-01-17T13:04:00Z
character count - 4891
generator - Microsoft Office Word
last saved by - cpsmith
creation date - 2008-01-10T10:31:00Z
template - Normal
Ejemplo de metadatos de un fichero PDF:
$ extract libacount.pdf
format - PDF 1.4
mimetype - application/pdf
Ejemplo de metadatos de un fichero ODT:
$ extract documento.odt
date - 2009-02-28T14:15:50
creation date - 2009-02-11T20:37:02
page count - 1
software - OpenOffice.org/3.0$Linux OpenOffice.org_project/300m15$Build-9379
mimetype - application/vnd.oasis.opendocument.text
Ejemplo de extracción de metadatos de un JPG obtenido por una cámara digital (Exif):
$ extract IMG01283.jpg
metering mode - Matrix
exposure mode - Auto
iso speed - 125
focal length - 5.8 mm
flash - Yes, auto, red-eye reduction, return light not detected
exposure bias - 0
aperture - F4.5
exposure - 1/640 s
date - 2009:04:02 12:10:06
orientation - top, left
camera model - DSC-T100
camera make - SONY
size - 3264x2448
mimetype - image/jpeg
También es posible obtener los metadatos en una sola línea, esto es útil si queremos realizar búsquedas entre los metadatos con grep:
$ extract -g *.jpg | grep SONY

No hay comentarios:

Publicar un comentario