Hace hoy 66 días desde que la comunidad científica recibió una inundación de datos sin parangón en la historia. El pasado 14 de Septiembre, la Agencia Europea del Espacio publicó el primer catálogo estelar de la sonda espacial GAIA. Un catálogo que tiene información del 1% de las estrellas de la galaxia. Un 1% puede parecer poco, pero traducido a cantidades absolutas supone la friolera de más de 1142 millones de estrellas. Este catálogo es el sucesor del Tycho y del Hipparcos. El Hipparcos contenía más de 118000 estrellas, las dos versiones del Tycho contenían 1 millón y 2 millones y medio de estrellas respectivamente. Así que el de GAIA supone tres órdenes de magnitud más en esta carrera de tener el mapa más completo de la galaxia.
Pero esta inundación de datos ha sido distinta no solo por la cantidad, la calidad de los datos también se ha mejorado enormemente y también en la forma de distribución de los datos. Desde el 14 de Septiembre estos datos están disponibles para toda la comunidad científica de forma completa, libre e inmediata gracias a su publicación en Internet.

gaia

Este primer catálogo es el producto de los tres primeros años de trabajo de los instrumentos de la sonda y se recopilan datos de posición, paralaje, movimiento propio y fotometría de 1142679769 estrellas. De momento la fotometría está solo en banda g, pero en sucesivos catálogos se completarán la fotometría en otras 4 bandas más (u, r, i y z) ademas de incluir la espectrometría de banda estrecha.
El gran trabajo que queda por delante es hacer ciencia con los datos suministrados por GAIA. Eso no es tarea fácil, serán aproximadamente 2 Pbytes de datos que permitirían los grandes objetivos de la misión:

  • Crear el mapa tridimensional dinámico de nuestra galaxia más detallado hasta la fecha
  • Mejorar la compresión de la estructura estelar y su evolución
  • Ampliar el catálogo de cuerpos menores hasta la magnitud 20, especialmente los NEO’s
  • Se estima que se podrán descubrir cientos de nuevos exoplanetas mediante la técnica de tránsitos planetarios y cambios en la velocidad radial

Serán necesarios técnicas de minería de datos para extraer ciencia de estos datos en bruto, lo que también desarrollará esta disciplina de la informática, con nuevos algoritmos, filtros y herramientas.

Los archivos de GAIA están disponibles desde varias plataformas y en varios formatos, por ejemplo

En este periodo desde que se publicaron los datos en bruto ya han aparecido otros catálogos derivados de datos filtrados, como el de estrellas variables globales detectadas (3194 estrellas), variables cefeidas (599 estrellas), variables RR Lyrae (2595 estrellas), y Cuásares (2191)

Estos datos del catálogo DR1 necesitán años de tratamiento por toda la comunidad científica para extraer conocimiento. Mientras GAIA seguirá su ritmo de envío de datos a la Tierra de 5 Mb/s durante ocho horas diarias hasta el 2020. Un legado impresionante que debemos aprovechar.
Manos a la obra…..