¿Qué es un cubo de datos? Analizamos Google Earth Engine

gee cubo de datos

¿Qué es un cubo de datos y cómo se utiliza para el análisis de big data? Cómo funciona un cubo de datos con datos de teledetección?

Antes de escribir este artículo, nunca había oído hablar de un cubo de datos ni del motor de Google Earth (GEE). Soy un profesional geoespacial de recien titulado y no sé nada de todo este concepto de cubo de datos. Para explorar el tema, he decidido examinar uno que ya está en funcionamiento. Así que acompáñame a echar un vistazo al motor de Google Earth y a cómo funciona y se puede utilizar.

Índice
  1. En términos generales ¿Qué es un cubo de datos?
  2. Google Earth Engine
  3. Cambio global de la cubierta arbórea, un ejemplo real del potencial de GEE

En términos generales ¿Qué es un cubo de datos?

Aunque el concepto de cubo de datos es complejo, intentaré explicarlo de la forma más sencilla posible. En esencia, el término "cubo de datos" se refiere a la idea de que podemos tomar cantidades masivas de datos de teledetección, como Landsat por ejemplo, durante 30 años, y luego apilar los datos en el tiempo para responder a preguntas que de otro modo podrían ser demasiado intensivas en términos de cálculo para un sistema normal. Con un cubo de datos podríamos hacer un análisis del tipo: ¿cómo han cambiado las costas en los últimos 30-40 años?

Estamos hablando de grandes cantidades de datos geográficos a lo largo de mucho tiempo. Se trata de una explicación simplista, pero que todos podemos entender desde el principio. Me ha costado mucho encontrar una definición clara de cubo de datos, así que si alguien tiene una, por favor, que la añada en los comentarios.

Google Earth Engine

Google describe el motor de Google Earth Engine como:

"El motor de Google Earth Engine combina un catálogo de varios petabytes de imágenes de satélite y conjuntos de datos geoespaciales con capacidades de análisis a escala planetaria y lo pone a disposición de científicos, investigadores y desarrolladores para detectar cambios, cartografiar tendencias y cuantificar diferencias en la superficie de la Tierra."

GEE se presentó por primera vez en diciembre de 2010 en la conferencia internacional sobre el cambio climático celebrada en Cancún (México). Google ha creado un vídeo en YouTube en el que se presenta la GEE y que me pareció bastante informativo.

Una de las razones por las que elegí la GEE para explorarla fue que tiene un proceso bastante sencillo para acceder al sistema. Los usuarios pueden solicitar el acceso rellenando un formulario en el sitio web https://earthengine.google.com/signup. No aceptan a todo el mundo, así que no te contengas. No estoy seguro de cómo deciden quién entra o no. El sistema es gratuito para las organizaciones sin ánimo de lucro y con fines educativos, por lo que tu escuela debería poder darte acceso.

Una vez dentro, tú y yo podemos usar el GEE utilizando la interfaz para desarrolladores web que combina la salida de mapas en una ventana para datos geoespaciales a gran escala. Tal y como lo describe Google, se trata de Imágenes de Satélite combinado con sus propios algoritmos para dar aplicaciones al mundo real.

Cambio global de la cubierta arbórea, un ejemplo real del potencial de GEE

Google ha realizado varios estudios de caso que ilustran cómo GEE proporciona soluciones a problemas del mundo real. Uno de ellos es el proyecto Global Tree Cover Change.

cubo de datos google  earth engine cubierta vegetal

El estudio se centró en la extensión, la pérdida y la ganancia de la cobertura arbórea mundial entre 2000 y 2012. Se utilizaron más de 143.000 millones de píxeles de datos Landsat para cubrir un área de estudio de 128,8 millones de km2, excluyendo zonas de la Antártida y algunas islas del Ártico. El objetivo del equipo era cuantificar la dinámica global de la tierra y crearon un mapa temático global de 30 metros de resolución, el primero de este tipo.

Para este proyecto, Google calcula que el procesamiento que realizó GEE en unos pocos días le habría llevado a un solo ordenador 15 años. GEE procesó 20 terapixels de datos Landsat utilizando un millón de horas de CPU en 10.000 ordenadores en paralelo. Como resultado, este estudio determinó que se perdían 2,3 millones de kilómetros cuadrados de bosque y se ganaban 0,8 millones de kilómetros cuadrados. También se determinó que incluso con la reducción de la deforestación en Brasil, la deforestación que también se produce en otros países como Indonesia, Malasia, Tanzania, Angola, Perú y Paraguay está contribuyendo a la pérdida de bosque tropical.

Los investigadores crearon un mapa interactivo que permite al usuario ver los diferentes resultados del estudio. Este estudio de caso ilustra cómo la GEE puede mejorar los procesos y producir soluciones a problemas del mundo real.

Entradas relacionadas de Geotermia

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir