El Big Data es el último eslabón para predecir las condiciones climáticas. Alrededor del mundo, miles de empresas, centros científicos, instituciones, etc., están usando el Big Data para encontrar patrones allí dónde se encuentren, los datos masivos. En meteorología, ciencia que también tiene una enorme e ingente cantidad de datos, tiene también sus útiles aplicaciones el Big Data. Ésta moderna y poderosa herramienta, puede usarse de múltiples formas. A pesar de ser nombrada como una sola cosa, puede lograr muchas predicciones diferentes según lo que se busque. Cómo no, ha llegado también a la meteorología, y aquí os vamos a contar qué es lo que hace y cómo.
Antes de nada, vamos a recordar que anticiparse al tiempo ha sido desde siempre una de las necesidades primarias del ser humano. Hace miles de años, las previsiones meteorológicas cobraban mucha importancia, incluso más que hoy, para la supervivencia. El desarrollo tecnológico no era tan puntero, cualquier inestabilidad podía acarrear graves consecuencias. Aunque existió siempre esa necesidad de prevenir el tiempo, no fue hasta la llegada de Aristóteles, que podemos acuñar el término meteorología. Él lo llamó “meteorológica”, nombre que le puso a su libro, alrededor del año 340 a.C.
Big Data en las previsiones
La lógica del comportamiento atmosférico, no ha dejado de desarrollarse desde entonces. Cada vez más rápido. Pasando por el termómetro que Galileo inventó en el 1607, hasta las simulaciones por ordenador a partir de los datos recopilados por los satélites. Ahora mismo, nos encontramos con el Big Data, muchos coinciden en que es la herramienta más revolucionaria desde que existe internet y no es para menos. Cómo si un futuro de ciencia ficción se tratara, hoy podemos decir que es real.
Cómo hemos comentado, el Big Data empieza a encargarse hoy, de dar ese otro punto de mira a los meteorólogos. Allí donde no podían llegar, o creían estar en lo cierto sin estarlo, los datos masivos les muestra aquello que permanecía escondido o desapercibido, además con un nivel de precisión jamás alcanzado. Hay empresas que ofrecen ya hoy en día estos servicios. Instituciones, gobiernos y empresas, que hacen uso del big data para anticipar el clima. ¿Pero cómo es todo éste proceso? ¿Cómo se lleva a cabo? ¿Cómo nos beneficiamos? A continuación vamos a ver y a entender cómo todo este proceso de innovación tecnológica es posible.
¿Cómo funciona el Big Data?
A groso modo, el Big Data deja más de lado el mirar el cielo para centrarse en los datos, y que sean procesados de forma correcta. Para que podáis entender más en su magnitud la implicación con la meteorología, antes hay que explicar cómo funciona.
El Big Data, tiene su núcleo de funcionamiento en lo que se llama las 4 V’s.
Volumen
Esto significa la cantidad de datos. Toda esta cantidad de datos recogidos es lo que se conoce como el volumen. Puede variar depende a lo que se aplique, a veces tenemos muchos datos y otras veces “menos”. Es decir, podemos ir desde 1.000 millones de datos a varios billones, dependiendo del que se analice.
Velocidad
Es decir, el ritmo al que se generan los datos. Vienen de la necesidad de capturarlos, almacenarlos y poder procesarlos. Cuántas más capturas de datos hay, más rápido se almacenan, más hay que analizar. La velocidad cobra en las previsiones meteorológicas una doble importancia, ya que los sucesos van ocurriendo en tiempo real, y deben de ser procesados lo antes posible.
Variedad
A veces se tiene un formato de cómo vienen esos datos, otras veces otros. Cada tipo de dato tiene su propia clasificación. Otras veces faltan algunos (hay técnicas para reparar esto, o los errores serían enormes) y otras vienen en formas de video incluso. Hay una masa de datos muy diferentes, que en el Big Data se encarga de ponerles un orden, una lógica para ser bien analizada. Por ejemplo, «no se puede» poner en el mismo paquete las mediciones de temperatura de un termómetro que las mediciones por satélite de un frente.
Veracidad
Relacionado con el paréntesis del punto anterior. Significa que los datos vengan finalmente limpios, sin cosas “raras”. Los equipos gestores del Big Data, deben contar con un equipo imparcial capacitado para mantener una buena estructura. Las consecuencias de una mala veracidad de los datos tiene efectos muy negativos. Para hacernos una idea, sería como si un grupo de mecánicos da por finalizado el arreglo de un coche, y se han olvidado atornillar dos ruedas.
Ejemplo sobre la veracidad de los datos
Tenemos muchos registros de muchas zonas. Imaginemos que tenemos temperaturas, índices de humedad, vientos, etc. Pero, tenemos un fallo, y nos faltan algunos registros de temperatura de alguna zona, por el motivo que sea, y no podemos acceder a saber qué temperatura se ha registrado. Tenemos un total de 30 datos, y dos de ellos, sin temperatura finalmente.
Lo que se podría hacer por ejemplo, es calcular la temperatura media de esas regiones para determinar con precisión la temperatura posible con la que se puede contar en el registro faltante, pero además, con unos márgenes de error muy pequeños. Los valores son repuestos, y entonces puede llevarse el cálculo a la práctica. De haber faltado esos datos, los ordenadores no lo hubiesen reconocido, creando un agujero negro en los datos, y unas predicciones totalmente erróneas.
¿Cómo se consigue?
En meteorología, igual que en cualquier campo, los datos vienen en forma de variables. Es decir, cada una es procesada en la forma que le pertenece. Y aunque parezca muy enrevesado y complicado todo, la tarea se vuelve «fácil» para los analistas de Big Data. Las variables que podemos registrar en meteorología, aunque no dejan de ser datos, pueden pertenecer a familias diferentes. Es decir, una variable es cualquier dato que pueda ser clasificado, pero no siempre son iguales.
La imagen superior, facilitada por la NASA, muestra el ejemplo de las corrientes alrededor del planeta. En el caso de la NASA, cuentan con una gran cantidad de satélites que les permite observar y medir en tiempo real los fenómenos de alrededor del globo.
El Big Data puede leer todo rastro que deje algo sobre algo, y que puede ser considerado un dato. Muchos al pensar en Big Data, rápido pensaran en cuándo usamos los móviles, navegamos por internet, hacemos click a una página, compramos un artículo online, o le damos a “me gusta” en Facebook. Eso es sólo una “pequeña” pero densa parte, eso sí, es muy fiable y bien codificada. Pero a su vez, dejamos un rastro físico/virtual, como la localización GPS de dónde estamos, gracias a los teléfonos móviles. Aquí ya empezamos a mezclar el mundo virtual con el físico. Y cómo no, movimientos físicos, compras físicas, según la edad, qué elegimos, todo esto es archivado siempre, y por supuesto, puede traducirse en más y más datos.
Las variables pueden ser categóricas
Las variables categóricas son aquellas que representan valores o variables limitadas que no necesariamente significan una magnitud concreta. Representan la cualidad de algo que describen. Básicamente su particularidad es la limitación de lo que representan. Se pueden clasificar en dos campos.
Variables categóricas nominales
Son aquellas que representan cosas de un mismo campo sin una conexión lógica entre si. Por ejemplo: El nombre de las regiones que indican de dónde son los registros, como la ciudad, comunidad autónoma, un código postal, etc.
Variables categóricas ordinales
Son aquellas que pueden representar la magnitud de algo, como por ejemplo la escala de Douglas en el nivel de oleaje, el nivel de la escala con la que pueden ser clasificados los tornados según su magnitud, etc.
Las variables pueden ser numéricas
Las variables numéricas son aquellas que representan valores o variables dentro de una magnitud y pueden ser medibles. Representan valores cuantitativos. Su particularidad es que pueden representar un abanico de mediciones muy grande en los fenómenos meteorológicos. Se clasifican de dos maneras
Variables numéricas continuas
Las variables continuas son aquellas que se encargan de la medición de algo establecido. Ejemplos de ellas serían el índice de humedad, temperatura, velocidad del viento, cantidad de lluvia caída, etc.
Variables numéricas discretas
Éstas son las que llevan el recuento de algo establecido. Es decir, el número de veces que ha llovido en un año en una región, las veces que ha nevado, etc.
Todas las variables son procesadas
Una vez clasificadas todas las variables, éstas son procesadas gracias a los ordenadores, siempre supervisadas por los analistas de Big Data. Hasta hace pocos años, la cantidad de datos con la que se contaba, a pesar de ser un número muy grande, no había problemas para ser analizados por analistas de datos. El análisis de Big Data sin embargo se encarga del análisis de estos datos masivos, donde los procesos de análisis que han sido comunes hasta hoy, tardarían mucho tiempo (hablamos incluso de días) en dar una respuesta. No sólo eso, el Big Data es más eficaz y preciso, al «jugar» con las variables entre ellas.
Todo ello origina lo que anteriormente hemos comentado de las 4 V’s del Big Data, consiguiendo una rapidez, fiabilidad y unos modelos meteorológicos que dan unos pronósticos increíblemente acertados en un lapso de tiempo súper reducido.
El Big Data cómo disciplina naciente
Un buen ejemplo sería hablar de la empresa ACCIONA, que cuenta con un Centro de Control de Energías Renovables (CECOER). Es el centro más grande del mundo dónde el objetivo es dar soluciones en tiempo real, de los millones de datos que son recopilados de sus instalaciones, tanto de biomasa, energía eólica y solar. Produce unas 3000 programaciones anuales que toman todos esos datos para ajustarse a la demanda requerida. Otra ventaja del CECOER es la recepción de incidencias que tienen de sus instalaciones, así pues el 50% de ellas son solventadas de forma remota. El 50% restante son arregladas físicamente por los operarios. De esta manera, Acciona consigue que su energía renovable, más que ser una energía alternativa, sea a día de hoy una solución.
Otro dato a destacar del Big Data en la actualidad es la escasez de científicos de datos. Es un campo naciente, y eso ha topado con ciertos estándares preconcebidos. ¿Realmente el Big Data puede ayudar tanto en la evolución de las previsiones, reportar beneficios a empresas, ser capaz de anticipar tantas cosas y justificar el costo que tiene el análisis de datos masivos? Sí. Pero es algo que se ha ido viendo poco a poco. La creciente demanda de científicos de datos ha ido paralela a los resultados y al entender de la necesidad de ellos en todos los lugares. Es cierto que ya hay muchos equipos de Big Data trabajando, con resultados espectaculares, pero es justo ahora dónde nos encontramos con que hay una mayor demanda. Los analistas Big Data están siendo muy muy buscados.
En consecuencia, estamos viviendo la revolución que éstos implican en el desarrollo, pero desde su principio. Cómo toda industria, estamos presenciando ahora su potencial, pero no se ha desarrollado al máximo, esto es algo que el tiempo nos depara. Una cosa ya es evidente, su potencial actual, la otra, hasta dónde podrá llegar. Sus resultados no nos dejarán indiferentes.
The Weather Company, de IBM, es una compañía privada que ofrece hasta 26 millones de pronósticos diarios sobre el clima. IBM desde el principio ha destacado, también junto a Google, por ser una de las compañías más pioneras en el campo. The Weather Company está sumamente comprometida con la gente, para que tomen decisiones informadas sobre el clima. Constituye la red más grande del mundo de estaciones meteorológicas personales. Las mayores marcas del mundo en aviación, energía, seguros, medios de comunicación y gobierno dependen de The Weather Company para datos, plataformas tecnológicas y servicios.
Big Data contra el Cambio Climático
United Nations Global Pulse, una iniciativa en big data de las Naciones Unidas y Western Digital Corporation, han firmado una alianza para luchar juntos contra el cambio climático. Éste proyecto liderado por la ONU y Western Digital Corp., reúnen a científicos de todo el mundo de innovación digital para atacar el problema de una manera más eficiente. Entre ellos, encontramos colaboradores por parte de sectores muy dispares entre ellos. BBVA, Orange, Planet, Plume Labs, Nielsen,Schneider Electric, Waze… son algunos de los que participan en éste proyecto.
También encontramos el Barcelona Supercomputing Center (BSC), se trata del 4º modelo de la serie MareNostrum. Un superordenador para el análisis de Big Data clave en muchos campos, entre ellos también se encuentra la lucha para el Cambio Climático. Se puso en funcionamiento a finales de junio de este 2017. Es la tercera computadora más rápida de Europa, en ella se ha realizado una inversión para su instalación de 34 millones de euros por parte del Ministerio de Economía, Industria y Competitividad de España. Cuenta con una capacidad de 14 Petabytes, es decir, 14 millones de Gigabytes. Llega a los 11,1 Petaflops, es decir, la barbaridad de 11.100 billones de operaciones por segundo.
El Big Data en el futuro de la meteorología y en nuestras vidas
En un mundo cambiante, dónde cada vez los cambios son más rápidos, y cada vez más sorprendentes, es difícil predecir el futuro de algo. Lo que sabemos con certeza es que el Big Data ha venido para quedarse, y que las previsiones que hace tanto meteorológicas como en otros ámbitos nos dejan perplejos. Algunos seguirán siendo escépticos, otros lo negarán, otros lo verán como algo muy lejano. Pero lo cierto es, que ya estamos viviendo con ello.
A día de hoy sabemos que el Big Data anticipa muchas lluvias, épocas de huracanes, también incluso con mucha precisión el número de medallas que un país puede ganar en los Juegos Olímpicos. También anticipa ya quién, dónde y cuándo se va a cometer un crimen (si alguno ha visto la película de «Minority Report» se le ha pasado por la cabeza, ¿verdad?). El Big Data está rápidamente dirigiéndose a anticipar el futuro de muchos ámbitos, y es que hasta Amazon lo comienza a anticipar, y recientemente ha comenzado a hacer envíos antes incluso que los clientes efectúen las compras. El futuro era hasta hoy, a menudo incierto. Pero está cambiando, el futuro es predecible.
Sabemos que su potencial irá creciendo. Quién sabe, quizás sea precipitado anticipar a quién anticipa (el Big Data) algo. Pero con el número de datos suficientes, ¿el Big Data podrá llegar a anticipar el clima mundial con una antelación enorme? Sí. Igual que puede anticipar que nuestras acciones darían escenarios diferentes a los que previamente había dado, porque cualquier acción tiene su eco en el futuro, y el Big Data lo sabe y reevalúa dando otro nuevo escenario.
Todo se puede anticipar. ¿Podremos en un futuro próximo saber lo que nos ocurrirá? ¿Qué problemas afrontaremos? ¿Cuándo y dónde surgirá un huracán? ¿Qué vamos a tener que seguir para solucionarlo? A medida que se mejoren las técnicas, se mejoren los ordenadores en eficacia y velocidad, se siga desarrollando éste campo… Lo más probable es que más que responder «quién sabe», quizás lo más oportuno será decir «preguntémosle al Big Data».
BA Partners | Willis Update | NASA