Hace unos días dije en este foro que por fin me había decidido a hacer una prueba con los millones de observaciones disponibles en la base de datos de Ogimet. El error en el tratamiento de algunos datos en GISS (ya corregidos) me hizo perder el miedo.
Bueno, pues ya me he puesto manos a la obra. Os cuento lo que tengo hecho, y a ver si me podéis resolver algunas dudas. Estoy abierto a sugerencias.
Se trata de ver qué pasa con la evolución de la temperatura media en la superficie terrestre si uno mete el mayor numero de datos y estaciones posible con un mínimo de calidad a corto plazo.
Por un mínimo de calidad se entiende que sean datos de tipo sinóptico y que sus valores permitan establecer al menos la temperatura media diaria. Tengo muchos controles y filtros para ello y en otro momento ya los detallaré.
No se trata, pues, de seleccionar unas pocas estaciones representativas con largas series homogéneas, sino de tomar el mayor número de datos de directos de temperatura en la superficie. Es una aproximación distinta, no exenta de problemas, para conocer cómo evoluciona la temperatura en la superficie.
El hecho de utilizar la temperatura media diaria trata de evitar en lo posible la influencia en el ciclo diurno debido a la falta de homogeneidad en la frecuencia de observaciones a lo largo del día.
Bien, en ogimet puedo obtener fácilmente estas temperaturas medias diarias y asignarlas a una caja latitud longitud de acuerdo a la posición del observatorio, barco o boya.
Tengo dudas en cuanto la resolución espacial y temporal de este análisis. Me explico, podría hacer por ejemplo:
Opción A) Estadísticas diarias de cada caja de 5 x 5 grados latitud x longitud.
Opción B) Estadísticas semanales de cada caja de 10 x 10 grados latitud x longitud. Esta opción requiere muchos menos recursos de almacenamiento que la A
Opción C) Utilizar mayor resolución para las observaciones terrestres y menor para las marítimas, ya que de este último tipo hay muchas menos. Es la que más me gusta.
Por estadística se entiende guardar de cada caja para el periodo considerado el número de datos diarios, número de estaciones distintas, valor medio de los datos, máximo, mínimo y desviación típica.
Cada caja tiene un porcentaje de tierra y mar. Los synops terrestres son representativos de la porción de tierra. Los datos derivados de ships y buoys, si hay alguno, representan la porción de mar de cada caja. Estoy dudando si los synops de islas pequeñas perdidas en la inmensidad del oceano se asignan a la fraccion de mar. Evidentemente la caja queda representada por una media ponderada en función de su composición.
¿Y qué diablos hago con esto?. Como bien dice Vigilant, RS y otros, los datos diarios o semanales seguramente no son de interés (o a lo mejor sí). La cosa puede cambiar si se van haciendo medias móviles anuales, ahí ya pueden indicar algo.
Si, Vigilant, ya sé que no son valores de 30 años. Ahora mismo en Ogimet dispongo de datos suficientes desde enero de 2000, y en pocos días desde Enero de 1999. La pregunta que me hago es si el comportamiento de esas medias móviles en los últimos 6 ó 7 años va a seguir el patrón que tienen los datos elaborados por la NOAA, GISS u otras instituciones internacionales en esas mismas fechas.
Veremos si sale algo después de todo. Los puristas de los datos me pueden atacar diciendo que meto datos que no se sabe muy bien cómo se toman, que no se sabe si son homogéneos, que la distribución espacial es irregular, que no se conoce bien los errores cometidos .... La esperanza que tengo es que todos los posibles errores sistemáticos se vayan compensando de alguna forma y al final salga algo aprovechable.
Ya tengo escrito el código que toma datos para cada caja, el que analiza la composición tierra/mar de cada una de ellas y realiza la estadística básica. Falta hacer los scripts que cojan la Base de Datos y comiencen a generar datos. Y eso me puede llevar algunas semanas.
Os hablaré de mis progresos.