Os dejo este gráfico de código de barras de anomalías tipificadas de Pamplona 1881-2017.
Los datos están a disposición de cualquiera en la página del Gobierno de Navarra, son gratuitos y no están manipulados ni normalizados, después yo sólo he calculado la anomalía tipificada sin más.
Buen curro te has pegado para combinar los 136 ficheros de datos
Si no te importa y no es mucho pedir, ¿podrías poner una gráfica convencional de temperatura o de anomalías térmicas con los mismos datos (medias anuales de las medias diarias)?
No se si me pides ésto: (como puedes ver las serie no está completa faltan algunos años, 1905-1909, Guerra Civil y 1948-1952).
Unas dudas (si no es molestia):
- ¿Usas la media anual de las medias diarias para cada año?
- ¿Cómo calculas los datos de anomalías (anom. dif.)?¿qué periodo de referencia base utilizas?
- ¿Qué entiendes por anomalías tipificadas y cómo la obtienes?
- ¿Por qué incluyes el año 2018 cuando solo hay datos de invierno y parte de la primavera?
- ¿Por qué se produce un pico tan bajo entorno a 1961?
- ¿Excluyes años en los que sólo haya datos parciales (faltan meses)?¿o aplicas alguna interpolación en esos casos?
*En este caso son las medias diarias, tengo también las máximas y mínimas de toda la serie.
Si te desenvuelves, por el tema de la estadística en lo que sería "Primeras nociones de estadística básica" tienes todos los conceptos de anomalías diferenciales y tipificadas o si lo prefieres
puntuaciones directas, diferenciales y típicas.
Así la puntuación directa es el dato que tomamos.
Puntuación o anomalía diferencial sería puntuación directa menos la media. (En estadística descriptiva se denominan por letras minúsculas latinas).
La puntuación o anomalía típica es la puntuación diferencial divido por la desviación típica. (En estadística descriptiva se denomina por la letra z minúscula).
Esta última, como me imagino que ya sabrás tiene unas propiedades muy interesantes pero una de las más importantes es la comparabilidad de puntuaciones típicas de varias variables.
* 2018, al hacer un seguimiento diario, de los últimos años diezminutal, voy metiendo todo en la base de datos, y si no pongo una condición, como en este caso, que se me ha pasado, sale hasta el último dato.
El problema de 1941 es que faltan 2 meses de datos, septiembre y octubre