Por otro lado, no creo que usar la mediana para dilucidar si hay sequía o no, sea lo correcto, pues lo que cuenta es el agua que cae realmente a lo largo de un tiempo. Si para un determinado mes tenemos una serie de 30 datos, y cogemos el del medio (M, es decir, la mediana), y el valor de este dato M está muy lejos de los 14 superiores, y muy cerca de los 14 inferiores, y hacemos lo mismo con los 12 meses del año, pues se va a penalizar mucho respecto a la media de cada mes, respecto a la media por estaciones, trimestral, y anual. Vamos, eso es especular aun más que con el "Deberían haber caído", puesto que es algo convenido. Coger el valor de mitad de la tabla de una serie de datos es un simple convenio que no tiene porqué reflejar (y de hecho no refleja) cuál es la realidad, como sí hace la media.
En un clima mediterráneo o continental, donde las precipitaciones son muy irregulares, pero que cuando llueve, llueve con ganas (ya sea por una DANA, o por incidencia de tormentas), coger la mediana para ver si hay sequía o no, es una temeridad.
Y sí, podemos decir "debería haber caído", que para eso están las medias. Y si no cae, hay una anomalía (sequía). Y si cae el triple, pues también hay anomalía. Y actualmente la anomalía es que no cae, o sea, sequía.
Yo creo que te equivocas. Para comparar un año con los del resto de la serie hablando de precis es mucho más representativa la mediana que la media. Estadísticamente un año elegido al azar va a tener una preci más cercana a la mediana que a la media. Por encima del valor de la media puedes tener un 30% de los valores y por debajo un 70%; sin embargo por encima de la mediana tienes el 50 % y por debajo el otro 50%. Además conforme el clima es más árido este porcentaje se descompensa aún más; es decir en el desierto del Sáhara tal vez puedas tener un 15% por encima de la media y un 85% por debajo. Si en una población del Sáhara te dicen que tiene una preci media anual de 100 mm y eliges un año de la serie al azar es mucho más probable que ese año este por debajo de 100 mm que por encima.
Una serie de 31 datos, para un mes de otoño, de una estación hipotética en el levante centro-sur:
0-2-4-5-10-10-11-12-15-16-18-20-21-21-24-25-30-32-33-40-42-50-55-60-64-72-90-120-132-150-267
Media: 46'8 mm
Mediana: 25 mm
¿De verdad crees que es más representativa la mediana que la media? Matemáticamente es posible, pero los acuíferos, los ríos, la flora, la fauna, etc., no entienden de matemáticas. Solo "saben" que hay años que les puede llover mucho, otros muy poco o nada. Es decir, que están acostumbrados a "beber" de media X litros. Si pudieran hablar y comunicarse con nosotros, y un año les cayeran 10 mm, no creo que fueras a decirles "no os quejéis, que la mediana es de 25 mm, y es más normal que caigan 10 mm (10 datos hacia abajo), que caigan 72 mm (10 datos hacia arriba), simplemente porque la desviación es menor". Igual te linchaban.
En resumen, la mediana podrá tener alguna utilidad, no lo discuto, pero aquí en este caso no sólo no se la veo, sino que se aleja totalmente de la realidad. Lo que vale es la media, y sí, sí se puede decir "deberían haber caído X litros" porque para eso está la media. Que deban caer X litros no quiere decir que haya obligación de que caigan en base a los datos, sino que estaría dentro de lo normal. Las precipitaciones podrán ser más o menos irregulares, pero lo que cuenta al final es el total caído, pues eso es lo que entienden las plantas, el suelo, los acuíferos, etc.
vamos a ver...
"lo normal" es la mediana, no la media. POR DEFINICIÓN.
puedes decir lo que quieras, pero las matemáticas SON la realidad. Para las plantas de Mula, para un fontanero de Singapur y para un átomo de higrógeno que está en la galaxia más lejana.
El tema de la mediana es curioso y complejo... esta claro que para muestras con datos muy extremos, la mediana es mas adecuada, el problema estriba en cuantos datos debemos tener en la muestra como para considerar usar la mediana en vez de la media... por ejemplo, supongamos estas precis anuales en un lugar cualquiera...
x1: 0
x2: 0
x3: 0
x4: 0
x5: 10
Media: 2
Mediana: 0
Parece mucho mas realista la mediana, sobre todo porque la media nos da un valor que en realidad nos engaña completamente... sin embargo, consideremos esto...
x1: 0
x2: 0
x3: 0
...
x55: 10
Media: 0'18
Mediana: 0
En este caso la media no nos engaña tanto, y podriamos darla por buena...
En todo caso, el problema se plantea porque en lo que nos ocupa (distribuciones pluviometricas), por lo menos en España, no encontramos casos tan extremos, con lo que es complicado elegir entre media o mediana...
En concreto, para Requena, tenemos estos datos...
MES MEDIA MEDIANA %
ene 32,6 21,3 65
feb 30,9 27,2 88
mar 33,1 27,2 82
abr 42,4 34,8 82
may 48,1 40,1 83
jun 35,4 28,8 81
jul 13,4 6,8 50
ago 22,2 17,1 77
sep 40,0 37,5 94
oct 58,3 39,4 68
nov 40,1 25,1 62
dic 41,0 29,2 71
437,5 334,3 En la tercera columna tenemos cuanto porcentaje de la media representa la mediana... cuanto mas cerca a 100 el valor, pues mas se acercan media y mediana... en mi opinion y para el caso concreto de Requena, para los meses comprendidos entre Febrero y Septiembre, la mediana es lo mas indicado para trabajar, ya que apenas baja respecto a la media, lo que nos indica que lo unico que hace es tener en cuenta los datos extremos y punto, lo cual es bueno... desde Febrero a Junio vemos mas de un 80% de concordancia (hasta un 88 en Febrero), y vemos incluso un 94 para Septiembre... el 77 de Junio y el bajisimo 50 de Agosto tambien valen, ya que al hablar de precis muy bajas, pues casi que da lo mismo 7/13, o 17/22... pero para Enero, Octubre, Noviembre y Diciembre tenemos, quizas, un problema, con concordancia de 60/70%...
Por ejemplo, fijemonos en la grafica que adjunto sobre Noviembre... parece claro que son extremos los tres ultimos datos (162'1 - 174'5 - 199'0)... si cogemos la media de todo el cojunto nos sale 40'1 mm, pero, y ahora viene el pero, la mediana nos baja a 25'1, que a todas luces se me antoja corta, porque si cogemos la media hasta el dato de 113'8, nos sale 33'3... incluso haciendo dicha media solo hasta 85'1, tendriamos 29'6, que se nos sigue quedando lejos del 25'1 de la mediana...
Por contra, y por ver un mes donde la mediana funciona bien, cojamos Febrero... la media nos sale 30'9 y la mediana 27'2... ya directamente vemos mucha cercania... si nos fijamos en la grafica (adjuntada tambien), la media cogiendo hasta 25'6 y hasta el 79'7 sale 29'5... la mediana (27'2) saldria entre medias, yo lo veo bien... en cualquier caso, parece claro que no se deberia tener en cuenta para trabajar ese extremisimo dato de 118'8...
En fin, mucho que discutir...