El objetivo principal de este informe es averiguar como funciona el mecanismo de análisis de la situación de las personas con fiebre mediante el establecimiento de una constante por encima de una “métrica de planta” o una métrica representativa del grupo, en este caso la “mediana”.

En cuanto a la situación de partida podemos apreciar lo siguiente:

Cada fila representa la temperatura de una persona y cada columna representa un mes desde enero hasta abril.

Los colores van representados en función a la lógica de la fiebre es decir, está pintado en rojo en el caso que la persona que se está analizando sufra fiebre.

¿qué pasaría si cogieras sólo abril para estimar la K?

El periodo que queremos estimar va a ser el mes de abril. Entonces, las personas que sufren de fiebre siguen siendo la persona nº1 y la persona nº8.

Sin embargo, el nivel de la fiebre en es menor que en las otras mensualidades, por lo que si estimaramos una mediana como métrica de grupo para establecer un indicador comparable saldría menor que la mediana para referenciar a los individuos que se encuentren en otros meses donde las sus temperaturas sean más elevadas.

Hablando el términos númericos, la situación de los dos individuos puede llegar a ser al siguiente:

#los datos del nº8 

 abril_8 <- c(1,2,3,4,5,6,7,8,9,10) %>% 
  as.data.frame() %>% 
  setNames("abril_8")


#los datos del nº1 
abril_1 <- c(1,2,3,4,5,6,7,8,9,10) %>% 
  as.data.frame() %>% 
  setNames("abril_1")

Y su correspondiente mediana grupal:

#juntamos los datos


abril <- bind_rows(abril_1,abril_8)


print(median(abril$abril_1))
## [1] 5.5

¿qué pasaría si cogieras marzo abril?

Siguiendo el ejemplo anterior, en este caso vamos a analizar bien marzo y abril, es decir, fin de invierno y principio de primavera, puesto que aunque no estemos analizando la estacionalidad como factor que puede incidir en la fiebre puede llegar a ser de utilidad.

Así pues fijándonos solamente en la temperatura de los individuos en los dos meses podemos observar la siguiente imagen:

En este caso, si que observamos que en marzo el individuo nº8 tuvo un temperatura más elevada que el individuo nº1. Así pues, hablando sobre la mediana del mes de marzo, tiene que ser ligeramente superior a la del mes de abril en términos grupales.

Númericamente hablando en el caso del individuo nº8, es decir, aquel que se encuentra en la línea de abajo, sus temperaturas podrían ser la siguientes:

marzo_8 <- c(1,2,3,11,5,6,7,8,9,10) %>% 
  as.data.frame() %>% 
  setNames("marzo_8")

Dotamos la consola de los valores del individuo nº1 para el mes de marzo para poder sacar conclusiones grupales:

marzo_1 <- c(1,2,3,9.5,5,6,7,8,9,10)%>% 
  as.data.frame() %>% 
  setNames("marzo_1")

Por lo consequente, hablando en términos grupales, la mediana de los individuos del conjunto grupal meses marzo-abril, tiene que ser superior en comparación con la del mes de marzo y del mes de abril.

#construimos la estructura pra 

marzo<- bind_rows(marzo_1,marzo_8)
print(median(marzo$marzo))
## [1] 6.5
print(median(abril$abril_1))
## [1] 5.5

Y lo es.

En conjunto, la métrica de grupo se caracteriza del siguiente valor:

#creamos el dataframe que alberga ambos numeros
abril_marzo_grupo <- bind_rows(abril,abril_marzo_8)
print(median(abril_marzo_grupo$metricas))
## [1] 6

Es normal que la metrica de grupo, se haya incrementado, puesto que los valores de marzo son más elevados.

Así, que los valores de marzo del individuo nº8, sí que afectan al incremento de la métrica de “planta”.

¿febrero marzo abril?

Siguiendo la misma línea, ahora analizaremos el mes de febrero. Vamos a ver su aspecto en conjunto con los demás meses:

En un primer lugar, parece ser que en febrero la incidencia del individuo nº8 no ha sido tan elevada como en el mes de marzo. De hecho diriamos incluso que ha sido bastante parecida en comparación con el mes de abril.

Así pues, la mediana del mes de febrero, indicador de la situación de los individuos de dicho mes debería de ser menor que el de marzo, pero parecida a la de abril. Numéricamente hablando

febrero_8 <- c(1,2,3,4,5,6,7,8,9,11) %>%
  as.data.frame() %>%
  setNames("febrero_8")

febrero_1 <- c(1,2,3.1,4,5,6,7,8,9,10) %>%
  as.data.frame() %>%
  setNames("febrero_1")
febrero_grupo <- bind_rows(febrero_1,febrero_8)

print(median(febrero_grupo$febrero_1))
## [1] 5.5

Y recoredemos cual era el aspecto de marzo y su mediana:

print(median(abril_marzo_grupo$metricas))
## [1] 6

Así pues, aunque los valores de febrero sean superiores a los de los meses marzo-abril, su mediana sigue siendo parecida, incluso inferior, porque la presencia de valores más parecidos a abril es más abundante.

Ahora bien, ¿qué sucede con la métrica grupal? Es decir, con la métrica que analiza el mes de febrero, marzo y abril.

Bien, pues en un principio parece ser que el efecto de las temperaturas del mes de febrero no hace disminuir la situación global.

febrero_marzo_abril<- bind_rows(abril ,abril_marzo_grupo , febrero_grupo)

print(median(febrero_marzo_abril$metricas))
## [1] 6

Recordemos la mediana del conjunto abril-marzo.

print(median(abril_marzo_grupo$metricas))
## [1] 6

Sin embargo, el factor sustancial es la aportación que le hace cada mes al indicador global, es decir el impacto.

En un principio, la mediana del mes de abril es, el valor mediano de ese vector:

median(abril$metricas)
## [1] 5.5

Y el de marzo-abril es el siguiente

median(abril_marzo_grupo$metricas)
## [1] 6

Ahora bien cuál es el peso de cada mes en el efecto global:

Cuando se ha añadido las métricas de marzo al calculo, es decir, las temperaturas que efectivamente hacen cambiar la trayectoría del indicador grupal, la estadística se aumenta en:

median(abril_marzo_grupo$metricas) - median(abril$metricas)
## [1] 0.5

…puntos.

Y cuando añadimos el mes de febrero la situación aumenta en…

median(febrero_marzo_abril$metricas)-median(abril_marzo_grupo$metricas)
## [1] 0

NADA.

Es decir, la diferencia del impacto del mes de febrero con valores semejamtes al mes de abril no hace que el estadístico varie.

¿enero febrero marzo y abril ?

Finalmente, el análisis global, es el siguiente:

Apreciando solamente el mes de Enero, vemos que hay un pico más alto que en marzo. El individuo nº1 ha sufrido una temperatura bastane más elevada que en los demás meses.

enero_1 <- c(1,3,5,5,6,6,7,8,9,10) %>% 
  as.data.frame() %>% 
  setNames("enero_1")

Sin embargo el nº8 se ha mantenido en valores estables, en comparacion con febrero y abril, puesto que en marzo se dispara.

enero_8 <- c(1,2,3,4,5,6,7,8,9,10) %>% 
  as.data.frame() %>% 
  setNames("enero_8")

Analizando solamente el mes de enero, la métrica que analizaría el aspecto de los dos individuos en dicho mes parece ser que debe ser ligeramente superior a los otros meses por le pico del nº1.

colnames(enero_8)[1] <- "enero_1"
enero_grupo <- bind_rows(enero_1, enero_8) %>% 
  setNames("enero_grupo")

print(median(enero_grupo$enero_grupo))
## [1] 6

Sin embargo no es así, puesto que, el estadísito representativo se es la mediana, es decir, el valor que se encuentra en el medio.

¿Y en el total?

enero_febrero_marzo_abril <- bind_rows(febrero_marzo_abril, enero_grupo)

print(median(enero_febrero_marzo_abril$metricas))
## [1] 6

Observamos que el calculo se mantiene constante también.

Conclusion

Entonces, dicho esto, las diferentes métricas grupales serían las siguienes:

print(median(abril$metricas))
## [1] 5.5
print(median(marzo$metricas))
## NULL
print(median(febrero_grupo$metricas))
## [1] 5.5
print(median(enero_febrero_marzo_abril$metricas))
## [1] 6

Visto esto, podemos decir que aunque se incrementen mucho las temperaturas de cada mes, en realidad el indicador parametro grupal fluctua muy poco.