Primer ejercicio de probabilidad y estadistica: Tablas, histogramas y poligonos de distribuciones de frecuencia

Este ejercicio usa datos de las normales climatologicas del periodo de 1951 a 2010 de Morelia, Michoacán, estación 00016081 MORELIA

Estos datos provienen de: https://smn.conagua.gob.mx/tools/RESOURCES/Normales5110/NORMAL16081.TXT

ob <- c(14.5,     15.8,     18.1,     20.3,     21.5,     20.9,     19.4,     19.4,     19.1,     18.0,     16.5,     15.0,     18.2)

Ordenar datos

De menor a mayor.

sort(ob, FALSE)
##  [1] 14.5 15.0 15.8 16.5 18.0 18.1 18.2 19.1 19.4 19.4 20.3 20.9 21.5

De mayor a menor

sort(ob, TRUE)
##  [1] 21.5 20.9 20.3 19.4 19.4 19.1 18.2 18.1 18.0 16.5 15.8 15.0 14.5

Histograma, polígonos y tablas de distribución de frecuencia

Tabla de distribucion de frecuencia según Sturges

  • Una tabla de distribución de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.
library(fdth)
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
tabla<-fdt(ob)
tabla
##     Class limits f   rf rf(%) cf  cf(%)
##  [14.355,15.827) 3 0.23 23.08  3  23.08
##  [15.827,17.299) 1 0.08  7.69  4  30.77
##  [17.299,18.771) 3 0.23 23.08  7  53.85
##  [18.771,20.243) 3 0.23 23.08 10  76.92
##  [20.243,21.715) 3 0.23 23.08 13 100.00

Histogramas y polígonos

Absolutos

  • Histograma de frecuencia absoluta
    • El histograma es una gráfica de la distribución de un conjunto de datos. Consiste de barras sin separación una de la otra y cada barra representa un subconjunto de datos.

      _ Fuente:http://asesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica/DOCUMENTOS/TEMA%201/7.%_20HISTOGRAMAS.pdf _

    • En esta ocasión a diferencia de los datos locales de Obregón, opté por un clima más templado ubicado a una altitud mayor en Morelia, Michoacán y como se puede apreciar en el siguiente gráfico un clima más estable y casi perfectamente distribuido.

plot(tabla, type="fh")

  • Polígonos de frecuencia absoluta
    • El polígono de frecuencia es el resultado de establecer pequeños puntos en el centro de cada barra del histograma, dando como resultado el siguiente gráfico.
plot(tabla, type="fp")

Relativos

  • Histograma de frecuencia relativa
    • El histograma de frecuencia relativa también consiste de un gráfico de barras que indica no el número absoluto pero sí la relación en base de porcentajes al resto de los datos.
plot(tabla, type="rfh")

  • Polígonos de frecuencia relativa

    • El polígono de frecuencia relativa sigue el mismo concepto que el de frecuencia absoluta pero en este caso indica en términos de porcentaje los puntos medios de cada subconjunto de datos o barras.
plot(tabla, type="rfp")

### Acumulados

  • Histograma de frecuencia acumulativa
    • Para este histograma lo que hay que entender para interpretar el gráfico es que la frecuencia del rango en el que estemos se suma con la anterior para dar lugar a la siguiente y así hasta llegar al final del conjunto de datos.
plot(tabla, type="cfh")

  • Polígonos de frecuencia acumulada
    • El polígono de frecuencia acumulada sigue la misma teoría que el histograma solo que en este caso al igual que hacíamos con el de frecuencia absoluta se trazan puntos en el centro de cada barra para dar lugar al siguiente polígono.
plot(tabla, type="cfp")

Medidas de tendencia central

Media

  • Es la medida de tendencia más conocida o más utilizada. Y en este caso nos arroja la temperatura más común en Morelia.
mean(ob)
## [1] 18.20769

Mediana

  • La mediana es simplemente conocida como el punto medio de una serie de datos. Es decir donde el 50% de los datos tiene valores igual o menores a la mediana y el otro 50% tiene valores igual o mayores a la misma.
median(ob)
## [1] 18.2

Moda

  • La moda vendría a ser el valor que más se repite en una serie de datos. En este caso nos arroja 19.4 ya que se repite en dos ocasiones.
library(modeest)
## 
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
## 
##     mfv
mlv(ob, method = "mfv")
## [1] 19.4

Cuantiles

  • Los cuantiles podemos entender que el primero nos indica hasta donde abarca el primer 25% de los datos. Luego sigue la Mediana que nos indica donde recae el 50% de los datos mientras que el 3ero nos indica donde recae el 75% de los datos.
summary(ob)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   14.50   16.50   18.20   18.21   19.40   21.50

Grafico de caja y bigotes

  • Los diagramas de Caja-Bigotes (boxplots o box and whiskers) son una presentación visual que describe varias características importantes, al mismo tiempo, tales como la dispersión y simetría.
boxplot(ob)