PRIMER EJERCICIO DE PROBABILIDAD Y ESTADÍSTICA: TABLAS, HISTOGRAMAS Y POLIGONOS DE DISTRIBUCIONES DE FRECUENCIA.
Importar datos
ob <- c(16.0, 17.5, 19.4, 21., 25.3, 29.4, 31.4, 31.5, 30.4, 26.9, 21.1, 16.7)
Ordenar datos
De menor a mayor
- Ordenar datos de menor a mayor sirve para percibir de manera más sencilla el cambio entre las temperaturas mensuales.
sort(ob, decreasing = FALSE)
## [1] 16.0 16.7 17.5 19.4 21.0 21.1 25.3 26.9 29.4 30.4 31.4 31.5
De mayor a menor
- De igual forma, se muestran de mayor a menor para analizar los datos más facil.
sort(ob, decreasing = TRUE)
## [1] 31.5 31.4 30.4 29.4 26.9 25.3 21.1 21.0 19.4 17.5 16.7 16.0
Tabla de distribucion de frecuencia
- Una tabla de distribucion de frecuencia es util para mostrar de manera gráfica la frecuencia de distribución de los datos en determinados limites, incluyendo su marca de clase, frecuencia absoluta, frecuencia absoluta acumulada, frecuencia relativa y frecuencia relativa acumulada.
- Gracias a esta tabla se observa facilmente que dentro del lmite de 28.62 a 31,815 se encuentran 4 frecuencias (la mayoría).
library(fdth)
##
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
##
## sd, var
tabla <- fdt(ob)
tabla
## Class limits f rf rf(%) cf cf(%)
## [15.84,19.035) 3 0.25 25.00 3 25.00
## [19.035,22.23) 3 0.25 25.00 6 50.00
## [22.23,25.425) 1 0.08 8.33 7 58.33
## [25.425,28.62) 1 0.08 8.33 8 66.67
## [28.62,31.815) 4 0.33 33.33 12 100.00
Histogramas y poligonos.
Absolutos
- Histograma
- Un histograma es un gráfico que permite mostrar cómo se distribuyen los datos de una muestra estadística o de una población. Esto, respecto a alguna variable numérica. En este ejemplo se muestra el histograma de la frecuencia absoluta de las temperaturas de SIRM.
- Referencia: https://economipedia.com/definiciones/histograma.html
plot(tabla, type="fh")

- Poligono
Un polígono de frecuencias permite la rápida visualización de las frecuencias, este polígono de frecuencia es realizado uniendo los puntos de mayor altura de estas columnas.
Referencia: https://definicion.de/poligono-de-frecuencia/
El eje de las x representa los limites de la clase, y el eje de las y representa las frecuencias absolutas.
plot(tabla, type="fp")

Relativos
- Histograma
- Este histograma representa las frecuencias relativas. Que tan frecuentemente se presentan las temperaturas a continuación.
plot(tabla, type="rfh")

- Poligono
- De igual forma que el histograma, muestra las frecuencias relativas dentro de ciertos limites, la frecuencia relativa se saca mediante una fracción: frecuencia absoluta / numero total de datos. Por lo tanto es la proporcion que corresponde a ese dato con respeto al numero total.
- De esta manera en la gráfica se observa que los datos mayores a 25.42 representan la mayor parte de los datos.
plot(tabla, type="rfp")

Acumulados
- Histograma
plot(tabla, type="cfh")

- Poligono
- Aquí se representa la frecuencia acumulada en forma de poligono de nueva cuenta de menor a mayor.
plot(tabla, type="cfp")

Medidas de tendecia central
Moda
- La moda sirve para determinar el dato que más se repite en el set, en este caso, las temperatura que más se frecuenta en el año. En caso de no tener moda, se mostrarán todos los datos.
library(modeest)
##
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
##
## mfv
mlv(ob, method = "mfv")
## [1] 16.0 16.7 17.5 19.4 21.0 21.1 25.3 26.9 29.4 30.4 31.4 31.5
Cuantiles
summary(ob)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 16.00 18.93 23.20 23.88 29.65 31.50
Grafico de caja y bigotes
- Un diagrama de cajas y bigotes es una manera conveniente de mostrar visualmente grupos de datos numéricos a través de sus cuartiles. Las lineas paralelas a la caja son los bigotes, mientras que el borde superior es el 3er cuartil, la linea de la mitad es la Mediana y el borde inferior representa al 1er cuartil.
- Referencia: https://datavizcatalogue.com/ES/metodos/diagrama_cajas_y_bigotes.html
boxplot(ob)
