PRIMER EJERCICIO DE PROBABILIDAD Y ESTADÍSTICA: TABLAS, HISTOGRAMAS Y POLIGONOS DE DISTRIBUCIONES DE FRECUENCIA.

Importar datos

ob <- c(16.0,     17.5,     19.4,     21.,     25.3,     29.4,     31.4,     31.5,     30.4,     26.9,     21.1,     16.7)

Ordenar datos

De menor a mayor

  • Ordenar datos de menor a mayor sirve para percibir de manera más sencilla el cambio entre las temperaturas mensuales.
sort(ob, decreasing = FALSE)
##  [1] 16.0 16.7 17.5 19.4 21.0 21.1 25.3 26.9 29.4 30.4 31.4 31.5

De mayor a menor

  • De igual forma, se muestran de mayor a menor para analizar los datos más facil.
sort(ob, decreasing = TRUE)
##  [1] 31.5 31.4 30.4 29.4 26.9 25.3 21.1 21.0 19.4 17.5 16.7 16.0

Tabla de distribucion de frecuencia

library(fdth)
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
tabla <- fdt(ob)
tabla
##    Class limits f   rf rf(%) cf  cf(%)
##  [15.84,19.035) 3 0.25 25.00  3  25.00
##  [19.035,22.23) 3 0.25 25.00  6  50.00
##  [22.23,25.425) 1 0.08  8.33  7  58.33
##  [25.425,28.62) 1 0.08  8.33  8  66.67
##  [28.62,31.815) 4 0.33 33.33 12 100.00

Histogramas y poligonos.

Absolutos

- Histograma

  • Un histograma es un gráfico que permite mostrar cómo se distribuyen los datos de una muestra estadística o de una población. Esto, respecto a alguna variable numérica. En este ejemplo se muestra el histograma de la frecuencia absoluta de las temperaturas de SIRM.
  • Referencia: https://economipedia.com/definiciones/histograma.html
plot(tabla, type="fh")

- Poligono

  • Un polígono de frecuencias permite la rápida visualización de las frecuencias, este polígono de frecuencia es realizado uniendo los puntos de mayor altura de estas columnas.

  • Referencia: https://definicion.de/poligono-de-frecuencia/

  • El eje de las x representa los limites de la clase, y el eje de las y representa las frecuencias absolutas.

plot(tabla, type="fp")

Relativos

- Histograma

  • Este histograma representa las frecuencias relativas. Que tan frecuentemente se presentan las temperaturas a continuación.
plot(tabla, type="rfh")

- Poligono

  • De igual forma que el histograma, muestra las frecuencias relativas dentro de ciertos limites, la frecuencia relativa se saca mediante una fracción: frecuencia absoluta / numero total de datos. Por lo tanto es la proporcion que corresponde a ese dato con respeto al numero total.
  • De esta manera en la gráfica se observa que los datos mayores a 25.42 representan la mayor parte de los datos.
plot(tabla, type="rfp")

Acumulados

- Histograma

plot(tabla, type="cfh")

- Poligono

  • Aquí se representa la frecuencia acumulada en forma de poligono de nueva cuenta de menor a mayor.
plot(tabla, type="cfp")

Medidas de tendecia central

Media

mean(ob)
## [1] 23.88333

Mediana

median(ob)
## [1] 23.2

Moda

  • La moda sirve para determinar el dato que más se repite en el set, en este caso, las temperatura que más se frecuenta en el año. En caso de no tener moda, se mostrarán todos los datos.
library(modeest)
## 
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
## 
##     mfv
mlv(ob, method = "mfv")
##  [1] 16.0 16.7 17.5 19.4 21.0 21.1 25.3 26.9 29.4 30.4 31.4 31.5

Cuantiles

  • Aquí se muestran los cuantiles que se obtienen de las temperaturas, un cuantil es aquel punto que divide la función de distribución de una variable aleatoria en intervalos regulares.
  • Referencia: https://economipedia.com/definiciones/cuantil.html
summary(ob)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   16.00   18.93   23.20   23.88   29.65   31.50

Grafico de caja y bigotes

  • Un diagrama de cajas y bigotes es una manera conveniente de mostrar visualmente grupos de datos numéricos a través de sus cuartiles. Las lineas paralelas a la caja son los bigotes, mientras que el borde superior es el 3er cuartil, la linea de la mitad es la Mediana y el borde inferior representa al 1er cuartil.
  • Referencia: https://datavizcatalogue.com/ES/metodos/diagrama_cajas_y_bigotes.html
boxplot(ob)