PRIMER EJERCICIO DE PROBABILIDAD Y ESTADISTICA: TABLAS HISTOGRAMAS Y POLÍGONOS DE DISTRIBUCIONES DE FRECUENCIA

Importar datos

ob <- c(16.9,     17.9,     20.3,     22.7,     25.1,     27.5,     28.8,     28.3,     27.1,     24.7,     21.3,     18.3)

*El bloque de código es conocido como “chunk”, en los archivos R Markdown nos permite producir resultados de texto, tablas o gráficos, pueden ser ejecutados de forma individual, se pueden invocar con el comando “CTRL-ALT-I”. Fuente: https://bookdown.org/yihui/rmarkdown/r-code.html

*Se concatenan los datos de temperatura bajo la variable “ob” utilizando “c”.

Ordenar datos

De menor a mayor

sort(ob, decreasing = FALSE)
##  [1] 16.9 17.9 18.3 20.3 21.3 22.7 24.7 25.1 27.1 27.5 28.3 28.8

De mayor a menor

sort(ob, decreasing = TRUE)
##  [1] 28.8 28.3 27.5 27.1 25.1 24.7 22.7 21.3 20.3 18.3 17.9 16.9
  • Si la variable decreasing es igual a True entonces los datos se presentarán de forma descendente.

Histogramas, polígonos y tablas de distribuciones de frecuencia

*Histograma de frecuencia absoluta

hist(ob)

*“hist” es la función estándar para un histograma de frecuencia. Fuente: https://www.rdocumentation.org/packages/lessR/versions/4.0.2/topics/Histogram

  • Este histograma se interpreta tal como el número de veces que se repiten los datos almacenados en “ob” en una línea de sucesiones del 2 empezando por el 16 ya que este es el valor más bajo dentro de la serie que se acerca al menor de los datos, la serie termina con el 30 ya que este es mayor número que contiene al dato más grande.

TABLA DE DISTRIBUCIÓN DE FRECUENCIA según Sturges

  • Herbert Arthur Sturges fue un matemático y estadístico alemán. Creó la regla de Sturges a los 44 años, un método para conocer el número de clases que se deben tomar en cuenta a la hora de elaborar histogramas. Fuente: https://es.wikipedia.org/wiki/Herbert_Sturges
library(fdth)
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
tabla <- fdt(ob)
tabla
##     Class limits f   rf rf(%) cf  cf(%)
##  [16.731,19.202) 3 0.25 25.00  3  25.00
##  [19.202,21.674) 2 0.17 16.67  5  41.67
##  [21.674,24.145) 1 0.08  8.33  6  50.00
##  [24.145,26.617) 2 0.17 16.67  8  66.67
##  [26.617,29.088) 4 0.33 33.33 12 100.00

*El paquete fdth se encarga de realizar tablas de distribución de frecuencia, histogramas y polígonos asociados a partir de objetos vectoriales, data.frame y matriz para variables numéricas y categóricas. Fuente: https://cran.r-project.org/web/packages/fdth/index.html

*La tabla se interpreta tal como:

*f= frecuencia absoluta

*rf= frecuencia relativa

*rf(%) frecuencia relativa porcentual

*cf= frecuencia acumulada

*cf(%)=frecuencia acumulada porcentual

*Declaramos la variable “tabla” y le asignamos la tabla de distribución de frecuencia de “ob”

Histogramas y polígonos

Absolutos

  • Histograma de frecuencia absoluta
plot(tabla, type = "fh")

*“fh” se refiere al histograma de frecuencia, tomando en cuenta los límites de clase, siendo estos los datos encontrados en ambos extremos, se representa la frecuencia que los datos aparecen dentro de este margen.

  • Polígonos de frecuencia absoluta
plot(tabla, type = "fp")

*“fp” se refiere al polígono de frecuencia, tomando en cuenta los límites de clase, siendo estos los datos encontrados en ambos extremos, se representa la frecuencia que los datos aparecen dentro de este margen, a diferencia de “fh”, la frecuencia se representa con vectores.

Relativos

  • Histograma
plot(tabla, type = "rfh")

*“rfh” hace referencia al histograma de frecuencia relativa, tomando en cuenta los límites de clase, siendo estos los datos encontrados en ambos extremos, se representa la frecuencia que los datos aparecen dentro de este margen considerando el número total de dichos datos.

  • Polígonos
plot(tabla, type = "rfp")

*“rfp” hace referencia al polígono de frecuencia relativa, tomando en cuenta los límites de clase, siendo estos los datos encontrados en ambos extremos, se representa la frecuencia que los datos aparecen dentro de este margen considerando el número total de dichos datos, la frecuencia se representa como vectores.

Acumulados

*Histograma

plot(tabla, type = "cfh")

*“cfh” el histograma de frecuencia acumulada toma en cuenta los datos previamente representados en el límite de clase y los añade al límite sucesivo creando una frecuencia progresiva.

*Polígonos

plot(tabla, type = "cfp")

*“cfp” el polígono de frecuencia acumulada toma en cuenta los datos previamente representados en el límite de clase y los añade al límite sucesivo creando una frecuencia progresiva, la frecuencia se representa con vectores.

Medidas de tendencia central

Media

mean(ob)
## [1] 23.24167

Mediana

median(ob)
## [1] 23.7

Moda

library(modeest)
## 
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
## 
##     mfv
mlv(ob, method = "mfv")
##  [1] 16.9 17.9 18.3 20.3 21.3 22.7 24.7 25.1 27.1 27.5 28.3 28.8

Cuantiles

summary(ob)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   16.90   19.80   23.70   23.24   27.20   28.80

Gráfico de caja y bigotes

boxplot(ob)

*En ambos extremos podemos ver reflejado el mínimo y el máximo, el inicio de la caja representa el primer cuantil, el punto medio representa la media dentro de las variables y la parte superior de la caja representa el tercer cuantil.