PRIMER EJERCICIO DE PROBABILIDAD Y ESTADISTICA: TABLAS, HISTOGRAMAS, POLIGONOS DE DISTRIBUCION DE FRECUENCIA

te <- c(15.4,     16.3,     18.2,     21.3,     24.6,     29.1,     29.4,     28.5,     27.7,    23.8,     18.8,     15.6,     22.4)

Ordenar datos

De menor a mayor

sort(te, decreasing = FALSE)
##  [1] 15.4 15.6 16.3 18.2 18.8 21.3 22.4 23.8 24.6 27.7 28.5 29.1 29.4

De mayor a menor

sort(te, decreasing = TRUE)
##  [1] 29.4 29.1 28.5 27.7 24.6 23.8 22.4 21.3 18.8 18.2 16.3 15.6 15.4

Histogramas, poloigonos y tablas de distribuciones de frecuencia

  • Los histogramas son gráficos que indican la frecuencia de un hecho mediante una distribución de los datos.
hist(te)

TABLA DE DISTRIBUCION DE FRECUENCIA SEGUN STURGES

  • La regla de Sturges se trata de un criterio hecho para determinar el numero de clases o intervalos necesarios para representar graficamente un conjunto de datos estadisticos. En la primer columna de la tabla se muestran los intervalos a tomarse en cuenta, la siguiente columna muestra la frecuencia “f” con la que estos aparecen, despues la siguiente columna muestra la frecuencia relativa “rf” junto con su porcentaje “rf(%)”, fianlmente en las ultimas 2 columnas se muestran la frecuencia acumulada “cf” junto con su porcentaje “cf(%)” el cual se consigue sumando todos los porcentajes de la frecuencia relativa

Referencia: https://www.lifeder.com/regla-sturges/

library(fdth)
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
tabla <- fdt(te)
tabla
##     Class limits f   rf rf(%) cf  cf(%)
##  [15.246,18.136) 3 0.23 23.08  3  23.08
##  [18.136,21.025) 2 0.15 15.38  5  38.46
##  [21.025,23.915) 3 0.23 23.08  8  61.54
##  [23.915,26.804) 1 0.08  7.69  9  69.23
##  [26.804,29.694) 4 0.31 30.77 13 100.00

Histogramas y poligonos

Absolutos

plot(tabla, type="fh")

  • Poligonos de frecuencia absoluta: Representa los mismos datos que el histograma de frecuencia absoluta con la diferencia que en lugar de utilizar barras agrupadas, este utiliza nodos unidos los cuales se encuentran cada uno en la parte central de donde estarian las barras
plot(tabla, type="fp")

Relativos

  • Histograma de frecuencia relativa: Representa los datos de frecuencia donde la frecuencia relativa es representada desde el eje y, los intervalos mostrados en el eje x son los mismos mostrados en la tabla de frecuencia absoluta
plot(tabla, type="rfh")

  • Poligono de frecuencia relativa: Representa los mismos datos presentados en el histograma de frecuencia relativa, la diferencia es que este lo representa a base de nodos unidos
plot(tabla, type="rfp")

### Acumulados

  • Histograma de frecuencia acumulada: En este histograma la frecuencia acumulada es representada por el eje y, y en como las demas tablas anteriores, los intervalos son representados en el eje x
plot(tabla, type="cfh")

  • Poligono de frecuencia acumulada: Representa lo mismo que el histograma de frecuencia acumulada pero este lo representa a base de nodos unidos
plot(tabla, type="cfp")

Medidas de tendencia central

Media

  • La media es el valor promedio de un conjunto de datos numéricos, para calcularse se tienen que sumar todos los valores y estos ser divididos entre la cantidad de valores que hay. referencia: https://economipedia.com/definiciones/media.html
mean(te)
## [1] 22.39231

Mediana

  • La mediana es un estadístico de posición central que parte la distribución en dos, es decir, deja la misma cantidad de valores a un lado que a otro, en otras palabras la mediana viene siendo el dato que se encuentra en el puro centro de los demas datos. referencia: https://economipedia.com/definiciones/mediana.html
median(te)
## [1] 22.4

Moda

  • Es el valor que aparece con mayor frecuencia en los datos, en este caso la moda vendrian siendo todos los valores ya que ninguno de los valores se repite
library(modeest)
## 
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
## 
##     mfv
mlv(te, method = "mfv")
##  [1] 15.4 15.6 16.3 18.2 18.8 21.3 22.4 23.8 24.6 27.7 28.5 29.1 29.4

Cuantiles

summary(te)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   15.40   18.20   22.40   22.39   27.70   29.40

Grafico de caja y bigotes

  • El grafico de caja y bigotes nos permite saber tanto la mediana como el rango intercultirico de una distribucion, aparte de que permite estimar la aproximacion a la normal de la distribucion y tambien comparar la igualdad de varianzas entre varias distribuciones. Referencia: https://anestesiar.org/2015/una-caja-con-bigotes-el-grafico-de-caja/
boxplot(te)