PRIMER EJERCICIO DE PROBABILIDAD Y ESTADÍSTICA: TABLAS, HISTOGRAMAS Y POLÍGONOS DE DISTRIBUCIONES DE FRECUENCIA.

Importar datos

tj <- c( 13.4, 13.8, 14.4, 16.0, 17.9, 20.0, 22.5, 23.2,     22.2, 19.5, 16.3, 13.6)

Ordenar datos

En este apartado se hará uso de la función sort para ordenar los datos de manera ascendente y descendente.

Ordenar de menor a mayor

   sort(tj, decreasing = FALSE)
##  [1] 13.4 13.6 13.8 14.4 16.0 16.3 17.9 19.5 20.0 22.2 22.5 23.2

Ordenar de mayor a menor

sort(tj, decreasing = TRUE)
##  [1] 23.2 22.5 22.2 20.0 19.5 17.9 16.3 16.0 14.4 13.8 13.6 13.4

Histogramas, polígonos y tablas de distribuciones de frecuencia.

Aquí se mostrarán una serie de graficas con el propósito de plasmar información relevante de los datos recopilados.

  • Histograma: El histograma es siempre una representación en barras, su función es exponer gráficamente números, variables y cifras de modo que los resultados se visualicen más clara y ordenadamente. Representa una distribucion de frecuencias.

Bembibre, V. (2009) Histograma. Definicion ABC. Recuperado de: https://www.definicionabc.com/tecnologia/histograma.php

  • Polígono de frecuencia: Se crea a partir de un histograma de frecuencia, es realizado uniendo los puntos de mayor altura de estas columnas.

Merino, M & Perez, J. (2021) Definición de polígono de frecuencia. Definición.de Recuperado de: https://definicion.de/poligono-de-frecuencia

Tabla de distribución de frecuencia según Sturges

La regla de Sturges es un método empírico utilizado para determinar el número de clases que deben existir en un histograma de frecuencias, para así poder clasificar un conjunto de datos que representan una muestra o población. Permite realizar una distribución de frecuencias a través del cálculo del número de clases (k), así como la longitud de cada una de estas, conocida también como amplitud.

D’Alessio, V. (s.f.) Regla de Sturges. Lifeder.com Recuperado de: https://www.lifeder.com/regla-sturges/

Para realizar nuestra tabla de frecuencias necesitaremos de la libreria fdth, para posteriormente hacer uso de la funcion fdt.

library(fdth)
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
tabla <- fdt(tj)
tabla
##     Class limits f   rf rf(%) cf  cf(%)
##  [13.266,15.299) 4 0.33 33.33  4  33.33
##  [15.299,17.332) 2 0.17 16.67  6  50.00
##  [17.332,19.366) 1 0.08  8.33  7  58.33
##  [19.366,21.399) 2 0.17 16.67  9  75.00
##  [21.399,23.432) 3 0.25 25.00 12 100.00

Histogramas y poligonos

Absolutos

  • Histograma de frecuencia absoluta: En este tipo de histograma Se agrupan los datos en clases, y se cuenta cuántas observaciones hay en cada una de ellas.
plot(tabla, type="fh")

  • Poligonos de frecuencia absoluta
plot(tabla, type="fp")

Relativos

  • Histograma: Para un conjunto de datos cuantitativo es una gráfica de barras en la que la altura de la barra muestra “con qué frecuencia” las mediciones caen en una clase o subintervalo particular.
plot(tabla, type="rfh")

  • Polígono: De igual forma muestra “con qué frecuencia” las mediciones caen en una clase o subintervalo particular.
plot(tabla, type="rfp")

Acumulados

La frecuencia acumulada es la sumatorias de los datos anteriores.

  • Histograma
plot(tabla, type="cfh")

plot(tabla, type="cfp")

Medidas de tendencia central

Tambien llamadas medidas de centro, son una de las primeras mediciones numéricas importantes, es decir, una medida a lo largo del eje horizontal que localiza el centro de la distribución. Las medidas de localización están diseñadas para brindar al analista algunos valores cuantitativos de la ubicación central o de otro tipo de los datos en una muestra.

Mendenhall, W. & Beaver, R & Beaver, B. (2010) Introducción a la probabilidad y estadística (13a edición). Editorial: Cengage Learning, Inc.

Media

  • La media aritmética o promedio de un conjunto de n mediciones es igual a la suma de las mediciones dividida entre n. Para esto hacemos uso de la funcion mean.

Mendenhall, W. & Beaver, R & Beaver, B. (2010) Introducción a la probabilidad y estadística (13a edición). Editorial: Cengage Learning, Inc.

mean(tj)
## [1] 17.73333

Mediana

  • La mediana m de un conjunto de n mediciones es el valor de x que cae en la posición media cuando las mediciones son ordenadas de menor a mayor. Para esto hacemos uso de la función median.

Mendenhall, W. & Beaver, R & Beaver, B. (2010) Introducción a la probabilidad y estadística (13a edición). Editorial: Cengage Learning, Inc.

median(tj)
## [1] 17.1

Moda

  • La moda hace referencia a la cantidad de veces que aparece un mismo dato en un conjunto. Para esto hacemos uso de la función mlv, y de la librería modeest.
library(modeest)
## 
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
## 
##     mfv
mlv(tj, method = "mfv")
##  [1] 13.4 13.6 13.8 14.4 16.0 16.3 17.9 19.5 20.0 22.2 22.5 23.2

Aquí podemos observar que, al no repetirse los datos, se nos muestra todo el conjunto, por ello concluimos que no existe una moda.

Cuantiles

  • Los cuantiles son puntos tomados a intervalos regulares de la función de distribución de una variable aleatoria.
summary(tj)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   13.40   14.25   17.10   17.73   20.55   23.20

Grafico de caja y bigotes

  • En este tipo de grafica podemos observar la ubicacion del valor minimo, el primer y tercer cuantil, la media, mediana y el valor maximo.
boxplot(tj)