Agrupar datos
El caso identifica un conjunto de datos que representan mediante una variable numérica llamada edades los valores precisamente de las edades de 50 alumnos de una institución educativa que tienen edades entre 18 y 24 años.
Se simula una muestra mediante la función * sample (), * la población de manera imaginaria sería el total de alumnos en una cantidad mayor a 50.
La función * set.seet () * significa sembrar una semilla para que generen los mismos valores en funciones aleatorias tales como * sample () * .
Se construye una tabla de frecuencias con la función * fdt () * de la librería * fdth (). *
Se genera una gráfica de barra con la función * barplot () * y un gráfico de talla y hoja con * stem () * .
Se elabora un histograma de los datos edades con la función * hist (). *
## Cargar librerías
# Se debe anticipadamente instalar librerías:
# install.packages(“fdth”)
# Luego cargar las librerías
library(fdth)
##
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
##
## sd, var
# Construir edades
#Se tiene una muestra de 50 alumnos con una variable de interés llamada edad.
# El vector edades contiene 50 valores numéricos que simulan las edades de 50 personas.
set.seed(2021)
edades <- sample(18:24, 50, replace = TRUE)
cat(edades, sep = ',')
## 24,23,23,19,24,21,21,23,23,20,23,23,22,24,24,18,24,21,20,21,19,20,21,22,20,23,19,21,22,23,24,19,20,21,22,23,22,18,24,23,19,20,20,19,23,23,23,24,24,19
# Histograma de los datos
hist(x = edades)
# Construir una tabla de edades
tabla <- fdt(x = edades, start = 17, end = 25, h = 2)
tabla
## Class limits f rf rf(%) cf cf(%)
## [17,19) 2 0.04 4 2 4
## [19,21) 14 0.28 28 16 32
## [21,23) 12 0.24 24 28 56
## [23,25) 22 0.44 44 50 100
# Diagrama de barra
barplot(height = tabla$table$f, names.arg = tabla$table$`Class limits`)
# Diagrama de tallo y hoja
stem(x = edades)
##
## The decimal point is at the |
##
## 18 | 00
## 19 | 0000000
## 20 | 0000000
## 21 | 0000000
## 22 | 00000
## 23 | 0000000000000
## 24 | 000000000
En este caso se pudieron identificar un conjunto de datos de 50 alumnos cuyas edades son de 18 a 24 años.
En el histograma de edades se puede ver que el numero de mayor frecuencia es de 22 a 23 años.
Con la ayuda de una gráfica de barras representamos un resultado de las edades con mayor frecuencia son de alrededor de 22 a 23 años de edad y la que en menor porcentaje que se muestra es de aproximadamente de 21 a 22 años de edad. Con la gráfica de tallo y hoja se puede identificar con exactitud el numero de personas y sus respectivas edades.
Se extrae una muestra de 50 alumnos de una población
El histograma de edades identifica que hay alrededor de 13 personas con edades de 23 años.
La gráfica de barra identifica que existen, 22 personas que tienen entre 23 y 25 años y representan un porcentaje del 44% de la muestra de 50 alumnos.
La gráfica de tallo y hoja identifica que hay 13 personas que tienen una edad específica de 23 años.