1 Objetivo

Agrupar y describir datos de manera visual de variables que tengan relación con la ‘Edad’ y de ‘Género’, utilizando la función fdt() y fdt_cat(), pertenecientes a la librería fdth.

2 Descripción

  • Se cargan las librerías adecuadas para realizar el caso.

  • Se construyen y simulan datos con dos variables de interés (edades y géneros de personas).

  • Se determina las clase para construir tablas de frecuencias de los datos a partir de las variables de interés edades y géneros.

  • Se visualizan frecuencias con histograma y gráfico de tallo y hoja para datos numéricos (edades) y gráfico de barra para datos categórico o tipo character (géneros).

  • Se interpreta el caso actual.

3 Fundamento Teórico

3.1 Datos Agrupados

Los Datos Agrupados y los Datos No Agrupados se les llaman en Estadística a la manera de representar y analizar la información que ha sido reunida.

La idea de Datos Agrupados tiene que ver con definir un conjunto de clases que identifican de manera organizada un conjunto de datos.

Los Datos No Agrupados es el conjunto de observaciones que se presentan en su forma original tal y como fueron recolectados, para obtener información directamente de ellos.

Los Datos No Agrupados es un conjunto de información si ningún orden que establezca relación clara con lo que se pretende desarrollar a lo largo de un problema; esto se soluciona mediante una tabulación que conduce a una tabla de frecuencias.

Los Valores Agrupados son datos que se dan en intervalos de clase, o en un rango, como cuando se resumen para una distribución de frecuencias.

3.2 Frecuencia

La Frecuencia o Frecuencia Absoluta es el número de veces que aparece un determinado valor en un estudio estadístico, dicho de otra forma, representa al número de repeticiones de un valor dentro de una muestra o población. Se cuenta el número de veces que aparece. La suma de las Frecuencias Absolutas es igual al número total de datos (que puede representarse como n cantidad de elementos).

3.2.1 Frecuencia Relativa

La Frecuencia Relativa es la relación de la frecuencia con respecto al número de elementos n. Es el cociente entre la Frecuencia Absoluta de un determinado valor y el número total de datos. La suma de la frecuencia relativa es igual a 1.

3.2.2 Frecuencia Porcentual

La Frecuencia Porcentual es la representación porcentual de la Frecuencia Relativa con respecto al 100%, es decir, se multiplica la Frecuencia Relativa por 100. La suma de la Frecuencia Porcentual (%) debe ser el 100%.

3.2.3 Frecuencia Acumulada

La Frecuencia Acumulada define la sumatoria parcial y total de la Frecuencia; puede ser la Frecuencia Absoluta, Relativa o la Porcentual.

3.3 Clases

Las clases definen los valores únicos del conjunto de datos o de un intervalo que define y agrupa cierto conjunto de datos. Las clases clasifican y agrupan el total de los datos.

3.4 Puntos Medios y Límites

Los Límites de Clase son los valores mínimos y máximos de una clase; los intervalos de clase es la diferencia entre Límite Superior y Límite Inferior y los Puntos Medios son el valor medio entre cada rango de cada clase.

3.5 Fórmulas para Determinar Clases

3.5.1 Regla de Scott

\[ k=3.5\cdot S \cdot n^{-1/3} \] S es la desviación estándar y n el total de elementos

3.5.2 Regla de Freedman & Diaconis (FD)

\[ k = 2 \cdot IQ \cdot n ^ {-\frac{1}{3}} \] En donde: - IQ es el el rango intercuartílico - n es el total de los datos

3.5.3 Regla de Sturges

La regla de Sturges es un criterio utilizado para determinar el número de clases o intervalos que son necesarios para representar gráficamente un conjunto de datos estadísticos.

La fórmula para calcular el número de clases de acuerdo a Sturges es: \[ k=1+3.322\cdot log10(N) \] En donde: - k es el número de clases.

  • N es el número total de observaciones de la muestra.

  • Log es el logaritmo común de base 10.

El rango de clase de acuerdo a Sturges está dada por: \[ h=\frac{max(datos) - min(datos)}{k} \]

4 Desarrollo

4.1 Sembrar Semilla

Al generar una semilla (con la función set.seed()) nos aseguramos que el conjunto de datos que se genere de manera aleatoria, será el mismo cada vez que utilicemos la función sample() (siempre y cuando se ejecute la semilla junto con la construcción de la población o de la muestra).

set.seed(20222202)

4.2 Cargar líbrerias

Indicamos las librerías que utilizaremos en el desarrollo de este caso; la librería fdth nos permite crear tablas de frecuencias tanto para elementos numéricos como elementos de tipo caracter (todo esto a partir de una estructura de datos), y la librería ggplot2 nos da la posibilidad de generar gráficos que apoyen nuestros resultados estadísticos.

library(fdth)
library(ggplot2)

4.3 Creación de Datos

En este caso se decidió crear una muestra o un conjunto de datos simulando una cantidad de 500 personas, las cuales cuentan con una edad que va desde los 18 hasta los 30 años. al igual que se menciona el género de cada persona. Todo esto será a través de la función sample(), y una vez con las muestras podremos generar el Data Frame o la estructura de datos.

Cant_Personas <- 500
Edades <- sample(x=18:30,size=Cant_Personas,replace = TRUE)
Edades
##   [1] 25 29 19 28 28 30 21 29 21 24 20 30 21 28 25 26 26 23 18 21 21 30 26 19 23
##  [26] 26 21 28 26 26 18 27 27 21 21 30 25 20 21 26 25 25 22 24 30 30 24 18 25 21
##  [51] 22 26 24 23 28 19 22 18 21 29 23 22 27 27 24 28 23 30 24 24 27 19 23 25 22
##  [76] 19 21 29 21 29 21 20 20 30 28 19 25 25 24 22 24 21 18 19 21 22 21 22 30 27
## [101] 18 28 30 25 21 26 24 21 21 23 22 27 24 18 26 30 21 26 25 29 28 22 22 21 24
## [126] 20 19 22 29 18 18 28 27 18 24 18 23 26 20 20 21 19 25 23 23 30 18 25 18 18
## [151] 28 19 18 24 24 27 20 19 26 29 29 21 18 18 20 23 23 29 30 24 24 19 27 20 18
## [176] 24 22 21 26 22 20 26 18 20 28 25 24 29 20 22 29 30 22 23 25 27 30 30 19 19
## [201] 23 21 19 21 25 28 24 20 18 21 24 18 19 30 24 27 24 25 19 26 18 25 21 20 23
## [226] 30 21 18 25 21 22 26 21 19 21 30 19 19 30 30 26 30 25 20 19 22 30 27 19 23
## [251] 23 26 22 26 23 29 20 26 29 27 24 27 30 19 30 23 28 28 28 20 28 23 20 30 20
## [276] 21 22 29 18 18 27 20 26 21 24 18 23 21 26 29 22 26 29 30 30 21 21 18 18 18
## [301] 29 28 26 18 25 27 29 30 30 18 24 29 27 18 20 26 28 26 29 30 27 29 27 20 20
## [326] 27 22 24 20 25 18 21 29 18 30 23 22 28 24 20 28 25 20 23 28 28 22 18 28 28
## [351] 23 29 18 23 29 19 21 23 23 22 24 29 23 18 29 28 18 19 21 25 18 26 27 20 21
## [376] 23 19 18 20 26 22 28 26 18 20 24 23 25 26 26 27 19 27 22 27 25 21 24 30 24
## [401] 26 25 21 25 27 29 19 26 23 22 25 24 19 29 30 26 21 30 23 27 18 25 27 19 30
## [426] 19 24 29 28 24 19 28 28 20 20 24 18 26 21 19 29 23 18 29 30 18 18 21 20 29
## [451] 19 28 23 30 30 28 22 23 21 30 30 24 19 20 27 19 20 24 28 21 25 22 28 18 22
## [476] 26 28 26 20 19 28 19 19 20 26 30 22 29 27 19 26 29 19 27 30 27 22 19 20 19
Generos <- sample(x=c('FEMENINO','MASCULINO'),size=Cant_Personas,replace = TRUE)
Generos
##   [1] "FEMENINO"  "MASCULINO" "FEMENINO"  "MASCULINO" "MASCULINO" "FEMENINO" 
##   [7] "MASCULINO" "MASCULINO" "MASCULINO" "FEMENINO"  "FEMENINO"  "FEMENINO" 
##  [13] "FEMENINO"  "FEMENINO"  "MASCULINO" "FEMENINO"  "FEMENINO"  "MASCULINO"
##  [19] "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO" "FEMENINO" 
##  [25] "MASCULINO" "MASCULINO" "FEMENINO"  "FEMENINO"  "FEMENINO"  "MASCULINO"
##  [31] "FEMENINO"  "FEMENINO"  "FEMENINO"  "MASCULINO" "FEMENINO"  "FEMENINO" 
##  [37] "FEMENINO"  "FEMENINO"  "MASCULINO" "FEMENINO"  "MASCULINO" "MASCULINO"
##  [43] "FEMENINO"  "MASCULINO" "FEMENINO"  "FEMENINO"  "FEMENINO"  "FEMENINO" 
##  [49] "FEMENINO"  "FEMENINO"  "FEMENINO"  "MASCULINO" "MASCULINO" "MASCULINO"
##  [55] "FEMENINO"  "MASCULINO" "MASCULINO" "MASCULINO" "FEMENINO"  "MASCULINO"
##  [61] "FEMENINO"  "FEMENINO"  "FEMENINO"  "FEMENINO"  "FEMENINO"  "MASCULINO"
##  [67] "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO" "FEMENINO"  "FEMENINO" 
##  [73] "MASCULINO" "FEMENINO"  "FEMENINO"  "FEMENINO"  "FEMENINO"  "MASCULINO"
##  [79] "FEMENINO"  "MASCULINO" "FEMENINO"  "FEMENINO"  "MASCULINO" "FEMENINO" 
##  [85] "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO"
##  [91] "MASCULINO" "FEMENINO"  "MASCULINO" "FEMENINO"  "MASCULINO" "FEMENINO" 
##  [97] "MASCULINO" "MASCULINO" "FEMENINO"  "MASCULINO" "MASCULINO" "MASCULINO"
## [103] "MASCULINO" "MASCULINO" "FEMENINO"  "MASCULINO" "FEMENINO"  "FEMENINO" 
## [109] "FEMENINO"  "MASCULINO" "MASCULINO" "MASCULINO" "FEMENINO"  "FEMENINO" 
## [115] "FEMENINO"  "MASCULINO" "FEMENINO"  "FEMENINO"  "MASCULINO" "MASCULINO"
## [121] "MASCULINO" "MASCULINO" "MASCULINO" "FEMENINO"  "FEMENINO"  "MASCULINO"
## [127] "FEMENINO"  "FEMENINO"  "FEMENINO"  "FEMENINO"  "MASCULINO" "MASCULINO"
## [133] "FEMENINO"  "FEMENINO"  "FEMENINO"  "MASCULINO" "MASCULINO" "FEMENINO" 
## [139] "FEMENINO"  "MASCULINO" "FEMENINO"  "FEMENINO"  "MASCULINO" "FEMENINO" 
## [145] "MASCULINO" "MASCULINO" "FEMENINO"  "FEMENINO"  "MASCULINO" "MASCULINO"
## [151] "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO"
## [157] "MASCULINO" "FEMENINO"  "FEMENINO"  "MASCULINO" "FEMENINO"  "FEMENINO" 
## [163] "MASCULINO" "FEMENINO"  "FEMENINO"  "MASCULINO" "FEMENINO"  "MASCULINO"
## [169] "FEMENINO"  "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO" "FEMENINO" 
## [175] "FEMENINO"  "FEMENINO"  "FEMENINO"  "FEMENINO"  "MASCULINO" "MASCULINO"
## [181] "MASCULINO" "FEMENINO"  "FEMENINO"  "FEMENINO"  "FEMENINO"  "MASCULINO"
## [187] "MASCULINO" "MASCULINO" "FEMENINO"  "FEMENINO"  "FEMENINO"  "MASCULINO"
## [193] "MASCULINO" "FEMENINO"  "FEMENINO"  "MASCULINO" "MASCULINO" "MASCULINO"
## [199] "FEMENINO"  "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO" "FEMENINO" 
## [205] "FEMENINO"  "FEMENINO"  "FEMENINO"  "MASCULINO" "MASCULINO" "MASCULINO"
## [211] "FEMENINO"  "FEMENINO"  "MASCULINO" "MASCULINO" "FEMENINO"  "MASCULINO"
## [217] "FEMENINO"  "FEMENINO"  "FEMENINO"  "MASCULINO" "MASCULINO" "FEMENINO" 
## [223] "FEMENINO"  "FEMENINO"  "FEMENINO"  "MASCULINO" "FEMENINO"  "MASCULINO"
## [229] "FEMENINO"  "MASCULINO" "FEMENINO"  "MASCULINO" "FEMENINO"  "MASCULINO"
## [235] "MASCULINO" "MASCULINO" "MASCULINO" "FEMENINO"  "MASCULINO" "FEMENINO" 
## [241] "FEMENINO"  "FEMENINO"  "FEMENINO"  "FEMENINO"  "MASCULINO" "FEMENINO" 
## [247] "MASCULINO" "FEMENINO"  "FEMENINO"  "FEMENINO"  "MASCULINO" "FEMENINO" 
## [253] "MASCULINO" "FEMENINO"  "FEMENINO"  "FEMENINO"  "FEMENINO"  "MASCULINO"
## [259] "FEMENINO"  "FEMENINO"  "MASCULINO" "FEMENINO"  "MASCULINO" "MASCULINO"
## [265] "MASCULINO" "FEMENINO"  "FEMENINO"  "MASCULINO" "MASCULINO" "FEMENINO" 
## [271] "FEMENINO"  "MASCULINO" "FEMENINO"  "MASCULINO" "MASCULINO" "MASCULINO"
## [277] "FEMENINO"  "FEMENINO"  "FEMENINO"  "FEMENINO"  "FEMENINO"  "MASCULINO"
## [283] "MASCULINO" "FEMENINO"  "FEMENINO"  "FEMENINO"  "FEMENINO"  "MASCULINO"
## [289] "MASCULINO" "FEMENINO"  "FEMENINO"  "MASCULINO" "FEMENINO"  "FEMENINO" 
## [295] "MASCULINO" "MASCULINO" "FEMENINO"  "MASCULINO" "FEMENINO"  "FEMENINO" 
## [301] "FEMENINO"  "FEMENINO"  "FEMENINO"  "MASCULINO" "FEMENINO"  "MASCULINO"
## [307] "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO"
## [313] "MASCULINO" "MASCULINO" "FEMENINO"  "MASCULINO" "MASCULINO" "MASCULINO"
## [319] "FEMENINO"  "MASCULINO" "MASCULINO" "FEMENINO"  "MASCULINO" "MASCULINO"
## [325] "FEMENINO"  "FEMENINO"  "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO"
## [331] "FEMENINO"  "FEMENINO"  "FEMENINO"  "FEMENINO"  "MASCULINO" "MASCULINO"
## [337] "MASCULINO" "FEMENINO"  "FEMENINO"  "MASCULINO" "MASCULINO" "MASCULINO"
## [343] "MASCULINO" "FEMENINO"  "FEMENINO"  "MASCULINO" "FEMENINO"  "FEMENINO" 
## [349] "MASCULINO" "FEMENINO"  "MASCULINO" "MASCULINO" "FEMENINO"  "FEMENINO" 
## [355] "MASCULINO" "FEMENINO"  "FEMENINO"  "FEMENINO"  "FEMENINO"  "MASCULINO"
## [361] "FEMENINO"  "FEMENINO"  "FEMENINO"  "MASCULINO" "FEMENINO"  "MASCULINO"
## [367] "MASCULINO" "MASCULINO" "FEMENINO"  "MASCULINO" "FEMENINO"  "FEMENINO" 
## [373] "FEMENINO"  "MASCULINO" "MASCULINO" "FEMENINO"  "FEMENINO"  "MASCULINO"
## [379] "MASCULINO" "MASCULINO" "FEMENINO"  "MASCULINO" "MASCULINO" "FEMENINO" 
## [385] "MASCULINO" "MASCULINO" "FEMENINO"  "MASCULINO" "MASCULINO" "FEMENINO" 
## [391] "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO" "FEMENINO"  "FEMENINO" 
## [397] "FEMENINO"  "FEMENINO"  "MASCULINO" "MASCULINO" "FEMENINO"  "MASCULINO"
## [403] "FEMENINO"  "FEMENINO"  "FEMENINO"  "FEMENINO"  "FEMENINO"  "FEMENINO" 
## [409] "MASCULINO" "MASCULINO" "MASCULINO" "FEMENINO"  "MASCULINO" "FEMENINO" 
## [415] "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO" "FEMENINO"  "FEMENINO" 
## [421] "FEMENINO"  "MASCULINO" "MASCULINO" "FEMENINO"  "FEMENINO"  "FEMENINO" 
## [427] "MASCULINO" "FEMENINO"  "MASCULINO" "FEMENINO"  "MASCULINO" "MASCULINO"
## [433] "FEMENINO"  "MASCULINO" "FEMENINO"  "MASCULINO" "MASCULINO" "FEMENINO" 
## [439] "FEMENINO"  "FEMENINO"  "MASCULINO" "FEMENINO"  "FEMENINO"  "FEMENINO" 
## [445] "MASCULINO" "FEMENINO"  "FEMENINO"  "FEMENINO"  "FEMENINO"  "FEMENINO" 
## [451] "MASCULINO" "FEMENINO"  "MASCULINO" "FEMENINO"  "FEMENINO"  "MASCULINO"
## [457] "MASCULINO" "FEMENINO"  "MASCULINO" "FEMENINO"  "FEMENINO"  "FEMENINO" 
## [463] "FEMENINO"  "FEMENINO"  "FEMENINO"  "FEMENINO"  "MASCULINO" "FEMENINO" 
## [469] "MASCULINO" "FEMENINO"  "MASCULINO" "MASCULINO" "MASCULINO" "FEMENINO" 
## [475] "MASCULINO" "MASCULINO" "FEMENINO"  "MASCULINO" "MASCULINO" "FEMENINO" 
## [481] "MASCULINO" "MASCULINO" "FEMENINO"  "FEMENINO"  "FEMENINO"  "FEMENINO" 
## [487] "MASCULINO" "FEMENINO"  "FEMENINO"  "FEMENINO"  "MASCULINO" "MASCULINO"
## [493] "FEMENINO"  "FEMENINO"  "FEMENINO"  "MASCULINO" "MASCULINO" "FEMENINO" 
## [499] "FEMENINO"  "FEMENINO"
DataFrame <- data.frame(Edades,Generos)
DataFrame
##     Edades   Generos
## 1       25  FEMENINO
## 2       29 MASCULINO
## 3       19  FEMENINO
## 4       28 MASCULINO
## 5       28 MASCULINO
## 6       30  FEMENINO
## 7       21 MASCULINO
## 8       29 MASCULINO
## 9       21 MASCULINO
## 10      24  FEMENINO
## 11      20  FEMENINO
## 12      30  FEMENINO
## 13      21  FEMENINO
## 14      28  FEMENINO
## 15      25 MASCULINO
## 16      26  FEMENINO
## 17      26  FEMENINO
## 18      23 MASCULINO
## 19      18 MASCULINO
## 20      21 MASCULINO
## 21      21 MASCULINO
## 22      30 MASCULINO
## 23      26 MASCULINO
## 24      19  FEMENINO
## 25      23 MASCULINO
## 26      26 MASCULINO
## 27      21  FEMENINO
## 28      28  FEMENINO
## 29      26  FEMENINO
## 30      26 MASCULINO
## 31      18  FEMENINO
## 32      27  FEMENINO
## 33      27  FEMENINO
## 34      21 MASCULINO
## 35      21  FEMENINO
## 36      30  FEMENINO
## 37      25  FEMENINO
## 38      20  FEMENINO
## 39      21 MASCULINO
## 40      26  FEMENINO
## 41      25 MASCULINO
## 42      25 MASCULINO
## 43      22  FEMENINO
## 44      24 MASCULINO
## 45      30  FEMENINO
## 46      30  FEMENINO
## 47      24  FEMENINO
## 48      18  FEMENINO
## 49      25  FEMENINO
## 50      21  FEMENINO
## 51      22  FEMENINO
## 52      26 MASCULINO
## 53      24 MASCULINO
## 54      23 MASCULINO
## 55      28  FEMENINO
## 56      19 MASCULINO
## 57      22 MASCULINO
## 58      18 MASCULINO
## 59      21  FEMENINO
## 60      29 MASCULINO
## 61      23  FEMENINO
## 62      22  FEMENINO
## 63      27  FEMENINO
## 64      27  FEMENINO
## 65      24  FEMENINO
## 66      28 MASCULINO
## 67      23 MASCULINO
## 68      30 MASCULINO
## 69      24 MASCULINO
## 70      24 MASCULINO
## 71      27  FEMENINO
## 72      19  FEMENINO
## 73      23 MASCULINO
## 74      25  FEMENINO
## 75      22  FEMENINO
## 76      19  FEMENINO
## 77      21  FEMENINO
## 78      29 MASCULINO
## 79      21  FEMENINO
## 80      29 MASCULINO
## 81      21  FEMENINO
## 82      20  FEMENINO
## 83      20 MASCULINO
## 84      30  FEMENINO
## 85      28 MASCULINO
## 86      19 MASCULINO
## 87      25 MASCULINO
## 88      25 MASCULINO
## 89      24 MASCULINO
## 90      22 MASCULINO
## 91      24 MASCULINO
## 92      21  FEMENINO
## 93      18 MASCULINO
## 94      19  FEMENINO
## 95      21 MASCULINO
## 96      22  FEMENINO
## 97      21 MASCULINO
## 98      22 MASCULINO
## 99      30  FEMENINO
## 100     27 MASCULINO
## 101     18 MASCULINO
## 102     28 MASCULINO
## 103     30 MASCULINO
## 104     25 MASCULINO
## 105     21  FEMENINO
## 106     26 MASCULINO
## 107     24  FEMENINO
## 108     21  FEMENINO
## 109     21  FEMENINO
## 110     23 MASCULINO
## 111     22 MASCULINO
## 112     27 MASCULINO
## 113     24  FEMENINO
## 114     18  FEMENINO
## 115     26  FEMENINO
## 116     30 MASCULINO
## 117     21  FEMENINO
## 118     26  FEMENINO
## 119     25 MASCULINO
## 120     29 MASCULINO
## 121     28 MASCULINO
## 122     22 MASCULINO
## 123     22 MASCULINO
## 124     21  FEMENINO
## 125     24  FEMENINO
## 126     20 MASCULINO
## 127     19  FEMENINO
## 128     22  FEMENINO
## 129     29  FEMENINO
## 130     18  FEMENINO
## 131     18 MASCULINO
## 132     28 MASCULINO
## 133     27  FEMENINO
## 134     18  FEMENINO
## 135     24  FEMENINO
## 136     18 MASCULINO
## 137     23 MASCULINO
## 138     26  FEMENINO
## 139     20  FEMENINO
## 140     20 MASCULINO
## 141     21  FEMENINO
## 142     19  FEMENINO
## 143     25 MASCULINO
## 144     23  FEMENINO
## 145     23 MASCULINO
## 146     30 MASCULINO
## 147     18  FEMENINO
## 148     25  FEMENINO
## 149     18 MASCULINO
## 150     18 MASCULINO
## 151     28 MASCULINO
## 152     19 MASCULINO
## 153     18 MASCULINO
## 154     24 MASCULINO
## 155     24 MASCULINO
## 156     27 MASCULINO
## 157     20 MASCULINO
## 158     19  FEMENINO
## 159     26  FEMENINO
## 160     29 MASCULINO
## 161     29  FEMENINO
## 162     21  FEMENINO
## 163     18 MASCULINO
## 164     18  FEMENINO
## 165     20  FEMENINO
## 166     23 MASCULINO
## 167     23  FEMENINO
## 168     29 MASCULINO
## 169     30  FEMENINO
## 170     24 MASCULINO
## 171     24 MASCULINO
## 172     19 MASCULINO
## 173     27 MASCULINO
## 174     20  FEMENINO
## 175     18  FEMENINO
## 176     24  FEMENINO
## 177     22  FEMENINO
## 178     21  FEMENINO
## 179     26 MASCULINO
## 180     22 MASCULINO
## 181     20 MASCULINO
## 182     26  FEMENINO
## 183     18  FEMENINO
## 184     20  FEMENINO
## 185     28  FEMENINO
## 186     25 MASCULINO
## 187     24 MASCULINO
## 188     29 MASCULINO
## 189     20  FEMENINO
## 190     22  FEMENINO
## 191     29  FEMENINO
## 192     30 MASCULINO
## 193     22 MASCULINO
## 194     23  FEMENINO
## 195     25  FEMENINO
## 196     27 MASCULINO
## 197     30 MASCULINO
## 198     30 MASCULINO
## 199     19  FEMENINO
## 200     19 MASCULINO
## 201     23 MASCULINO
## 202     21 MASCULINO
## 203     19 MASCULINO
## 204     21  FEMENINO
## 205     25  FEMENINO
## 206     28  FEMENINO
## 207     24  FEMENINO
## 208     20 MASCULINO
## 209     18 MASCULINO
## 210     21 MASCULINO
## 211     24  FEMENINO
## 212     18  FEMENINO
## 213     19 MASCULINO
## 214     30 MASCULINO
## 215     24  FEMENINO
## 216     27 MASCULINO
## 217     24  FEMENINO
## 218     25  FEMENINO
## 219     19  FEMENINO
## 220     26 MASCULINO
## 221     18 MASCULINO
## 222     25  FEMENINO
## 223     21  FEMENINO
## 224     20  FEMENINO
## 225     23  FEMENINO
## 226     30 MASCULINO
## 227     21  FEMENINO
## 228     18 MASCULINO
## 229     25  FEMENINO
## 230     21 MASCULINO
## 231     22  FEMENINO
## 232     26 MASCULINO
## 233     21  FEMENINO
## 234     19 MASCULINO
## 235     21 MASCULINO
## 236     30 MASCULINO
## 237     19 MASCULINO
## 238     19  FEMENINO
## 239     30 MASCULINO
## 240     30  FEMENINO
## 241     26  FEMENINO
## 242     30  FEMENINO
## 243     25  FEMENINO
## 244     20  FEMENINO
## 245     19 MASCULINO
## 246     22  FEMENINO
## 247     30 MASCULINO
## 248     27  FEMENINO
## 249     19  FEMENINO
## 250     23  FEMENINO
## 251     23 MASCULINO
## 252     26  FEMENINO
## 253     22 MASCULINO
## 254     26  FEMENINO
## 255     23  FEMENINO
## 256     29  FEMENINO
## 257     20  FEMENINO
## 258     26 MASCULINO
## 259     29  FEMENINO
## 260     27  FEMENINO
## 261     24 MASCULINO
## 262     27  FEMENINO
## 263     30 MASCULINO
## 264     19 MASCULINO
## 265     30 MASCULINO
## 266     23  FEMENINO
## 267     28  FEMENINO
## 268     28 MASCULINO
## 269     28 MASCULINO
## 270     20  FEMENINO
## 271     28  FEMENINO
## 272     23 MASCULINO
## 273     20  FEMENINO
## 274     30 MASCULINO
## 275     20 MASCULINO
## 276     21 MASCULINO
## 277     22  FEMENINO
## 278     29  FEMENINO
## 279     18  FEMENINO
## 280     18  FEMENINO
## 281     27  FEMENINO
## 282     20 MASCULINO
## 283     26 MASCULINO
## 284     21  FEMENINO
## 285     24  FEMENINO
## 286     18  FEMENINO
## 287     23  FEMENINO
## 288     21 MASCULINO
## 289     26 MASCULINO
## 290     29  FEMENINO
## 291     22  FEMENINO
## 292     26 MASCULINO
## 293     29  FEMENINO
## 294     30  FEMENINO
## 295     30 MASCULINO
## 296     21 MASCULINO
## 297     21  FEMENINO
## 298     18 MASCULINO
## 299     18  FEMENINO
## 300     18  FEMENINO
## 301     29  FEMENINO
## 302     28  FEMENINO
## 303     26  FEMENINO
## 304     18 MASCULINO
## 305     25  FEMENINO
## 306     27 MASCULINO
## 307     29 MASCULINO
## 308     30 MASCULINO
## 309     30 MASCULINO
## 310     18 MASCULINO
## 311     24 MASCULINO
## 312     29 MASCULINO
## 313     27 MASCULINO
## 314     18 MASCULINO
## 315     20  FEMENINO
## 316     26 MASCULINO
## 317     28 MASCULINO
## 318     26 MASCULINO
## 319     29  FEMENINO
## 320     30 MASCULINO
## 321     27 MASCULINO
## 322     29  FEMENINO
## 323     27 MASCULINO
## 324     20 MASCULINO
## 325     20  FEMENINO
## 326     27  FEMENINO
## 327     22 MASCULINO
## 328     24 MASCULINO
## 329     20 MASCULINO
## 330     25 MASCULINO
## 331     18  FEMENINO
## 332     21  FEMENINO
## 333     29  FEMENINO
## 334     18  FEMENINO
## 335     30 MASCULINO
## 336     23 MASCULINO
## 337     22 MASCULINO
## 338     28  FEMENINO
## 339     24  FEMENINO
## 340     20 MASCULINO
## 341     28 MASCULINO
## 342     25 MASCULINO
## 343     20 MASCULINO
## 344     23  FEMENINO
## 345     28  FEMENINO
## 346     28 MASCULINO
## 347     22  FEMENINO
## 348     18  FEMENINO
## 349     28 MASCULINO
## 350     28  FEMENINO
## 351     23 MASCULINO
## 352     29 MASCULINO
## 353     18  FEMENINO
## 354     23  FEMENINO
## 355     29 MASCULINO
## 356     19  FEMENINO
## 357     21  FEMENINO
## 358     23  FEMENINO
## 359     23  FEMENINO
## 360     22 MASCULINO
## 361     24  FEMENINO
## 362     29  FEMENINO
## 363     23  FEMENINO
## 364     18 MASCULINO
## 365     29  FEMENINO
## 366     28 MASCULINO
## 367     18 MASCULINO
## 368     19 MASCULINO
## 369     21  FEMENINO
## 370     25 MASCULINO
## 371     18  FEMENINO
## 372     26  FEMENINO
## 373     27  FEMENINO
## 374     20 MASCULINO
## 375     21 MASCULINO
## 376     23  FEMENINO
## 377     19  FEMENINO
## 378     18 MASCULINO
## 379     20 MASCULINO
## 380     26 MASCULINO
## 381     22  FEMENINO
## 382     28 MASCULINO
## 383     26 MASCULINO
## 384     18  FEMENINO
## 385     20 MASCULINO
## 386     24 MASCULINO
## 387     23  FEMENINO
## 388     25 MASCULINO
## 389     26 MASCULINO
## 390     26  FEMENINO
## 391     27 MASCULINO
## 392     19 MASCULINO
## 393     27 MASCULINO
## 394     22 MASCULINO
## 395     27  FEMENINO
## 396     25  FEMENINO
## 397     21  FEMENINO
## 398     24  FEMENINO
## 399     30 MASCULINO
## 400     24 MASCULINO
## 401     26  FEMENINO
## 402     25 MASCULINO
## 403     21  FEMENINO
## 404     25  FEMENINO
## 405     27  FEMENINO
## 406     29  FEMENINO
## 407     19  FEMENINO
## 408     26  FEMENINO
## 409     23 MASCULINO
## 410     22 MASCULINO
## 411     25 MASCULINO
## 412     24  FEMENINO
## 413     19 MASCULINO
## 414     29  FEMENINO
## 415     30 MASCULINO
## 416     26 MASCULINO
## 417     21 MASCULINO
## 418     30 MASCULINO
## 419     23  FEMENINO
## 420     27  FEMENINO
## 421     18  FEMENINO
## 422     25 MASCULINO
## 423     27 MASCULINO
## 424     19  FEMENINO
## 425     30  FEMENINO
## 426     19  FEMENINO
## 427     24 MASCULINO
## 428     29  FEMENINO
## 429     28 MASCULINO
## 430     24  FEMENINO
## 431     19 MASCULINO
## 432     28 MASCULINO
## 433     28  FEMENINO
## 434     20 MASCULINO
## 435     20  FEMENINO
## 436     24 MASCULINO
## 437     18 MASCULINO
## 438     26  FEMENINO
## 439     21  FEMENINO
## 440     19  FEMENINO
## 441     29 MASCULINO
## 442     23  FEMENINO
## 443     18  FEMENINO
## 444     29  FEMENINO
## 445     30 MASCULINO
## 446     18  FEMENINO
## 447     18  FEMENINO
## 448     21  FEMENINO
## 449     20  FEMENINO
## 450     29  FEMENINO
## 451     19 MASCULINO
## 452     28  FEMENINO
## 453     23 MASCULINO
## 454     30  FEMENINO
## 455     30  FEMENINO
## 456     28 MASCULINO
## 457     22 MASCULINO
## 458     23  FEMENINO
## 459     21 MASCULINO
## 460     30  FEMENINO
## 461     30  FEMENINO
## 462     24  FEMENINO
## 463     19  FEMENINO
## 464     20  FEMENINO
## 465     27  FEMENINO
## 466     19  FEMENINO
## 467     20 MASCULINO
## 468     24  FEMENINO
## 469     28 MASCULINO
## 470     21  FEMENINO
## 471     25 MASCULINO
## 472     22 MASCULINO
## 473     28 MASCULINO
## 474     18  FEMENINO
## 475     22 MASCULINO
## 476     26 MASCULINO
## 477     28  FEMENINO
## 478     26 MASCULINO
## 479     20 MASCULINO
## 480     19  FEMENINO
## 481     28 MASCULINO
## 482     19 MASCULINO
## 483     19  FEMENINO
## 484     20  FEMENINO
## 485     26  FEMENINO
## 486     30  FEMENINO
## 487     22 MASCULINO
## 488     29  FEMENINO
## 489     27  FEMENINO
## 490     19  FEMENINO
## 491     26 MASCULINO
## 492     29 MASCULINO
## 493     19  FEMENINO
## 494     27  FEMENINO
## 495     30  FEMENINO
## 496     27 MASCULINO
## 497     22 MASCULINO
## 498     19  FEMENINO
## 499     20  FEMENINO
## 500     19  FEMENINO

4.4 Mostrar los primeros diez datos.

Para solo mostrar los primeros 10 datos o elementos del conjunto de datos (si es que asi se requiere), se utiliza la función head() (en donde se le especifica el nombre del conjunto de datos y la cantidad de elementos que quieres obtener, ya que por defecto muestra los primeros 6 elementos).

head(DataFrame,10)
##    Edades   Generos
## 1      25  FEMENINO
## 2      29 MASCULINO
## 3      19  FEMENINO
## 4      28 MASCULINO
## 5      28 MASCULINO
## 6      30  FEMENINO
## 7      21 MASCULINO
## 8      29 MASCULINO
## 9      21 MASCULINO
## 10     24  FEMENINO

4.5 Mostrar los últimos diez datos.

En caso contrario, si se requiere conocer los últimos 10 datos del conjunto de datos, entonces se utiliza la función tails() (se indica el nombre del conjunto de datos y la cantidad de elementos que se desea mostrar. Por defecto mostrara los últimos 6 elementos).

tail(DataFrame,10)
##     Edades   Generos
## 491     26 MASCULINO
## 492     29 MASCULINO
## 493     19  FEMENINO
## 494     27  FEMENINO
## 495     30  FEMENINO
## 496     27 MASCULINO
## 497     22 MASCULINO
## 498     19  FEMENINO
## 499     20  FEMENINO
## 500     19  FEMENINO

4.6 Crear Tabla de Frecuencias y Visualizar los Datos

4.6.1 Variable Edades

En esta sección se genera una tabla de frecuencias a partir de una variable de interés; en este caso usaremos la variable asignada que contiene las edades del conjunto de datos; para esto se utiliza la función fdt() (en donde se le especifica que los valores x serán obtenidos de una variable especifica que forma parte de un conjunto de datos, y una formula que nos permita calcular las clases por la cual se dividirá la tabla de frecuencias.)

Tabla.Frec.Edades <- fdt(x=DataFrame$Edades,breaks ='Sturges')
Tabla.Frec.Edades
##   Class limits  f   rf rf(%)  cf cf(%)
##  [17.82,19.07) 90 0.18  18.0  90  18.0
##  [19.07,20.32) 38 0.08   7.6 128  25.6
##  [20.32,21.56) 49 0.10   9.8 177  35.4
##  [21.56,22.81) 33 0.07   6.6 210  42.0
##  [22.81,24.06) 73 0.15  14.6 283  56.6
##  [24.06,25.31) 31 0.06   6.2 314  62.8
##  [25.31,26.56) 40 0.08   8.0 354  70.8
##   [26.56,27.8) 32 0.06   6.4 386  77.2
##   [27.8,29.05) 71 0.14  14.2 457  91.4
##   [29.05,30.3) 43 0.09   8.6 500 100.0

4.6.2 Histograma

Un histograma es un representación gráfica organizada que describe frecuencias de clases de datos numéricos en forma de barra (esto a través de la función ggplot()).

ggplot(data = DataFrame) +
    geom_histogram(aes(x=Edades), fill ='orange', binwidth = 0.2, bins = 30)

4.6.2.1 Histograma utilizando la función hist()

La función hist() no requiere librería y se puede utilizar directamente para representar un histograma y determina frecuencia. En este ejemplo con los valores de la Tabla de Frecuencias de Edades

hist(DataFrame$Edades, breaks = (min(Edades)-1):(max(Edades)+1), main = "Histograma de Edades (de 18 a 30 años)", xlab = "Edades", ylab = "Frecuencia")

4.6.3 Diagrama de Tallo y Hoja

La función stem() representa un diagrama de tallo y hoja. El diagrama de tallo y hoja identifica frecuencias de clases en formato textual.

stem(DataFrame$Edades)
## 
##   The decimal point is at the |
## 
##   18 | 00000000000000000000000000000000000000000000000
##   19 | 0000000000000000000000000000000000000000000
##   20 | 00000000000000000000000000000000000000
##   21 | 0000000000000000000000000000000000000000000000000
##   22 | 000000000000000000000000000000000
##   23 | 00000000000000000000000000000000000
##   24 | 00000000000000000000000000000000000000
##   25 | 0000000000000000000000000000000
##   26 | 0000000000000000000000000000000000000000
##   27 | 00000000000000000000000000000000
##   28 | 000000000000000000000000000000000000
##   29 | 00000000000000000000000000000000000
##   30 | 0000000000000000000000000000000000000000000

4.6.4 Variable Géneros

Ahora se genera una tabla de frecuencias a partir de una variable de interés; en este caso usaremos la variable asignada que contiene los géneros del conjunto de datos; para esto se utiliza la función fdt_cat() (en donde se le especifica que los valores de tipo caracter x serán obtenidos de una variable especifica que forma parte de un conjunto de datos, y una formula que nos permita calcular las clases por la cual se dividirá la tabla de frecuencias.)

Tabla.Frec.Generos <- fdt_cat(x=DataFrame$Generos, breaks = "Sturges")
Tabla.Frec.Generos
##   Category   f   rf rf(%)  cf cf(%)
##   FEMENINO 259 0.52  51.8 259  51.8
##  MASCULINO 241 0.48  48.2 500 100.0

4.6.5 Diagrama o Gráfica de Barras

La Grafica de Barras nos ayuda a visualizar de una mejor manera la frecuencia de cierta variable que nosotros indiquemos (en este caso el valor a visualizar sera la frecuencia en cuanto a el Género de las personas).

ggplot(data = DataFrame) +
  geom_bar(aes(x = Generos))

5 Interpretación

De cierta forma puedo decir que el usar las funciones o métodos aplicados durante el desarrollo de este caso, pueden ser de gran utilidad al momento de visualizar los elementos que conforman un conjunto de datos con el cual estemos trabajando; como se vio hay varias maneras de observar dichos datos, y a través de esta interpretación puede darse el seguimiento a cierta toma de decisiones (aunque esto ya dependerá de las diferentes situaciones).

Habrá ocasiones en las un resumen estadístico no sea suficiente (quizás dependiendo de la experiencia de cada persona), por lo tanto hacer uso de herramientas especiales o funciones que nos permitan visualizar estos conjuntos de datos, brindan una ayuda considerable en cuanto a la comprensión y análisis de datos (que pueden servir de base para aquellos que decidan especializarse como Analista de Datos).