Agrupar y describir datos de manera visual de variables que tengan relación con la ‘Edad’ y de ‘Género’, utilizando la función fdt() y fdt_cat(), pertenecientes a la librería fdth.
Se cargan las librerías adecuadas para realizar el caso.
Se construyen y simulan datos con dos variables de interés (edades y géneros de personas).
Se determina las clase para construir tablas de frecuencias de los datos a partir de las variables de interés edades y géneros.
Se visualizan frecuencias con histograma y gráfico de tallo y hoja para datos numéricos (edades) y gráfico de barra para datos categórico o tipo character (géneros).
Se interpreta el caso actual.
Los Datos Agrupados y los Datos No Agrupados se les llaman en Estadística a la manera de representar y analizar la información que ha sido reunida.
La idea de Datos Agrupados tiene que ver con definir un conjunto de clases que identifican de manera organizada un conjunto de datos.
Los Datos No Agrupados es el conjunto de observaciones que se presentan en su forma original tal y como fueron recolectados, para obtener información directamente de ellos.
Los Datos No Agrupados es un conjunto de información si ningún orden que establezca relación clara con lo que se pretende desarrollar a lo largo de un problema; esto se soluciona mediante una tabulación que conduce a una tabla de frecuencias.
Los Valores Agrupados son datos que se dan en intervalos de clase, o en un rango, como cuando se resumen para una distribución de frecuencias.
La Frecuencia o Frecuencia Absoluta es el número de veces que aparece un determinado valor en un estudio estadístico, dicho de otra forma, representa al número de repeticiones de un valor dentro de una muestra o población. Se cuenta el número de veces que aparece. La suma de las Frecuencias Absolutas es igual al número total de datos (que puede representarse como n cantidad de elementos).
La Frecuencia Relativa es la relación de la frecuencia con respecto al número de elementos n. Es el cociente entre la Frecuencia Absoluta de un determinado valor y el número total de datos. La suma de la frecuencia relativa es igual a 1.
La Frecuencia Porcentual es la representación porcentual de la Frecuencia Relativa con respecto al 100%, es decir, se multiplica la Frecuencia Relativa por 100. La suma de la Frecuencia Porcentual (%) debe ser el 100%.
La Frecuencia Acumulada define la sumatoria parcial y total de la Frecuencia; puede ser la Frecuencia Absoluta, Relativa o la Porcentual.
Las clases definen los valores únicos del conjunto de datos o de un intervalo que define y agrupa cierto conjunto de datos. Las clases clasifican y agrupan el total de los datos.
Los Límites de Clase son los valores mínimos y máximos de una clase; los intervalos de clase es la diferencia entre Límite Superior y Límite Inferior y los Puntos Medios son el valor medio entre cada rango de cada clase.
\[ k=3.5\cdot S \cdot n^{-1/3} \] S es la desviación estándar y n el total de elementos
\[ k = 2 \cdot IQ \cdot n ^ {-\frac{1}{3}} \] En donde: - IQ es el el rango intercuartílico - n es el total de los datos
La regla de Sturges es un criterio utilizado para determinar el número de clases o intervalos que son necesarios para representar gráficamente un conjunto de datos estadísticos.
La fórmula para calcular el número de clases de acuerdo a Sturges es: \[ k=1+3.322\cdot log10(N) \] En donde: - k es el número de clases.
N es el número total de observaciones de la muestra.
Log es el logaritmo común de base 10.
El rango de clase de acuerdo a Sturges está dada por: \[ h=\frac{max(datos) - min(datos)}{k} \]
Al generar una semilla (con la función set.seed()) nos aseguramos que el conjunto de datos que se genere de manera aleatoria, será el mismo cada vez que utilicemos la función sample() (siempre y cuando se ejecute la semilla junto con la construcción de la población o de la muestra).
set.seed(20222202)
Indicamos las librerías que utilizaremos en el desarrollo de este caso; la librería fdth nos permite crear tablas de frecuencias tanto para elementos numéricos como elementos de tipo caracter (todo esto a partir de una estructura de datos), y la librería ggplot2 nos da la posibilidad de generar gráficos que apoyen nuestros resultados estadísticos.
library(fdth)
library(ggplot2)
En este caso se decidió crear una muestra o un conjunto de datos simulando una cantidad de 500 personas, las cuales cuentan con una edad que va desde los 18 hasta los 30 años. al igual que se menciona el género de cada persona. Todo esto será a través de la función sample(), y una vez con las muestras podremos generar el Data Frame o la estructura de datos.
Cant_Personas <- 500
Edades <- sample(x=18:30,size=Cant_Personas,replace = TRUE)
Edades
## [1] 25 29 19 28 28 30 21 29 21 24 20 30 21 28 25 26 26 23 18 21 21 30 26 19 23
## [26] 26 21 28 26 26 18 27 27 21 21 30 25 20 21 26 25 25 22 24 30 30 24 18 25 21
## [51] 22 26 24 23 28 19 22 18 21 29 23 22 27 27 24 28 23 30 24 24 27 19 23 25 22
## [76] 19 21 29 21 29 21 20 20 30 28 19 25 25 24 22 24 21 18 19 21 22 21 22 30 27
## [101] 18 28 30 25 21 26 24 21 21 23 22 27 24 18 26 30 21 26 25 29 28 22 22 21 24
## [126] 20 19 22 29 18 18 28 27 18 24 18 23 26 20 20 21 19 25 23 23 30 18 25 18 18
## [151] 28 19 18 24 24 27 20 19 26 29 29 21 18 18 20 23 23 29 30 24 24 19 27 20 18
## [176] 24 22 21 26 22 20 26 18 20 28 25 24 29 20 22 29 30 22 23 25 27 30 30 19 19
## [201] 23 21 19 21 25 28 24 20 18 21 24 18 19 30 24 27 24 25 19 26 18 25 21 20 23
## [226] 30 21 18 25 21 22 26 21 19 21 30 19 19 30 30 26 30 25 20 19 22 30 27 19 23
## [251] 23 26 22 26 23 29 20 26 29 27 24 27 30 19 30 23 28 28 28 20 28 23 20 30 20
## [276] 21 22 29 18 18 27 20 26 21 24 18 23 21 26 29 22 26 29 30 30 21 21 18 18 18
## [301] 29 28 26 18 25 27 29 30 30 18 24 29 27 18 20 26 28 26 29 30 27 29 27 20 20
## [326] 27 22 24 20 25 18 21 29 18 30 23 22 28 24 20 28 25 20 23 28 28 22 18 28 28
## [351] 23 29 18 23 29 19 21 23 23 22 24 29 23 18 29 28 18 19 21 25 18 26 27 20 21
## [376] 23 19 18 20 26 22 28 26 18 20 24 23 25 26 26 27 19 27 22 27 25 21 24 30 24
## [401] 26 25 21 25 27 29 19 26 23 22 25 24 19 29 30 26 21 30 23 27 18 25 27 19 30
## [426] 19 24 29 28 24 19 28 28 20 20 24 18 26 21 19 29 23 18 29 30 18 18 21 20 29
## [451] 19 28 23 30 30 28 22 23 21 30 30 24 19 20 27 19 20 24 28 21 25 22 28 18 22
## [476] 26 28 26 20 19 28 19 19 20 26 30 22 29 27 19 26 29 19 27 30 27 22 19 20 19
Generos <- sample(x=c('FEMENINO','MASCULINO'),size=Cant_Personas,replace = TRUE)
Generos
## [1] "FEMENINO" "MASCULINO" "FEMENINO" "MASCULINO" "MASCULINO" "FEMENINO"
## [7] "MASCULINO" "MASCULINO" "MASCULINO" "FEMENINO" "FEMENINO" "FEMENINO"
## [13] "FEMENINO" "FEMENINO" "MASCULINO" "FEMENINO" "FEMENINO" "MASCULINO"
## [19] "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO" "FEMENINO"
## [25] "MASCULINO" "MASCULINO" "FEMENINO" "FEMENINO" "FEMENINO" "MASCULINO"
## [31] "FEMENINO" "FEMENINO" "FEMENINO" "MASCULINO" "FEMENINO" "FEMENINO"
## [37] "FEMENINO" "FEMENINO" "MASCULINO" "FEMENINO" "MASCULINO" "MASCULINO"
## [43] "FEMENINO" "MASCULINO" "FEMENINO" "FEMENINO" "FEMENINO" "FEMENINO"
## [49] "FEMENINO" "FEMENINO" "FEMENINO" "MASCULINO" "MASCULINO" "MASCULINO"
## [55] "FEMENINO" "MASCULINO" "MASCULINO" "MASCULINO" "FEMENINO" "MASCULINO"
## [61] "FEMENINO" "FEMENINO" "FEMENINO" "FEMENINO" "FEMENINO" "MASCULINO"
## [67] "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO" "FEMENINO" "FEMENINO"
## [73] "MASCULINO" "FEMENINO" "FEMENINO" "FEMENINO" "FEMENINO" "MASCULINO"
## [79] "FEMENINO" "MASCULINO" "FEMENINO" "FEMENINO" "MASCULINO" "FEMENINO"
## [85] "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO"
## [91] "MASCULINO" "FEMENINO" "MASCULINO" "FEMENINO" "MASCULINO" "FEMENINO"
## [97] "MASCULINO" "MASCULINO" "FEMENINO" "MASCULINO" "MASCULINO" "MASCULINO"
## [103] "MASCULINO" "MASCULINO" "FEMENINO" "MASCULINO" "FEMENINO" "FEMENINO"
## [109] "FEMENINO" "MASCULINO" "MASCULINO" "MASCULINO" "FEMENINO" "FEMENINO"
## [115] "FEMENINO" "MASCULINO" "FEMENINO" "FEMENINO" "MASCULINO" "MASCULINO"
## [121] "MASCULINO" "MASCULINO" "MASCULINO" "FEMENINO" "FEMENINO" "MASCULINO"
## [127] "FEMENINO" "FEMENINO" "FEMENINO" "FEMENINO" "MASCULINO" "MASCULINO"
## [133] "FEMENINO" "FEMENINO" "FEMENINO" "MASCULINO" "MASCULINO" "FEMENINO"
## [139] "FEMENINO" "MASCULINO" "FEMENINO" "FEMENINO" "MASCULINO" "FEMENINO"
## [145] "MASCULINO" "MASCULINO" "FEMENINO" "FEMENINO" "MASCULINO" "MASCULINO"
## [151] "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO"
## [157] "MASCULINO" "FEMENINO" "FEMENINO" "MASCULINO" "FEMENINO" "FEMENINO"
## [163] "MASCULINO" "FEMENINO" "FEMENINO" "MASCULINO" "FEMENINO" "MASCULINO"
## [169] "FEMENINO" "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO" "FEMENINO"
## [175] "FEMENINO" "FEMENINO" "FEMENINO" "FEMENINO" "MASCULINO" "MASCULINO"
## [181] "MASCULINO" "FEMENINO" "FEMENINO" "FEMENINO" "FEMENINO" "MASCULINO"
## [187] "MASCULINO" "MASCULINO" "FEMENINO" "FEMENINO" "FEMENINO" "MASCULINO"
## [193] "MASCULINO" "FEMENINO" "FEMENINO" "MASCULINO" "MASCULINO" "MASCULINO"
## [199] "FEMENINO" "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO" "FEMENINO"
## [205] "FEMENINO" "FEMENINO" "FEMENINO" "MASCULINO" "MASCULINO" "MASCULINO"
## [211] "FEMENINO" "FEMENINO" "MASCULINO" "MASCULINO" "FEMENINO" "MASCULINO"
## [217] "FEMENINO" "FEMENINO" "FEMENINO" "MASCULINO" "MASCULINO" "FEMENINO"
## [223] "FEMENINO" "FEMENINO" "FEMENINO" "MASCULINO" "FEMENINO" "MASCULINO"
## [229] "FEMENINO" "MASCULINO" "FEMENINO" "MASCULINO" "FEMENINO" "MASCULINO"
## [235] "MASCULINO" "MASCULINO" "MASCULINO" "FEMENINO" "MASCULINO" "FEMENINO"
## [241] "FEMENINO" "FEMENINO" "FEMENINO" "FEMENINO" "MASCULINO" "FEMENINO"
## [247] "MASCULINO" "FEMENINO" "FEMENINO" "FEMENINO" "MASCULINO" "FEMENINO"
## [253] "MASCULINO" "FEMENINO" "FEMENINO" "FEMENINO" "FEMENINO" "MASCULINO"
## [259] "FEMENINO" "FEMENINO" "MASCULINO" "FEMENINO" "MASCULINO" "MASCULINO"
## [265] "MASCULINO" "FEMENINO" "FEMENINO" "MASCULINO" "MASCULINO" "FEMENINO"
## [271] "FEMENINO" "MASCULINO" "FEMENINO" "MASCULINO" "MASCULINO" "MASCULINO"
## [277] "FEMENINO" "FEMENINO" "FEMENINO" "FEMENINO" "FEMENINO" "MASCULINO"
## [283] "MASCULINO" "FEMENINO" "FEMENINO" "FEMENINO" "FEMENINO" "MASCULINO"
## [289] "MASCULINO" "FEMENINO" "FEMENINO" "MASCULINO" "FEMENINO" "FEMENINO"
## [295] "MASCULINO" "MASCULINO" "FEMENINO" "MASCULINO" "FEMENINO" "FEMENINO"
## [301] "FEMENINO" "FEMENINO" "FEMENINO" "MASCULINO" "FEMENINO" "MASCULINO"
## [307] "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO"
## [313] "MASCULINO" "MASCULINO" "FEMENINO" "MASCULINO" "MASCULINO" "MASCULINO"
## [319] "FEMENINO" "MASCULINO" "MASCULINO" "FEMENINO" "MASCULINO" "MASCULINO"
## [325] "FEMENINO" "FEMENINO" "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO"
## [331] "FEMENINO" "FEMENINO" "FEMENINO" "FEMENINO" "MASCULINO" "MASCULINO"
## [337] "MASCULINO" "FEMENINO" "FEMENINO" "MASCULINO" "MASCULINO" "MASCULINO"
## [343] "MASCULINO" "FEMENINO" "FEMENINO" "MASCULINO" "FEMENINO" "FEMENINO"
## [349] "MASCULINO" "FEMENINO" "MASCULINO" "MASCULINO" "FEMENINO" "FEMENINO"
## [355] "MASCULINO" "FEMENINO" "FEMENINO" "FEMENINO" "FEMENINO" "MASCULINO"
## [361] "FEMENINO" "FEMENINO" "FEMENINO" "MASCULINO" "FEMENINO" "MASCULINO"
## [367] "MASCULINO" "MASCULINO" "FEMENINO" "MASCULINO" "FEMENINO" "FEMENINO"
## [373] "FEMENINO" "MASCULINO" "MASCULINO" "FEMENINO" "FEMENINO" "MASCULINO"
## [379] "MASCULINO" "MASCULINO" "FEMENINO" "MASCULINO" "MASCULINO" "FEMENINO"
## [385] "MASCULINO" "MASCULINO" "FEMENINO" "MASCULINO" "MASCULINO" "FEMENINO"
## [391] "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO" "FEMENINO" "FEMENINO"
## [397] "FEMENINO" "FEMENINO" "MASCULINO" "MASCULINO" "FEMENINO" "MASCULINO"
## [403] "FEMENINO" "FEMENINO" "FEMENINO" "FEMENINO" "FEMENINO" "FEMENINO"
## [409] "MASCULINO" "MASCULINO" "MASCULINO" "FEMENINO" "MASCULINO" "FEMENINO"
## [415] "MASCULINO" "MASCULINO" "MASCULINO" "MASCULINO" "FEMENINO" "FEMENINO"
## [421] "FEMENINO" "MASCULINO" "MASCULINO" "FEMENINO" "FEMENINO" "FEMENINO"
## [427] "MASCULINO" "FEMENINO" "MASCULINO" "FEMENINO" "MASCULINO" "MASCULINO"
## [433] "FEMENINO" "MASCULINO" "FEMENINO" "MASCULINO" "MASCULINO" "FEMENINO"
## [439] "FEMENINO" "FEMENINO" "MASCULINO" "FEMENINO" "FEMENINO" "FEMENINO"
## [445] "MASCULINO" "FEMENINO" "FEMENINO" "FEMENINO" "FEMENINO" "FEMENINO"
## [451] "MASCULINO" "FEMENINO" "MASCULINO" "FEMENINO" "FEMENINO" "MASCULINO"
## [457] "MASCULINO" "FEMENINO" "MASCULINO" "FEMENINO" "FEMENINO" "FEMENINO"
## [463] "FEMENINO" "FEMENINO" "FEMENINO" "FEMENINO" "MASCULINO" "FEMENINO"
## [469] "MASCULINO" "FEMENINO" "MASCULINO" "MASCULINO" "MASCULINO" "FEMENINO"
## [475] "MASCULINO" "MASCULINO" "FEMENINO" "MASCULINO" "MASCULINO" "FEMENINO"
## [481] "MASCULINO" "MASCULINO" "FEMENINO" "FEMENINO" "FEMENINO" "FEMENINO"
## [487] "MASCULINO" "FEMENINO" "FEMENINO" "FEMENINO" "MASCULINO" "MASCULINO"
## [493] "FEMENINO" "FEMENINO" "FEMENINO" "MASCULINO" "MASCULINO" "FEMENINO"
## [499] "FEMENINO" "FEMENINO"
DataFrame <- data.frame(Edades,Generos)
DataFrame
## Edades Generos
## 1 25 FEMENINO
## 2 29 MASCULINO
## 3 19 FEMENINO
## 4 28 MASCULINO
## 5 28 MASCULINO
## 6 30 FEMENINO
## 7 21 MASCULINO
## 8 29 MASCULINO
## 9 21 MASCULINO
## 10 24 FEMENINO
## 11 20 FEMENINO
## 12 30 FEMENINO
## 13 21 FEMENINO
## 14 28 FEMENINO
## 15 25 MASCULINO
## 16 26 FEMENINO
## 17 26 FEMENINO
## 18 23 MASCULINO
## 19 18 MASCULINO
## 20 21 MASCULINO
## 21 21 MASCULINO
## 22 30 MASCULINO
## 23 26 MASCULINO
## 24 19 FEMENINO
## 25 23 MASCULINO
## 26 26 MASCULINO
## 27 21 FEMENINO
## 28 28 FEMENINO
## 29 26 FEMENINO
## 30 26 MASCULINO
## 31 18 FEMENINO
## 32 27 FEMENINO
## 33 27 FEMENINO
## 34 21 MASCULINO
## 35 21 FEMENINO
## 36 30 FEMENINO
## 37 25 FEMENINO
## 38 20 FEMENINO
## 39 21 MASCULINO
## 40 26 FEMENINO
## 41 25 MASCULINO
## 42 25 MASCULINO
## 43 22 FEMENINO
## 44 24 MASCULINO
## 45 30 FEMENINO
## 46 30 FEMENINO
## 47 24 FEMENINO
## 48 18 FEMENINO
## 49 25 FEMENINO
## 50 21 FEMENINO
## 51 22 FEMENINO
## 52 26 MASCULINO
## 53 24 MASCULINO
## 54 23 MASCULINO
## 55 28 FEMENINO
## 56 19 MASCULINO
## 57 22 MASCULINO
## 58 18 MASCULINO
## 59 21 FEMENINO
## 60 29 MASCULINO
## 61 23 FEMENINO
## 62 22 FEMENINO
## 63 27 FEMENINO
## 64 27 FEMENINO
## 65 24 FEMENINO
## 66 28 MASCULINO
## 67 23 MASCULINO
## 68 30 MASCULINO
## 69 24 MASCULINO
## 70 24 MASCULINO
## 71 27 FEMENINO
## 72 19 FEMENINO
## 73 23 MASCULINO
## 74 25 FEMENINO
## 75 22 FEMENINO
## 76 19 FEMENINO
## 77 21 FEMENINO
## 78 29 MASCULINO
## 79 21 FEMENINO
## 80 29 MASCULINO
## 81 21 FEMENINO
## 82 20 FEMENINO
## 83 20 MASCULINO
## 84 30 FEMENINO
## 85 28 MASCULINO
## 86 19 MASCULINO
## 87 25 MASCULINO
## 88 25 MASCULINO
## 89 24 MASCULINO
## 90 22 MASCULINO
## 91 24 MASCULINO
## 92 21 FEMENINO
## 93 18 MASCULINO
## 94 19 FEMENINO
## 95 21 MASCULINO
## 96 22 FEMENINO
## 97 21 MASCULINO
## 98 22 MASCULINO
## 99 30 FEMENINO
## 100 27 MASCULINO
## 101 18 MASCULINO
## 102 28 MASCULINO
## 103 30 MASCULINO
## 104 25 MASCULINO
## 105 21 FEMENINO
## 106 26 MASCULINO
## 107 24 FEMENINO
## 108 21 FEMENINO
## 109 21 FEMENINO
## 110 23 MASCULINO
## 111 22 MASCULINO
## 112 27 MASCULINO
## 113 24 FEMENINO
## 114 18 FEMENINO
## 115 26 FEMENINO
## 116 30 MASCULINO
## 117 21 FEMENINO
## 118 26 FEMENINO
## 119 25 MASCULINO
## 120 29 MASCULINO
## 121 28 MASCULINO
## 122 22 MASCULINO
## 123 22 MASCULINO
## 124 21 FEMENINO
## 125 24 FEMENINO
## 126 20 MASCULINO
## 127 19 FEMENINO
## 128 22 FEMENINO
## 129 29 FEMENINO
## 130 18 FEMENINO
## 131 18 MASCULINO
## 132 28 MASCULINO
## 133 27 FEMENINO
## 134 18 FEMENINO
## 135 24 FEMENINO
## 136 18 MASCULINO
## 137 23 MASCULINO
## 138 26 FEMENINO
## 139 20 FEMENINO
## 140 20 MASCULINO
## 141 21 FEMENINO
## 142 19 FEMENINO
## 143 25 MASCULINO
## 144 23 FEMENINO
## 145 23 MASCULINO
## 146 30 MASCULINO
## 147 18 FEMENINO
## 148 25 FEMENINO
## 149 18 MASCULINO
## 150 18 MASCULINO
## 151 28 MASCULINO
## 152 19 MASCULINO
## 153 18 MASCULINO
## 154 24 MASCULINO
## 155 24 MASCULINO
## 156 27 MASCULINO
## 157 20 MASCULINO
## 158 19 FEMENINO
## 159 26 FEMENINO
## 160 29 MASCULINO
## 161 29 FEMENINO
## 162 21 FEMENINO
## 163 18 MASCULINO
## 164 18 FEMENINO
## 165 20 FEMENINO
## 166 23 MASCULINO
## 167 23 FEMENINO
## 168 29 MASCULINO
## 169 30 FEMENINO
## 170 24 MASCULINO
## 171 24 MASCULINO
## 172 19 MASCULINO
## 173 27 MASCULINO
## 174 20 FEMENINO
## 175 18 FEMENINO
## 176 24 FEMENINO
## 177 22 FEMENINO
## 178 21 FEMENINO
## 179 26 MASCULINO
## 180 22 MASCULINO
## 181 20 MASCULINO
## 182 26 FEMENINO
## 183 18 FEMENINO
## 184 20 FEMENINO
## 185 28 FEMENINO
## 186 25 MASCULINO
## 187 24 MASCULINO
## 188 29 MASCULINO
## 189 20 FEMENINO
## 190 22 FEMENINO
## 191 29 FEMENINO
## 192 30 MASCULINO
## 193 22 MASCULINO
## 194 23 FEMENINO
## 195 25 FEMENINO
## 196 27 MASCULINO
## 197 30 MASCULINO
## 198 30 MASCULINO
## 199 19 FEMENINO
## 200 19 MASCULINO
## 201 23 MASCULINO
## 202 21 MASCULINO
## 203 19 MASCULINO
## 204 21 FEMENINO
## 205 25 FEMENINO
## 206 28 FEMENINO
## 207 24 FEMENINO
## 208 20 MASCULINO
## 209 18 MASCULINO
## 210 21 MASCULINO
## 211 24 FEMENINO
## 212 18 FEMENINO
## 213 19 MASCULINO
## 214 30 MASCULINO
## 215 24 FEMENINO
## 216 27 MASCULINO
## 217 24 FEMENINO
## 218 25 FEMENINO
## 219 19 FEMENINO
## 220 26 MASCULINO
## 221 18 MASCULINO
## 222 25 FEMENINO
## 223 21 FEMENINO
## 224 20 FEMENINO
## 225 23 FEMENINO
## 226 30 MASCULINO
## 227 21 FEMENINO
## 228 18 MASCULINO
## 229 25 FEMENINO
## 230 21 MASCULINO
## 231 22 FEMENINO
## 232 26 MASCULINO
## 233 21 FEMENINO
## 234 19 MASCULINO
## 235 21 MASCULINO
## 236 30 MASCULINO
## 237 19 MASCULINO
## 238 19 FEMENINO
## 239 30 MASCULINO
## 240 30 FEMENINO
## 241 26 FEMENINO
## 242 30 FEMENINO
## 243 25 FEMENINO
## 244 20 FEMENINO
## 245 19 MASCULINO
## 246 22 FEMENINO
## 247 30 MASCULINO
## 248 27 FEMENINO
## 249 19 FEMENINO
## 250 23 FEMENINO
## 251 23 MASCULINO
## 252 26 FEMENINO
## 253 22 MASCULINO
## 254 26 FEMENINO
## 255 23 FEMENINO
## 256 29 FEMENINO
## 257 20 FEMENINO
## 258 26 MASCULINO
## 259 29 FEMENINO
## 260 27 FEMENINO
## 261 24 MASCULINO
## 262 27 FEMENINO
## 263 30 MASCULINO
## 264 19 MASCULINO
## 265 30 MASCULINO
## 266 23 FEMENINO
## 267 28 FEMENINO
## 268 28 MASCULINO
## 269 28 MASCULINO
## 270 20 FEMENINO
## 271 28 FEMENINO
## 272 23 MASCULINO
## 273 20 FEMENINO
## 274 30 MASCULINO
## 275 20 MASCULINO
## 276 21 MASCULINO
## 277 22 FEMENINO
## 278 29 FEMENINO
## 279 18 FEMENINO
## 280 18 FEMENINO
## 281 27 FEMENINO
## 282 20 MASCULINO
## 283 26 MASCULINO
## 284 21 FEMENINO
## 285 24 FEMENINO
## 286 18 FEMENINO
## 287 23 FEMENINO
## 288 21 MASCULINO
## 289 26 MASCULINO
## 290 29 FEMENINO
## 291 22 FEMENINO
## 292 26 MASCULINO
## 293 29 FEMENINO
## 294 30 FEMENINO
## 295 30 MASCULINO
## 296 21 MASCULINO
## 297 21 FEMENINO
## 298 18 MASCULINO
## 299 18 FEMENINO
## 300 18 FEMENINO
## 301 29 FEMENINO
## 302 28 FEMENINO
## 303 26 FEMENINO
## 304 18 MASCULINO
## 305 25 FEMENINO
## 306 27 MASCULINO
## 307 29 MASCULINO
## 308 30 MASCULINO
## 309 30 MASCULINO
## 310 18 MASCULINO
## 311 24 MASCULINO
## 312 29 MASCULINO
## 313 27 MASCULINO
## 314 18 MASCULINO
## 315 20 FEMENINO
## 316 26 MASCULINO
## 317 28 MASCULINO
## 318 26 MASCULINO
## 319 29 FEMENINO
## 320 30 MASCULINO
## 321 27 MASCULINO
## 322 29 FEMENINO
## 323 27 MASCULINO
## 324 20 MASCULINO
## 325 20 FEMENINO
## 326 27 FEMENINO
## 327 22 MASCULINO
## 328 24 MASCULINO
## 329 20 MASCULINO
## 330 25 MASCULINO
## 331 18 FEMENINO
## 332 21 FEMENINO
## 333 29 FEMENINO
## 334 18 FEMENINO
## 335 30 MASCULINO
## 336 23 MASCULINO
## 337 22 MASCULINO
## 338 28 FEMENINO
## 339 24 FEMENINO
## 340 20 MASCULINO
## 341 28 MASCULINO
## 342 25 MASCULINO
## 343 20 MASCULINO
## 344 23 FEMENINO
## 345 28 FEMENINO
## 346 28 MASCULINO
## 347 22 FEMENINO
## 348 18 FEMENINO
## 349 28 MASCULINO
## 350 28 FEMENINO
## 351 23 MASCULINO
## 352 29 MASCULINO
## 353 18 FEMENINO
## 354 23 FEMENINO
## 355 29 MASCULINO
## 356 19 FEMENINO
## 357 21 FEMENINO
## 358 23 FEMENINO
## 359 23 FEMENINO
## 360 22 MASCULINO
## 361 24 FEMENINO
## 362 29 FEMENINO
## 363 23 FEMENINO
## 364 18 MASCULINO
## 365 29 FEMENINO
## 366 28 MASCULINO
## 367 18 MASCULINO
## 368 19 MASCULINO
## 369 21 FEMENINO
## 370 25 MASCULINO
## 371 18 FEMENINO
## 372 26 FEMENINO
## 373 27 FEMENINO
## 374 20 MASCULINO
## 375 21 MASCULINO
## 376 23 FEMENINO
## 377 19 FEMENINO
## 378 18 MASCULINO
## 379 20 MASCULINO
## 380 26 MASCULINO
## 381 22 FEMENINO
## 382 28 MASCULINO
## 383 26 MASCULINO
## 384 18 FEMENINO
## 385 20 MASCULINO
## 386 24 MASCULINO
## 387 23 FEMENINO
## 388 25 MASCULINO
## 389 26 MASCULINO
## 390 26 FEMENINO
## 391 27 MASCULINO
## 392 19 MASCULINO
## 393 27 MASCULINO
## 394 22 MASCULINO
## 395 27 FEMENINO
## 396 25 FEMENINO
## 397 21 FEMENINO
## 398 24 FEMENINO
## 399 30 MASCULINO
## 400 24 MASCULINO
## 401 26 FEMENINO
## 402 25 MASCULINO
## 403 21 FEMENINO
## 404 25 FEMENINO
## 405 27 FEMENINO
## 406 29 FEMENINO
## 407 19 FEMENINO
## 408 26 FEMENINO
## 409 23 MASCULINO
## 410 22 MASCULINO
## 411 25 MASCULINO
## 412 24 FEMENINO
## 413 19 MASCULINO
## 414 29 FEMENINO
## 415 30 MASCULINO
## 416 26 MASCULINO
## 417 21 MASCULINO
## 418 30 MASCULINO
## 419 23 FEMENINO
## 420 27 FEMENINO
## 421 18 FEMENINO
## 422 25 MASCULINO
## 423 27 MASCULINO
## 424 19 FEMENINO
## 425 30 FEMENINO
## 426 19 FEMENINO
## 427 24 MASCULINO
## 428 29 FEMENINO
## 429 28 MASCULINO
## 430 24 FEMENINO
## 431 19 MASCULINO
## 432 28 MASCULINO
## 433 28 FEMENINO
## 434 20 MASCULINO
## 435 20 FEMENINO
## 436 24 MASCULINO
## 437 18 MASCULINO
## 438 26 FEMENINO
## 439 21 FEMENINO
## 440 19 FEMENINO
## 441 29 MASCULINO
## 442 23 FEMENINO
## 443 18 FEMENINO
## 444 29 FEMENINO
## 445 30 MASCULINO
## 446 18 FEMENINO
## 447 18 FEMENINO
## 448 21 FEMENINO
## 449 20 FEMENINO
## 450 29 FEMENINO
## 451 19 MASCULINO
## 452 28 FEMENINO
## 453 23 MASCULINO
## 454 30 FEMENINO
## 455 30 FEMENINO
## 456 28 MASCULINO
## 457 22 MASCULINO
## 458 23 FEMENINO
## 459 21 MASCULINO
## 460 30 FEMENINO
## 461 30 FEMENINO
## 462 24 FEMENINO
## 463 19 FEMENINO
## 464 20 FEMENINO
## 465 27 FEMENINO
## 466 19 FEMENINO
## 467 20 MASCULINO
## 468 24 FEMENINO
## 469 28 MASCULINO
## 470 21 FEMENINO
## 471 25 MASCULINO
## 472 22 MASCULINO
## 473 28 MASCULINO
## 474 18 FEMENINO
## 475 22 MASCULINO
## 476 26 MASCULINO
## 477 28 FEMENINO
## 478 26 MASCULINO
## 479 20 MASCULINO
## 480 19 FEMENINO
## 481 28 MASCULINO
## 482 19 MASCULINO
## 483 19 FEMENINO
## 484 20 FEMENINO
## 485 26 FEMENINO
## 486 30 FEMENINO
## 487 22 MASCULINO
## 488 29 FEMENINO
## 489 27 FEMENINO
## 490 19 FEMENINO
## 491 26 MASCULINO
## 492 29 MASCULINO
## 493 19 FEMENINO
## 494 27 FEMENINO
## 495 30 FEMENINO
## 496 27 MASCULINO
## 497 22 MASCULINO
## 498 19 FEMENINO
## 499 20 FEMENINO
## 500 19 FEMENINO
Para solo mostrar los primeros 10 datos o elementos del conjunto de datos (si es que asi se requiere), se utiliza la función head() (en donde se le especifica el nombre del conjunto de datos y la cantidad de elementos que quieres obtener, ya que por defecto muestra los primeros 6 elementos).
head(DataFrame,10)
## Edades Generos
## 1 25 FEMENINO
## 2 29 MASCULINO
## 3 19 FEMENINO
## 4 28 MASCULINO
## 5 28 MASCULINO
## 6 30 FEMENINO
## 7 21 MASCULINO
## 8 29 MASCULINO
## 9 21 MASCULINO
## 10 24 FEMENINO
En caso contrario, si se requiere conocer los últimos 10 datos del conjunto de datos, entonces se utiliza la función tails() (se indica el nombre del conjunto de datos y la cantidad de elementos que se desea mostrar. Por defecto mostrara los últimos 6 elementos).
tail(DataFrame,10)
## Edades Generos
## 491 26 MASCULINO
## 492 29 MASCULINO
## 493 19 FEMENINO
## 494 27 FEMENINO
## 495 30 FEMENINO
## 496 27 MASCULINO
## 497 22 MASCULINO
## 498 19 FEMENINO
## 499 20 FEMENINO
## 500 19 FEMENINO
En esta sección se genera una tabla de frecuencias a partir de una variable de interés; en este caso usaremos la variable asignada que contiene las edades del conjunto de datos; para esto se utiliza la función fdt() (en donde se le especifica que los valores x serán obtenidos de una variable especifica que forma parte de un conjunto de datos, y una formula que nos permita calcular las clases por la cual se dividirá la tabla de frecuencias.)
Tabla.Frec.Edades <- fdt(x=DataFrame$Edades,breaks ='Sturges')
Tabla.Frec.Edades
## Class limits f rf rf(%) cf cf(%)
## [17.82,19.07) 90 0.18 18.0 90 18.0
## [19.07,20.32) 38 0.08 7.6 128 25.6
## [20.32,21.56) 49 0.10 9.8 177 35.4
## [21.56,22.81) 33 0.07 6.6 210 42.0
## [22.81,24.06) 73 0.15 14.6 283 56.6
## [24.06,25.31) 31 0.06 6.2 314 62.8
## [25.31,26.56) 40 0.08 8.0 354 70.8
## [26.56,27.8) 32 0.06 6.4 386 77.2
## [27.8,29.05) 71 0.14 14.2 457 91.4
## [29.05,30.3) 43 0.09 8.6 500 100.0
Un histograma es un representación gráfica organizada que describe frecuencias de clases de datos numéricos en forma de barra (esto a través de la función ggplot()).
ggplot(data = DataFrame) +
geom_histogram(aes(x=Edades), fill ='orange', binwidth = 0.2, bins = 30)
La función hist() no requiere librería y se puede utilizar directamente para representar un histograma y determina frecuencia. En este ejemplo con los valores de la Tabla de Frecuencias de Edades
hist(DataFrame$Edades, breaks = (min(Edades)-1):(max(Edades)+1), main = "Histograma de Edades (de 18 a 30 años)", xlab = "Edades", ylab = "Frecuencia")
La función stem() representa un diagrama de tallo y hoja. El diagrama de tallo y hoja identifica frecuencias de clases en formato textual.
stem(DataFrame$Edades)
##
## The decimal point is at the |
##
## 18 | 00000000000000000000000000000000000000000000000
## 19 | 0000000000000000000000000000000000000000000
## 20 | 00000000000000000000000000000000000000
## 21 | 0000000000000000000000000000000000000000000000000
## 22 | 000000000000000000000000000000000
## 23 | 00000000000000000000000000000000000
## 24 | 00000000000000000000000000000000000000
## 25 | 0000000000000000000000000000000
## 26 | 0000000000000000000000000000000000000000
## 27 | 00000000000000000000000000000000
## 28 | 000000000000000000000000000000000000
## 29 | 00000000000000000000000000000000000
## 30 | 0000000000000000000000000000000000000000000
Ahora se genera una tabla de frecuencias a partir de una variable de interés; en este caso usaremos la variable asignada que contiene los géneros del conjunto de datos; para esto se utiliza la función fdt_cat() (en donde se le especifica que los valores de tipo caracter x serán obtenidos de una variable especifica que forma parte de un conjunto de datos, y una formula que nos permita calcular las clases por la cual se dividirá la tabla de frecuencias.)
Tabla.Frec.Generos <- fdt_cat(x=DataFrame$Generos, breaks = "Sturges")
Tabla.Frec.Generos
## Category f rf rf(%) cf cf(%)
## FEMENINO 259 0.52 51.8 259 51.8
## MASCULINO 241 0.48 48.2 500 100.0
La Grafica de Barras nos ayuda a visualizar de una mejor manera la frecuencia de cierta variable que nosotros indiquemos (en este caso el valor a visualizar sera la frecuencia en cuanto a el Género de las personas).
ggplot(data = DataFrame) +
geom_bar(aes(x = Generos))
De cierta forma puedo decir que el usar las funciones o métodos aplicados durante el desarrollo de este caso, pueden ser de gran utilidad al momento de visualizar los elementos que conforman un conjunto de datos con el cual estemos trabajando; como se vio hay varias maneras de observar dichos datos, y a través de esta interpretación puede darse el seguimiento a cierta toma de decisiones (aunque esto ya dependerá de las diferentes situaciones).
Habrá ocasiones en las un resumen estadístico no sea suficiente (quizás dependiendo de la experiencia de cada persona), por lo tanto hacer uso de herramientas especiales o funciones que nos permitan visualizar estos conjuntos de datos, brindan una ayuda considerable en cuanto a la comprensión y análisis de datos (que pueden servir de base para aquellos que decidan especializarse como Analista de Datos).