\[frecuencia.de.clase=número.de.elementos.de.cada.clase\]
\[frecuencia.relativa=\frac{frecuencia.de.clase}{n}\]
\[frecuencia.porcentual=frecuencia.relativa\times100\]
set.seed() significa que al momento de generar valores aleatorios dé o genere los mismos resultados cada vez que se ejecuta alguna función de aleatoriedad como sample().
set.seed(2020)
nombres <- c('Javier', 'Rubén', 'Hilda', 'Maria','Claudia','Héctor','Jairo', 'Luis', 'José', 'Angel','Manuel', 'Mayra', 'Juán', 'César', 'Edgar','Aaron','Francia', 'Lucero', 'Valeria','Yazmín','Paty', 'Jessica', 'Laura', 'Mayela','Lucy', 'Jesús', 'Bety', 'Martha', 'Guadalupe','Antonio', 'Humberto', 'Gabriela', 'Lorenzo','Joaquín','Ana','Louisa','Fernando','Gabriel','Jeorgina','Ernesto','Rocío','Vicoria','Italia','América','Jimena','Xóchitl','Lucrecia','Erendira','Verónica','Ramón' )
nombres
## [1] "Javier" "Rubén" "Hilda" "Maria" "Claudia" "Héctor"
## [7] "Jairo" "Luis" "José" "Angel" "Manuel" "Mayra"
## [13] "Juán" "César" "Edgar" "Aaron" "Francia" "Lucero"
## [19] "Valeria" "Yazmín" "Paty" "Jessica" "Laura" "Mayela"
## [25] "Lucy" "Jesús" "Bety" "Martha" "Guadalupe" "Antonio"
## [31] "Humberto" "Gabriela" "Lorenzo" "Joaquín" "Ana" "Louisa"
## [37] "Fernando" "Gabriel" "Jeorgina" "Ernesto" "Rocío" "Vicoria"
## [43] "Italia" "América" "Jimena" "Xóchitl" "Lucrecia" "Erendira"
## [49] "Verónica" "Ramón"
datos <- sample(nombres, size = 10000, replace = TRUE)
head(datos, 50) # Los primeros cincuenta
## [1] "Martha" "América" "Laura" "Jessica" "Mayela" "Javier"
## [7] "Francia" "Louisa" "Vicoria" "Héctor" "Verónica" "Jimena"
## [13] "Luis" "Vicoria" "Ramón" "Aaron" "Guadalupe" "Joaquín"
## [19] "Erendira" "Hilda" "Rubén" "Guadalupe" "Ernesto" "Maria"
## [25] "Ramón" "César" "César" "Mayra" "Erendira" "Lucrecia"
## [31] "César" "Jairo" "Yazmín" "Lucero" "Paty" "Erendira"
## [37] "América" "Lucero" "Angel" "Humberto" "Héctor" "Lucrecia"
## [43] "Italia" "Juán" "Gabriela" "Mayela" "Juán" "Jimena"
## [49] "Rubén" "Humberto"
tail(datos, 50) # Los últimos cincuenta
## [1] "Mayela" "Vicoria" "Vicoria" "Martha" "Erendira" "Erendira"
## [7] "Jeorgina" "Erendira" "Aaron" "Juán" "Mayela" "Paty"
## [13] "Jeorgina" "Héctor" "Aaron" "Rocío" "Xóchitl" "Gabriel"
## [19] "Edgar" "Javier" "Manuel" "Jesús" "Vicoria" "Gabriel"
## [25] "Yazmín" "Gabriel" "Luis" "Mayra" "Erendira" "Valeria"
## [31] "América" "Francia" "Claudia" "Manuel" "Angel" "Verónica"
## [37] "Manuel" "Italia" "Claudia" "Jairo" "Luis" "Hilda"
## [43] "Martha" "Lucy" "Luis" "César" "Manuel" "Jeorgina"
## [49] "Manuel" "Erendira"
n <- length(datos)
n
## [1] 10000
datos <- factor(datos)
frecuencia.clase <- table(datos)
frecuencia.clase
## datos
## Aaron América Ana Angel Antonio Bety César Claudia
## 210 199 207 206 194 218 211 182
## Edgar Erendira Ernesto Fernando Francia Gabriel Gabriela Guadalupe
## 203 216 214 194 214 211 188 181
## Héctor Hilda Humberto Italia Jairo Javier Jeorgina Jessica
## 201 209 230 183 189 192 207 194
## Jesús Jimena Joaquín José Juán Laura Lorenzo Louisa
## 192 204 217 190 192 205 203 192
## Lucero Lucrecia Lucy Luis Manuel Maria Martha Mayela
## 214 217 205 177 207 206 171 194
## Mayra Paty Ramón Rocío Rubén Valeria Verónica Vicoria
## 187 208 190 181 194 192 188 201
## Xóchitl Yazmín
## 212 208
\[\frac{frecuencia.clase}{n}\]
frecuencia.relativa <- frecuencia.clase / n
frecuencia.relativa
## datos
## Aaron América Ana Angel Antonio Bety César Claudia
## 0.0210 0.0199 0.0207 0.0206 0.0194 0.0218 0.0211 0.0182
## Edgar Erendira Ernesto Fernando Francia Gabriel Gabriela Guadalupe
## 0.0203 0.0216 0.0214 0.0194 0.0214 0.0211 0.0188 0.0181
## Héctor Hilda Humberto Italia Jairo Javier Jeorgina Jessica
## 0.0201 0.0209 0.0230 0.0183 0.0189 0.0192 0.0207 0.0194
## Jesús Jimena Joaquín José Juán Laura Lorenzo Louisa
## 0.0192 0.0204 0.0217 0.0190 0.0192 0.0205 0.0203 0.0192
## Lucero Lucrecia Lucy Luis Manuel Maria Martha Mayela
## 0.0214 0.0217 0.0205 0.0177 0.0207 0.0206 0.0171 0.0194
## Mayra Paty Ramón Rocío Rubén Valeria Verónica Vicoria
## 0.0187 0.0208 0.0190 0.0181 0.0194 0.0192 0.0188 0.0201
## Xóchitl Yazmín
## 0.0212 0.0208
frecuencia.porcentual <- frecuencia.relativa * 100
frecuencia.porcentual
## datos
## Aaron América Ana Angel Antonio Bety César Claudia
## 2.10 1.99 2.07 2.06 1.94 2.18 2.11 1.82
## Edgar Erendira Ernesto Fernando Francia Gabriel Gabriela Guadalupe
## 2.03 2.16 2.14 1.94 2.14 2.11 1.88 1.81
## Héctor Hilda Humberto Italia Jairo Javier Jeorgina Jessica
## 2.01 2.09 2.30 1.83 1.89 1.92 2.07 1.94
## Jesús Jimena Joaquín José Juán Laura Lorenzo Louisa
## 1.92 2.04 2.17 1.90 1.92 2.05 2.03 1.92
## Lucero Lucrecia Lucy Luis Manuel Maria Martha Mayela
## 2.14 2.17 2.05 1.77 2.07 2.06 1.71 1.94
## Mayra Paty Ramón Rocío Rubén Valeria Verónica Vicoria
## 1.87 2.08 1.90 1.81 1.94 1.92 1.88 2.01
## Xóchitl Yazmín
## 2.12 2.08
tabla.frecuencia <- data.frame(names(frecuencia.clase), as.vector(frecuencia.clase), as.vector(frecuencia.relativa), as.vector(frecuencia.porcentual))
names(tabla.frecuencia) <- c('Clases', 'Frecuencia de clase', 'Relativa', 'Porcentual')
tabla.frecuencia
## Clases Frecuencia de clase Relativa Porcentual
## 1 Aaron 210 0.0210 2.10
## 2 América 199 0.0199 1.99
## 3 Ana 207 0.0207 2.07
## 4 Angel 206 0.0206 2.06
## 5 Antonio 194 0.0194 1.94
## 6 Bety 218 0.0218 2.18
## 7 César 211 0.0211 2.11
## 8 Claudia 182 0.0182 1.82
## 9 Edgar 203 0.0203 2.03
## 10 Erendira 216 0.0216 2.16
## 11 Ernesto 214 0.0214 2.14
## 12 Fernando 194 0.0194 1.94
## 13 Francia 214 0.0214 2.14
## 14 Gabriel 211 0.0211 2.11
## 15 Gabriela 188 0.0188 1.88
## 16 Guadalupe 181 0.0181 1.81
## 17 Héctor 201 0.0201 2.01
## 18 Hilda 209 0.0209 2.09
## 19 Humberto 230 0.0230 2.30
## 20 Italia 183 0.0183 1.83
## 21 Jairo 189 0.0189 1.89
## 22 Javier 192 0.0192 1.92
## 23 Jeorgina 207 0.0207 2.07
## 24 Jessica 194 0.0194 1.94
## 25 Jesús 192 0.0192 1.92
## 26 Jimena 204 0.0204 2.04
## 27 Joaquín 217 0.0217 2.17
## 28 José 190 0.0190 1.90
## 29 Juán 192 0.0192 1.92
## 30 Laura 205 0.0205 2.05
## 31 Lorenzo 203 0.0203 2.03
## 32 Louisa 192 0.0192 1.92
## 33 Lucero 214 0.0214 2.14
## 34 Lucrecia 217 0.0217 2.17
## 35 Lucy 205 0.0205 2.05
## 36 Luis 177 0.0177 1.77
## 37 Manuel 207 0.0207 2.07
## 38 Maria 206 0.0206 2.06
## 39 Martha 171 0.0171 1.71
## 40 Mayela 194 0.0194 1.94
## 41 Mayra 187 0.0187 1.87
## 42 Paty 208 0.0208 2.08
## 43 Ramón 190 0.0190 1.90
## 44 Rocío 181 0.0181 1.81
## 45 Rubén 194 0.0194 1.94
## 46 Valeria 192 0.0192 1.92
## 47 Verónica 188 0.0188 1.88
## 48 Vicoria 201 0.0201 2.01
## 49 Xóchitl 212 0.0212 2.12
## 50 Yazmín 208 0.0208 2.08
barplot(height = tabla.frecuencia$`Frecuencia de clase`, names.arg = tabla.frecuencia$Clases, main = "Frecuencia de nombres. ")
tabla.frecuencia <- tabla.frecuencia[order(tabla.frecuencia$`Frecuencia de clase`, decreasing = TRUE), ]
tabla.frecuencia <- tabla.frecuencia[1:10,]
tabla.frecuencia
## Clases Frecuencia de clase Relativa Porcentual
## 19 Humberto 230 0.0230 2.30
## 6 Bety 218 0.0218 2.18
## 27 Joaquín 217 0.0217 2.17
## 34 Lucrecia 217 0.0217 2.17
## 10 Erendira 216 0.0216 2.16
## 11 Ernesto 214 0.0214 2.14
## 13 Francia 214 0.0214 2.14
## 33 Lucero 214 0.0214 2.14
## 49 Xóchitl 212 0.0212 2.12
## 7 César 211 0.0211 2.11
barplot(height = tabla.frecuencia$`Frecuencia de clase`, names.arg = tabla.frecuencia$Clases, main = "Frecuencia de nombres. Top 10")
pie(x = tabla.frecuencia$`Frecuencia de clase`, labels = tabla.frecuencia$Clases)