Generar tablas de frecuencias con un conjunto de datos de 100 registros
Crear un conjunto de datos de 100 registros con cuatro variables: nombre, genero, edad y deporte favorito de cada persona. Una vez construido el conjunto de datos elaborar tablas de frecuencias de los nombres, géneros (sexo) y deporte favorito; de igual forma determinar la tabla de frecuencia de las edades de las personas.
library(fdth)
set.seed(2020) # Año 2020
losnombres <- c("JOSE","MARIA","JUAN","MARIO","ALONDRA","ESMERALDA","FERNANDA","MISTY","BULMA","KARINA","VICTORIA","ALFREDO","PINA","IBAN","OSCAR","DANIEL","LUNA","JONATHAN","ALEXIS","AGUSTIN")
nombres <- sample(losnombres, 100, replace = TRUE)
generos <- sample(c("Femenino", "Masculino"), 100, replace = TRUE)
edades <- sample(15:60, 100, replace = TRUE)
losdeportes <- c("FUTBOL","BASKETBOL","TENIS","AJEDRES","ATLETISMO","NATACION","KARATE","BEISBOL","FUTBOL AMERICANO","VOLEIBOL")
deportes <- sample(losdeportes, 100, replace = TRUE)
personal <- data.frame(nombres, generos, edades, deportes)
personal
## nombres generos edades deportes
## 1 ALFREDO Femenino 15 KARATE
## 2 JOSE Masculino 53 NATACION
## 3 LUNA Femenino 58 FUTBOL
## 4 MARIO Femenino 58 NATACION
## 5 KARINA Femenino 36 FUTBOL AMERICANO
## 6 ESMERALDA Masculino 26 BASKETBOL
## 7 LUNA Masculino 26 KARATE
## 8 PINA Masculino 24 KARATE
## 9 MISTY Femenino 27 VOLEIBOL
## 10 KARINA Masculino 41 NATACION
## 11 JONATHAN Femenino 59 NATACION
## 12 DANIEL Masculino 56 VOLEIBOL
## 13 MARIA Masculino 55 AJEDRES
## 14 DANIEL Masculino 58 KARATE
## 15 JUAN Masculino 43 VOLEIBOL
## 16 MARIA Masculino 39 VOLEIBOL
## 17 MISTY Femenino 33 AJEDRES
## 18 MARIO Femenino 16 TENIS
## 19 JONATHAN Femenino 58 VOLEIBOL
## 20 IBAN Masculino 18 BASKETBOL
## 21 IBAN Femenino 25 KARATE
## 22 ALFREDO Femenino 33 AJEDRES
## 23 DANIEL Femenino 43 KARATE
## 24 OSCAR Femenino 55 BASKETBOL
## 25 IBAN Femenino 16 KARATE
## 26 FERNANDA Femenino 34 BEISBOL
## 27 AGUSTIN Femenino 21 KARATE
## 28 JONATHAN Masculino 22 BASKETBOL
## 29 AGUSTIN Masculino 28 BEISBOL
## 30 AGUSTIN Femenino 58 AJEDRES
## 31 DANIEL Masculino 39 FUTBOL AMERICANO
## 32 ALFREDO Femenino 50 VOLEIBOL
## 33 JONATHAN Masculino 37 FUTBOL
## 34 KARINA Femenino 24 TENIS
## 35 ESMERALDA Femenino 27 NATACION
## 36 OSCAR Masculino 41 ATLETISMO
## 37 VICTORIA Femenino 49 NATACION
## 38 PINA Femenino 41 BEISBOL
## 39 PINA Femenino 41 TENIS
## 40 PINA Masculino 34 BEISBOL
## 41 MARIA Femenino 37 ATLETISMO
## 42 DANIEL Femenino 21 TENIS
## 43 PINA Femenino 42 ATLETISMO
## 44 JOSE Femenino 19 NATACION
## 45 ESMERALDA Masculino 41 ATLETISMO
## 46 JUAN Masculino 53 BEISBOL
## 47 PINA Femenino 36 NATACION
## 48 VICTORIA Masculino 35 FUTBOL AMERICANO
## 49 ALONDRA Femenino 39 AJEDRES
## 50 VICTORIA Femenino 59 NATACION
## 51 ESMERALDA Femenino 40 TENIS
## 52 MARIA Masculino 30 TENIS
## 53 JUAN Masculino 33 NATACION
## 54 JONATHAN Femenino 46 KARATE
## 55 JOSE Femenino 40 FUTBOL AMERICANO
## 56 FERNANDA Masculino 56 ATLETISMO
## 57 MISTY Masculino 50 VOLEIBOL
## 58 PINA Masculino 50 FUTBOL
## 59 MARIA Femenino 23 BASKETBOL
## 60 ALONDRA Femenino 42 BASKETBOL
## 61 MARIO Masculino 15 ATLETISMO
## 62 ALEXIS Masculino 59 BEISBOL
## 63 DANIEL Femenino 56 TENIS
## 64 MARIO Femenino 48 BEISBOL
## 65 AGUSTIN Masculino 59 ATLETISMO
## 66 JONATHAN Masculino 20 ATLETISMO
## 67 KARINA Femenino 55 ATLETISMO
## 68 JOSE Femenino 38 ATLETISMO
## 69 OSCAR Masculino 17 FUTBOL
## 70 BULMA Masculino 40 ATLETISMO
## 71 DANIEL Masculino 52 VOLEIBOL
## 72 ESMERALDA Masculino 48 NATACION
## 73 KARINA Masculino 48 TENIS
## 74 JOSE Femenino 18 NATACION
## 75 JOSE Masculino 54 FUTBOL
## 76 LUNA Femenino 23 BEISBOL
## 77 MISTY Femenino 57 KARATE
## 78 OSCAR Masculino 24 TENIS
## 79 ALFREDO Femenino 57 VOLEIBOL
## 80 JONATHAN Femenino 56 AJEDRES
## 81 PINA Femenino 26 AJEDRES
## 82 ALONDRA Masculino 55 TENIS
## 83 DANIEL Femenino 44 AJEDRES
## 84 AGUSTIN Masculino 46 FUTBOL
## 85 AGUSTIN Femenino 45 FUTBOL
## 86 AGUSTIN Femenino 52 KARATE
## 87 IBAN Masculino 41 BEISBOL
## 88 PINA Femenino 25 AJEDRES
## 89 LUNA Femenino 46 ATLETISMO
## 90 PINA Femenino 16 TENIS
## 91 FERNANDA Masculino 25 FUTBOL AMERICANO
## 92 BULMA Femenino 15 AJEDRES
## 93 MISTY Masculino 28 TENIS
## 94 JUAN Femenino 21 VOLEIBOL
## 95 JUAN Masculino 33 TENIS
## 96 MARIA Femenino 20 ATLETISMO
## 97 PINA Masculino 44 TENIS
## 98 MISTY Masculino 31 TENIS
## 99 MARIO Masculino 59 ATLETISMO
## 100 FERNANDA Femenino 24 TENIS
N <- nrow(personal)
N
## [1] 100
tabla_frec.nombres <- data.frame(transform(table(personal$nombres)))
names(tabla_frec.nombres) <- c("Nombres", "Frecuencia.Abso")
tabla_frec.nombres
## Nombres Frecuencia.Abso
## 1 AGUSTIN 7
## 2 ALEXIS 1
## 3 ALFREDO 4
## 4 ALONDRA 3
## 5 BULMA 2
## 6 DANIEL 8
## 7 ESMERALDA 5
## 8 FERNANDA 4
## 9 IBAN 4
## 10 JONATHAN 7
## 11 JOSE 6
## 12 JUAN 5
## 13 KARINA 5
## 14 LUNA 4
## 15 MARIA 6
## 16 MARIO 5
## 17 MISTY 6
## 18 OSCAR 4
## 19 PINA 11
## 20 VICTORIA 3
Freq.relativa <- tabla_frec.nombres$Frecuencia / N
Freq.relativa
## [1] 0.07 0.01 0.04 0.03 0.02 0.08 0.05 0.04 0.04 0.07 0.06 0.05 0.05 0.04 0.06
## [16] 0.05 0.06 0.04 0.11 0.03
Freq.Porcentual <- Freq.relativa * 100
Freq.Porcentual
## [1] 7 1 4 3 2 8 5 4 4 7 6 5 5 4 6 5 6 4 11 3
tabla_frec.nombres <- cbind(tabla_frec.nombres, Freq.relativa, Freq.Porcentual)
tabla_frec.nombres
## Nombres Frecuencia.Abso Freq.relativa Freq.Porcentual
## 1 AGUSTIN 7 0.07 7
## 2 ALEXIS 1 0.01 1
## 3 ALFREDO 4 0.04 4
## 4 ALONDRA 3 0.03 3
## 5 BULMA 2 0.02 2
## 6 DANIEL 8 0.08 8
## 7 ESMERALDA 5 0.05 5
## 8 FERNANDA 4 0.04 4
## 9 IBAN 4 0.04 4
## 10 JONATHAN 7 0.07 7
## 11 JOSE 6 0.06 6
## 12 JUAN 5 0.05 5
## 13 KARINA 5 0.05 5
## 14 LUNA 4 0.04 4
## 15 MARIA 6 0.06 6
## 16 MARIO 5 0.05 5
## 17 MISTY 6 0.06 6
## 18 OSCAR 4 0.04 4
## 19 PINA 11 0.11 11
## 20 VICTORIA 3 0.03 3
tabla_frec.nombres.2 <- data.frame(fdt_cat(personal$nombres))
names(tabla_frec.nombres.2) <- c("nombres", "Freq Abso.", "Freq Rela.", "Freq Porce.", "Freq Acum.", "Freq Porce.Acum")
tabla_frec.nombres.2
## nombres Freq Abso. Freq Rela. Freq Porce. Freq Acum. Freq Porce.Acum
## 1 PINA 11 0.11 11 11 11
## 2 DANIEL 8 0.08 8 19 19
## 3 AGUSTIN 7 0.07 7 26 26
## 4 JONATHAN 7 0.07 7 33 33
## 5 JOSE 6 0.06 6 39 39
## 6 MARIA 6 0.06 6 45 45
## 7 MISTY 6 0.06 6 51 51
## 8 ESMERALDA 5 0.05 5 56 56
## 9 JUAN 5 0.05 5 61 61
## 10 KARINA 5 0.05 5 66 66
## 11 MARIO 5 0.05 5 71 71
## 12 ALFREDO 4 0.04 4 75 75
## 13 FERNANDA 4 0.04 4 79 79
## 14 IBAN 4 0.04 4 83 83
## 15 LUNA 4 0.04 4 87 87
## 16 OSCAR 4 0.04 4 91 91
## 17 ALONDRA 3 0.03 3 94 94
## 18 VICTORIA 3 0.03 3 97 97
## 19 BULMA 2 0.02 2 99 99
## 20 ALEXIS 1 0.01 1 100 100
barplot(height = tabla_frec.nombres$Frecuencia, names.arg = tabla_frec.nombres.2$nombres)
hist(personal$edades, main = "Frecuencia de edades", xlab = "Edades", ylab = "Frecuencias")
tabla.frec.edades <- data.frame(transform(table(personal$edades)))
names(tabla.frec.edades) <- c("edades", "Frecuencia")
barplot(height = tabla.frec.edades$Frecuencia, names.arg = tabla.frec.edades$edades,main = "Frecuencias de Edades",xlab = "Edades", ylab = "Frecuencias")
tabla.frec.edades_2 <- fdt(personal$edades)
tabla.frec.edades_2 <- data.frame(tabla.frec.edades_2$table)
names(tabla.frec.edades_2) <- c('clases', 'Frecuencia', 'Frecuencia.Rela', 'Frecuencia.Porce', 'Frecuencia.Acum', 'Frecuencia.Porce.Acumu')
tabla.frec.edades_2
## clases Frecuencia Frecuencia.Rela Frecuencia.Porce Frecuencia.Acum
## 1 [14.85,20.442) 12 0.12 12 12
## 2 [20.442,26.035) 16 0.16 16 28
## 3 [26.035,31.627) 6 0.06 6 34
## 4 [31.627,37.22) 11 0.11 11 45
## 5 [37.22,42.812) 15 0.15 15 60
## 6 [42.812,48.405) 11 0.11 11 71
## 7 [48.405,53.998) 8 0.08 8 79
## 8 [53.998,59.59) 21 0.21 21 100
## Frecuencia.Porce.Acumu
## 1 12
## 2 28
## 3 34
## 4 45
## 5 60
## 6 71
## 7 79
## 8 100
barplot(height = tabla.frec.edades_2$Frecuencia,
names.arg = tabla.frec.edades_2$clases,
main = "Frecuencias de Clases",
xlab = "Clases de edades", ylab = "Frecuencias")
tabla_frec.genero <- data.frame(fdt_cat(personal$generos))
names(tabla_frec.genero) <- c('generos', 'Frecuencia', 'Frecuencia.Rela', 'Frecuencia.Porce', 'Frecuencia.Acum', 'Frecuencia.Porce.Acum')
tabla_frec.genero
## generos Frecuencia Frecuencia.Rela Frecuencia.Porce Frecuencia.Acum
## 1 Femenino 55 0.55 55 55
## 2 Masculino 45 0.45 45 100
## Frecuencia.Porce.Acum
## 1 55
## 2 100
barplot(height = tabla_frec.genero$Frecuencia,
names.arg = tabla_frec.genero$generos,
main = "Frecuencias de Géneros",
xlab = "Géneros", ylab = "Frecuencias")
pie(x = tabla_frec.genero$Frecuencia,
labels = tabla_frec.genero$generos,
col = c(110,100))
tabla_frec.deporte <- data.frame(fdt_cat(personal$deportes))
names(tabla_frec.deporte) <- c('deportes', 'Frecuencia', 'Frecuencia.Rela', 'Frecuencia.Porce', 'Frecuencia.Acum', 'Frecuencia.Porce.Acum')
tabla_frec.deporte
## deportes Frecuencia Frecuencia.Rela Frecuencia.Porce Frecuencia.Acum
## 1 TENIS 16 0.16 16 16
## 2 ATLETISMO 14 0.14 14 30
## 3 NATACION 12 0.12 12 42
## 4 KARATE 11 0.11 11 53
## 5 AJEDRES 10 0.10 10 63
## 6 VOLEIBOL 10 0.10 10 73
## 7 BEISBOL 9 0.09 9 82
## 8 FUTBOL 7 0.07 7 89
## 9 BASKETBOL 6 0.06 6 95
## 10 FUTBOL AMERICANO 5 0.05 5 100
## Frecuencia.Porce.Acum
## 1 16
## 2 30
## 3 42
## 4 53
## 5 63
## 6 73
## 7 82
## 8 89
## 9 95
## 10 100
barplot(height = tabla_frec.deporte$Frecuencia,
names.arg = tabla_frec.deporte$deportes,
main = "Frecuencias de deportes",
xlab = "Deportes", ylab = "Frecuencias")
pie(x = tabla_frec.deporte$Frecuencia,
labels = tabla_frec.deporte$deportes,
col = rainbow(length(tabla_frec.deporte$deportes)))
En el caso 2, se aprendio el como generar datos de maneria aleatoria y que cantidad se quiera generar, tambien cuenta ya sea para generar deportes, generos, edades, etc., de manera aleatoria, tambien el familiarizarce con la creacion de tablas y frecuencias, y usando un nuevo comando el cual, nos ayuda a separar cada elementos que nosotros le demos.
Ahora, viendo los resultados que arrojan las tablas, frecuencias y graficas:
En la grafica de deportes, se puede observar que la mayoria de las personas les gusta el deporte de tenis, despues natacion, siguiendo de ajedres, pero en la grafica de pastel, atletismo, karate, tambien hay personas que les gusta estos deportes, mientras que futbol, basketbol, y futbol americano, son deportes que lo juegan muy pocas personas.
En la grafica de barras, son las mujeres, las cuales les gusta mas los deportes, alcanzando mas de 50 personas femeninas, mientras que los hombres, llegan a 40 personas.
En la frecuencia de edades, se muestra que las personas con edades de 24, 31, 41, 55, 58 años, son las que practican deportes.
Las personas de 21 y 58 años, son las que mas practican deporte. Y gracias a este caso, se puede saber cuantas les gusta el deporte.