Crear un conjunto de datos de 100 registros con cuatro variables: nombre, genero, edad y deporto favorito de cada persona. Una vez construido el conjunto de datos elaborar tablas de frecuencias de los nombres, géneros (sexo) y deporte favorito; de igual forma determinar la tabla de frecuencia de las edades de las personas.
library(fdth)
set.seed(2000)
NombresPerso<- c('Leonardo',"Alan","Gerardo","Gabriel","Everardo","Monserrat"
,"pancho","Brayan","Kevin","Jose","Adriana","Gabriela","Luis","Joan",
"Adrian","Jesus","Jose","Clarissa",'Dilan','Saul')
Nombres<- sample(NombresPerso, 100, replace=TRUE)
Nombres
## [1] "Brayan" "Clarissa" "Adrian" "Joan" "Adrian" "Everardo"
## [7] "Gabriel" "Monserrat" "Kevin" "pancho" "Everardo" "Joan"
## [13] "Adriana" "Jose" "Leonardo" "Kevin" "Adriana" "Gerardo"
## [19] "Leonardo" "pancho" "Adrian" "Alan" "Adriana" "Jose"
## [25] "Gerardo" "Adrian" "Jose" "Jose" "Jose" "Jesus"
## [31] "Saul" "Kevin" "Everardo" "Monserrat" "Jose" "Gerardo"
## [37] "Jose" "Leonardo" "Gabriel" "Alan" "Alan" "Adrian"
## [43] "Adriana" "Luis" "Monserrat" "Leonardo" "Gabriela" "pancho"
## [49] "Alan" "Dilan" "Kevin" "Adrian" "Adrian" "Monserrat"
## [55] "Gabriela" "Clarissa" "Joan" "Jose" "Dilan" "Adriana"
## [61] "Brayan" "pancho" "Saul" "Gerardo" "Clarissa" "Monserrat"
## [67] "Everardo" "Everardo" "Clarissa" "Leonardo" "Monserrat" "Everardo"
## [73] "Dilan" "pancho" "Monserrat" "Clarissa" "Gabriel" "Everardo"
## [79] "Jose" "pancho" "Dilan" "Adrian" "Adrian" "Dilan"
## [85] "Saul" "Brayan" "Everardo" "Adriana" "Gabriel" "Dilan"
## [91] "Gerardo" "Dilan" "Monserrat" "Jose" "Adrian" "Monserrat"
## [97] "Jose" "pancho" "Brayan" "Everardo"
Genero<- sample(c('Femenino','Masculino'),100, replace=TRUE)
Edad<- sample(15:60, 100, replace=TRUE)
losDeportes<- c('Futbol','Tenis','Ajedrez', 'Basquetbol', 'Atletismo','Natacion','Karate',
'Beisbol','Futbol Americano','Rugby')
Deportes<- sample(losDeportes,100, replace = TRUE)
Personal<- data.frame(Nombres,Genero,Edad,Deportes)
Personal
## Nombres Genero Edad Deportes
## 1 Brayan Masculino 38 Futbol
## 2 Clarissa Femenino 55 Tenis
## 3 Adrian Masculino 32 Atletismo
## 4 Joan Femenino 34 Beisbol
## 5 Adrian Femenino 22 Natacion
## 6 Everardo Femenino 32 Rugby
## 7 Gabriel Masculino 47 Tenis
## 8 Monserrat Masculino 60 Futbol
## 9 Kevin Masculino 29 Rugby
## 10 pancho Masculino 52 Rugby
## 11 Everardo Masculino 49 Ajedrez
## 12 Joan Femenino 17 Karate
## 13 Adriana Masculino 41 Atletismo
## 14 Jose Masculino 57 Ajedrez
## 15 Leonardo Femenino 19 Atletismo
## 16 Kevin Femenino 17 Rugby
## 17 Adriana Femenino 39 Karate
## 18 Gerardo Masculino 24 Futbol Americano
## 19 Leonardo Femenino 35 Rugby
## 20 pancho Femenino 16 Tenis
## 21 Adrian Masculino 32 Beisbol
## 22 Alan Masculino 43 Atletismo
## 23 Adriana Masculino 35 Beisbol
## 24 Jose Masculino 26 Futbol
## 25 Gerardo Masculino 55 Ajedrez
## 26 Adrian Femenino 49 Tenis
## 27 Jose Masculino 21 Natacion
## 28 Jose Masculino 36 Atletismo
## 29 Jose Femenino 27 Natacion
## 30 Jesus Masculino 41 Atletismo
## 31 Saul Femenino 44 Beisbol
## 32 Kevin Femenino 60 Karate
## 33 Everardo Masculino 58 Rugby
## 34 Monserrat Femenino 29 Karate
## 35 Jose Masculino 37 Beisbol
## 36 Gerardo Femenino 40 Beisbol
## 37 Jose Femenino 48 Tenis
## 38 Leonardo Masculino 33 Futbol Americano
## 39 Gabriel Femenino 56 Futbol
## 40 Alan Masculino 52 Atletismo
## 41 Alan Femenino 27 Ajedrez
## 42 Adrian Femenino 41 Tenis
## 43 Adriana Masculino 27 Natacion
## 44 Luis Femenino 40 Futbol
## 45 Monserrat Femenino 47 Beisbol
## 46 Leonardo Masculino 21 Tenis
## 47 Gabriela Masculino 53 Rugby
## 48 pancho Femenino 45 Basquetbol
## 49 Alan Femenino 28 Beisbol
## 50 Dilan Masculino 35 Karate
## 51 Kevin Masculino 31 Tenis
## 52 Adrian Masculino 15 Rugby
## 53 Adrian Masculino 40 Tenis
## 54 Monserrat Masculino 19 Rugby
## 55 Gabriela Femenino 32 Tenis
## 56 Clarissa Masculino 54 Futbol
## 57 Joan Masculino 26 Beisbol
## 58 Jose Masculino 46 Ajedrez
## 59 Dilan Femenino 27 Atletismo
## 60 Adriana Masculino 51 Beisbol
## 61 Brayan Femenino 30 Tenis
## 62 pancho Masculino 46 Karate
## 63 Saul Masculino 59 Karate
## 64 Gerardo Femenino 21 Natacion
## 65 Clarissa Femenino 22 Rugby
## 66 Monserrat Femenino 59 Natacion
## 67 Everardo Femenino 46 Futbol
## 68 Everardo Femenino 49 Futbol
## 69 Clarissa Femenino 58 Beisbol
## 70 Leonardo Masculino 36 Beisbol
## 71 Monserrat Femenino 24 Basquetbol
## 72 Everardo Masculino 50 Beisbol
## 73 Dilan Masculino 38 Ajedrez
## 74 pancho Femenino 36 Futbol
## 75 Monserrat Masculino 23 Basquetbol
## 76 Clarissa Femenino 58 Futbol
## 77 Gabriel Femenino 58 Ajedrez
## 78 Everardo Masculino 47 Natacion
## 79 Jose Masculino 17 Rugby
## 80 pancho Masculino 58 Futbol
## 81 Dilan Masculino 46 Atletismo
## 82 Adrian Femenino 42 Karate
## 83 Adrian Masculino 52 Rugby
## 84 Dilan Femenino 35 Karate
## 85 Saul Femenino 26 Karate
## 86 Brayan Masculino 50 Beisbol
## 87 Everardo Femenino 15 Ajedrez
## 88 Adriana Femenino 33 Atletismo
## 89 Gabriel Femenino 60 Karate
## 90 Dilan Masculino 54 Beisbol
## 91 Gerardo Masculino 43 Tenis
## 92 Dilan Masculino 42 Ajedrez
## 93 Monserrat Femenino 21 Natacion
## 94 Jose Masculino 25 Tenis
## 95 Adrian Femenino 24 Futbol Americano
## 96 Monserrat Femenino 57 Natacion
## 97 Jose Masculino 58 Natacion
## 98 pancho Femenino 33 Karate
## 99 Brayan Femenino 31 Basquetbol
## 100 Everardo Masculino 36 Futbol Americano
table(Personal$Nombres)
##
## Adrian Adriana Alan Brayan Clarissa Dilan Everardo Gabriel
## 10 6 4 4 5 7 9 4
## Gabriela Gerardo Jesus Joan Jose Kevin Leonardo Luis
## 2 5 1 3 11 4 5 1
## Monserrat pancho Saul
## 9 7 3
transform(table(Personal$Nombres))
## Var1 Freq
## 1 Adrian 10
## 2 Adriana 6
## 3 Alan 4
## 4 Brayan 4
## 5 Clarissa 5
## 6 Dilan 7
## 7 Everardo 9
## 8 Gabriel 4
## 9 Gabriela 2
## 10 Gerardo 5
## 11 Jesus 1
## 12 Joan 3
## 13 Jose 11
## 14 Kevin 4
## 15 Leonardo 5
## 16 Luis 1
## 17 Monserrat 9
## 18 pancho 7
## 19 Saul 3
Tablafrec.Nom <- data.frame(transform(table(Personal$Nombres)))
names(Tablafrec.Nom) <- c('nombres', 'freq')
Tablafrec.Nom
## nombres freq
## 1 Adrian 10
## 2 Adriana 6
## 3 Alan 4
## 4 Brayan 4
## 5 Clarissa 5
## 6 Dilan 7
## 7 Everardo 9
## 8 Gabriel 4
## 9 Gabriela 2
## 10 Gerardo 5
## 11 Jesus 1
## 12 Joan 3
## 13 Jose 11
## 14 Kevin 4
## 15 Leonardo 5
## 16 Luis 1
## 17 Monserrat 9
## 18 pancho 7
## 19 Saul 3
library(fdth)
tabla.frec.nombres<- data.frame(fdt_cat(Personal$Nombres))
names(tabla.frec.nombres)<- c('nombres',"frequencia","freq.relat",'freq.porce',
'freq.acum','freq.por.acum')
tabla.frec.nombres
## nombres frequencia freq.relat freq.porce freq.acum freq.por.acum
## 1 Jose 11 0.11 11 11 11
## 2 Adrian 10 0.10 10 21 21
## 3 Everardo 9 0.09 9 30 30
## 4 Monserrat 9 0.09 9 39 39
## 5 Dilan 7 0.07 7 46 46
## 6 pancho 7 0.07 7 53 53
## 7 Adriana 6 0.06 6 59 59
## 8 Clarissa 5 0.05 5 64 64
## 9 Gerardo 5 0.05 5 69 69
## 10 Leonardo 5 0.05 5 74 74
## 11 Alan 4 0.04 4 78 78
## 12 Brayan 4 0.04 4 82 82
## 13 Gabriel 4 0.04 4 86 86
## 14 Kevin 4 0.04 4 90 90
## 15 Joan 3 0.03 3 93 93
## 16 Saul 3 0.03 3 96 96
## 17 Gabriela 2 0.02 2 98 98
## 18 Jesus 1 0.01 1 99 99
## 19 Luis 1 0.01 1 100 100
*Para crear un visualizador de barras seria con barplot
barplot(height =tabla.frec.nombres$frequencia, names.arg = tabla.frec.nombres$nombres)
hist(Personal$Edad, main = "Frecuencia de las edades", xlab = "Edades", ylab = "Frecuencias")
#### 7. Crear tabla de frecuencias con table() de la variable edad * Crear tabla de frecuencias ahora con la variable de edad
table(Personal$Edad)
##
## 15 16 17 19 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42
## 2 1 3 2 4 2 1 3 1 3 4 1 2 1 2 4 3 1 4 4 1 2 1 3 3 2
## 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60
## 2 1 1 4 3 1 3 2 1 3 1 2 2 1 2 6 2 3
transform(table(Personal$Edad))
## Var1 Freq
## 1 15 2
## 2 16 1
## 3 17 3
## 4 19 2
## 5 21 4
## 6 22 2
## 7 23 1
## 8 24 3
## 9 25 1
## 10 26 3
## 11 27 4
## 12 28 1
## 13 29 2
## 14 30 1
## 15 31 2
## 16 32 4
## 17 33 3
## 18 34 1
## 19 35 4
## 20 36 4
## 21 37 1
## 22 38 2
## 23 39 1
## 24 40 3
## 25 41 3
## 26 42 2
## 27 43 2
## 28 44 1
## 29 45 1
## 30 46 4
## 31 47 3
## 32 48 1
## 33 49 3
## 34 50 2
## 35 51 1
## 36 52 3
## 37 53 1
## 38 54 2
## 39 55 2
## 40 56 1
## 41 57 2
## 42 58 6
## 43 59 2
## 44 60 3
Tablafrec.Edad <- data.frame(transform(table(Personal$Edad)))
names(Tablafrec.Edad) <- c('edades', 'freq')
Tablafrec.Edad
## edades freq
## 1 15 2
## 2 16 1
## 3 17 3
## 4 19 2
## 5 21 4
## 6 22 2
## 7 23 1
## 8 24 3
## 9 25 1
## 10 26 3
## 11 27 4
## 12 28 1
## 13 29 2
## 14 30 1
## 15 31 2
## 16 32 4
## 17 33 3
## 18 34 1
## 19 35 4
## 20 36 4
## 21 37 1
## 22 38 2
## 23 39 1
## 24 40 3
## 25 41 3
## 26 42 2
## 27 43 2
## 28 44 1
## 29 45 1
## 30 46 4
## 31 47 3
## 32 48 1
## 33 49 3
## 34 50 2
## 35 51 1
## 36 52 3
## 37 53 1
## 38 54 2
## 39 55 2
## 40 56 1
## 41 57 2
## 42 58 6
## 43 59 2
## 44 60 3
tabla.frec.edades<- data.frame(fdt(Personal$Edad))
## Warning in (function (..., row.names = NULL, check.rows = FALSE, check.names =
## TRUE, : row names were found from a short variable and have been discarded
names(tabla.frec.edades)<- c('Edades',"frequencia","freq.relat",'freq.porce',
'freq.acum','freq.por.acum')
tabla.frec.edades
## Edades frequencia freq.relat freq.porce freq.acum freq.por.acum
## 1 [14.85,20.57) 8 0.08 8 8 8
## 2 [20.57,26.29) 14 0.14 14 22 22
## 3 [26.29,32.01) 14 0.14 14 36 36
## 4 [32.01,37.73) 13 0.13 13 49 49
## 5 [37.73,43.44) 13 0.13 13 62 62
## 6 [43.44,49.16) 13 0.13 13 75 75
## 7 [49.16,54.88) 9 0.09 9 84 84
## 8 [54.88,60.6) 16 0.16 16 100 100
## NA
## 1 14.85000
## 2 60.60000
## 3 5.71875
## 4 0.00000
## 5 14.85000
## 6 60.60000
## 7 5.71875
## 8 0.00000
barplot(height =tabla.frec.edades$frequencia, names.arg = tabla.frec.edades$Edades,
main="Frecuencia de las edades", xlab="Clases de Edades", ylab="Frecuencias" )
#### 10.Crear tabla de frecuencias con fdt_cat() de la variable genero * a. Determinar frecuencia absoluta * b. Determinar frecuencia relativa * c. Determinar frecuencia porcentual * d. Determinar frecuencia acumulada * e. Determinar frecuencia porcentual acumulada
tabla.frec.Generos<- data.frame(fdt_cat(Personal$Genero))
names(tabla.frec.Generos)<- c('Generos',"frequencia","freq.relat",'freq.porce',
'freq.acum','freq.por.acum')
tabla.frec.Generos
## Generos frequencia freq.relat freq.porce freq.acum freq.por.acum
## 1 Masculino 52 0.52 52 52 52
## 2 Femenino 48 0.48 48 100 100
barplot(height =tabla.frec.Generos$frequencia, names.arg = tabla.frec.Generos$Generos,
main="Frecuencia de los Generos", xlab="Generos", ylab="Frecuencias" )
#### 12.Crear tabla de frecuencias con fdt_cat() de a variable deportes * a. Determinar frecuencia absoluta * b. Determinar frecuencia relativa * c. Determinar frecuencia porcentual * d. Determinar frecuencia acumulada * e. Determinar frecuencia porcentual acumulada
tabla.frec.dep<- data.frame(fdt_cat(Personal$Deportes))
names(tabla.frec.dep)<- c('Deportes',"frequencia","freq.relat",'freq.porce',
'freq.acum','freq.por.acum')
tabla.frec.dep
## Deportes frequencia freq.relat freq.porce freq.acum freq.por.acum
## 1 Beisbol 15 0.15 15 15 15
## 2 Tenis 13 0.13 13 28 28
## 3 Karate 12 0.12 12 40 40
## 4 Rugby 12 0.12 12 52 52
## 5 Futbol 11 0.11 11 63 63
## 6 Atletismo 10 0.10 10 73 73
## 7 Natacion 10 0.10 10 83 83
## 8 Ajedrez 9 0.09 9 92 92
## 9 Basquetbol 4 0.04 4 96 96
## 10 Futbol Americano 4 0.04 4 100 100
barplot(height =tabla.frec.dep$frequencia, names.arg = tabla.frec.dep$Deportes,
main="Frecuencia de los Deportes", xlab="Deportes", ylab="Frecuencias" )
#### 14.Describir el caso. Por medio de 80 a 100 palabras describir el CASO 2 * DESCRIPCION #### Bueno les contare lo primero sobre el Caso Numero 2, los 20 nombres que aparecen en la lista fueron escogidos aleatoriamente y ya se generan los 100 a partir de esos 20, sobre los géneros entre masculinos y femeninos hay varios nombres que están en géneros diferentes y no es para ofender a nadie ni nada por el estilo solo son datos que la misma computadora acomodo este programa es solo para mostrar todo sobre las tablas y las frecuencias, bueno ya aclarado lo anterior al generar los 100 nombres me pude dar cuenta que en la tabla de frecuencias de los nombres el nombre que más se repitió fue el de José con 11 veces y hubo 2 nombres que tenían menos veces repetidas entre ellos Jesús y Luis, en las edades hubo más gente que tenía 58 años, en los géneros hubo mas gente Masculina que Femenina y el deporte más elegido por estas 100 personas fue el de Beisbol (Aunque es Mejor el Basquetbol) y bueno eso seria todo de mi parte soy Leonardo Xavier Jacquez Ortiz.