Practica 9 Manejo e importacion de datos en R
Objetivo: Importar datos de excel y realizar análisis sobre dichos datos
Descripcion: Importar datos en excel y realizar análisi para determinar:
Importar y hacer análisis
Importar los datos
library(readxl)
datos <- read_excel("nombres_edades_generos_sueldos_pasatiempos_edocivil.xlsx")
datos
## # A tibble: 18 x 6
## nombre edad genero sueldo pasatiempo edocivil
## <chr> <dbl> <chr> <dbl> <chr> <chr>
## 1 JUAN 17 M 17.5 VIDEOJUEGOS S
## 2 PEDRO 25 M 20.8 MUSICA C
## 3 MARIA 20 F 13.5 VIDEOJUEGOS S
## 4 ROBERTO 28 M 10.8 LECTURA C
## 5 LUCY 32 F 12.4 LECTURA S
## 6 ADRIANA 20 F 0 VIDEOJUEGOS S
## 7 JORGUE 24 M 10.5 MUSICA C
## 8 MARY 45 M 54 LECTURA S
## 9 RUBEN 48 M 25 MUSICA S
## 10 RENE 18 M 10.5 VIDEOJUEGOS C
## 11 OSCAR 24 M 12.5 MUSICA S
## 12 FABRICIO 28 M 10.5 MUSICA C
## 13 ERNESTO 30 M 10.8 MUSICA S
## 14 FERNANDA 28 F 10.6 MUSICA C
## 15 LUISA 35 F 20.6 LECTURA S
## 16 JESSICA 19 F 10.4 VIDEOJUEGOS S
## 17 ROBERT 27 M 20.4 MUSICA S
## 18 YESENIA 32 F 32.5 MUSICA C
¿Cual es el promedio de edades?
mean(datos$edad)
## [1] 27.77778
¿Cual es el promedio de sueldos?
mean(datos$sueldo)
## [1] 16.85
Quien gana mas dinero, mostrando todas las columnas del registro?
datos[which.max(datos$sueldo),]
## # A tibble: 1 x 6
## nombre edad genero sueldo pasatiempo edocivil
## <chr> <dbl> <chr> <dbl> <chr> <chr>
## 1 MARY 45 M 54 LECTURA S
¿Quien tiene mayor pasatiempo de “videojuegos” las personas de genero M o genero F?
datos[which(datos$pasatiempo == "VIDEOJUEGOS"),]
## # A tibble: 5 x 6
## nombre edad genero sueldo pasatiempo edocivil
## <chr> <dbl> <chr> <dbl> <chr> <chr>
## 1 JUAN 17 M 17.5 VIDEOJUEGOS S
## 2 MARIA 20 F 13.5 VIDEOJUEGOS S
## 3 ADRIANA 20 F 0 VIDEOJUEGOS S
## 4 RENE 18 M 10.5 VIDEOJUEGOS C
## 5 JESSICA 19 F 10.4 VIDEOJUEGOS S
M.videojuegos <- datos[which(datos$pasatiempo == "VIDEOJUEGOS" & datos$genero == 'M'),]
F.videojuegos <- datos[which(datos$pasatiempo == "VIDEOJUEGOS" & datos$genero == 'F'),]
M.videojuegos
## # A tibble: 2 x 6
## nombre edad genero sueldo pasatiempo edocivil
## <chr> <dbl> <chr> <dbl> <chr> <chr>
## 1 JUAN 17 M 17.5 VIDEOJUEGOS S
## 2 RENE 18 M 10.5 VIDEOJUEGOS C
F.videojuegos
## # A tibble: 3 x 6
## nombre edad genero sueldo pasatiempo edocivil
## <chr> <dbl> <chr> <dbl> <chr> <chr>
## 1 MARIA 20 F 13.5 VIDEOJUEGOS S
## 2 ADRIANA 20 F 0 VIDEOJUEGOS S
## 3 JESSICA 19 F 10.4 VIDEOJUEGOS S
print(paste("M que juegan videojuegos ", length(M.videojuegos$nombre)))
## [1] "M que juegan videojuegos 2"
print(paste("F que juegan videojuegos ", length(F.videojuegos$nombre)))
## [1] "F que juegan videojuegos 3"
¿Quien gana mas los de genero M o genero F (Sumando los sueldos)?
m <- datos[which(datos$genero == 'M'),]
f <- datos[which(datos$genero == 'F'),]
m
## # A tibble: 11 x 6
## nombre edad genero sueldo pasatiempo edocivil
## <chr> <dbl> <chr> <dbl> <chr> <chr>
## 1 JUAN 17 M 17.5 VIDEOJUEGOS S
## 2 PEDRO 25 M 20.8 MUSICA C
## 3 ROBERTO 28 M 10.8 LECTURA C
## 4 JORGUE 24 M 10.5 MUSICA C
## 5 MARY 45 M 54 LECTURA S
## 6 RUBEN 48 M 25 MUSICA S
## 7 RENE 18 M 10.5 VIDEOJUEGOS C
## 8 OSCAR 24 M 12.5 MUSICA S
## 9 FABRICIO 28 M 10.5 MUSICA C
## 10 ERNESTO 30 M 10.8 MUSICA S
## 11 ROBERT 27 M 20.4 MUSICA S
f
## # A tibble: 7 x 6
## nombre edad genero sueldo pasatiempo edocivil
## <chr> <dbl> <chr> <dbl> <chr> <chr>
## 1 MARIA 20 F 13.5 VIDEOJUEGOS S
## 2 LUCY 32 F 12.4 LECTURA S
## 3 ADRIANA 20 F 0 VIDEOJUEGOS S
## 4 FERNANDA 28 F 10.6 MUSICA C
## 5 LUISA 35 F 20.6 LECTURA S
## 6 JESSICA 19 F 10.4 VIDEOJUEGOS S
## 7 YESENIA 32 F 32.5 MUSICA C
if (sum(m$sueldo) > sum(f$sueldo)) {
print (paste("Los M ganan mas, con $ ", sum(m$sueldo)))
print (paste("Los F ganan menos, con $ ", sum(f$sueldo)))
} else {
print(paste("Los F ganan mas, con $", sum(f$sueldo)))
print (paste("Los M ganan menos, con $ ", sum(m$sueldo)))
}
## [1] "Los M ganan mas, con $ 203.3"
## [1] "Los F ganan menos, con $ 100"
Que nombres de personas y cuántas personas están entre 15 y 25 años de edad
print("Personas en edad joven entre 15 y 25")
## [1] "Personas en edad joven entre 15 y 25"
datos[which(datos$edad>=15 & datos$edad <=25),]
## # A tibble: 8 x 6
## nombre edad genero sueldo pasatiempo edocivil
## <chr> <dbl> <chr> <dbl> <chr> <chr>
## 1 JUAN 17 M 17.5 VIDEOJUEGOS S
## 2 PEDRO 25 M 20.8 MUSICA C
## 3 MARIA 20 F 13.5 VIDEOJUEGOS S
## 4 ADRIANA 20 F 0 VIDEOJUEGOS S
## 5 JORGUE 24 M 10.5 MUSICA C
## 6 RENE 18 M 10.5 VIDEOJUEGOS C
## 7 OSCAR 24 M 12.5 MUSICA S
## 8 JESSICA 19 F 10.4 VIDEOJUEGOS S
print("Numero de personas entre 15 y 25")
## [1] "Numero de personas entre 15 y 25"
c <- datos[which(datos$edad>=15 & datos$edad <=25),]
length(c$nombre)
## [1] 8
Cuantas y cuales nombres son de estado civil C de casado y S de soltero
c <- datos[which(datos$edocivil == 'C'),]
s <- datos[which(datos$edocivil == 'S'),]
# Nombres de personas con Estado Civil Casado
c
## # A tibble: 7 x 6
## nombre edad genero sueldo pasatiempo edocivil
## <chr> <dbl> <chr> <dbl> <chr> <chr>
## 1 PEDRO 25 M 20.8 MUSICA C
## 2 ROBERTO 28 M 10.8 LECTURA C
## 3 JORGUE 24 M 10.5 MUSICA C
## 4 RENE 18 M 10.5 VIDEOJUEGOS C
## 5 FABRICIO 28 M 10.5 MUSICA C
## 6 FERNANDA 28 F 10.6 MUSICA C
## 7 YESENIA 32 F 32.5 MUSICA C
# Cuantas personas con Estado Civil Casado
length(c$edocivil)
## [1] 7
# Nombres de personas con Estado Civil Soltero
s
## # A tibble: 11 x 6
## nombre edad genero sueldo pasatiempo edocivil
## <chr> <dbl> <chr> <dbl> <chr> <chr>
## 1 JUAN 17 M 17.5 VIDEOJUEGOS S
## 2 MARIA 20 F 13.5 VIDEOJUEGOS S
## 3 LUCY 32 F 12.4 LECTURA S
## 4 ADRIANA 20 F 0 VIDEOJUEGOS S
## 5 MARY 45 M 54 LECTURA S
## 6 RUBEN 48 M 25 MUSICA S
## 7 OSCAR 24 M 12.5 MUSICA S
## 8 ERNESTO 30 M 10.8 MUSICA S
## 9 LUISA 35 F 20.6 LECTURA S
## 10 JESSICA 19 F 10.4 VIDEOJUEGOS S
## 11 ROBERT 27 M 20.4 MUSICA S
# Cuantas personas con Estado Civil Casado
length(s$edocivil)
## [1] 11