Importar y hacer análisis
Importar los datos
# vlibrary(readxl) # en caso de usar esta libreria
library(xlsx)
## Warning: package 'xlsx' was built under R version 3.4.4
datos <- read.xlsx("nombres edades generos sueldos pasatiempos edocivil.xlsx",1)
datos
## nombre edad genero sueldo pasatiempo edocivil
## 1 JUAN 17 M 17.5 VIDEOJUEGOS S
## 2 PEDRO 25 M 20.8 MUSICA C
## 3 MARIA 20 F 13.5 VIDEOJUEGOS S
## 4 ROBERTO 28 M 10.8 LECTURA C
## 5 LUCY 32 F 12.4 LECTURA S
## 6 ADRIANA 20 F 0.0 VIDEOJUEGOS S
## 7 JORGUE 24 M 10.5 MUSICA C
## 8 MARY 45 M 54.0 LECTURA S
## 9 RUBEN 48 M 25.0 MUSICA S
## 10 RENE 18 M 10.5 VIDEOJUEGOS C
## 11 OSCAR 24 M 12.5 MUSICA S
## 12 FABRICIO 28 M 10.5 MUSICA C
## 13 ERNESTO 30 M 10.8 MUSICA S
## 14 FERNANDA 28 F 10.6 MUSICA C
## 15 LUISA 35 F 20.6 LECTURA S
## 16 JESSICA 19 F 10.4 VIDEOJUEGOS S
## 17 ROBERT 27 M 20.4 MUSICA S
## 18 YESENIA 32 F 32.5 MUSICA C
Hacer análisis
- ¿Cual es el promedio de edades?
- ¿Cual es el promedio de sueldos?
- ¿Quien gana mas dinero, mostrando todos las columnas del registro?
- ¿Quien tiene mayor pasatiempo de “videojuegos” las personas de género M o género F?
- ¿Quien gana mas los de género M o género F (sumando el total)?
- Que nombres de personas y cuántas personas están entre 15 y 25 años de edad
- Cuántas y cuáles nombres son de estado civil C de casado y S de soltero
¿Cual es el promedio de edades?
# Promedio de edades
mean(datos$edad)
## [1] 27.77778
¿Cual es el promedio de sueldos?
# Promedio de edades
mean(datos$sueldo)
## [1] 16.85
¿Quien gana mas dinero, mostrando todos las columnas del registro?
datos[which.max(datos$sueldo), ]
## nombre edad genero sueldo pasatiempo edocivil
## 8 MARY 45 M 54 LECTURA S
¿Quien tiene mayor pasatiempo de “videojuegos” las personas de género M o género F?
datos[which(datos$pasatiempo == "VIDEOJUEGOS"),]
## nombre edad genero sueldo pasatiempo edocivil
## 1 JUAN 17 M 17.5 VIDEOJUEGOS S
## 3 MARIA 20 F 13.5 VIDEOJUEGOS S
## 6 ADRIANA 20 F 0.0 VIDEOJUEGOS S
## 10 RENE 18 M 10.5 VIDEOJUEGOS C
## 16 JESSICA 19 F 10.4 VIDEOJUEGOS S
M.videojuegos <- datos[which(datos$pasatiempo == "VIDEOJUEGOS" & datos$genero == 'M'),]
F.videojuegos <- datos[which(datos$pasatiempo == "VIDEOJUEGOS" & datos$genero == 'F'),]
M.videojuegos
## nombre edad genero sueldo pasatiempo edocivil
## 1 JUAN 17 M 17.5 VIDEOJUEGOS S
## 10 RENE 18 M 10.5 VIDEOJUEGOS C
F.videojuegos
## nombre edad genero sueldo pasatiempo edocivil
## 3 MARIA 20 F 13.5 VIDEOJUEGOS S
## 6 ADRIANA 20 F 0.0 VIDEOJUEGOS S
## 16 JESSICA 19 F 10.4 VIDEOJUEGOS S
print(paste("M que juegan videojuegos ", length(M.videojuegos$nombre)))
## [1] "M que juegan videojuegos 2"
print(paste("F que juegan videojuegos ", length(F.videojuegos$nombre)))
## [1] "F que juegan videojuegos 3"
¿Quien gana mas los de género M o género F?
m <- datos[which(datos$genero == 'M'),]
f <- datos[which(datos$genero == 'F'),]
m
## nombre edad genero sueldo pasatiempo edocivil
## 1 JUAN 17 M 17.5 VIDEOJUEGOS S
## 2 PEDRO 25 M 20.8 MUSICA C
## 4 ROBERTO 28 M 10.8 LECTURA C
## 7 JORGUE 24 M 10.5 MUSICA C
## 8 MARY 45 M 54.0 LECTURA S
## 9 RUBEN 48 M 25.0 MUSICA S
## 10 RENE 18 M 10.5 VIDEOJUEGOS C
## 11 OSCAR 24 M 12.5 MUSICA S
## 12 FABRICIO 28 M 10.5 MUSICA C
## 13 ERNESTO 30 M 10.8 MUSICA S
## 17 ROBERT 27 M 20.4 MUSICA S
f
## nombre edad genero sueldo pasatiempo edocivil
## 3 MARIA 20 F 13.5 VIDEOJUEGOS S
## 5 LUCY 32 F 12.4 LECTURA S
## 6 ADRIANA 20 F 0.0 VIDEOJUEGOS S
## 14 FERNANDA 28 F 10.6 MUSICA C
## 15 LUISA 35 F 20.6 LECTURA S
## 16 JESSICA 19 F 10.4 VIDEOJUEGOS S
## 18 YESENIA 32 F 32.5 MUSICA C
if (sum(m$sueldo) > sum(f$sueldo)) {
print (paste("Los M ganan mas, con $ ", sum(m$sueldo)))
print (paste("Los F ganan menos, con $ ", sum(f$sueldo)))
} else {
print(paste("Los F ganan mas, con $", sum(f$sueldo)))
print (paste("Los M ganan menos, con $ ", sum(m$sueldo)))
}
## [1] "Los M ganan mas, con $ 203.3"
## [1] "Los F ganan menos, con $ 100"
Que nombres de personas y cuántas personas están entre 15 y 25 años de edad
print("Personas en edad jovenentre 15-25")
## [1] "Personas en edad jovenentre 15-25"
datos[which(datos$edad >= 15 & datos$edad <= 25),]
## nombre edad genero sueldo pasatiempo edocivil
## 1 JUAN 17 M 17.5 VIDEOJUEGOS S
## 2 PEDRO 25 M 20.8 MUSICA C
## 3 MARIA 20 F 13.5 VIDEOJUEGOS S
## 6 ADRIANA 20 F 0.0 VIDEOJUEGOS S
## 7 JORGUE 24 M 10.5 MUSICA C
## 10 RENE 18 M 10.5 VIDEOJUEGOS C
## 11 OSCAR 24 M 12.5 MUSICA S
## 16 JESSICA 19 F 10.4 VIDEOJUEGOS S
Cuántas y cuáles nombres son de estado civil C de casado y S de soltero
print("Personas Casadas C y Solteras S")
## [1] "Personas Casadas C y Solteras S"
casadas <- datos[which(datos$edocivil == 'C'),]
solteras <- datos[which(datos$edocivil == 'S'),]
casadas
## nombre edad genero sueldo pasatiempo edocivil
## 2 PEDRO 25 M 20.8 MUSICA C
## 4 ROBERTO 28 M 10.8 LECTURA C
## 7 JORGUE 24 M 10.5 MUSICA C
## 10 RENE 18 M 10.5 VIDEOJUEGOS C
## 12 FABRICIO 28 M 10.5 MUSICA C
## 14 FERNANDA 28 F 10.6 MUSICA C
## 18 YESENIA 32 F 32.5 MUSICA C
#print(paste("Son ", length(casadas$nombres) ))
print(paste("Cuantos son ", length(casadas$nombre)))
## [1] "Cuantos son 7"
solteras
## nombre edad genero sueldo pasatiempo edocivil
## 1 JUAN 17 M 17.5 VIDEOJUEGOS S
## 3 MARIA 20 F 13.5 VIDEOJUEGOS S
## 5 LUCY 32 F 12.4 LECTURA S
## 6 ADRIANA 20 F 0.0 VIDEOJUEGOS S
## 8 MARY 45 M 54.0 LECTURA S
## 9 RUBEN 48 M 25.0 MUSICA S
## 11 OSCAR 24 M 12.5 MUSICA S
## 13 ERNESTO 30 M 10.8 MUSICA S
## 15 LUISA 35 F 20.6 LECTURA S
## 16 JESSICA 19 F 10.4 VIDEOJUEGOS S
## 17 ROBERT 27 M 20.4 MUSICA S
print(paste("Cuantos son ", length(solteras$nombre)))
## [1] "Cuantos son 11"
#print(paste("Son ", length(solteras$nombres) ))