Importar y hacer análisis

Importar los datos

# vlibrary(readxl)   # en caso de usar esta libreria
library(xlsx)
## Warning: package 'xlsx' was built under R version 3.4.4
datos <- read.xlsx("nombres edades generos sueldos pasatiempos edocivil.xlsx",1)

datos
##      nombre edad genero sueldo  pasatiempo edocivil
## 1      JUAN   17      M   17.5 VIDEOJUEGOS        S
## 2     PEDRO   25      M   20.8      MUSICA        C
## 3     MARIA   20      F   13.5 VIDEOJUEGOS        S
## 4   ROBERTO   28      M   10.8     LECTURA        C
## 5      LUCY   32      F   12.4     LECTURA        S
## 6   ADRIANA   20      F    0.0 VIDEOJUEGOS        S
## 7    JORGUE   24      M   10.5      MUSICA        C
## 8      MARY   45      M   54.0     LECTURA        S
## 9     RUBEN   48      M   25.0      MUSICA        S
## 10     RENE   18      M   10.5 VIDEOJUEGOS        C
## 11    OSCAR   24      M   12.5      MUSICA        S
## 12 FABRICIO   28      M   10.5      MUSICA        C
## 13  ERNESTO   30      M   10.8      MUSICA        S
## 14 FERNANDA   28      F   10.6      MUSICA        C
## 15    LUISA   35      F   20.6     LECTURA        S
## 16  JESSICA   19      F   10.4 VIDEOJUEGOS        S
## 17   ROBERT   27      M   20.4      MUSICA        S
## 18  YESENIA   32      F   32.5      MUSICA        C

Hacer análisis

  • ¿Cual es el promedio de edades?
  • ¿Cual es el promedio de sueldos?
  • ¿Quien gana mas dinero, mostrando todos las columnas del registro?
  • ¿Quien tiene mayor pasatiempo de “videojuegos” las personas de género M o género F?
  • ¿Quien gana mas los de género M o género F (sumando el total)?
  • Que nombres de personas y cuántas personas están entre 15 y 25 años de edad
  • Cuántas y cuáles nombres son de estado civil C de casado y S de soltero

¿Cual es el promedio de edades?

# Promedio de edades
mean(datos$edad)
## [1] 27.77778

¿Cual es el promedio de sueldos?

# Promedio de edades
mean(datos$sueldo)
## [1] 16.85

¿Quien gana mas dinero, mostrando todos las columnas del registro?

datos[which.max(datos$sueldo), ]
##   nombre edad genero sueldo pasatiempo edocivil
## 8   MARY   45      M     54    LECTURA        S

¿Quien tiene mayor pasatiempo de “videojuegos” las personas de género M o género F?

datos[which(datos$pasatiempo == "VIDEOJUEGOS"),]
##     nombre edad genero sueldo  pasatiempo edocivil
## 1     JUAN   17      M   17.5 VIDEOJUEGOS        S
## 3    MARIA   20      F   13.5 VIDEOJUEGOS        S
## 6  ADRIANA   20      F    0.0 VIDEOJUEGOS        S
## 10    RENE   18      M   10.5 VIDEOJUEGOS        C
## 16 JESSICA   19      F   10.4 VIDEOJUEGOS        S
M.videojuegos <- datos[which(datos$pasatiempo == "VIDEOJUEGOS" & datos$genero == 'M'),]
F.videojuegos <- datos[which(datos$pasatiempo == "VIDEOJUEGOS" & datos$genero == 'F'),]


M.videojuegos
##    nombre edad genero sueldo  pasatiempo edocivil
## 1    JUAN   17      M   17.5 VIDEOJUEGOS        S
## 10   RENE   18      M   10.5 VIDEOJUEGOS        C
F.videojuegos
##     nombre edad genero sueldo  pasatiempo edocivil
## 3    MARIA   20      F   13.5 VIDEOJUEGOS        S
## 6  ADRIANA   20      F    0.0 VIDEOJUEGOS        S
## 16 JESSICA   19      F   10.4 VIDEOJUEGOS        S
print(paste("M que juegan videojuegos ", length(M.videojuegos$nombre)))
## [1] "M que juegan videojuegos  2"
print(paste("F que juegan videojuegos ", length(F.videojuegos$nombre)))
## [1] "F que juegan videojuegos  3"

¿Quien gana mas los de género M o género F?

m <- datos[which(datos$genero == 'M'),]
f <- datos[which(datos$genero == 'F'),]

m
##      nombre edad genero sueldo  pasatiempo edocivil
## 1      JUAN   17      M   17.5 VIDEOJUEGOS        S
## 2     PEDRO   25      M   20.8      MUSICA        C
## 4   ROBERTO   28      M   10.8     LECTURA        C
## 7    JORGUE   24      M   10.5      MUSICA        C
## 8      MARY   45      M   54.0     LECTURA        S
## 9     RUBEN   48      M   25.0      MUSICA        S
## 10     RENE   18      M   10.5 VIDEOJUEGOS        C
## 11    OSCAR   24      M   12.5      MUSICA        S
## 12 FABRICIO   28      M   10.5      MUSICA        C
## 13  ERNESTO   30      M   10.8      MUSICA        S
## 17   ROBERT   27      M   20.4      MUSICA        S
f
##      nombre edad genero sueldo  pasatiempo edocivil
## 3     MARIA   20      F   13.5 VIDEOJUEGOS        S
## 5      LUCY   32      F   12.4     LECTURA        S
## 6   ADRIANA   20      F    0.0 VIDEOJUEGOS        S
## 14 FERNANDA   28      F   10.6      MUSICA        C
## 15    LUISA   35      F   20.6     LECTURA        S
## 16  JESSICA   19      F   10.4 VIDEOJUEGOS        S
## 18  YESENIA   32      F   32.5      MUSICA        C
if (sum(m$sueldo) > sum(f$sueldo)) {
  print (paste("Los M ganan mas, con $ ", sum(m$sueldo)))
  print (paste("Los F ganan menos, con $ ", sum(f$sueldo)))
  } else {
    print(paste("Los F ganan mas, con $", sum(f$sueldo)))
    print (paste("Los M ganan menos, con $ ", sum(m$sueldo)))
  }
## [1] "Los M ganan mas, con $  203.3"
## [1] "Los F ganan menos, con $  100"

Que nombres de personas y cuántas personas están entre 15 y 25 años de edad

print("Personas en edad jovenentre 15-25")
## [1] "Personas en edad jovenentre 15-25"
datos[which(datos$edad >= 15 & datos$edad <= 25),]
##     nombre edad genero sueldo  pasatiempo edocivil
## 1     JUAN   17      M   17.5 VIDEOJUEGOS        S
## 2    PEDRO   25      M   20.8      MUSICA        C
## 3    MARIA   20      F   13.5 VIDEOJUEGOS        S
## 6  ADRIANA   20      F    0.0 VIDEOJUEGOS        S
## 7   JORGUE   24      M   10.5      MUSICA        C
## 10    RENE   18      M   10.5 VIDEOJUEGOS        C
## 11   OSCAR   24      M   12.5      MUSICA        S
## 16 JESSICA   19      F   10.4 VIDEOJUEGOS        S

Cuántas y cuáles nombres son de estado civil C de casado y S de soltero

print("Personas Casadas C y Solteras S")
## [1] "Personas Casadas C y Solteras S"
casadas <- datos[which(datos$edocivil == 'C'),]
solteras <- datos[which(datos$edocivil == 'S'),]

casadas
##      nombre edad genero sueldo  pasatiempo edocivil
## 2     PEDRO   25      M   20.8      MUSICA        C
## 4   ROBERTO   28      M   10.8     LECTURA        C
## 7    JORGUE   24      M   10.5      MUSICA        C
## 10     RENE   18      M   10.5 VIDEOJUEGOS        C
## 12 FABRICIO   28      M   10.5      MUSICA        C
## 14 FERNANDA   28      F   10.6      MUSICA        C
## 18  YESENIA   32      F   32.5      MUSICA        C
#print(paste("Son ", length(casadas$nombres) ))
print(paste("Cuantos son ", length(casadas$nombre)))
## [1] "Cuantos son  7"
solteras
##     nombre edad genero sueldo  pasatiempo edocivil
## 1     JUAN   17      M   17.5 VIDEOJUEGOS        S
## 3    MARIA   20      F   13.5 VIDEOJUEGOS        S
## 5     LUCY   32      F   12.4     LECTURA        S
## 6  ADRIANA   20      F    0.0 VIDEOJUEGOS        S
## 8     MARY   45      M   54.0     LECTURA        S
## 9    RUBEN   48      M   25.0      MUSICA        S
## 11   OSCAR   24      M   12.5      MUSICA        S
## 13 ERNESTO   30      M   10.8      MUSICA        S
## 15   LUISA   35      F   20.6     LECTURA        S
## 16 JESSICA   19      F   10.4 VIDEOJUEGOS        S
## 17  ROBERT   27      M   20.4      MUSICA        S
print(paste("Cuantos son ", length(solteras$nombre)))
## [1] "Cuantos son  11"
#print(paste("Son ", length(solteras$nombres) ))