Nombre: Importar datos de archivo excel a R y realizar análisis

Objetivo. Importar datos de excel y realizar análisis sobre dichos datos

Descripción. Importar datos en excel y realizar análisi para determinar:

Importando Datos

library(readxl)
datos<- read_excel("nombres_edades_generos_sueldos_pasatiempos_edocivil.xlsx")
datos
## # A tibble: 18 x 6
##    nombre    edad genero sueldo pasatiempo  edocivil
##    <chr>    <dbl> <chr>   <dbl> <chr>       <chr>   
##  1 JUAN        17 M        17.5 VIDEOJUEGOS S       
##  2 PEDRO       25 M        20.8 MUSICA      C       
##  3 MARIA       20 F        13.5 VIDEOJUEGOS S       
##  4 ROBERTO     28 M        10.8 LECTURA     C       
##  5 LUCY        32 F        12.4 LECTURA     S       
##  6 ADRIANA     20 F         0   VIDEOJUEGOS S       
##  7 JORGUE      24 M        10.5 MUSICA      C       
##  8 MARY        45 M        54   LECTURA     S       
##  9 RUBEN       48 M        25   MUSICA      S       
## 10 RENE        18 M        10.5 VIDEOJUEGOS C       
## 11 OSCAR       24 M        12.5 MUSICA      S       
## 12 FABRICIO    28 M        10.5 MUSICA      C       
## 13 ERNESTO     30 M        10.8 MUSICA      S       
## 14 FERNANDA    28 F        10.6 MUSICA      C       
## 15 LUISA       35 F        20.6 LECTURA     S       
## 16 JESSICA     19 F        10.4 VIDEOJUEGOS S       
## 17 ROBERT      27 M        20.4 MUSICA      S       
## 18 YESENIA     32 F        32.5 MUSICA      C
#View(nombres_edades_generos_sueldos_pasatiempos_edocivil)

se puede usar library(xlsx) o library (readxl) dependiendo de la version

Hacer análisis

¿Cual es el promedio de edades?

mean(datos$edad)
## [1] 27.77778

¿Cual es el promedio de sueldos?

Promedio de edades

mean(datos$sueldo)
## [1] 16.85

¿Quien gana mas dinero, mostrando todos las columnas del registro?

datos[which.max(datos$sueldo), ]
## # A tibble: 1 x 6
##   nombre  edad genero sueldo pasatiempo edocivil
##   <chr>  <dbl> <chr>   <dbl> <chr>      <chr>   
## 1 MARY      45 M          54 LECTURA    S

¿Quien tiene mayor pasatiempo de “videojuegos” las personas de género M o género F?

datos[which(datos$pasatiempo == "VIDEOJUEGOS"),]
## # A tibble: 5 x 6
##   nombre   edad genero sueldo pasatiempo  edocivil
##   <chr>   <dbl> <chr>   <dbl> <chr>       <chr>   
## 1 JUAN       17 M        17.5 VIDEOJUEGOS S       
## 2 MARIA      20 F        13.5 VIDEOJUEGOS S       
## 3 ADRIANA    20 F         0   VIDEOJUEGOS S       
## 4 RENE       18 M        10.5 VIDEOJUEGOS C       
## 5 JESSICA    19 F        10.4 VIDEOJUEGOS S
M.videojuegos <- datos[which(datos$pasatiempo == "VIDEOJUEGOS" & datos$genero == 'M'),]
F.videojuegos <- datos[which(datos$pasatiempo == "VIDEOJUEGOS" & datos$genero == 'F'),]


M.videojuegos
## # A tibble: 2 x 6
##   nombre  edad genero sueldo pasatiempo  edocivil
##   <chr>  <dbl> <chr>   <dbl> <chr>       <chr>   
## 1 JUAN      17 M        17.5 VIDEOJUEGOS S       
## 2 RENE      18 M        10.5 VIDEOJUEGOS C
F.videojuegos
## # A tibble: 3 x 6
##   nombre   edad genero sueldo pasatiempo  edocivil
##   <chr>   <dbl> <chr>   <dbl> <chr>       <chr>   
## 1 MARIA      20 F        13.5 VIDEOJUEGOS S       
## 2 ADRIANA    20 F         0   VIDEOJUEGOS S       
## 3 JESSICA    19 F        10.4 VIDEOJUEGOS S
print(paste("M que juegan videojuegos ", length(M.videojuegos$nombre)))
## [1] "M que juegan videojuegos  2"
print(paste("F que juegan videojuegos ", length(F.videojuegos$nombre)))
## [1] "F que juegan videojuegos  3"

¿Quien gana mas los de género M o género F?

m <- datos[which(datos$genero == 'M'),]
f <- datos[which(datos$genero == 'F'),]

m
## # A tibble: 11 x 6
##    nombre    edad genero sueldo pasatiempo  edocivil
##    <chr>    <dbl> <chr>   <dbl> <chr>       <chr>   
##  1 JUAN        17 M        17.5 VIDEOJUEGOS S       
##  2 PEDRO       25 M        20.8 MUSICA      C       
##  3 ROBERTO     28 M        10.8 LECTURA     C       
##  4 JORGUE      24 M        10.5 MUSICA      C       
##  5 MARY        45 M        54   LECTURA     S       
##  6 RUBEN       48 M        25   MUSICA      S       
##  7 RENE        18 M        10.5 VIDEOJUEGOS C       
##  8 OSCAR       24 M        12.5 MUSICA      S       
##  9 FABRICIO    28 M        10.5 MUSICA      C       
## 10 ERNESTO     30 M        10.8 MUSICA      S       
## 11 ROBERT      27 M        20.4 MUSICA      S
f
## # A tibble: 7 x 6
##   nombre    edad genero sueldo pasatiempo  edocivil
##   <chr>    <dbl> <chr>   <dbl> <chr>       <chr>   
## 1 MARIA       20 F        13.5 VIDEOJUEGOS S       
## 2 LUCY        32 F        12.4 LECTURA     S       
## 3 ADRIANA     20 F         0   VIDEOJUEGOS S       
## 4 FERNANDA    28 F        10.6 MUSICA      C       
## 5 LUISA       35 F        20.6 LECTURA     S       
## 6 JESSICA     19 F        10.4 VIDEOJUEGOS S       
## 7 YESENIA     32 F        32.5 MUSICA      C
if (sum(m$sueldo) > sum(f$sueldo)) {
  print (paste("Los M ganan mas, con $ ", sum(m$sueldo)))
  print (paste("Los F ganan menos, con $ ", sum(f$sueldo)))
  } else {
    print(paste("Los F ganan mas, con $", sum(f$sueldo)))
    print (paste("Los M ganan menos, con $ ", sum(m$sueldo)))
  }
## [1] "Los M ganan mas, con $  203.3"
## [1] "Los F ganan menos, con $  100"

Que nombres de personas y cuántas personas están entre 15 y 25 años de edad

print(“Personas en edad joven entre 15-25”)

datos[which(datos$edad >= 15 & datos$edad <= 25),]
## # A tibble: 8 x 6
##   nombre   edad genero sueldo pasatiempo  edocivil
##   <chr>   <dbl> <chr>   <dbl> <chr>       <chr>   
## 1 JUAN       17 M        17.5 VIDEOJUEGOS S       
## 2 PEDRO      25 M        20.8 MUSICA      C       
## 3 MARIA      20 F        13.5 VIDEOJUEGOS S       
## 4 ADRIANA    20 F         0   VIDEOJUEGOS S       
## 5 JORGUE     24 M        10.5 MUSICA      C       
## 6 RENE       18 M        10.5 VIDEOJUEGOS C       
## 7 OSCAR      24 M        12.5 MUSICA      S       
## 8 JESSICA    19 F        10.4 VIDEOJUEGOS S

Cuántas y cuáles nombres son de estado civil C de casado y S de soltero

print(“Personas Casadas C y Solteras S”)

casadas <- datos[which(datos$edocivil == 'C'),]
solteras <- datos[which(datos$edocivil == 'S'),]

casadas
## # A tibble: 7 x 6
##   nombre    edad genero sueldo pasatiempo  edocivil
##   <chr>    <dbl> <chr>   <dbl> <chr>       <chr>   
## 1 PEDRO       25 M        20.8 MUSICA      C       
## 2 ROBERTO     28 M        10.8 LECTURA     C       
## 3 JORGUE      24 M        10.5 MUSICA      C       
## 4 RENE        18 M        10.5 VIDEOJUEGOS C       
## 5 FABRICIO    28 M        10.5 MUSICA      C       
## 6 FERNANDA    28 F        10.6 MUSICA      C       
## 7 YESENIA     32 F        32.5 MUSICA      C
print(paste("Cuantos son ", length(casadas$nombre)))
## [1] "Cuantos son  7"
solteras
## # A tibble: 11 x 6
##    nombre   edad genero sueldo pasatiempo  edocivil
##    <chr>   <dbl> <chr>   <dbl> <chr>       <chr>   
##  1 JUAN       17 M        17.5 VIDEOJUEGOS S       
##  2 MARIA      20 F        13.5 VIDEOJUEGOS S       
##  3 LUCY       32 F        12.4 LECTURA     S       
##  4 ADRIANA    20 F         0   VIDEOJUEGOS S       
##  5 MARY       45 M        54   LECTURA     S       
##  6 RUBEN      48 M        25   MUSICA      S       
##  7 OSCAR      24 M        12.5 MUSICA      S       
##  8 ERNESTO    30 M        10.8 MUSICA      S       
##  9 LUISA      35 F        20.6 LECTURA     S       
## 10 JESSICA    19 F        10.4 VIDEOJUEGOS S       
## 11 ROBERT     27 M        20.4 MUSICA      S
print(paste("Cuantos son ", length(solteras$nombre)))
## [1] "Cuantos son  11"