Objetivo: Realizar un análisis desciptivo de datos de un conjunto de personas

Bloque uno: Creacion de dataframe

nombres   <- c("Juan","Mary","Ruben","Paty","Jorge",
               "Luis","Olga","Veronica","Mimi","Karina",
               "Carlos","Gerardo","Alejandra","Claudia","Miguel")
edades    <- c(40,26,56,70,3,17,23,45,34,28,18,32,25,46,75)
genero   <- c("M","F","M","F","M","M","F","F","F","F","M","M","F","F","M")
sueldo    <- c(5400.30,6800.50,34200.20,68400.40,23500.90,
               32900,23550.90,25800.20,20500.40,21800.20,
               10000,21060,150000,9000,4560.80)
edocivil  <- c("s","c","v","d","s","c","v","d","s","c","V","D","S","C","V")
personas  <- data.frame(nombres, edades, genero, sueldo, edocivil)

Bloque dos: Mostrar el dataframe en pantalla. Todos los registros y todas las columnas

personas
##      nombres edades genero   sueldo edocivil
## 1       Juan     40      M   5400.3        s
## 2       Mary     26      F   6800.5        c
## 3      Ruben     56      M  34200.2        v
## 4       Paty     70      F  68400.4        d
## 5      Jorge      3      M  23500.9        s
## 6       Luis     17      M  32900.0        c
## 7       Olga     23      F  23550.9        v
## 8   Veronica     45      F  25800.2        d
## 9       Mimi     34      F  20500.4        s
## 10    Karina     28      F  21800.2        c
## 11    Carlos     18      M  10000.0        V
## 12   Gerardo     32      M  21060.0        D
## 13 Alejandra     25      F 150000.0        S
## 14   Claudia     46      F   9000.0        C
## 15    Miguel     75      M   4560.8        V

Bloque tres: Acceder a ciertos registros

#Los datos del atributo nombre del dataframe personas
personas$nombres
##  [1] Juan      Mary      Ruben     Paty      Jorge     Luis      Olga     
##  [8] Veronica  Mimi      Karina    Carlos    Gerardo   Alejandra Claudia  
## [15] Miguel   
## 15 Levels: Alejandra Carlos Claudia Gerardo Jorge Juan Karina ... Veronica
#Los datos del atributo genero del dataframe personas
personas$genero
##  [1] M F M F M M F F F F M M F F M
## Levels: F M
#El registro 5 y todos los atributos
personas[5,]
##   nombres edades genero  sueldo edocivil
## 5   Jorge      3      M 23500.9        s
#El registro 6 y todos los atributos
personas[6,]
##   nombres edades genero sueldo edocivil
## 6    Luis     17      M  32900        c
#El registro 7 y 8 con las columnas 1, 3 y 4
personas[c(7,8), c(1,3,4)]
##    nombres genero  sueldo
## 7     Olga      F 23550.9
## 8 Veronica      F 25800.2

Bloque cuatro: Realizar análisis general

#Determinar todos los datos de la persona que MAS sueldo gana. max()
personas[which.max(personas$sueldo),]
##      nombres edades genero sueldo edocivil
## 13 Alejandra     25      F 150000        S
#Determinar todos los datos de la persona que MENOS sueldo gana. min()
personas[which.min(personas$sueldo),]
##    nombres edades genero sueldo edocivil
## 15  Miguel     75      M 4560.8        V
#Determinar todos los datos de la persona que MAS edad tiene
personas[which.max(personas$edad),]
##    nombres edades genero sueldo edocivil
## 15  Miguel     75      M 4560.8        V
#Determinar todos los datos de la persona que MENOS edad tiene
personas[which.min(personas$edad),]
##   nombres edades genero  sueldo edocivil
## 5   Jorge      3      M 23500.9        s

Bloque cinco: Determinar la media de edades y sueldos

#Cuales es el valor de la media de edad de las personas?
paste("El valor de la media de edad es: ", round(mean(personas$edades), 2))
## [1] "El valor de la media de edad es:  35.87"
#Cual es el valor de la media de sueldos de las personas?
paste("El valor de la media de los sueldos es: ", mean(personas$sueldo))
## [1] "El valor de la media de los sueldos es:  30498.32"

Bloque seis. Determinar rango de persona por sueldo

#Cuales son las personas que ganan entre 22000.00 y 28000.00 (veintidos mil y veintiocho mil)?. Todos los atributos
sueldoentre <- which(personas$sueldo >= 22000 & personas$sueldo <= 28000)
personas[sueldoentre, ]
##    nombres edades genero  sueldo edocivil
## 5    Jorge      3      M 23500.9        s
## 7     Olga     23      F 23550.9        v
## 8 Veronica     45      F 25800.2        d
#Cual son las personas que en el valor de la edad están por encima de la media de la edad de todas las personas?
mediaedad <- mean(personas$edades)
arribamedia <- which(personas$edades >= mediaedad)
personas[arribamedia, ]
##     nombres edades genero  sueldo edocivil
## 1      Juan     40      M  5400.3        s
## 3     Ruben     56      M 34200.2        v
## 4      Paty     70      F 68400.4        d
## 8  Veronica     45      F 25800.2        d
## 14  Claudia     46      F  9000.0        C
## 15   Miguel     75      M  4560.8        V

Interpretación de la práctica

En la práctica: Analisis de personas, el conjunto de datos es de 15 registros y 5 columnas, la persona que más gana es Alejandra y la persona que menos ingresos recibe es Miguel. La media del sueldo del conjunto de datos es 30498.32.

Por otra parte, con respecto a las edades, el valor de la media es de 35.87, la persona más joven se llama Jorge con 3 años de edad y la persona menos joven se llama Miguel y tienen 75 años.

Finalmente las personas que tienen un sueldo entre 26000.00 y 28000.00 son. Jorge, Olga y Veronica

Y las personas que están por encima de la media de la edad del conjunto de datos son. Juan, Ruben, Paty, Veronica, Claudia y Miguel