nombres <- c("Juan","Mary","Ruben","Paty","Jorge",
"Luis","Olga","Veronica","Mimi","Karina",
"Carlos","Gerardo","Alejandra","Claudia","Miguel")
edades <- c(40,26,56,70,3,17,23,45,34,28,18,32,25,46,75)
genero <- c("M","F","M","F","M","M","F","F","F","F","M","M","F","F","M")
sueldo <- c(5400.30,6800.50,34200.20,68400.40,23500.90,
32900,23550.90,25800.20,20500.40,21800.20,
10000,21060,150000,9000,4560.80)
edocivil <- c("s","c","v","d","s","c","v","d","s","c","V","D","S","C","V")
personas <- data.frame(nombres, edades, genero, sueldo, edocivil)
personas
## nombres edades genero sueldo edocivil
## 1 Juan 40 M 5400.3 s
## 2 Mary 26 F 6800.5 c
## 3 Ruben 56 M 34200.2 v
## 4 Paty 70 F 68400.4 d
## 5 Jorge 3 M 23500.9 s
## 6 Luis 17 M 32900.0 c
## 7 Olga 23 F 23550.9 v
## 8 Veronica 45 F 25800.2 d
## 9 Mimi 34 F 20500.4 s
## 10 Karina 28 F 21800.2 c
## 11 Carlos 18 M 10000.0 V
## 12 Gerardo 32 M 21060.0 D
## 13 Alejandra 25 F 150000.0 S
## 14 Claudia 46 F 9000.0 C
## 15 Miguel 75 M 4560.8 V
#Los datos del atributo nombre del dataframe personas
personas$nombres
## [1] Juan Mary Ruben Paty Jorge Luis Olga
## [8] Veronica Mimi Karina Carlos Gerardo Alejandra Claudia
## [15] Miguel
## 15 Levels: Alejandra Carlos Claudia Gerardo Jorge Juan Karina ... Veronica
#Los datos del atributo genero del dataframe personas
personas$genero
## [1] M F M F M M F F F F M M F F M
## Levels: F M
#El registro 5 y todos los atributos
personas[5,]
## nombres edades genero sueldo edocivil
## 5 Jorge 3 M 23500.9 s
#El registro 6 y todos los atributos
personas[6,]
## nombres edades genero sueldo edocivil
## 6 Luis 17 M 32900 c
#El registro 7 y 8 con las columnas 1, 3 y 4
personas[c(7,8), c(1,3,4)]
## nombres genero sueldo
## 7 Olga F 23550.9
## 8 Veronica F 25800.2
#Determinar todos los datos de la persona que MAS sueldo gana. max()
personas[which.max(personas$sueldo),]
## nombres edades genero sueldo edocivil
## 13 Alejandra 25 F 150000 S
#Determinar todos los datos de la persona que MENOS sueldo gana. min()
personas[which.min(personas$sueldo),]
## nombres edades genero sueldo edocivil
## 15 Miguel 75 M 4560.8 V
#Determinar todos los datos de la persona que MAS edad tiene
personas[which.max(personas$edad),]
## nombres edades genero sueldo edocivil
## 15 Miguel 75 M 4560.8 V
#Determinar todos los datos de la persona que MENOS edad tiene
personas[which.min(personas$edad),]
## nombres edades genero sueldo edocivil
## 5 Jorge 3 M 23500.9 s
#Cuales es el valor de la media de edad de las personas?
paste("El valor de la media de edad es: ", round(mean(personas$edades), 2))
## [1] "El valor de la media de edad es: 35.87"
#Cual es el valor de la media de sueldos de las personas?
paste("El valor de la media de los sueldos es: ", mean(personas$sueldo))
## [1] "El valor de la media de los sueldos es: 30498.32"
#Cuales son las personas que ganan entre 22000.00 y 28000.00 (veintidos mil y veintiocho mil)?. Todos los atributos
sueldoentre <- which(personas$sueldo >= 22000 & personas$sueldo <= 28000)
personas[sueldoentre, ]
## nombres edades genero sueldo edocivil
## 5 Jorge 3 M 23500.9 s
## 7 Olga 23 F 23550.9 v
## 8 Veronica 45 F 25800.2 d
#Cual son las personas que en el valor de la edad están por encima de la media de la edad de todas las personas?
mediaedad <- mean(personas$edades)
arribamedia <- which(personas$edades >= mediaedad)
personas[arribamedia, ]
## nombres edades genero sueldo edocivil
## 1 Juan 40 M 5400.3 s
## 3 Ruben 56 M 34200.2 v
## 4 Paty 70 F 68400.4 d
## 8 Veronica 45 F 25800.2 d
## 14 Claudia 46 F 9000.0 C
## 15 Miguel 75 M 4560.8 V
En la práctica: Analisis de personas, el conjunto de datos es de 15 registros y 5 columnas, la persona que más gana es Alejandra y la persona que menos ingresos recibe es Miguel. La media del sueldo del conjunto de datos es 30498.32.
Por otra parte, con respecto a las edades, el valor de la media es de 35.87, la persona más joven se llama Jorge con 3 años de edad y la persona menos joven se llama Miguel y tienen 75 años.
Finalmente las personas que tienen un sueldo entre 26000.00 y 28000.00 son. Jorge, Olga y Veronica
Y las personas que están por encima de la media de la edad del conjunto de datos son. Juan, Ruben, Paty, Veronica, Claudia y Miguel