Objetivo: crearun documento con formato html markdown para publicarse en Rpubs, que muestre la creación de un dataframe en R que integre un conjunto de vectores con los atributos: nombres, edad, genero, sueldo y estado civilde 15 personas interpretando y analizando los datos.
nombres = c("juan","Mary", "Ruben", "Paty", "Jorge", "Luis","Olga", "Veronica","Mimi","Karina","Pablo","Beto","Saul","Omar","Salma")
edades = c (40, 26, 56, 70, 3, 13, 23,15,45,78,25,46,65,23,59)
generos= c("M","F","M","F","M","M","F","F","F","F","M","M","M","M","F")
sueldos= c(1500,320,1020,2345,15000,6500,2356,1123,5423,7800,25000,13200,2400,12600,4500)
edosciviles= c("s","c","v","d","v","s","c","v","v","d","d","d","d","d","s")
personas= data.frame(nombres, edades, generos, sueldos, edosciviles)
personas
## nombres edades generos sueldos edosciviles
## 1 juan 40 M 1500 s
## 2 Mary 26 F 320 c
## 3 Ruben 56 M 1020 v
## 4 Paty 70 F 2345 d
## 5 Jorge 3 M 15000 v
## 6 Luis 13 M 6500 s
## 7 Olga 23 F 2356 c
## 8 Veronica 15 F 1123 v
## 9 Mimi 45 F 5423 v
## 10 Karina 78 F 7800 d
## 11 Pablo 25 M 25000 d
## 12 Beto 46 M 13200 d
## 13 Saul 65 M 2400 d
## 14 Omar 23 M 12600 d
## 15 Salma 59 F 4500 s
personas$nombres
## [1] juan Mary Ruben Paty Jorge Luis Olga
## [8] Veronica Mimi Karina Pablo Beto Saul Omar
## [15] Salma
## 15 Levels: Beto Jorge juan Karina Luis Mary Mimi Olga Omar Pablo ... Veronica
personas$generos
## [1] M F M F M M F F F F M M M M F
## Levels: F M
personas[5,]
## nombres edades generos sueldos edosciviles
## 5 Jorge 3 M 15000 v
personas[6,]
## nombres edades generos sueldos edosciviles
## 6 Luis 13 M 6500 s
personas[7,c (1,3,4)]
## nombres generos sueldos
## 7 Olga F 2356
personas[8,c (1,3,4)]
## nombres generos sueldos
## 8 Veronica F 1123
###Bloque 4: Realizar análisis general
##Determinar todos los datos de la persona que MAS sueldo gana. max() ##Determinar todos los datos de la persona que MENOS sueldo gana. min()
personas[which.max(personas$sueldos),]
## nombres edades generos sueldos edosciviles
## 11 Pablo 25 M 25000 d
personas[which.min(personas$sueldos),]
## nombres edades generos sueldos edosciviles
## 2 Mary 26 F 320 c
#Determinar todos los datos de la persona que MAS edad tiene #Determinar todos los datos de la persona que MENOS edad tiene
personas[which.max(personas$edades),]
## nombres edades generos sueldos edosciviles
## 10 Karina 78 F 7800 d
personas[which.min(personas$edades),]
## nombres edades generos sueldos edosciviles
## 5 Jorge 3 M 15000 v
###Bloque 5: Determinar la media de edades y sueldos
mean(personas$edades)
## [1] 39.13333
mean(personas$sueldos)
## [1] 6739.133
###Bloque 6: Determinar rango de persona por sueldo
#Cuáles son las personas que ganan entre 22000.00 y 28000.00 (veintidos mil y veintiocho mil)?. Todos los atributos #Cuáles son las personas están por encima de la media de la edad
personas[which(personas$sueldos >= 22000 & personas$sueldos >= 28000), ]
## [1] nombres edades generos sueldos edosciviles
## <0 rows> (or 0-length row.names)
mediaEdad= mean(personas$edades)
cuales= which(personas$edades >= mediaEdad)
personas[cuales, ]
## nombres edades generos sueldos edosciviles
## 1 juan 40 M 1500 s
## 3 Ruben 56 M 1020 v
## 4 Paty 70 F 2345 d
## 9 Mimi 45 F 5423 v
## 10 Karina 78 F 7800 d
## 12 Beto 46 M 13200 d
## 13 Saul 65 M 2400 d
## 15 Salma 59 F 4500 s
##En la práctica el conjunto de datos es de cinco campos y quince registros ##la persona que más gana es Pablo y la que menos gana es Mary ## el valor medio del conjunto de datos es 6,739 y la edad media es 39 ##la pesona más joven se llama Jorge con tres años y la de mayor edad se llama Karina con 78 años ##la persona que cuenta con un sueldo entre 22000 y 28000, se llama Pablo