Objetivo: Crear documento con formato html markdown para publicarse en Rpubs que muestre la creación de un dataframe en R que integre un conjunto de vectores con atributos de nombres, edades, generos, sueldos, estados civiles de 15 personas y muestre e interprete análisis de los datos.

1. Crear vectores y luego el Dataframe

## primero llenamos los vectores

nombres <- c("juan", "mary", "ruben", "paty", "jorge", 
             "luis", "olga", "vero", "mimi", "karina", 
             "carmen", "raul", "sarah", "sonia", "ernesto")
edades <- c(40, 26, 56, 70, 3, 17, 23, 45, 34, 28, 35, 43, 27, 54, 32)

generos <- c("M", "F", "M", "F", "M", 
             "M", "F", "F", "F", "F", 
             "F", "M", "F", "F", "M")

sueldos <- c(5400.90, 6800.50, 34200.20, 68400.40, 23500.90,
             32900, 23550.90, 25800.20, 20500.40, 21800.20,
             22121, 4897.5, 54953.25, 7899.5, 25182.56)

edociviles <- c("S", "C", "V", "D", "V", "S", "C", "V", "D", "V", "C", "D", 
                "S", "V", "C")

personas <- data.frame(nombres, edades, generos, sueldos, edociviles)

2. mostrar dataframe

personas
##    nombres edades generos  sueldos edociviles
## 1     juan     40       M  5400.90          S
## 2     mary     26       F  6800.50          C
## 3    ruben     56       M 34200.20          V
## 4     paty     70       F 68400.40          D
## 5    jorge      3       M 23500.90          V
## 6     luis     17       M 32900.00          S
## 7     olga     23       F 23550.90          C
## 8     vero     45       F 25800.20          V
## 9     mimi     34       F 20500.40          D
## 10  karina     28       F 21800.20          V
## 11  carmen     35       F 22121.00          C
## 12    raul     43       M  4897.50          D
## 13   sarah     27       F 54953.25          S
## 14   sonia     54       F  7899.50          V
## 15 ernesto     32       M 25182.56          C

3. Acceder a ciertos registros

personas$nombres   #muestra valores dataframes nombres
##  [1] juan    mary    ruben   paty    jorge   luis    olga    vero   
##  [9] mimi    karina  carmen  raul    sarah   sonia   ernesto
## 15 Levels: carmen ernesto jorge juan karina luis mary mimi olga ... vero
personas$generos   # muestra valores dataframes generos
##  [1] M F M F M M F F F F F M F F M
## Levels: F M
personas[5,]    # mostrar todos los elementos registro 5
##   nombres edades generos sueldos edociviles
## 5   jorge      3       M 23500.9          V
personas[6,]    # mostrar todos los elementos registro 6
##   nombres edades generos sueldos edociviles
## 6    luis     17       M   32900          S
personas[c(7,8), c(1,3,4)] # persona 7 y 8  solo atributo 1,3,4
##   nombres generos sueldos
## 7    olga       F 23550.9
## 8    vero       F 25800.2

4: Realizar análisis general

# todos los datos persona que MAS gana
personas[which.max(personas$sueldos),]
##   nombres edades generos sueldos edociviles
## 4    paty     70       F 68400.4          D
# todos los datos persona que MENOS gana
personas[which.min(personas$sueldos),]   
##    nombres edades generos sueldos edociviles
## 12    raul     43       M  4897.5          D
# todos los datos persona que MAS edad tiene
personas[which.max(personas$edades),]    
##   nombres edades generos sueldos edociviles
## 4    paty     70       F 68400.4          D
# todos los datos persona que MENOS edad tiene
personas[which.min(personas$edades),]    
##   nombres edades generos sueldos edociviles
## 5   jorge      3       M 23500.9          V

5. Determinar la media de edades y sueldos

paste( "El promedio de edad es: " ,round(mean(personas$edades),2))
## [1] "El promedio de edad es:  35.53"
paste("El promedio de los sueldos es: ", mean(personas$sueldos))
## [1] "El promedio de los sueldos es:  25193.894"

6. Determinar rango de persona por sueldo

# ¿cuáles personas están por encima de la media de la edad?
mediaedad <- mean(personas$edades)
cuales <- which(personas$edades >= mediaedad) # Por encima de la media
personas[cuales, ]
##    nombres edades generos sueldos edociviles
## 1     juan     40       M  5400.9          S
## 3    ruben     56       M 34200.2          V
## 4     paty     70       F 68400.4          D
## 8     vero     45       F 25800.2          V
## 12    raul     43       M  4897.5          D
## 14   sonia     54       F  7899.5          V
# Cuáles personas tienen un sueldo entre 22000 y 28000
# Todos sus campos
personas[which(personas$sueldos >= 22000 & personas$sueldos <= 28000), ] 
##    nombres edades generos  sueldos edociviles
## 5    jorge      3       M 23500.90          V
## 7     olga     23       F 23550.90          C
## 8     vero     45       F 25800.20          V
## 11  carmen     35       F 22121.00          C
## 15 ernesto     32       M 25182.56          C

7. Interpretacion del análisis

El dataframe muestra un conjunto de datos con 15 registro y 5 atributos(nombre, edad, sueldo, genero y edo civil).

En lo que respecta a sueldos, la persona que más gana es Paty ($68400.4); la persona que menos gana es Juan ($5400.9). El valor medio del sueldo es de $25193.894

En lo referente a las edades, la persona que más edad tiene es Paty (70 años) y la de menor edad es Jorge (3 años). El valor medio de edades es de 35.53 años.

Por otra parte las personas que tienen un sueldo entre 22000.00 y 28000.00 son: jorge ($23500.9), Olga ($23550.9), Vero ($25800.2), carmen ($22121), Ernesto ($25182.56)

Y por último las personas que están por encima de la media de la edad de las personas son: Juan (40 años),Ruben (70años),Vero (45 años), Raúl (43 años), Sonia (54 años)