Practica No 2

Analisis de Personas

Objetivo: Realizar un analisis descriptivo de un conjunto de datos para determinar.

Bloque 1. Creación del Dataframe

nombres <- c("Juan", "Mary","Ruben","Paty", "Jorge", "Luis",                      "Olga","Veronica", "Mimi", "Karina", "Susana", "Raul",
             "Pedro","Lucia","Ana")

edades <- c(40,26,56,70,3,17,23,45,34,28,25,31,18,37,50) # con la               letra c se genera el arreglo

generos<- c('M','F','M','F','M','M','F','F','F','F','F','M','M','F',
            'F')

sueldos<-c(5400.90,6800.50,34200.20,68400.40,23500.90,32900,
           23550.90,25800.20,20500.40,21800.20,7700.10,11400.50,
           8900.60,14300.20,21900.50)

edociviles<-c('S','C','V','D','V','S','C','V','D','V','S','C','S',
              'S','S')

personas<-data.frame(nombres,edades,generos,sueldos,edociviles)

Bloque 2. Mostrar el dataframe en pantalla

personas # mostrar personas
##     nombres edades generos sueldos edociviles
## 1      Juan     40       M  5400.9          S
## 2      Mary     26       F  6800.5          C
## 3     Ruben     56       M 34200.2          V
## 4      Paty     70       F 68400.4          D
## 5     Jorge      3       M 23500.9          V
## 6      Luis     17       M 32900.0          S
## 7      Olga     23       F 23550.9          C
## 8  Veronica     45       F 25800.2          V
## 9      Mimi     34       F 20500.4          D
## 10   Karina     28       F 21800.2          V
## 11   Susana     25       F  7700.1          S
## 12     Raul     31       M 11400.5          C
## 13    Pedro     18       M  8900.6          S
## 14    Lucia     37       F 14300.2          S
## 15      Ana     50       F 21900.5          S

Bloque 3.Acceder a registros especificos.

# Muestra los nombres que hay en los registros:
personas$nombres
##  [1] Juan     Mary     Ruben    Paty     Jorge    Luis     Olga    
##  [8] Veronica Mimi     Karina   Susana   Raul     Pedro    Lucia   
## [15] Ana     
## 15 Levels: Ana Jorge Juan Karina Lucia Luis Mary Mimi Olga Paty ... Veronica
# Muestra los generos: 
personas$generos
##  [1] M F M F M M F F F F F M M F F
## Levels: F M
# Datos del registro 5:
personas[5,]
##   nombres edades generos sueldos edociviles
## 5   Jorge      3       M 23500.9          V
# Datos del registro 6:
personas[6,]
##   nombres edades generos sueldos edociviles
## 6    Luis     17       M   32900          S
# Nombre, Genero y Sueldo de los registros 7 y 8:
personas[c(7,8),c(1,3,4)]
##    nombres generos sueldos
## 7     Olga       F 23550.9
## 8 Veronica       F 25800.2

Bloque 4. Analisis general

# La persona con sueldo mayor es:
personas[which.max(personas$sueldos),] 
##   nombres edades generos sueldos edociviles
## 4    Paty     70       F 68400.4          D
# La persona con menor sueldo es:
personas[which.min(personas$sueldos),] 
##   nombres edades generos sueldos edociviles
## 1    Juan     40       M  5400.9          S
# Persona con rango de edad mayor:
personas[which.max(personas$edades),]
##   nombres edades generos sueldos edociviles
## 4    Paty     70       F 68400.4          D
# Persona con menor edad:
personas[which.min(personas$edades),] 
##   nombres edades generos sueldos edociviles
## 5   Jorge      3       M 23500.9          V

Bloque 5. Determinar la media de edades y sueldos

# Media de edades:
mean(personas$edades) #Media de edades
## [1] 33.53333
# Media de sueldos:
mean(personas$sueldos) #Media de sueldos
## [1] 21803.77

Bloque 6.Determinar rango de persona deacuerdo al sueldo

# Media
mediaedad<- mean(edades) 
cuales <- which(personas$edades >= mediaedad) 

#Persona que se encuentran por encima de la media
personas[cuales, ] 
##     nombres edades generos sueldos edociviles
## 1      Juan     40       M  5400.9          S
## 3     Ruben     56       M 34200.2          V
## 4      Paty     70       F 68400.4          D
## 8  Veronica     45       F 25800.2          V
## 9      Mimi     34       F 20500.4          D
## 14    Lucia     37       F 14300.2          S
## 15      Ana     50       F 21900.5          S
#Muestra personas que estan por encima de la media en sueldos:
cual <- which(personas$sueldos >= 22000 & personas$sueldos <= 28000)
personas[cual, ] 
##    nombres edades generos sueldos edociviles
## 5    Jorge      3       M 23500.9          V
## 7     Olga     23       F 23550.9          C
## 8 Veronica     45       F 25800.2          V

En la Practica Analisis de Datos el conjunto que se muestra consta de 15 registros y 5 columnas.

La persona que tiene mayor sueldo es: Paty, su sueldo es: 68,400.40. Por el contrario la persona que tiene menor ingreso : Juan y su sueldo es: 5,400.50. El valor medio del sueldo del conjunto de datos es: 21,803.77.

Con respecto a las edades que se muestran el valor medio es: 33.53 años. La persona de menor edad es: Jorge y tiene 3 años.

La persona que tiene el mayor rango de edad es: Paty y ella tiene 70 años.

Las personas que tienen un sueldo entre 22000 y 28000 son las siguientes:

Jorge, Olga y Veronica.

Y por último las personas que presentan una edad por encima de la media son:

Juan 40

Ruben 56

Paty 70

Veronica 45

Mimi 34

Lucia 37

Ana 50