ANALISIS DE PERSONAS

OBJETIVO: Realizar un analisis descriptivo de datos de un conjunto de personas para determinar.

Creacion de un dataframe

Primero llenamos los vectores

nombre <- c("JUAN", "MARY", "RUBEN", "PATY", "JORGE",
             "LUIS", "OLGA","VERONICA","MIMI","KARINA",
            "LAURA","EMILIANO","JANETH","JAVIER","ALONSO")

edad <- c(40, 26, 56, 70, 3, 
          17, 23, 45, 34, 28,
          11, 50, 30, 21, 80)

genero <- c('M','F','M','F','M',
             'M','F','F','F','F',
            'F','M','F','M','M')

sueldo <- c(5400.90, 6800.50, 34200.20, 64800.40, 23500.90,
             32900, 23550.90, 25800.20, 20500.40, 21800.20,
             6700.80, 35700.34, 12300, 4300, 11000)

edocivil <- c('S','C','C','D','V',
              'S','C','V','D','V',
              'S','C','V','D','V')

personas <- data.frame(nombre, edad, genero, sueldo, edocivil )

BLOQUE 2: MOSTRAR EL DATAFRAME EN PANTALLA.

TODOS LOS REGISTROS Y TODAS LAS COLUMNAS

personas # Muestra las personas
##      nombre edad genero   sueldo edocivil
## 1      JUAN   40      M  5400.90        S
## 2      MARY   26      F  6800.50        C
## 3     RUBEN   56      M 34200.20        C
## 4      PATY   70      F 64800.40        D
## 5     JORGE    3      M 23500.90        V
## 6      LUIS   17      M 32900.00        S
## 7      OLGA   23      F 23550.90        C
## 8  VERONICA   45      F 25800.20        V
## 9      MIMI   34      F 20500.40        D
## 10   KARINA   28      F 21800.20        V
## 11    LAURA   11      F  6700.80        S
## 12 EMILIANO   50      M 35700.34        C
## 13   JANETH   30      F 12300.00        V
## 14   JAVIER   21      M  4300.00        D
## 15   ALONSO   80      M 11000.00        V

BLOQUE 3. ACCEDER A CIERTOS REGISTROS

# Los datos del atributo nombre del dataframe personas
personas$nombre
##  [1] JUAN     MARY     RUBEN    PATY     JORGE    LUIS     OLGA    
##  [8] VERONICA MIMI     KARINA   LAURA    EMILIANO JANETH   JAVIER  
## [15] ALONSO  
## 15 Levels: ALONSO EMILIANO JANETH JAVIER JORGE JUAN KARINA LAURA ... VERONICA
# los datos del atributo genero del dataframe personas
personas$genero
##  [1] M F M F M M F F F F F M F M M
## Levels: F M
# el registro 5 y todos sus atributos
personas[5,]
##   nombre edad genero  sueldo edocivil
## 5  JORGE    3      M 23500.9        V
# el registro 6 y todos sus atributos
personas[6,] 
##   nombre edad genero sueldo edocivil
## 6   LUIS   17      M  32900        S
#el registro 7 y 8 con las columnas 1,3 y 4
personas[c(7,8), c(1,3,4)]
##     nombre genero  sueldo
## 7     OLGA      F 23550.9
## 8 VERONICA      F 25800.2

BLOQUE 4: REALIZAR ANALISIS GENERAL

# Determinar todos los datos de la persona que MAS sueldo gana. which.max()

personas[which.max(personas$sueldo),]
##   nombre edad genero  sueldo edocivil
## 4   PATY   70      F 64800.4        D
# Determinar los datos de la persona que MENOS sueldo gana. which.min()
personas[which.min(personas$sueldo),]
##    nombre edad genero sueldo edocivil
## 14 JAVIER   21      M   4300        D
# Determinar los datos de la persona que MAS edad tiene
personas[which.max(personas$edad),]
##    nombre edad genero sueldo edocivil
## 15 ALONSO   80      M  11000        V
# Determinar los datos de la persnoa que MENOS edad tiene
personas[which.min(personas$edad),]
##   nombre edad genero  sueldo edocivil
## 5  JORGE    3      M 23500.9        V

BLOQUE 5: DETERMINAR LA MEDIA DE EDADES Y SUELDOS

# Cual es el valor de la media de edad de las personas?
paste("El promedio de edad es", mean(personas$edad))
## [1] "El promedio de edad es 35.6"
# Cual es el valor de la media de sueldos de las personas?

paste("El promedio de los sueldos es: ", mean(personas$sueldo))
## [1] "El promedio de los sueldos es:  21950.3826666667"

BLOQUE 6: DETERMINAR RANGO DE PERSONA POR SUELDO

# Cuales son las personas que ganan entre 22000.00 y 28000.00
# (veinidos mil y veintiocho mil). Todos los atributos
cuales <- which(personas$sueldo >= 22000 & personas$sueldo >= 28000)
personas[cuales, ] # Todos sus campos
##      nombre edad genero   sueldo edocivil
## 3     RUBEN   56      M 34200.20        C
## 4      PATY   70      F 64800.40        D
## 6      LUIS   17      M 32900.00        S
## 12 EMILIANO   50      M 35700.34        C
# Cuales son las personas que en el valor de la edad estan por 
# encima de la media de la edad de todas las personas?
mediaEdad <- mean(edad)
cuales <- which(personas$edad >= mediaEdad) # Por encima de la media
personas[cuales, ]
##      nombre edad genero   sueldo edocivil
## 1      JUAN   40      M  5400.90        S
## 3     RUBEN   56      M 34200.20        C
## 4      PATY   70      F 64800.40        D
## 8  VERONICA   45      F 25800.20        V
## 12 EMILIANO   50      M 35700.34        C
## 15   ALONSO   80      M 11000.00        V

INTERPRETACION DEL ANALISIS

Esta practica tiene una Dataframe de 15 renglones y 5 columnas.

La personas que mas gana es Paty con $64800.4 y la que menos gana es Javier con $4300. Tambien la persona que mas edad tiene es Alonso con 80 años y la que menos tiene es Jorge con 3 años de edad.

El promedio de edad es de: 35.6

El promedio de los sueldos es de: $21950.38

Y las personas que ganan entre $22000 y $28000 es una lista de 4 personas; Ruben, Paty, Luis y Emiliano.

Y finalmente las personas que estan por encima de la media de la edad, tambien es una lista de 6 personas; Juan, Ruben, Paty, Veronica, Emiliano y Alonso.