Analisis de Personas
Objetivo: Realizar un analisis descriptivo de un conjunto de datos para determinar.
Bloque 1. Creación del Dataframe
nombres <- c("Juan", "Mary","Ruben","Paty", "Jorge", "Luis", "Olga","Veronica", "Mimi", "Karina", "Susana", "Raul",
"Pedro","Lucia","Ana")
edades <- c(40,26,56,70,3,17,23,45,34,28,25,31,18,37,50) # con la letra c se genera el arreglo
generos<- c('M','F','M','F','M','M','F','F','F','F','F','M','M','F',
'F')
sueldos<-c(5400.90,6800.50,34200.20,68400.40,23500.90,32900,
23550.90,25800.20,20500.40,21800.20,7700.10,11400.50,
8900.60,14300.20,21900.50)
edociviles<-c('S','C','V','D','V','S','C','V','D','V','S','C','S',
'S','S')
personas<-data.frame(nombres,edades,generos,sueldos,edociviles)
Bloque 2. Mostrar el dataframe en pantalla
personas # mostrar personas
## nombres edades generos sueldos edociviles
## 1 Juan 40 M 5400.9 S
## 2 Mary 26 F 6800.5 C
## 3 Ruben 56 M 34200.2 V
## 4 Paty 70 F 68400.4 D
## 5 Jorge 3 M 23500.9 V
## 6 Luis 17 M 32900.0 S
## 7 Olga 23 F 23550.9 C
## 8 Veronica 45 F 25800.2 V
## 9 Mimi 34 F 20500.4 D
## 10 Karina 28 F 21800.2 V
## 11 Susana 25 F 7700.1 S
## 12 Raul 31 M 11400.5 C
## 13 Pedro 18 M 8900.6 S
## 14 Lucia 37 F 14300.2 S
## 15 Ana 50 F 21900.5 S
Bloque 3.Acceder a registros especificos.
# Muestra los nombres que hay en los registros:
personas$nombres
## [1] Juan Mary Ruben Paty Jorge Luis Olga
## [8] Veronica Mimi Karina Susana Raul Pedro Lucia
## [15] Ana
## 15 Levels: Ana Jorge Juan Karina Lucia Luis Mary Mimi Olga Paty ... Veronica
# Muestra los generos:
personas$generos
## [1] M F M F M M F F F F F M M F F
## Levels: F M
# Datos del registro 5:
personas[5,]
## nombres edades generos sueldos edociviles
## 5 Jorge 3 M 23500.9 V
# Datos del registro 6:
personas[6,]
## nombres edades generos sueldos edociviles
## 6 Luis 17 M 32900 S
# Nombre, Genero y Sueldo de los registros 7 y 8:
personas[c(7,8),c(1,3,4)]
## nombres generos sueldos
## 7 Olga F 23550.9
## 8 Veronica F 25800.2
Bloque 4. Analisis general
# La persona con sueldo mayor es:
personas[which.max(personas$sueldos),]
## nombres edades generos sueldos edociviles
## 4 Paty 70 F 68400.4 D
# La persona con menor sueldo es:
personas[which.min(personas$sueldos),]
## nombres edades generos sueldos edociviles
## 1 Juan 40 M 5400.9 S
# Persona con rango de edad mayor:
personas[which.max(personas$edades),]
## nombres edades generos sueldos edociviles
## 4 Paty 70 F 68400.4 D
# Persona con menor edad:
personas[which.min(personas$edades),]
## nombres edades generos sueldos edociviles
## 5 Jorge 3 M 23500.9 V
Bloque 6.Determinar rango de persona deacuerdo al sueldo
# Media
mediaedad<- mean(edades)
cuales <- which(personas$edades >= mediaedad)
#Persona que se encuentran por encima de la media
personas[cuales, ]
## nombres edades generos sueldos edociviles
## 1 Juan 40 M 5400.9 S
## 3 Ruben 56 M 34200.2 V
## 4 Paty 70 F 68400.4 D
## 8 Veronica 45 F 25800.2 V
## 9 Mimi 34 F 20500.4 D
## 14 Lucia 37 F 14300.2 S
## 15 Ana 50 F 21900.5 S
#Muestra personas que estan por encima de la media en sueldos:
cual <- which(personas$sueldos >= 22000 & personas$sueldos <= 28000)
personas[cual, ]
## nombres edades generos sueldos edociviles
## 5 Jorge 3 M 23500.9 V
## 7 Olga 23 F 23550.9 C
## 8 Veronica 45 F 25800.2 V
En la Practica Analisis de Datos el conjunto que se muestra consta de 15 registros y 5 columnas.
La persona que tiene mayor sueldo es: Paty, su sueldo es: 68,400.40. Por el contrario la persona que tiene menor ingreso : Juan y su sueldo es: 5,400.50. El valor medio del sueldo del conjunto de datos es: 21,803.77.
Con respecto a las edades que se muestran el valor medio es: 33.53 años. La persona de menor edad es: Jorge y tiene 3 años.
La persona que tiene el mayor rango de edad es: Paty y ella tiene 70 años.
Las personas que tienen un sueldo entre 22000 y 28000 son las siguientes:
Jorge, Olga y Veronica.