——–
19041231 Osiris Ochoa Solis
19041239 Elias Jr. Ramos Lopez
19041216 Frida Krystel Herrera Hernández
19041198 Marco Daniel De La Torre Mendia
19041206 Irving alonso Galvan carabez
——–
Objetivo: Analizar datos de alumnos
——–
Descripción. Con un proceso de descarga de los datos de alumnos alojados en la dirccción realizar un conjunto de análisis descriptivos de los datos de algunas variables de alumnos
Instalar e utilizar estos dos paquetes ya que nos seran de utilidad para el trabajo. Instalar en caso de no tenerlos:
install.packages(“readr”)
install.packages(“dplyr”)
library(readr)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
Aqui usamos esta comando para buscar el archivo que usaremos para datos (OJO es importante tener el archivo descargado y la direccion de localizacion de los datos varian en base a la persona)
datos <- read_csv('E:/Probabilidad y Estadistica/Datos/datosalumnos.csv')
## Parsed with column specification:
## cols(
## NO = col_double(),
## NOMBRE = col_character(),
## GENERO = col_character(),
## EDAD = col_double(),
## ESTATURA = col_double(),
## PESO = col_double()
## )
Juntamos los datos en un DataFrame y los mostramos
datos <- as.data.frame(datos)
class(datos)
## [1] "data.frame"
datos
## NO NOMBRE GENERO EDAD ESTATURA PESO
## 1 1 ANAND M 18 176 72
## 2 2 DIANA F 18 178 78
## 3 3 IVAN M 19 170 55
## 4 4 DANIEL M 18 180 78
## 5 5 KEVIN M 18 178 80
## 6 6 ANGEL M 19 173 55
## 7 7 JESUS M 18 170 70
## 8 8 MARCO M 18 180 91
## 9 9 IRVING M 19 170 70
## 10 10 ELEAZAR M 18 180 95
## 11 11 JUAN M 19 180 60
## 12 12 BORDAS M 18 185 80
## 13 13 LUIS M 19 177 92
## 14 14 JAZHIEL M 18 172 87
## 15 15 KEYLA F 18 154 63
## 16 16 VANESSA F 18 162 50
## 17 17 JESUS M 18 160 60
## 18 18 ALEXEI M 19 170 80
## 19 19 FANNY F 18 165 52
## 20 20 ALDO M 18 176 85
## 21 21 LUIS M 18 186 87
## 22 22 FERNANDA F 19 145 58
## 23 23 FRIDA F 18 150 55
## 24 24 JESABEL F 18 176 80
## 25 25 MARIO M 18 176 65
## 26 26 FABIO M 18 180 60
## 27 27 NOE M 19 176 77
## 28 28 ELIAS M 19 180 90
## 29 29 OSIRIS M 18 180 99
Aqui vemos el inicio y el final del dataFrame en base al comando
head(datos)
## NO NOMBRE GENERO EDAD ESTATURA PESO
## 1 1 ANAND M 18 176 72
## 2 2 DIANA F 18 178 78
## 3 3 IVAN M 19 170 55
## 4 4 DANIEL M 18 180 78
## 5 5 KEVIN M 18 178 80
## 6 6 ANGEL M 19 173 55
tail(datos)
## NO NOMBRE GENERO EDAD ESTATURA PESO
## 24 24 JESABEL F 18 176 80
## 25 25 MARIO M 18 176 65
## 26 26 FABIO M 18 180 60
## 27 27 NOE M 19 176 77
## 28 28 ELIAS M 19 180 90
## 29 29 OSIRIS M 18 180 99
Movemos los nombres a una sola variable para poder trabajar con ellos
nombresString<-datos$NOMBRE
nombresString
## [1] "ANAND" "DIANA" "IVAN" "DANIEL" "KEVIN" "ANGEL"
## [7] "JESUS" "MARCO" "IRVING" "ELEAZAR" "JUAN" "BORDAS"
## [13] "LUIS" "JAZHIEL" "KEYLA" "VANESSA" "JESUS" "ALEXEI"
## [19] "FANNY" "ALDO" "LUIS" "FERNANDA" "FRIDA" "JESABEL"
## [25] "MARIO" "FABIO" "NOE" "ELIAS" "OSIRIS"
Encontramos el nombre con mas caracteres
max(nombresString)
## [1] "VANESSA"
Ponemos los generos en una sola variable para poder trabajarlos indepenfientemente
genero<-datos$GENERO
genero
## [1] "M" "F" "M" "M" "M" "M" "M" "M" "M" "M" "M" "M" "M" "M" "F" "F" "M" "M" "F"
## [20] "M" "M" "F" "F" "F" "M" "M" "M" "M" "M"
Sacamos la frecuencia de las personas en base al genero
frecuencia <- table(genero)
frecuencia
## genero
## F M
## 7 22
Sacamos N
n <- length(genero)
n
## [1] 29
Sacamos los percentajes de genero
porcentaje <- (frecuencia/n)*100
porcentaje
## genero
## F M
## 24.13793 75.86207
Generamos la grafica de pastel con una pequeña leyenda
color<- c("pink", "blue")
color1<- c("blue", "pink")
pie(porcentaje, labels = c(porcentaje), main = "PORCENTAJE DE HOMBRES/MUJERES EN EL SALON",col=(color))
legend("topright", c("HOMBRES","MUJERES"),cex = 0.8, fill = color1)

Aislamos las edades para poder trabajarlas por separado y ver la frecuencia
edades <- datos$EDAD
edades
## [1] 18 18 19 18 18 19 18 18 19 18 19 18 19 18 18 18 18 19 18 18 18 19 18 18 18
## [26] 18 19 19 18
frecuenciaEdades <- table(edades)
frecuenciaEdades
## edades
## 18 19
## 20 9
Hoja de tallo de las edades
hist(edades)

Diagrama stem() de las edades
stem(edades)
##
## The decimal point is 1 digit(s) to the left of the |
##
## 180 | 00000000000000000000
## 182 |
## 184 |
## 186 |
## 188 |
## 190 | 000000000
Creamos un nuevo dataFrame para manipular nuevos objetos
alu <- data.frame(datos$NOMBRE, datos$EDAD, datos$GENERO, datos$ESTATURA, datos$PESO)
alu
## datos.NOMBRE datos.EDAD datos.GENERO datos.ESTATURA datos.PESO
## 1 ANAND 18 M 176 72
## 2 DIANA 18 F 178 78
## 3 IVAN 19 M 170 55
## 4 DANIEL 18 M 180 78
## 5 KEVIN 18 M 178 80
## 6 ANGEL 19 M 173 55
## 7 JESUS 18 M 170 70
## 8 MARCO 18 M 180 91
## 9 IRVING 19 M 170 70
## 10 ELEAZAR 18 M 180 95
## 11 JUAN 19 M 180 60
## 12 BORDAS 18 M 185 80
## 13 LUIS 19 M 177 92
## 14 JAZHIEL 18 M 172 87
## 15 KEYLA 18 F 154 63
## 16 VANESSA 18 F 162 50
## 17 JESUS 18 M 160 60
## 18 ALEXEI 19 M 170 80
## 19 FANNY 18 F 165 52
## 20 ALDO 18 M 176 85
## 21 LUIS 18 M 186 87
## 22 FERNANDA 19 F 145 58
## 23 FRIDA 18 F 150 55
## 24 JESABEL 18 F 176 80
## 25 MARIO 18 M 176 65
## 26 FABIO 18 M 180 60
## 27 NOE 19 M 176 77
## 28 ELIAS 19 M 180 90
## 29 OSIRIS 18 M 180 99
Filtramos los datos por Masculino
hombres<-alu %>% filter(datos.GENERO== "M")
hombres
## datos.NOMBRE datos.EDAD datos.GENERO datos.ESTATURA datos.PESO
## 1 ANAND 18 M 176 72
## 2 IVAN 19 M 170 55
## 3 DANIEL 18 M 180 78
## 4 KEVIN 18 M 178 80
## 5 ANGEL 19 M 173 55
## 6 JESUS 18 M 170 70
## 7 MARCO 18 M 180 91
## 8 IRVING 19 M 170 70
## 9 ELEAZAR 18 M 180 95
## 10 JUAN 19 M 180 60
## 11 BORDAS 18 M 185 80
## 12 LUIS 19 M 177 92
## 13 JAZHIEL 18 M 172 87
## 14 JESUS 18 M 160 60
## 15 ALEXEI 19 M 170 80
## 16 ALDO 18 M 176 85
## 17 LUIS 18 M 186 87
## 18 MARIO 18 M 176 65
## 19 FABIO 18 M 180 60
## 20 NOE 19 M 176 77
## 21 ELIAS 19 M 180 90
## 22 OSIRIS 18 M 180 99
Generamos variables individuales de hombres para determinar solo ciertos datos
hombresEdad<- hombres$datos.EDAD
hombresEdad
## [1] 18 19 18 18 19 18 18 19 18 19 18 19 18 18 19 18 18 18 18 19 19 18
hombresEstatura <- hombres$datos.ESTATURA
hombresEstatura
## [1] 176 170 180 178 173 170 180 170 180 180 185 177 172 160 170 176 186 176 180
## [20] 176 180 180
hombresPeso <- hombres$datos.PESO
hombresPeso
## [1] 72 55 78 80 55 70 91 70 95 60 80 92 87 60 80 85 87 65 60 77 90 99
Filtramos los datos por Femenino
mujeres<-alu %>% filter(datos.GENERO== "F")
mujeres
## datos.NOMBRE datos.EDAD datos.GENERO datos.ESTATURA datos.PESO
## 1 DIANA 18 F 178 78
## 2 KEYLA 18 F 154 63
## 3 VANESSA 18 F 162 50
## 4 FANNY 18 F 165 52
## 5 FERNANDA 19 F 145 58
## 6 FRIDA 18 F 150 55
## 7 JESABEL 18 F 176 80
Generamos variables individuales de mujeres para determinar solo ciertos datos
mujeresEdad<- mujeres$datos.EDAD
mujeresEdad
## [1] 18 18 18 18 19 18 18
mujeresEstatura <- mujeres$datos.ESTATURA
mujeresEstatura
## [1] 178 154 162 165 145 150 176
mujeresPeso <- mujeres$datos.PESO
mujeresPeso
## [1] 78 63 50 52 58 55 80
Comparacion de la edad entre hombres y mujeres. Y mayor o menor
comparacion <- data.frame(mediaHEdad, mediaMEdad)
comparacion
## mediaHEdad mediaMEdad
## 1 18.36364 18.14286
max(comparacion)
## [1] 18.36364
Comparacion de la Estatura entre hombres y mujeres. Y mayor o menor
comparacion1 <- data.frame(mediaHEstatura, mediaMEstatura)
comparacion1
## mediaHEstatura mediaMEstatura
## 1 176.1364 161.4286
max(comparacion1)
## [1] 176.1364
Comparacion del peso entre hombres y mujeres. Y mayor o menor
comparacion2 <- data.frame(mediaHPeso, mediaMPeso)
comparacion2
## mediaHPeso mediaMPeso
## 1 76.72727 62.28571
max(comparacion2)
## [1] 76.72727
Summary (Muestra todos los datos de interes)
summary(datos)
## NO NOMBRE GENERO EDAD
## Min. : 1 Length:29 Length:29 Min. :18.00
## 1st Qu.: 8 Class :character Class :character 1st Qu.:18.00
## Median :15 Mode :character Mode :character Median :18.00
## Mean :15 Mean :18.31
## 3rd Qu.:22 3rd Qu.:19.00
## Max. :29 Max. :19.00
## ESTATURA PESO
## Min. :145.0 Min. :50.00
## 1st Qu.:170.0 1st Qu.:60.00
## Median :176.0 Median :77.00
## Mean :172.6 Mean :73.24
## 3rd Qu.:180.0 3rd Qu.:85.00
## Max. :186.0 Max. :99.00
——–
ANALISIS FINAL
Con los datos anteriormente obtenidos podemos observar que poseemos un gran conjunto de variables las cuales pueden tener una distinta interpertracion segun el fin para el que las usemos. Por ejemplo: al comprender que la poblacion dominante dentro del salon es de hombres con un numero de 22 hombres contra 7 mujeres podemos razonar que la moyaria de los datos tendran tendencia central hacia los datos comunes arrojados por los hombres, como el peso, edad, estaura y demas.
Analizando los datos por encima podemos darnos que se tomo una muestra de 29 personas ya que no todos fueron encuestados con estas simples preguntas, en donde podemos notar que hay una media de 18 años de edad asi como una mayoria de 18 años dandondos a entender la edad pormedio del salon.
Dentro de los datos mas importantes podemos resaltar que la edad minima es de 18 y la edad maxima no exede los 19 años, la estatura minima es de 145 cm y la estatura maxima es de 186 cm, asi como el peso donde el peso minimo es de 50 kg y el peso maximo de 99 kg.
Importancia de los datos:
Segun para la que se necesite estos datos pueden tomar un rol en especial, por ejemplo: podemos calcular el indice de mas corporal para determinar la salud de los estudiantes de la institucion, podemos ver que alumnos son mas altos o de mayor peso para ciertas actividades fisicas, podemos ver que domina mas en el tipo de carrera en Sistemas si hombres o mujeres para generar planes para balancear aquel dato para que sean los mismo hombres y las mismas mujeres, tambien nos pueden servir para en base a la edad determinar que tipo de actividades son las adecuadas para los jovenes de cierta edad o como podriamos hacer las cosas mas comodas para personas de aquella edad dentro de la institucion.
Por si solos estos datos nos muestran una estimado promedio de como es el grupo, pero todo depende para el fin que lo utilicemos.
——–
——–
——–