——–

19041231 Osiris Ochoa Solis

19041239 Elias Jr. Ramos Lopez

19041216 Frida Krystel Herrera Hernández

19041198 Marco Daniel De La Torre Mendia

19041206 Irving alonso Galvan carabez

——–
Objetivo: Analizar datos de alumnos
——–
Descripción. Con un proceso de descarga de los datos de alumnos alojados en la dirccción realizar un conjunto de análisis descriptivos de los datos de algunas variables de alumnos

Instalar e utilizar estos dos paquetes ya que nos seran de utilidad para el trabajo. Instalar en caso de no tenerlos:

install.packages(“readr”)

install.packages(“dplyr”)

library(readr)

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

Aqui usamos esta comando para buscar el archivo que usaremos para datos (OJO es importante tener el archivo descargado y la direccion de localizacion de los datos varian en base a la persona)

datos <- read_csv('E:/Probabilidad y Estadistica/Datos/datosalumnos.csv')
## Parsed with column specification:
## cols(
##   NO = col_double(),
##   NOMBRE = col_character(),
##   GENERO = col_character(),
##   EDAD = col_double(),
##   ESTATURA = col_double(),
##   PESO = col_double()
## )

Juntamos los datos en un DataFrame y los mostramos

datos <- as.data.frame(datos)
class(datos)
## [1] "data.frame"
datos
##    NO   NOMBRE GENERO EDAD ESTATURA PESO
## 1   1    ANAND      M   18      176   72
## 2   2    DIANA      F   18      178   78
## 3   3     IVAN      M   19      170   55
## 4   4   DANIEL      M   18      180   78
## 5   5    KEVIN      M   18      178   80
## 6   6    ANGEL      M   19      173   55
## 7   7    JESUS      M   18      170   70
## 8   8    MARCO      M   18      180   91
## 9   9   IRVING      M   19      170   70
## 10 10  ELEAZAR      M   18      180   95
## 11 11     JUAN      M   19      180   60
## 12 12   BORDAS      M   18      185   80
## 13 13     LUIS      M   19      177   92
## 14 14  JAZHIEL      M   18      172   87
## 15 15    KEYLA      F   18      154   63
## 16 16  VANESSA      F   18      162   50
## 17 17    JESUS      M   18      160   60
## 18 18   ALEXEI      M   19      170   80
## 19 19    FANNY      F   18      165   52
## 20 20     ALDO      M   18      176   85
## 21 21     LUIS      M   18      186   87
## 22 22 FERNANDA      F   19      145   58
## 23 23    FRIDA      F   18      150   55
## 24 24  JESABEL      F   18      176   80
## 25 25    MARIO      M   18      176   65
## 26 26    FABIO      M   18      180   60
## 27 27      NOE      M   19      176   77
## 28 28    ELIAS      M   19      180   90
## 29 29   OSIRIS      M   18      180   99

Aqui vemos el inicio y el final del dataFrame en base al comando

head(datos)
##   NO NOMBRE GENERO EDAD ESTATURA PESO
## 1  1  ANAND      M   18      176   72
## 2  2  DIANA      F   18      178   78
## 3  3   IVAN      M   19      170   55
## 4  4 DANIEL      M   18      180   78
## 5  5  KEVIN      M   18      178   80
## 6  6  ANGEL      M   19      173   55
tail(datos)
##    NO  NOMBRE GENERO EDAD ESTATURA PESO
## 24 24 JESABEL      F   18      176   80
## 25 25   MARIO      M   18      176   65
## 26 26   FABIO      M   18      180   60
## 27 27     NOE      M   19      176   77
## 28 28   ELIAS      M   19      180   90
## 29 29  OSIRIS      M   18      180   99

Movemos los nombres a una sola variable para poder trabajar con ellos

nombresString<-datos$NOMBRE

nombresString
##  [1] "ANAND"    "DIANA"    "IVAN"     "DANIEL"   "KEVIN"    "ANGEL"   
##  [7] "JESUS"    "MARCO"    "IRVING"   "ELEAZAR"  "JUAN"     "BORDAS"  
## [13] "LUIS"     "JAZHIEL"  "KEYLA"    "VANESSA"  "JESUS"    "ALEXEI"  
## [19] "FANNY"    "ALDO"     "LUIS"     "FERNANDA" "FRIDA"    "JESABEL" 
## [25] "MARIO"    "FABIO"    "NOE"      "ELIAS"    "OSIRIS"

Encontramos el nombre con mas caracteres

max(nombresString)
## [1] "VANESSA"

Ponemos los generos en una sola variable para poder trabajarlos indepenfientemente

genero<-datos$GENERO

genero
##  [1] "M" "F" "M" "M" "M" "M" "M" "M" "M" "M" "M" "M" "M" "M" "F" "F" "M" "M" "F"
## [20] "M" "M" "F" "F" "F" "M" "M" "M" "M" "M"

Sacamos la frecuencia de las personas en base al genero

frecuencia <- table(genero)
frecuencia
## genero
##  F  M 
##  7 22

Sacamos N

n <- length(genero)
n
## [1] 29

Sacamos los percentajes de genero

porcentaje <- (frecuencia/n)*100
porcentaje
## genero
##        F        M 
## 24.13793 75.86207

Generamos la grafica de pastel con una pequeña leyenda

color<- c("pink", "blue")
color1<- c("blue", "pink")

pie(porcentaje, labels = c(porcentaje), main = "PORCENTAJE DE HOMBRES/MUJERES EN EL SALON",col=(color))
legend("topright", c("HOMBRES","MUJERES"),cex = 0.8, fill = color1)

Aislamos las edades para poder trabajarlas por separado y ver la frecuencia

edades <- datos$EDAD
edades
##  [1] 18 18 19 18 18 19 18 18 19 18 19 18 19 18 18 18 18 19 18 18 18 19 18 18 18
## [26] 18 19 19 18
frecuenciaEdades <- table(edades)
frecuenciaEdades
## edades
## 18 19 
## 20  9

Hoja de tallo de las edades

hist(edades)

Diagrama stem() de las edades

stem(edades)
## 
##   The decimal point is 1 digit(s) to the left of the |
## 
##   180 | 00000000000000000000
##   182 | 
##   184 | 
##   186 | 
##   188 | 
##   190 | 000000000

Creamos un nuevo dataFrame para manipular nuevos objetos

alu <- data.frame(datos$NOMBRE, datos$EDAD, datos$GENERO, datos$ESTATURA, datos$PESO)
alu
##    datos.NOMBRE datos.EDAD datos.GENERO datos.ESTATURA datos.PESO
## 1         ANAND         18            M            176         72
## 2         DIANA         18            F            178         78
## 3          IVAN         19            M            170         55
## 4        DANIEL         18            M            180         78
## 5         KEVIN         18            M            178         80
## 6         ANGEL         19            M            173         55
## 7         JESUS         18            M            170         70
## 8         MARCO         18            M            180         91
## 9        IRVING         19            M            170         70
## 10      ELEAZAR         18            M            180         95
## 11         JUAN         19            M            180         60
## 12       BORDAS         18            M            185         80
## 13         LUIS         19            M            177         92
## 14      JAZHIEL         18            M            172         87
## 15        KEYLA         18            F            154         63
## 16      VANESSA         18            F            162         50
## 17        JESUS         18            M            160         60
## 18       ALEXEI         19            M            170         80
## 19        FANNY         18            F            165         52
## 20         ALDO         18            M            176         85
## 21         LUIS         18            M            186         87
## 22     FERNANDA         19            F            145         58
## 23        FRIDA         18            F            150         55
## 24      JESABEL         18            F            176         80
## 25        MARIO         18            M            176         65
## 26        FABIO         18            M            180         60
## 27          NOE         19            M            176         77
## 28        ELIAS         19            M            180         90
## 29       OSIRIS         18            M            180         99

Filtramos los datos por Masculino

hombres<-alu %>% filter(datos.GENERO== "M")
hombres
##    datos.NOMBRE datos.EDAD datos.GENERO datos.ESTATURA datos.PESO
## 1         ANAND         18            M            176         72
## 2          IVAN         19            M            170         55
## 3        DANIEL         18            M            180         78
## 4         KEVIN         18            M            178         80
## 5         ANGEL         19            M            173         55
## 6         JESUS         18            M            170         70
## 7         MARCO         18            M            180         91
## 8        IRVING         19            M            170         70
## 9       ELEAZAR         18            M            180         95
## 10         JUAN         19            M            180         60
## 11       BORDAS         18            M            185         80
## 12         LUIS         19            M            177         92
## 13      JAZHIEL         18            M            172         87
## 14        JESUS         18            M            160         60
## 15       ALEXEI         19            M            170         80
## 16         ALDO         18            M            176         85
## 17         LUIS         18            M            186         87
## 18        MARIO         18            M            176         65
## 19        FABIO         18            M            180         60
## 20          NOE         19            M            176         77
## 21        ELIAS         19            M            180         90
## 22       OSIRIS         18            M            180         99

Generamos variables individuales de hombres para determinar solo ciertos datos

hombresEdad<- hombres$datos.EDAD
hombresEdad
##  [1] 18 19 18 18 19 18 18 19 18 19 18 19 18 18 19 18 18 18 18 19 19 18
hombresEstatura <- hombres$datos.ESTATURA
hombresEstatura
##  [1] 176 170 180 178 173 170 180 170 180 180 185 177 172 160 170 176 186 176 180
## [20] 176 180 180
hombresPeso <- hombres$datos.PESO
hombresPeso
##  [1] 72 55 78 80 55 70 91 70 95 60 80 92 87 60 80 85 87 65 60 77 90 99

Filtramos los datos por Femenino

mujeres<-alu %>% filter(datos.GENERO== "F")
mujeres
##   datos.NOMBRE datos.EDAD datos.GENERO datos.ESTATURA datos.PESO
## 1        DIANA         18            F            178         78
## 2        KEYLA         18            F            154         63
## 3      VANESSA         18            F            162         50
## 4        FANNY         18            F            165         52
## 5     FERNANDA         19            F            145         58
## 6        FRIDA         18            F            150         55
## 7      JESABEL         18            F            176         80

Generamos variables individuales de mujeres para determinar solo ciertos datos

mujeresEdad<- mujeres$datos.EDAD
mujeresEdad
## [1] 18 18 18 18 19 18 18
mujeresEstatura <- mujeres$datos.ESTATURA
mujeresEstatura
## [1] 178 154 162 165 145 150 176
mujeresPeso <- mujeres$datos.PESO
mujeresPeso
## [1] 78 63 50 52 58 55 80

Media de la edad de los hombres

mediaHEdad <- mean(hombresEdad)
mediaHEdad
## [1] 18.36364

Media de la estatura de los hombres

mediaHEstatura <- mean(hombresEstatura)
mediaHEstatura
## [1] 176.1364

Media del peso de los hombres

mediaHPeso <- mean(hombresPeso)
mediaHPeso
## [1] 76.72727

Media de la edad de las mujeres

mediaMEdad <- mean(mujeresEdad)
mediaMEdad
## [1] 18.14286

Media de la estatura de las mujeres

mediaMEstatura <- mean(mujeresEstatura)
mediaMEstatura
## [1] 161.4286

Media del peso de las mujeres

mediaMPeso <- mean(mujeresPeso)
mediaMPeso
## [1] 62.28571

Comparacion de la edad entre hombres y mujeres. Y mayor o menor

comparacion <- data.frame(mediaHEdad, mediaMEdad)
comparacion
##   mediaHEdad mediaMEdad
## 1   18.36364   18.14286
max(comparacion)
## [1] 18.36364

Comparacion de la Estatura entre hombres y mujeres. Y mayor o menor

comparacion1 <- data.frame(mediaHEstatura, mediaMEstatura)
comparacion1
##   mediaHEstatura mediaMEstatura
## 1       176.1364       161.4286
max(comparacion1)
## [1] 176.1364

Comparacion del peso entre hombres y mujeres. Y mayor o menor

comparacion2 <- data.frame(mediaHPeso, mediaMPeso)
comparacion2
##   mediaHPeso mediaMPeso
## 1   76.72727   62.28571
max(comparacion2)
## [1] 76.72727

Summary (Muestra todos los datos de interes)

summary(datos)
##        NO        NOMBRE             GENERO               EDAD      
##  Min.   : 1   Length:29          Length:29          Min.   :18.00  
##  1st Qu.: 8   Class :character   Class :character   1st Qu.:18.00  
##  Median :15   Mode  :character   Mode  :character   Median :18.00  
##  Mean   :15                                         Mean   :18.31  
##  3rd Qu.:22                                         3rd Qu.:19.00  
##  Max.   :29                                         Max.   :19.00  
##     ESTATURA          PESO      
##  Min.   :145.0   Min.   :50.00  
##  1st Qu.:170.0   1st Qu.:60.00  
##  Median :176.0   Median :77.00  
##  Mean   :172.6   Mean   :73.24  
##  3rd Qu.:180.0   3rd Qu.:85.00  
##  Max.   :186.0   Max.   :99.00

——–

ANALISIS FINAL

Con los datos anteriormente obtenidos podemos observar que poseemos un gran conjunto de variables las cuales pueden tener una distinta interpertracion segun el fin para el que las usemos. Por ejemplo: al comprender que la poblacion dominante dentro del salon es de hombres con un numero de 22 hombres contra 7 mujeres podemos razonar que la moyaria de los datos tendran tendencia central hacia los datos comunes arrojados por los hombres, como el peso, edad, estaura y demas.

Analizando los datos por encima podemos darnos que se tomo una muestra de 29 personas ya que no todos fueron encuestados con estas simples preguntas, en donde podemos notar que hay una media de 18 años de edad asi como una mayoria de 18 años dandondos a entender la edad pormedio del salon.

Dentro de los datos mas importantes podemos resaltar que la edad minima es de 18 y la edad maxima no exede los 19 años, la estatura minima es de 145 cm y la estatura maxima es de 186 cm, asi como el peso donde el peso minimo es de 50 kg y el peso maximo de 99 kg.

Importancia de los datos:

Segun para la que se necesite estos datos pueden tomar un rol en especial, por ejemplo: podemos calcular el indice de mas corporal para determinar la salud de los estudiantes de la institucion, podemos ver que alumnos son mas altos o de mayor peso para ciertas actividades fisicas, podemos ver que domina mas en el tipo de carrera en Sistemas si hombres o mujeres para generar planes para balancear aquel dato para que sean los mismo hombres y las mismas mujeres, tambien nos pueden servir para en base a la edad determinar que tipo de actividades son las adecuadas para los jovenes de cierta edad o como podriamos hacer las cosas mas comodas para personas de aquella edad dentro de la institucion.

Por si solos estos datos nos muestran una estimado promedio de como es el grupo, pero todo depende para el fin que lo utilicemos.

——–

——–

——–