Cargar librería

library(readr)

Cargar los datos

datos = read_csv("~/Probabilidad/Datos/datosalumnos.csv")
## Parsed with column specification:
## cols(
##   NO = col_double(),
##   NOMBRE = col_character(),
##   GENERO = col_character(),
##   EDAD = col_double(),
##   ESTATURA = col_double(),
##   PESO = col_double()
## )
datos
## # A tibble: 29 x 6
##       NO NOMBRE  GENERO  EDAD ESTATURA  PESO
##    <dbl> <chr>   <chr>  <dbl>    <dbl> <dbl>
##  1     1 ANAND   M         18      176    72
##  2     2 DIANA   F         18      178    78
##  3     3 IVAN    M         19      170    55
##  4     4 DANIEL  M         18      180    78
##  5     5 KEVIN   M         18      178    80
##  6     6 ANGEL   M         19      173    55
##  7     7 JESUS   M         18      170    70
##  8     8 MARCO   M         18      180    91
##  9     9 IRVING  M         19      170    70
## 10    10 ELEAZAR M         18      180    95
## # ... with 19 more rows
class(datos)
## [1] "spec_tbl_df" "tbl_df"      "tbl"         "data.frame"

Transformar a data frame

datos = as.data.frame(datos)

Ver los datos

datos
##    NO   NOMBRE GENERO EDAD ESTATURA PESO
## 1   1    ANAND      M   18      176   72
## 2   2    DIANA      F   18      178   78
## 3   3     IVAN      M   19      170   55
## 4   4   DANIEL      M   18      180   78
## 5   5    KEVIN      M   18      178   80
## 6   6    ANGEL      M   19      173   55
## 7   7    JESUS      M   18      170   70
## 8   8    MARCO      M   18      180   91
## 9   9   IRVING      M   19      170   70
## 10 10  ELEAZAR      M   18      180   95
## 11 11     JUAN      M   19      180   60
## 12 12   BORDAS      M   18      185   80
## 13 13     LUIS      M   19      177   92
## 14 14  JAZHIEL      M   18      172   87
## 15 15    KEYLA      F   18      154   63
## 16 16  VANESSA      F   18      162   50
## 17 17    JESUS      M   18      160   60
## 18 18   ALEXEI      M   19      170   80
## 19 19    FANNY      F   18      165   52
## 20 20     ALDO      M   18      176   85
## 21 21     LUIS      M   18      186   87
## 22 22 FERNANDA      F   19      145   58
## 23 23    FRIDA      F   18      150   55
## 24 24  JESABEL      F   18      176   80
## 25 25    MARIO      M   18      176   65
## 26 26    FABIO      M   18      180   60
## 27 27      NOE      M   19      176   77
## 28 28    ELIAS      M   19      180   90
## 29 29   OSIRIS      M   18      180   99
head(datos) #Primeros 6 datos
##   NO NOMBRE GENERO EDAD ESTATURA PESO
## 1  1  ANAND      M   18      176   72
## 2  2  DIANA      F   18      178   78
## 3  3   IVAN      M   19      170   55
## 4  4 DANIEL      M   18      180   78
## 5  5  KEVIN      M   18      178   80
## 6  6  ANGEL      M   19      173   55
tail(datos) #Ultimos 6 datos
##    NO  NOMBRE GENERO EDAD ESTATURA PESO
## 24 24 JESABEL      F   18      176   80
## 25 25   MARIO      M   18      176   65
## 26 26   FABIO      M   18      180   60
## 27 27     NOE      M   19      176   77
## 28 28   ELIAS      M   19      180   90
## 29 29  OSIRIS      M   18      180   99

Número de caracteres de los nombres

nombres = (datos$NOMBRE) #Obtener los nombres
class(nombres)
## [1] "character"
caracteres = nchar(nombres, type = "chars", allowNA = FALSE, keepNA = FALSE) #Determinar longitud de caracteres
caracteres
##  [1] 5 5 4 6 5 5 5 5 6 7 4 6 4 7 5 7 5 6 5 4 4 8 5 7 5 5 3 5 6
masLargo = max(caracteres) #Numero más grande de la lista
masLargo
## [1] 8
nombreLargo = which(caracteres == masLargo, arr.ind = TRUE) #Nombre correspondiente al número más grande
datos$NOMBRE[nombreLargo]
## [1] "FERNANDA"

Obtener frecuencia de hombres, mujeres y graficar pastel

frec = datos$GENERO
pie(table(frec))

Identificar la frecuencia de edades de los alumnos y visualizar con diagrama de tallo y hoja stem()

stem(datos$EDAD, scale =.10)
## 
##   The decimal point is at the |
## 
##   18 | 00000000000000000000000000000

Valores estadísticos

Media de edades de los hombres

hombres = subset(datos,GENERO=="M")
media = mean(hombres$EDAD)
media
## [1] 18.36364

Media de edades de las mujeres

mujeres = subset(datos, GENERO == "F")
mediaM = mean(mujeres$EDAD)
mediaM
## [1] 18.14286

Determinar si son mayores los hombres o las mujeres

if (media > mediaM){print("Los hombres son mayores.")} else{print("Las mujeres son mayores")}
## [1] "Los hombres son mayores."

Media de la estatura de los hombres

hombresA = subset(datos, GENERO == "M")
estHombres = mean(hombresA$ESTATURA)
estHombres
## [1] 176.1364

Media de la estatura de las mujeres

mujeresA = subset(datos, GENERO == "F")
estMujeres = mean(mujeresA$ESTATURA)
estMujeres
## [1] 161.4286

Determinar quienes son más altos

if(estHombres > estMujeres){print("Los hombres son más altos")} else{print("Las mujeres son más altas")}
## [1] "Los hombres son más altos"

Media del peso de hombres

pesoHom = subset(datos, GENERO == "M")
mPesoHom = mean(pesoHom$PESO)
mPesoHom
## [1] 76.72727

Media del peso de mujeres

pesoMujer = subset(datos, GENERO == "F")
mPesoMujer = mean(pesoMujer$PESO)
mPesoMujer
## [1] 62.28571

Determinar quien pesa más, si hombres o mujeres

if(mPesoHom > mPesoMujer){print("Los hombres pesan más que las mujeres.")} else{print("Las mujeres pesan más que los hombres")}
## [1] "Los hombres pesan más que las mujeres."

La práctica consistió en recolectar los nombre, peso, estatura y edad de los alumnos de la clase de probabilidad y estadística del ITD, se generó un data frame una vez recolectados los datos. Posteriormente, se determinó el número de caracteres de cada nombre y se conoció el nombre más largo de el grupo de personas. Después se procedió a realizar una gráfica de pastel con las frecuencias del género. Luego, se generó un diagrama de tallo de hoja con las frecuencias de las edades de los alumnos. En seguida, se calculó la media de edades de mujeres y hombres, y se determinó quienes son mayores. Luego, determinó la media de estatura de mujeres y hombres y se concluyó que los hombres son más altos. Finalmente, se determinó la media de ambos géneros y llegamos a la conclusión de que los hombres pesan más que las mujeres.