Clase de consulta día viernes 25 de abril de 2025
Como cargar una imagen: 1ro la traemos a la ventana 4 y luego usamos:
.

install.packages("tidyverse")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
install.packages("summarytools")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
library(tidyverse)
library(summarytools)
# Configuración general del paquete summarytools
st_options( lang = "es", footnote = "")
ALUMNOS_2025 <- read_csv("https://docs.google.com/spreadsheets/d/e/2PACX-1vQGHbPvrMJVpb23yFWHOy10eo-PDwWxYWsNQo9Tui_gEIDSvKTPwOOEUHHdSU5Xdf2Ue1SZCFHFcjFz/pub?gid=1029907686&single=true&output=csv")
## Rows: 28 Columns: 8
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (4): Marca temporal, Género, Lugar de Procedencia, En líneas generales ¿...
## dbl (4): Edad, Indica tu altura (cm), ¿En qué año comenzaste la carrera de I...
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
# Función para observar los nombres de las variables dentro de la base de datos
names(ALUMNOS_2025)
## [1] "Marca temporal"
## [2] "Edad"
## [3] "Género"
## [4] "Indica tu altura (cm)"
## [5] "Lugar de Procedencia"
## [6] "¿En qué año comenzaste la carrera de Ingeniería Agronómica?"
## [7] "En líneas generales ¿Qué nivel de dificultad ha presentado hasta ahora la carrera de Ingeniería Agronómica?"
## [8] "Indica la cantidad de asignaturas rendidas y aprobadas en el turno de febrero - marzo de 2025."
# Funcion para explorar la base de datos
glimpse(ALUMNOS_2025)
## Rows: 28
## Columns: 8
## $ `Marca temporal` <chr> …
## $ Edad <dbl> …
## $ Género <chr> …
## $ `Indica tu altura (cm)` <dbl> …
## $ `Lugar de Procedencia` <chr> …
## $ `¿En qué año comenzaste la carrera de Ingeniería Agronómica?` <dbl> …
## $ `En líneas generales ¿Qué nivel de dificultad ha presentado hasta ahora la carrera de Ingeniería Agronómica?` <chr> …
## $ `Indica la cantidad de asignaturas rendidas y aprobadas en el turno de febrero - marzo de 2025.` <dbl> …
ALUMNOS_2025_RENOMBRADA <- ALUMNOS_2025 %>%
rename (MARCA = "Marca temporal",
EDAD = "Edad",
GENERO = "Género",
ALTURA = "Indica tu altura (cm)",
PROCEDENCIA = "Lugar de Procedencia",
INGRESO_CARRERA = "¿En qué año comenzaste la carrera de Ingeniería Agronómica?",
NIVEL_DIF_IA = "En líneas generales ¿Qué nivel de dificultad ha presentado hasta ahora la carrera de Ingeniería Agronómica?",
ASIG_APROB = "Indica la cantidad de asignaturas rendidas y aprobadas en el turno de febrero - marzo de 2025." )
# Le pedimos al software que nos muestre los nuevos nombres de las variables
names(ALUMNOS_2025_RENOMBRADA)
## [1] "MARCA" "EDAD" "GENERO" "ALTURA"
## [5] "PROCEDENCIA" "INGRESO_CARRERA" "NIVEL_DIF_IA" "ASIG_APROB"
Ordenemos el trabajo para cada tipo de variable (nominal, ordinal, discreta y continua).
# Hay que mostrar progresivamente la incorporación de los argumentos de la función
freq(ALUMNOS_2025_RENOMBRADA$GENERO)
## Frecuencias
## ALUMNOS_2025_RENOMBRADA$GENERO
## Tipo: Alfahnumérico
##
## Frec. % Válido % Válido acu. % Total % Total acu.
## --------------- ------- ---------- --------------- --------- --------------
## Femenino 13 46.43 46.43 46.43 46.43
## Masculino 15 53.57 100.00 53.57 100.00
## <NA> 0 0.00 100.00
## Total 28 100.00 100.00 100.00 100.00
freq(ALUMNOS_2025_RENOMBRADA$GENERO, round.digits = 1, report.nas = FALSE, justify = "center", headings = FALSE)
##
## Frec. % % Acu.
## --------------- ------- ------- --------
## Femenino 13 46.4 46.4
## Masculino 15 53.6 100.0
## Total 28 100.0 100.0
freq(ALUMNOS_2025_RENOMBRADA$GENERO, round.digits = 1, report.nas = FALSE, justify = "center", headings = FALSE)
##
## Frec. % % Acu.
## --------------- ------- ------- --------
## Femenino 13 46.4 46.4
## Masculino 15 53.6 100.0
## Total 28 100.0 100.0
La frecuencia acumulada de una variable cualitativa nominal no tiene sentido, ya que no tiene sentido decir que el 100% de los encuestados son hombres y mujeres, no son variables que sigan una después de otra o que tengan orden.
freq(ALUMNOS_2025_RENOMBRADA$GENERO, round.digits = 1, report.nas = FALSE, justify = "center", headings = FALSE, cumul= FALSE )
##
## Frec. %
## --------------- ------- -------
## Femenino 13 46.4
## Masculino 15 53.6
## Total 28 100.0
ggplot(ALUMNOS_2025_RENOMBRADA, aes(x = "", y = GENERO, fill = GENERO)) +
geom_bar(stat = "identity", width = 1) +
coord_polar(theta = "y") +
theme_void() +
theme(plot.title = element_text(hjust = 0.5))
freq(ALUMNOS_2025_RENOMBRADA$NIVEL_DIF_IA, round.digits = 1, report.nas = FALSE, justify = "center", headings = FALSE)
##
## Frec. % % Acu.
## --------------------- ------- ------- --------
## 2. Poco difícil 6 21.4 21.4
## 3. Difícil 20 71.4 92.9
## 4. Muy difícil 2 7.1 100.0
## Total 28 100.0 100.0
ALUMNOS_2025_RENOMBRADA %>%
group_by(GENERO) %>%
freq(NIVEL_DIF_IA, report.nas = FALSE, headings = FALSE)
## Subgrupo: GENERO = Femenino
##
## Frec. % % Acu.
## --------------------- ------- -------- --------
## 2. Poco difícil 6 46.15 46.15
## 3. Difícil 5 38.46 84.62
## 4. Muy difícil 2 15.38 100.00
## Total 13 100.00 100.00
##
## Subgrupo: GENERO = Masculino
##
## Frec. % % Acu.
## ---------------- ------- -------- --------
## 3. Difícil 15 100.00 100.00
## Total 15 100.00 100.00
ggplot(ALUMNOS_2025_RENOMBRADA, aes(x = GENERO, fill = NIVEL_DIF_IA)) +
geom_bar(position = "stack") + # Usa "stack" para apilar las barras por niveles de dificultad
xlab("Género") + # Etiqueta del eje X
ylab("Cantidad de estudiantes") + # Etiqueta del eje Y
labs(fill = "Nivel de Dificultad") + # Título de la leyenda
scale_y_continuous(limits= c(0,15)) + # recorrido del eje y
theme(axis.title.x = element_text(size = 14, face = "bold"), # Tamaño y negrita ("bold") del título del eje X
axis.title.y = element_text(size = 14, face = "bold"), # Tamaño y negrita del título del eje Y
axis.text.x = element_text(size = 12, face = "bold"), # Tamaño y negrita de los valores del eje X
axis.text.y = element_text(size = 12, face = "bold"), # Tamaño y negrita de los valores del eje Y
legend.title = element_text(size = 10, face = "bold"), # Tamaño y negrita del título de la leyenda
legend.text = element_text(size = 8) # Tamaño del texto de la leyenda
)
freq(ALUMNOS_2025_RENOMBRADA$NIVEL_DIF_IA)
## Frecuencias
## ALUMNOS_2025_RENOMBRADA$NIVEL_DIF_IA
## Tipo: Alfahnumérico
##
## Frec. % Válido % Válido acu. % Total % Total acu.
## --------------------- ------- ---------- --------------- --------- --------------
## 2. Poco difícil 6 21.43 21.43 21.43 21.43
## 3. Difícil 20 71.43 92.86 71.43 92.86
## 4. Muy difícil 2 7.14 100.00 7.14 100.00
## <NA> 0 0.00 100.00
## Total 28 100.00 100.00 100.00 100.00
freq(ALUMNOS_2025_RENOMBRADA$NIVEL_DIF_IA, round.digits = 1, report.nas = FALSE, justify = "center", headings = FALSE)
##
## Frec. % % Acu.
## --------------------- ------- ------- --------
## 2. Poco difícil 6 21.4 21.4
## 3. Difícil 20 71.4 92.9
## 4. Muy difícil 2 7.1 100.0
## Total 28 100.0 100.0
freq(ALUMNOS_2025_RENOMBRADA$ASIG_APROB, round.digits = 1, report.nas = FALSE, justify = "center", headings = FALSE)
##
## Frec. % % Acu.
## ----------- ------- ------- --------
## 0 18 64.3 64.3
## 1 7 25.0 89.3
## 2 1 3.6 92.9
## 3 1 3.6 96.4
## 4 1 3.6 100.0
## Total 28 100.0 100.0
# Asignaturas aprobadas según Género
ALUMNOS_2025_RENOMBRADA %>%
group_by(GENERO) %>%
freq(ASIG_APROB, report.nas = FALSE, headings = FALSE)
## Subgrupo: GENERO = Femenino
##
## Frec. % % Acu.
## ----------- ------- -------- --------
## 0 8 61.54 61.54
## 1 3 23.08 84.62
## 2 1 7.69 92.31
## 3 1 7.69 100.00
## Total 13 100.00 100.00
##
## Subgrupo: GENERO = Masculino
##
## Frec. % % Acu.
## ----------- ------- -------- --------
## 0 10 66.67 66.67
## 1 4 26.67 93.33
## 4 1 6.67 100.00
## Total 15 100.00 100.00
# Gráfico de barras
ggplot(ALUMNOS_2025_RENOMBRADA, aes(ASIG_APROB)) +
geom_bar(color = "black", fill= "green") +
xlab("N° asignaturas aprobadas") + # Etiqueta del eje X
ylab("Cantidad de estudiantes") + # Etiqueta del eje Y
scale_y_continuous(limits= c(0,20)) + # recorrido del eje y
theme(axis.title.x = element_text(size = 14, face = "bold"), # Tamaño y negrita ("bold") del título del eje X
axis.title.y = element_text(size = 14, face = "bold"), # Tamaño y negrita del título del eje Y
axis.text.x = element_text(size = 12, face = "bold"), # Tamaño y negrita de los valores del eje X
axis.text.y = element_text(size = 12, face = "bold")) + # Tamaño y negrita de los valores del eje Y
coord_flip() + # Gira las barras a horizontal
theme_minimal()
# Gráfico de cajas según Género sin leyenda
ggplot(ALUMNOS_2025_RENOMBRADA, aes(x = GENERO, y = ASIG_APROB, fill = GENERO)) +
geom_boxplot() +
xlab("Género") + # Etiqueta del eje X
ylab("Número de asignaturas aprobadas") + # Etiqueta del eje Y
theme(
axis.title.x = element_text(size = 14, face = "bold"),
axis.title.y = element_text(size = 14, face = "bold"),
axis.text.x = element_text(size = 10, face = "bold"),
axis.text.y = element_text(size = 10, face = "bold"))
# Lo mostramos progresivamente
descr(ALUMNOS_2025_RENOMBRADA$ASIG_APROB)
## Estadísticas descriptivas
## ALUMNOS_2025_RENOMBRADA$ASIG_APROB
## N: 28
##
## ASIG_APROB
## ------------------ ------------
## Media 0.57
## Dev.std. 1.00
## Min 0.00
## Q1 0.00
## Mediana 0.00
## Q3 1.00
## Max 4.00
## DAP 0.00
## RI 1.00
## CV 1.75
## Asimetría 1.97
## ES-Asimetría 0.44
## Curtosis 3.47
## Num.Válido 28.00
## N 28.00
## Pct.Válido 100.00
descr(ALUMNOS_2025_RENOMBRADA$ASIG_APROB, round.digits = 1, headings = FALSE)
##
## ASIG_APROB
## ------------------ ------------
## Media 0.6
## Dev.std. 1.0
## Min 0.0
## Q1 0.0
## Mediana 0.0
## Q3 1.0
## Max 4.0
## DAP 0.0
## RI 1.0
## CV 1.7
## Asimetría 2.0
## ES-Asimetría 0.4
## Curtosis 3.5
## Num.Válido 28.0
## N 28.0
## Pct.Válido 100.0
# Ojo con esta variable ya que hay que construir los intervalos de confianza primero
freq(ALUMNOS_2025_RENOMBRADA$ALTURA)
## Frecuencias
## ALUMNOS_2025_RENOMBRADA$ALTURA
## Tipo: Numérico
##
## Frec. % Válido % Válido acu. % Total % Total acu.
## ----------- ------- ---------- --------------- --------- --------------
## 154 1 3.57 3.57 3.57 3.57
## 157 1 3.57 7.14 3.57 7.14
## 158 3 10.71 17.86 10.71 17.86
## 160 2 7.14 25.00 7.14 25.00
## 161 1 3.57 28.57 3.57 28.57
## 165 3 10.71 39.29 10.71 39.29
## 168 2 7.14 46.43 7.14 46.43
## 169 1 3.57 50.00 3.57 50.00
## 170 3 10.71 60.71 10.71 60.71
## 172 2 7.14 67.86 7.14 67.86
## 174 1 3.57 71.43 3.57 71.43
## 178 1 3.57 75.00 3.57 75.00
## 180 2 7.14 82.14 7.14 82.14
## 182 1 3.57 85.71 3.57 85.71
## 188 1 3.57 89.29 3.57 89.29
## 189 1 3.57 92.86 3.57 92.86
## 190 1 3.57 96.43 3.57 96.43
## 197 1 3.57 100.00 3.57 100.00
## <NA> 0 0.00 100.00
## Total 28 100.00 100.00 100.00 100.00
HISTOGRAMA <- hist(ALUMNOS_2025_RENOMBRADA$ALTURA) #Creamos el objeto llamado HISTOGRAMA
INTERVALOS <- HISTOGRAMA$breaks # Obtiene los límites de los intervalos utilizados en el histograma
ALTURA_CATEGORIZADA <- cut(ALUMNOS_2025_RENOMBRADA$ALTURA,INTERVALOS) #Devuelve un factor que indica a qué intervalo pertenece cada valor de "Altura".
freq(ALTURA_CATEGORIZADA,# cuenta las frecuencias de cada categoría en la variable y muestra la tabla de frecuencias resultante
report.nas = FALSE, # No muestra conteos de NA
headings = FALSE, # No muestra encabezados
justify = "center") #muestra el texto alineado al centro
##
## Frec. % % Acu.
## --------------- ------- -------- --------
## (150,160] 7 25.00 25.00
## (160,170] 10 35.71 60.71
## (170,180] 6 21.43 82.14
## (180,190] 4 14.29 96.43
## (190,200] 1 3.57 100.00
## Total 28 100.00 100.00
# Con 6 contenedores queda mejor la forma de la distribución
ggplot(ALUMNOS_2025_RENOMBRADA, aes(ALTURA)) +
geom_histogram(bins = 6, color = "gray", fill = "lightblue") +
theme_classic()
binwidth.ggplot(ALUMNOS_2025_RENOMBRADA, aes(ALTURA)) +
geom_freqpoly(binwidth = 10)
ggplot(ALUMNOS_2025_RENOMBRADA, aes(ALTURA)) +
geom_histogram() +
geom_histogram(binwidth = 7, color = "yellow") +
geom_freqpoly(binwidth = 7, color = "red", linewidth = 1.5)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
# Tabla de frecuencias de la altura según el género
ALUMNOS_2025_RENOMBRADA %>%
group_by(GENERO) %>%
descr(ALTURA, report.nas = FALSE, headings = FALSE)
##
## Femenino Masculino
## ------------------ ---------- -----------
## Media 162.15 178.00
## Dev.std. 5.71 9.70
## Min 154.00 165.00
## Q1 158.00 169.00
## Mediana 160.00 178.00
## Q3 165.00 188.00
## Max 172.00 197.00
## DAP 4.45 13.34
## RI 7.00 15.50
## CV 0.04 0.05
## Asimetría 0.43 0.39
## ES-Asimetría 0.62 0.58
## Curtosis -1.33 -1.21
## Num.Válido 13.00 15.00
## N 13.00 15.00
## Pct.Válido 100.00 100.00
# Polígono de frecuencias de la altura según el género
ggplot(ALUMNOS_2025_RENOMBRADA, aes(x = ALTURA, color = GENERO, fill = GENERO)) +
geom_freqpoly(bins = 8, size = 1) + # Ajustar a 6 bins y grosor de la línea
xlab("Altura (cm)") + # Etiqueta del eje X
ylab("N° de estudiantes") + # Etiqueta del eje Y
theme(
axis.title.x = element_text(size = 14, face = "bold"),
axis.title.y = element_text(size = 14, face = "bold"),
axis.text.x = element_text(size = 12, face = "bold"),
axis.text.y = element_text(size = 12, face = "bold")
) +
theme_minimal() # Tema minimalista
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
freq(ALUMNOS_2025_RENOMBRADA$PROCEDENCIA)
## Frecuencias
## ALUMNOS_2025_RENOMBRADA$PROCEDENCIA
## Tipo: Alfahnumérico
##
## Frec. % Válido % Válido acu. % Total % Total acu.
## -------------------- ------- ---------- --------------- --------- --------------
## Ambato 4 14.29 14.29 14.29 14.29
## Capayán 1 3.57 17.86 3.57 17.86
## Capital (SFVC) 2 7.14 25.00 7.14 25.00
## El Alto 1 3.57 28.57 3.57 28.57
## Fiambalá 1 3.57 32.14 3.57 32.14
## Pomán 2 7.14 39.29 7.14 39.29
## Santa Rosa 2 7.14 46.43 7.14 46.43
## Tucumán 8 28.57 75.00 28.57 75.00
## Valle Viejo 7 25.00 100.00 25.00 100.00
## <NA> 0 0.00 100.00
## Total 28 100.00 100.00 100.00 100.00
ggplot(ALUMNOS_2025_RENOMBRADA, aes(x = "", y = PROCEDENCIA, fill = PROCEDENCIA)) +
geom_bar(stat = "identity", width = 1) +
coord_polar(theta = "y") +
theme_void() +
theme(plot.title = element_text(hjust = 0.5))
descr(ALUMNOS_2025_RENOMBRADA$EDAD, round.digits = 1, headings = FALSE)
##
## EDAD
## ------------------ -------
## Media 22.6
## Dev.std. 4.6
## Min 18.0
## Q1 20.0
## Mediana 21.0
## Q3 24.0
## Max 39.0
## DAP 3.0
## RI 3.5
## CV 0.2
## Asimetría 1.9
## ES-Asimetría 0.4
## Curtosis 3.9
## Num.Válido 28.0
## N 28.0
## Pct.Válido 100.0
freq(ALUMNOS_2025_RENOMBRADA$EDAD)
## Frecuencias
## ALUMNOS_2025_RENOMBRADA$EDAD
## Tipo: Numérico
##
## Frec. % Válido % Válido acu. % Total % Total acu.
## ----------- ------- ---------- --------------- --------- --------------
## 18 2 7.14 7.14 7.14 7.14
## 19 4 14.29 21.43 14.29 21.43
## 20 4 14.29 35.71 14.29 35.71
## 21 5 17.86 53.57 17.86 53.57
## 22 4 14.29 67.86 14.29 67.86
## 23 2 7.14 75.00 7.14 75.00
## 25 1 3.57 78.57 3.57 78.57
## 26 2 7.14 85.71 7.14 85.71
## 27 2 7.14 92.86 7.14 92.86
## 32 1 3.57 96.43 3.57 96.43
## 39 1 3.57 100.00 3.57 100.00
## <NA> 0 0.00 100.00
## Total 28 100.00 100.00 100.00 100.00
ggplot(ALUMNOS_2025_RENOMBRADA, aes(x = EDAD, y = GENERO, fill = GENERO)) +
geom_boxplot()
#fecha de ingreso
freq(ALUMNOS_2025_RENOMBRADA$INGRESO_CARRERA)
## Frecuencias
## ALUMNOS_2025_RENOMBRADA$INGRESO_CARRERA
## Tipo: Numérico
##
## Frec. % Válido % Válido acu. % Total % Total acu.
## ----------- ------- ---------- --------------- --------- --------------
## 2010 1 3.57 3.57 3.57 3.57
## 2011 1 3.57 7.14 3.57 7.14
## 2016 2 7.14 14.29 7.14 14.29
## 2018 2 7.14 21.43 7.14 21.43
## 2019 1 3.57 25.00 3.57 25.00
## 2021 2 7.14 32.14 7.14 32.14
## 2022 5 17.86 50.00 17.86 50.00
## 2023 5 17.86 67.86 17.86 67.86
## 2024 8 28.57 96.43 28.57 96.43
## 2025 1 3.57 100.00 3.57 100.00
## <NA> 0 0.00 100.00
## Total 28 100.00 100.00 100.00 100.00
ggplot(ALUMNOS_2025_RENOMBRADA, aes(x = INGRESO_CARRERA, y = GENERO, fill = GENERO)) +
geom_boxplot()
Según la encuesta realizada a los alumnos que cursan Estadística y Biometría en el año 2025 se puede concluír que:
El 53,6 % de los encuestados se identifican con el género masculino, mientras que el 46,4 % se identifican con el género femenino.
Respecto a las participantes del genero femenino, el 61,54% no aprobó ninguna asignatura en el llamado de examenes finales correspondiente a Febrero - Marzo del corriente año, y solo un encuestado aprobó tres asignaturas; al mismo tiempo, refiriéndonos a los participantes del género masculino, solo un encuestado aprobó cuatro asignaturas, mientras que el 66,67% no aprobó ninguna.
Referido al nivel de dificultad, los participantes del género masculino indicaron en su totalidad que la carrera es dificil, mientras que en el caso de las mujeres, las respuestas se vieron distribuídas entre “muy dificil”( 15,38 %) y “dificil”(38,46 %), aunque la mayor parte seleccionó la opción “poco difícil (46,15 %)”.
La altura de los participantes demostró que el 35,71% se encuentra entre 160 y 170 centímetros de altura. Además, se observa que, en el caso de los masculinos, la altura se encuentra distribuída de forma más uniforme (una gráfica achatada y con menos picos), mientras que en el género femenino la altura se encuentra en torno a los 160cm.
Según el lugar de procedencia, se puede afirmar que el 28,57% de los participantes provinen de la provincia de Tucumán, seguido por el 25% proveniente de la localidad de Valle Viejo y el 14,69% de Ambato. Es importante destacar que el 72.03% de los encuestados son originarios de la provincia de Catamarca, y de estos, el 64,89% provenientes del interior de dicha provincia.
La edad de los estudiantes tiene como media los 22 años, sin embargo hay que tener en cuenta la debilidad de la media a los datos atípicos. Se observa una edad mínima de 18 y una edad máxima de 39 años. Sin embargo, el 60,73% se encuentra entre los 19 y 22 años.Si se observa la gráfica de cajas y patillas respecto a la edad, se puede determinar que tanto en el género masculino y femenino, se encuentran dos datos atípicos que corresponden a los 39 y los 32 años respectivamente.
Notese que existe un error en el cuestionatio realizado por uno de los encuestantes masculinos que postuló que ingresó en el año 2025, lo cual produce errores en los análisis realizados. Esto podría ser cierto en el caso de que no hubiera tenido la necesidad de cursar Matemática 1 y Matemática 2.