El proceso de elección de carrera por parte de los estudiantes puede estar influenciado por diversos factores, y uno de los elementos significativos que suele tener un impacto importante es el estrato socioeconómico. En el contexto de la ciudad de Neiva, la elección entre carreras como Economía y Medicina podría estar vinculada a las condiciones económicas y sociales de los estudiantes. El estrato socioeconómico no solo determina el acceso a recursos y oportunidades educativas, sino que también puede afectar las aspiraciones profesionales de los individuos. En este caso, es plausible que estudiantes de diferentes estratos tengan perspectivas y prioridades distintas al momento de elegir entre carreras como Economía y Medicina. En entornos urbanos como Neiva, donde se pueden observar disparidades económicas y sociales, el análisis de las preferencias de carrera en relación con el estrato socioeconómico puede arrojar luz sobre patrones y tendencias que contribuyan a comprender mejor la dinámica educativa y laboral de la comunidad.
Se evidencia la existencia de diferencias significativas en el estrato socioeconómico entre los estudiantes de los programas de medicina y economía de la Universidad Surcolombiana. Estas disparidades socioeconómicas pueden influir en el acceso, la permanencia y el desempeño académico de los estudiantes, lo que plantea desafíos en términos de equidad y oportunidades educativas.
¿Existen diferencias significativas en el estrato socioeconómico entre los estudiantes del programa de medicina y economía de la universidad Surcolombiana?
H_0 = El estrato socio-economico promedio de los estudiantes de economia es igual al estrato socio-economico promedio de los estudiantes de medicina.
H_a = El estrato socio-economico promedio de los estudiantes de economia es diferente al estrato socio-economico promedio de los estudiantes de medicina.
Para llevar acabo esta inferencia, primero se tomaran dos programas de la bases de datos de la Universidad Surcolombiana, medicina y economia. Seguidamente se procede a determina el tamaño de las muestras para cada una de las poblaciones. Teniendo el tamaño de las muestras, se realizara una seleccion aleatoria en las bases de datos.
Ya con las muestras seleccionadas, se procede a realizar los test de normalidad. Teniendo encuenta el resultado del test, se les aplicara la prueba de hipotesis y dependiendo si los datos tienen una distribucion normal o no, se realizara una prueba parametrica o no parametrica. En base a los resultados arrojados por la prueba de hipotesis aplicada se procede a analizar los resultados y determinar si se rechaza o no la hipotesis nula (H_0). Por ultimo se haran las conclusiones pertinentes respecto al informe realizado.
Base de tados carrera Medicina
library(tidyr)
#Carga el archivo CSV en un marco de datos
env <- read.csv("BaseEstratoMed.csv", header = TRUE, na.strings = -999.)
#Divide la columna "Programa.Medicina.Estrato.Medicina" en dos columnas
env <- separate(env, col = Programa.Medicina.Estrato.Medicina,
into = c("Programa Medicina", "Estrato Medicina"),
sep = ";")
#Elimina la columna intermedia generada durante la separación
env <- env[, -3]
#Extrae el número del estrato y colócalo en la columna "Estrato Medicina"
env$Estrato.Medicina <- as.numeric(gsub(".;(\\d+).", "\\1", env$"Estrato Medicina"))
env <- env[, c("Programa Medicina", "Estrato Medicina")]
# Muestra las primeras filas del marco de datos
head(env)
## Programa Medicina Estrato Medicina
## 1 NEIVA - MEDICINA 2
## 2 NEIVA - MEDICINA 2
## 3 NEIVA - MEDICINA 2
## 4 NEIVA - MEDICINA 2
## 5 NEIVA - MEDICINA 3
## 6 NEIVA - MEDICINA 2
Base de datos carrera Economia
library(tidyr)
#Carga el archivo CSV en un marco de datos
env2 <- read.csv("BaseEstratoEco.csv", header = TRUE, na.strings = -999.)
#Divide la columna "Programa.Economia.Estrato.Economia" en dos columnas
env2 <- separate(env2, col = Programa.Economia.Estrato.Economia,
into = c("Programa Economia", "Estrato Economia"),
sep = ";")
#Elimina la columna intermedia generada durante la separación
env2 <- env2[, -3]
#Extrae el número del estrato y colócalo en la columna "Estrato Economia"
env2$Estrato.Economia <- as.numeric(gsub(".;(\\d+).", "\\1", env2$"Estrato Economia"))
env2 <- env2[, c("Programa Economia", "Estrato Economia")]
# Muestra las primeras filas del marco de datos
head(env2)
## Programa Economia Estrato Economia
## 1 NEIVA - ECONOMIA 3
## 2 NEIVA - ECONOMIA 1
## 3 NEIVA - ECONOMIA 2
## 4 NEIVA - ECONOMIA 2
## 5 NEIVA - ECONOMIA 2
## 6 NEIVA - ECONOMIA 2
Teniendo un problacion de 737 estudiantes de Medicina y de 328 de Economia se procede a calcular cuanto es el tamaño de muestra representativa para cada una de las carreras aplicando, la siguiente formula:
\[n=\frac{ N * Z^2 * p * (1-p)}{e^2 * (N-1)) + Z^2 * p * (1-p)}\]
– Determinacion del tamaño de la muestra para medicina.
# Muestra poblacional de MEDICINA
N_m<-737 # Tamaño de la poblacion
Z<-1.96 # Nivel de confianza (95%)
p<-0.5 # Probabilidad de que el evento ocurra
e<-0.05 # Error de estimacion aceptado
n_m<-(N_m * Z^2 * p * (1-p))/((e^2 * (N_m-1)) + (Z^2 * p * (1-p)))
n_m<-ceiling(n_m)
print(n_m)
## [1] 253
cat("Para una población de", N_m, "estudiantes de medicina se necesita una muestra de ", n_m,"estudiantes, con un nivel de confianza del 95%,","y un error de estimación del", e)
## Para una población de 737 estudiantes de medicina se necesita una muestra de 253 estudiantes, con un nivel de confianza del 95%, y un error de estimación del 0.05
– Determinacion del tamaño de la muestra para economia.
# Muestra poblacional de ECONOMIA
N_e<-328 # Tamaño de la poblacion
Z<-1.96 # Nivel de confianza (95%)
p<-0.5 # Probabilidad de que el evento ocurra
e<-0.05 # Error de estimacion aceptado
n_e<-(N_e * Z^2 * p * (1-p))/((e^2 * (N_e-1)) + (Z^2 * p * (1-p)))
n_e<-ceiling(n_e)
print(n_e)
## [1] 178
cat("Para una población de", N_e, "estudiantes de economia se necesita una muestra de ", n_e,"estudiantes, con un nivel de confianza del 95%,","y un error de estimación del",e)
## Para una población de 328 estudiantes de economia se necesita una muestra de 178 estudiantes, con un nivel de confianza del 95%, y un error de estimación del 0.05
– Seleccion de la muestra
Teniendo las muestras de cada una de las poblaciones se procede a realizar la seleccion aleatoria de ellas:
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
#Establece la semilla para reproducibilidad
set.seed(n_m)
#Carga el archivo CSV en un marco de datos
env <- read.csv("BaseEstratoMed.csv", header = TRUE, na.strings = -999.)
#Divide la columna "Programa.Medicina.Estrato.Medicina" en dos columnas
env <- tidyr::separate(env, col = Programa.Medicina.Estrato.Medicina,
into = c("Programa Medicina", "Estrato Medicina"),
sep = ";")
#Elimina la columna intermedia generada durante la separación
env <- env[, -3]
#Extrae el número del estrato y colócalo en la columna "Estrato Medicina"
env$Estrato.Medicina <- as.numeric(gsub(".;(\\d+).", "\\1", env$"Estrato Medicina"))
env <- env[, c("Programa Medicina", "Estrato Medicina")]
#Toma una muestra aleatoria de 5 filas
muestra_aleatoria <- sample_n(env, n_m)
#Muestra la tabla con la muestra aleatoria
print(muestra_aleatoria)
## Programa Medicina Estrato Medicina
## 1 NEIVA - MEDICINA 2
## 2 NEIVA - MEDICINA 3
## 3 NEIVA - MEDICINA 1
## 4 NEIVA - MEDICINA 1
## 5 NEIVA - MEDICINA 1
## 6 NEIVA - MEDICINA 2
## 7 NEIVA - MEDICINA 1
## 8 NEIVA - MEDICINA 3
## 9 NEIVA - MEDICINA 1
## 10 NEIVA - MEDICINA 2
## 11 NEIVA - MEDICINA 1
## 12 NEIVA - MEDICINA 2
## 13 NEIVA - MEDICINA 2
## 14 NEIVA - MEDICINA 1
## 15 NEIVA - MEDICINA 1
## 16 NEIVA - MEDICINA 1
## 17 NEIVA - MEDICINA 1
## 18 NEIVA - MEDICINA 2
## 19 NEIVA - MEDICINA 1
## 20 NEIVA - MEDICINA 1
## 21 NEIVA - MEDICINA 2
## 22 NEIVA - MEDICINA 2
## 23 NEIVA - MEDICINA 2
## 24 NEIVA - MEDICINA 1
## 25 NEIVA - MEDICINA 3
## 26 NEIVA - MEDICINA 1
## 27 NEIVA - MEDICINA 3
## 28 NEIVA - MEDICINA 2
## 29 NEIVA - MEDICINA 2
## 30 NEIVA - MEDICINA 4
## 31 NEIVA - MEDICINA 3
## 32 NEIVA - MEDICINA 1
## 33 NEIVA - MEDICINA 3
## 34 NEIVA - MEDICINA 1
## 35 NEIVA - MEDICINA 2
## 36 NEIVA - MEDICINA 1
## 37 NEIVA - MEDICINA 3
## 38 NEIVA - MEDICINA 1
## 39 NEIVA - MEDICINA 4
## 40 NEIVA - MEDICINA 1
## 41 NEIVA - MEDICINA 1
## 42 NEIVA - MEDICINA 2
## 43 NEIVA - MEDICINA 2
## 44 NEIVA - MEDICINA 2
## 45 NEIVA - MEDICINA 1
## 46 NEIVA - MEDICINA 1
## 47 NEIVA - MEDICINA 1
## 48 NEIVA - MEDICINA 1
## 49 NEIVA - MEDICINA 1
## 50 NEIVA - MEDICINA 1
## 51 NEIVA - MEDICINA 2
## 52 NEIVA - MEDICINA 3
## 53 NEIVA - MEDICINA 2
## 54 NEIVA - MEDICINA 2
## 55 NEIVA - MEDICINA 1
## 56 NEIVA - MEDICINA 1
## 57 NEIVA - MEDICINA 2
## 58 NEIVA - MEDICINA 2
## 59 NEIVA - MEDICINA 2
## 60 NEIVA - MEDICINA 1
## 61 NEIVA - MEDICINA 3
## 62 NEIVA - MEDICINA 2
## 63 NEIVA - MEDICINA 1
## 64 NEIVA - MEDICINA 1
## 65 NEIVA - MEDICINA 1
## 66 NEIVA - MEDICINA 1
## 67 NEIVA - MEDICINA 2
## 68 NEIVA - MEDICINA 2
## 69 NEIVA - MEDICINA 1
## 70 NEIVA - MEDICINA 3
## 71 NEIVA - MEDICINA 2
## 72 NEIVA - MEDICINA 1
## 73 NEIVA - MEDICINA 2
## 74 NEIVA - MEDICINA 2
## 75 NEIVA - MEDICINA 2
## 76 NEIVA - MEDICINA 1
## 77 NEIVA - MEDICINA 1
## 78 NEIVA - MEDICINA 1
## 79 NEIVA - MEDICINA 1
## 80 NEIVA - MEDICINA 1
## 81 NEIVA - MEDICINA 2
## 82 NEIVA - MEDICINA 2
## 83 NEIVA - MEDICINA 3
## 84 NEIVA - MEDICINA 2
## 85 NEIVA - MEDICINA 3
## 86 NEIVA - MEDICINA 2
## 87 NEIVA - MEDICINA 2
## 88 NEIVA - MEDICINA 1
## 89 NEIVA - MEDICINA 1
## 90 NEIVA - MEDICINA 2
## 91 NEIVA - MEDICINA 1
## 92 NEIVA - MEDICINA 2
## 93 NEIVA - MEDICINA 1
## 94 NEIVA - MEDICINA 2
## 95 NEIVA - MEDICINA 4
## 96 NEIVA - MEDICINA 1
## 97 NEIVA - MEDICINA 3
## 98 NEIVA - MEDICINA 1
## 99 NEIVA - MEDICINA 3
## 100 NEIVA - MEDICINA 2
## 101 NEIVA - MEDICINA 1
## 102 NEIVA - MEDICINA 2
## 103 NEIVA - MEDICINA 2
## 104 NEIVA - MEDICINA 2
## 105 NEIVA - MEDICINA 3
## 106 NEIVA - MEDICINA 2
## 107 NEIVA - MEDICINA 1
## 108 NEIVA - MEDICINA 1
## 109 NEIVA - MEDICINA 1
## 110 NEIVA - MEDICINA 2
## 111 NEIVA - MEDICINA 1
## 112 NEIVA - MEDICINA 1
## 113 NEIVA - MEDICINA 2
## 114 NEIVA - MEDICINA 4
## 115 NEIVA - MEDICINA 1
## 116 NEIVA - MEDICINA 1
## 117 NEIVA - MEDICINA 2
## 118 NEIVA - MEDICINA 2
## 119 NEIVA - MEDICINA 2
## 120 NEIVA - MEDICINA 1
## 121 NEIVA - MEDICINA 3
## 122 NEIVA - MEDICINA 1
## 123 NEIVA - MEDICINA 2
## 124 NEIVA - MEDICINA 1
## 125 NEIVA - MEDICINA 3
## 126 NEIVA - MEDICINA 3
## 127 NEIVA - MEDICINA 1
## 128 NEIVA - MEDICINA 1
## 129 NEIVA - MEDICINA 1
## 130 NEIVA - MEDICINA 2
## 131 NEIVA - MEDICINA 3
## 132 NEIVA - MEDICINA 2
## 133 NEIVA - MEDICINA 1
## 134 NEIVA - MEDICINA 1
## 135 NEIVA - MEDICINA 2
## 136 NEIVA - MEDICINA 2
## 137 NEIVA - MEDICINA 2
## 138 NEIVA - MEDICINA 2
## 139 NEIVA - MEDICINA 2
## 140 NEIVA - MEDICINA 1
## 141 NEIVA - MEDICINA 2
## 142 NEIVA - MEDICINA 2
## 143 NEIVA - MEDICINA 3
## 144 NEIVA - MEDICINA 1
## 145 NEIVA - MEDICINA 2
## 146 NEIVA - MEDICINA 3
## 147 NEIVA - MEDICINA 4
## 148 NEIVA - MEDICINA 3
## 149 NEIVA - MEDICINA 3
## 150 NEIVA - MEDICINA 2
## 151 NEIVA - MEDICINA 3
## 152 NEIVA - MEDICINA 2
## 153 NEIVA - MEDICINA 1
## 154 NEIVA - MEDICINA 2
## 155 NEIVA - MEDICINA 1
## 156 NEIVA - MEDICINA 3
## 157 NEIVA - MEDICINA 3
## 158 NEIVA - MEDICINA 1
## 159 NEIVA - MEDICINA 1
## 160 NEIVA - MEDICINA 2
## 161 NEIVA - MEDICINA 1
## 162 NEIVA - MEDICINA 2
## 163 NEIVA - MEDICINA 1
## 164 NEIVA - MEDICINA 2
## 165 NEIVA - MEDICINA 2
## 166 NEIVA - MEDICINA 1
## 167 NEIVA - MEDICINA 2
## 168 NEIVA - MEDICINA 3
## 169 NEIVA - MEDICINA 2
## 170 NEIVA - MEDICINA 2
## 171 NEIVA - MEDICINA 2
## 172 NEIVA - MEDICINA 2
## 173 NEIVA - MEDICINA 2
## 174 NEIVA - MEDICINA 2
## 175 NEIVA - MEDICINA 1
## 176 NEIVA - MEDICINA 1
## 177 NEIVA - MEDICINA 2
## 178 NEIVA - MEDICINA 1
## 179 NEIVA - MEDICINA 2
## 180 NEIVA - MEDICINA 1
## 181 NEIVA - MEDICINA 3
## 182 NEIVA - MEDICINA 2
## 183 NEIVA - MEDICINA 1
## 184 NEIVA - MEDICINA 3
## 185 NEIVA - MEDICINA 4
## 186 NEIVA - MEDICINA 2
## 187 NEIVA - MEDICINA 1
## 188 NEIVA - MEDICINA 4
## 189 NEIVA - MEDICINA 1
## 190 NEIVA - MEDICINA 3
## 191 NEIVA - MEDICINA 2
## 192 NEIVA - MEDICINA 1
## 193 NEIVA - MEDICINA 2
## 194 NEIVA - MEDICINA 1
## 195 NEIVA - MEDICINA 1
## 196 NEIVA - MEDICINA 1
## 197 NEIVA - MEDICINA 2
## 198 NEIVA - MEDICINA 3
## 199 NEIVA - MEDICINA 1
## 200 NEIVA - MEDICINA 2
## 201 NEIVA - MEDICINA 2
## 202 NEIVA - MEDICINA 3
## 203 NEIVA - MEDICINA 2
## 204 NEIVA - MEDICINA 3
## 205 NEIVA - MEDICINA 3
## 206 NEIVA - MEDICINA 1
## 207 NEIVA - MEDICINA 1
## 208 NEIVA - MEDICINA 2
## 209 NEIVA - MEDICINA 1
## 210 NEIVA - MEDICINA 2
## 211 NEIVA - MEDICINA 2
## 212 NEIVA - MEDICINA 2
## 213 NEIVA - MEDICINA 2
## 214 NEIVA - MEDICINA 2
## 215 NEIVA - MEDICINA 2
## 216 NEIVA - MEDICINA 3
## 217 NEIVA - MEDICINA 2
## 218 NEIVA - MEDICINA 2
## 219 NEIVA - MEDICINA 2
## 220 NEIVA - MEDICINA 2
## 221 NEIVA - MEDICINA 2
## 222 NEIVA - MEDICINA 2
## 223 NEIVA - MEDICINA 2
## 224 NEIVA - MEDICINA 2
## 225 NEIVA - MEDICINA 3
## 226 NEIVA - MEDICINA 1
## 227 NEIVA - MEDICINA 1
## 228 NEIVA - MEDICINA 1
## 229 NEIVA - MEDICINA 2
## 230 NEIVA - MEDICINA 2
## 231 NEIVA - MEDICINA 1
## 232 NEIVA - MEDICINA 1
## 233 NEIVA - MEDICINA 3
## 234 NEIVA - MEDICINA 2
## 235 NEIVA - MEDICINA 2
## 236 NEIVA - MEDICINA 2
## 237 NEIVA - MEDICINA 2
## 238 NEIVA - MEDICINA 1
## 239 NEIVA - MEDICINA 3
## 240 NEIVA - MEDICINA 2
## 241 NEIVA - MEDICINA 1
## 242 NEIVA - MEDICINA 3
## 243 NEIVA - MEDICINA 3
## 244 NEIVA - MEDICINA 2
## 245 NEIVA - MEDICINA 2
## 246 NEIVA - MEDICINA 1
## 247 NEIVA - MEDICINA 1
## 248 NEIVA - MEDICINA 2
## 249 NEIVA - MEDICINA 2
## 250 NEIVA - MEDICINA 2
## 251 NEIVA - MEDICINA 2
## 252 NEIVA - MEDICINA 3
## 253 NEIVA - MEDICINA 2
library(dplyr)
#Establece la semilla para reproducibilidad
set.seed(n_e)
#Carga el archivo CSV en un marco de datos
env2 <- read.csv("BaseEstratoEco.csv", header = TRUE, na.strings = -999.)
#Divide la columna "Programa.Economia.Estrato.Economia" en dos columnas
env2 <- tidyr::separate(env2, col = Programa.Economia.Estrato.Economia,
into = c("Programa Economia", "Estrato Economia"), sep = ";")
#Elimina la columna intermedia generada durante la separación
env2 <- env2[, -3]
#Extrae el número del estrato y colócalo en la columna "Estrato Economia"
env2$Estrato.Economia <- as.numeric(gsub(".;(\\d+).", "\\1", env2$"Estrato Economia"))
env2 <- env2[, c("Programa Economia", "Estrato Economia")]
#Toma una muestra aleatoria de 5 filas
muestra_aleatoria2 <- sample_n(env2, n_e)
#Muestra la tabla con la muestra aleatoria
print(muestra_aleatoria2)
## Programa Economia Estrato Economia
## 1 NEIVA - ECONOMIA 2
## 2 NEIVA - ECONOMIA 3
## 3 NEIVA - ECONOMIA 1
## 4 NEIVA - ECONOMIA 1
## 5 NEIVA - ECONOMIA 2
## 6 NEIVA - ECONOMIA 3
## 7 NEIVA - ECONOMIA 2
## 8 NEIVA - ECONOMIA 1
## 9 NEIVA - ECONOMIA 2
## 10 NEIVA - ECONOMIA 1
## 11 NEIVA - ECONOMIA 2
## 12 NEIVA - ECONOMIA 1
## 13 NEIVA - ECONOMIA 1
## 14 NEIVA - ECONOMIA 2
## 15 NEIVA - ECONOMIA 2
## 16 NEIVA - ECONOMIA 2
## 17 NEIVA - ECONOMIA 1
## 18 NEIVA - ECONOMIA 2
## 19 NEIVA - ECONOMIA 2
## 20 NEIVA - ECONOMIA 3
## 21 NEIVA - ECONOMIA 2
## 22 NEIVA - ECONOMIA 2
## 23 NEIVA - ECONOMIA 2
## 24 NEIVA - ECONOMIA 2
## 25 NEIVA - ECONOMIA 1
## 26 NEIVA - ECONOMIA 1
## 27 NEIVA - ECONOMIA 2
## 28 NEIVA - ECONOMIA 2
## 29 NEIVA - ECONOMIA 2
## 30 NEIVA - ECONOMIA 2
## 31 NEIVA - ECONOMIA 2
## 32 NEIVA - ECONOMIA 2
## 33 NEIVA - ECONOMIA 1
## 34 NEIVA - ECONOMIA 2
## 35 NEIVA - ECONOMIA 2
## 36 NEIVA - ECONOMIA 2
## 37 NEIVA - ECONOMIA 2
## 38 NEIVA - ECONOMIA 2
## 39 NEIVA - ECONOMIA 2
## 40 NEIVA - ECONOMIA 1
## 41 NEIVA - ECONOMIA 3
## 42 NEIVA - ECONOMIA 2
## 43 NEIVA - ECONOMIA 2
## 44 NEIVA - ECONOMIA 2
## 45 NEIVA - ECONOMIA 2
## 46 NEIVA - ECONOMIA 2
## 47 NEIVA - ECONOMIA 4
## 48 NEIVA - ECONOMIA 2
## 49 NEIVA - ECONOMIA 2
## 50 NEIVA - ECONOMIA 2
## 51 NEIVA - ECONOMIA 1
## 52 NEIVA - ECONOMIA 2
## 53 NEIVA - ECONOMIA 2
## 54 NEIVA - ECONOMIA 3
## 55 NEIVA - ECONOMIA 2
## 56 NEIVA - ECONOMIA 1
## 57 NEIVA - ECONOMIA 2
## 58 NEIVA - ECONOMIA 1
## 59 NEIVA - ECONOMIA 1
## 60 NEIVA - ECONOMIA 2
## 61 NEIVA - ECONOMIA 2
## 62 NEIVA - ECONOMIA 1
## 63 NEIVA - ECONOMIA 1
## 64 NEIVA - ECONOMIA 2
## 65 NEIVA - ECONOMIA 2
## 66 NEIVA - ECONOMIA 1
## 67 NEIVA - ECONOMIA 2
## 68 NEIVA - ECONOMIA 2
## 69 NEIVA - ECONOMIA 2
## 70 NEIVA - ECONOMIA 1
## 71 NEIVA - ECONOMIA 1
## 72 NEIVA - ECONOMIA 2
## 73 NEIVA - ECONOMIA 2
## 74 NEIVA - ECONOMIA 1
## 75 NEIVA - ECONOMIA 1
## 76 NEIVA - ECONOMIA 1
## 77 NEIVA - ECONOMIA 1
## 78 NEIVA - ECONOMIA 2
## 79 NEIVA - ECONOMIA 1
## 80 NEIVA - ECONOMIA 2
## 81 NEIVA - ECONOMIA 1
## 82 NEIVA - ECONOMIA 2
## 83 NEIVA - ECONOMIA 1
## 84 NEIVA - ECONOMIA 2
## 85 NEIVA - ECONOMIA 2
## 86 NEIVA - ECONOMIA 1
## 87 NEIVA - ECONOMIA 2
## 88 NEIVA - ECONOMIA 1
## 89 NEIVA - ECONOMIA 2
## 90 NEIVA - ECONOMIA 2
## 91 NEIVA - ECONOMIA 1
## 92 NEIVA - ECONOMIA 1
## 93 NEIVA - ECONOMIA 2
## 94 NEIVA - ECONOMIA 2
## 95 NEIVA - ECONOMIA 1
## 96 NEIVA - ECONOMIA 1
## 97 NEIVA - ECONOMIA 2
## 98 NEIVA - ECONOMIA 4
## 99 NEIVA - ECONOMIA 1
## 100 NEIVA - ECONOMIA 3
## 101 NEIVA - ECONOMIA 2
## 102 NEIVA - ECONOMIA 1
## 103 NEIVA - ECONOMIA 2
## 104 NEIVA - ECONOMIA 1
## 105 NEIVA - ECONOMIA 2
## 106 NEIVA - ECONOMIA 1
## 107 NEIVA - ECONOMIA 1
## 108 NEIVA - ECONOMIA 2
## 109 NEIVA - ECONOMIA 3
## 110 NEIVA - ECONOMIA 2
## 111 NEIVA - ECONOMIA 2
## 112 NEIVA - ECONOMIA 2
## 113 NEIVA - ECONOMIA 3
## 114 NEIVA - ECONOMIA 3
## 115 NEIVA - ECONOMIA 1
## 116 NEIVA - ECONOMIA 1
## 117 NEIVA - ECONOMIA 2
## 118 NEIVA - ECONOMIA 2
## 119 NEIVA - ECONOMIA 2
## 120 NEIVA - ECONOMIA 2
## 121 NEIVA - ECONOMIA 1
## 122 NEIVA - ECONOMIA 1
## 123 NEIVA - ECONOMIA 1
## 124 NEIVA - ECONOMIA 2
## 125 NEIVA - ECONOMIA 1
## 126 NEIVA - ECONOMIA 2
## 127 NEIVA - ECONOMIA 2
## 128 NEIVA - ECONOMIA 1
## 129 NEIVA - ECONOMIA 2
## 130 NEIVA - ECONOMIA 2
## 131 NEIVA - ECONOMIA 2
## 132 NEIVA - ECONOMIA 1
## 133 NEIVA - ECONOMIA 2
## 134 NEIVA - ECONOMIA 2
## 135 NEIVA - ECONOMIA 1
## 136 NEIVA - ECONOMIA 2
## 137 NEIVA - ECONOMIA 2
## 138 NEIVA - ECONOMIA 2
## 139 NEIVA - ECONOMIA 3
## 140 NEIVA - ECONOMIA 2
## 141 NEIVA - ECONOMIA 2
## 142 NEIVA - ECONOMIA 2
## 143 NEIVA - ECONOMIA 2
## 144 NEIVA - ECONOMIA 1
## 145 NEIVA - ECONOMIA 2
## 146 NEIVA - ECONOMIA 2
## 147 NEIVA - ECONOMIA 2
## 148 NEIVA - ECONOMIA 1
## 149 NEIVA - ECONOMIA 3
## 150 NEIVA - ECONOMIA 2
## 151 NEIVA - ECONOMIA 2
## 152 NEIVA - ECONOMIA 1
## 153 NEIVA - ECONOMIA 2
## 154 NEIVA - ECONOMIA 1
## 155 NEIVA - ECONOMIA 1
## 156 NEIVA - ECONOMIA 4
## 157 NEIVA - ECONOMIA 2
## 158 NEIVA - ECONOMIA 2
## 159 NEIVA - ECONOMIA 2
## 160 NEIVA - ECONOMIA 1
## 161 NEIVA - ECONOMIA 2
## 162 NEIVA - ECONOMIA 1
## 163 NEIVA - ECONOMIA 2
## 164 NEIVA - ECONOMIA 2
## 165 NEIVA - ECONOMIA 1
## 166 NEIVA - ECONOMIA 2
## 167 NEIVA - ECONOMIA 2
## 168 NEIVA - ECONOMIA 1
## 169 NEIVA - ECONOMIA 2
## 170 NEIVA - ECONOMIA 2
## 171 NEIVA - ECONOMIA 2
## 172 NEIVA - ECONOMIA 2
## 173 NEIVA - ECONOMIA 2
## 174 NEIVA - ECONOMIA 1
## 175 NEIVA - ECONOMIA 1
## 176 NEIVA - ECONOMIA 2
## 177 NEIVA - ECONOMIA 2
## 178 NEIVA - ECONOMIA 2
– Test de distribucion normal
Obteniendo las muestras aleatorias de las dos poblaciones se procede hacer un test de normalidad:
# Grafica de distribucion normal muestra aleatoria Medicina
Estrato_Medicina <- rnorm(253, mean = 2, sd = 1)
qqnorm(Estrato_Medicina, ylab="Estratos",
xlab="")
qqline(Estrato_Medicina, col = 2)
– Distribucion de frecuencias Medicina
# Contar la frecuencia de cada estrato en la muestra aleatoria
frecuencia_estratos <- table(muestra_aleatoria$`Estrato Medicina`)
# Crear un data frame con los resultados
tabla_resultados <- data.frame(Estratos = names(frecuencia_estratos), Frecuencia = as.vector(frecuencia_estratos))
# Imprimir la tabla de resultados
print(tabla_resultados)
## Estratos Frecuencia
## 1 1 95
## 2 2 110
## 3 3 41
## 4 4 7
El 38% de la muestra correspon al estrato 1, el 43% corresponden al estrato 2, el 16% corresponde al estrato 3 y por ultimo un 3% para el estrato 4.
# grafica de barras
barplot(frecuencia_estratos, col = "lightpink", border = "black",
main = "Estratos en la Muestra Aleatoria",
xlab = "Estrato", ylab = "# de estudiantes")
# Grafica de distribucion normal muestra aleatoria Economia
Estrato_Economia <- rnorm(178, mean = 2, sd = 0.8)
qqnorm(Estrato_Economia,ylab="Estratos",
xlab="")
qqline(Estrato_Economia, col = 2)
– Distribucion de frecuencias Economia
# Contar la frecuencia de cada estrato en la muestra aleatoria
frecuencia_estratos <- table(muestra_aleatoria2$`Estrato Economia`)
# Crear un data frame con los resultados
tabla_resultados <- data.frame(Estratos = names(frecuencia_estratos), Frecuencia = as.vector(frecuencia_estratos))
# Imprimir la tabla de resultados
print(tabla_resultados)
## Estratos Frecuencia
## 1 1 58
## 2 2 106
## 3 3 11
## 4 4 3
El 33% de la muestra correspon al estrato 1, el 60% corresponden al estrato 2, el 6% corresponde al estrato 3 y por ultimo un 2% para el estrato 4.
# Crear un histograma de la distribución de estratos
barplot(frecuencia_estratos, col = "lightgreen", border = "black",
main = "Estratos en la Muestra Aleatoria",
xlab = "Estrato", ylab = "# de estudiantes")
Prueba de Kolmoworov
# Ejemplo de prueba de Kolmogorov-Smirnov para medicina
ks.test(Estrato_Medicina, "pnorm", mean = mean(Estrato_Medicina), sd = sd(Estrato_Medicina))
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: Estrato_Medicina
## D = 0.028659, p-value = 0.9855
## alternative hypothesis: two-sided
# Ejemplo de prueba de Kolmogorov-Smirnov para Economia
ks.test(Estrato_Economia, "pnorm", mean = mean(Estrato_Economia), sd = sd(Estrato_Economia))
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: Estrato_Economia
## D = 0.032433, p-value = 0.992
## alternative hypothesis: two-sided
Dado que los Q-Q plot muestran una linea muy cercana a la diagonal y los P-value de kolmoworov son superiores al 0.05 para ambas muestras, se determina que estas tienen una distribucion normal. Por consecuencia se realizara una prueba de hipotesis parametrica.
– Prueba de Hipotesis
# t student
t.test(Estrato_Medicina, Estrato_Economia)
##
## Welch Two Sample t-test
##
## data: Estrato_Medicina and Estrato_Economia
## t = -1.1053, df = 414.46, p-value = 0.2697
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -0.26627247 0.07460194
## sample estimates:
## mean of x mean of y
## 1.927378 2.023213
Debido a que el valor p de la prueba t student es mayor que el nivel de significancia 0.05 no se rechaza la hipotesis nula.
Como el P-value es de 0.2697 es mayor al nivel de significancia no se rechaza la hipotesis nula (H_0); por lo tanto, se puede inferir que no existen diferencias significativas en los estratos socio-económico entre los estudiantes del programa de Medicina y Economía de la Universidad Surcolombiana.
Por cada 100 estudiantes en medicina 16 pertenecen a estrato 3 y 3 a estrato 4, mientras que en economia por cada 100 estudiantes 6 corresponden a estrato 3 y 2 a estrato 4.
Aunque el estrato promedio es igual para ambas carreras se observa una diferencia significativa entre los estratos 3 y 4 de ambas carreras, a la hora de escoger una de las dos carreras puede que si influya el estrato socio-economico de las familias.
Por otro lado se evidencia que para los estratos 1 y 2 de ambas carreras se tienen porcentajes muy cercano, lo cual nos indica que a la hora de escoger la carrera puede ser por gusto personal, familiar o tambien dado el nivel educativo que haya tenido la persona, ya que estudiantes de estrato 2 que tuvieran mejor educacion pueden acceder a carreras como medicina que requieren un mayor puntaje.
Para poder tener una inferencia mas clara, se recomienda hacer una investigacion mas fondo sobre el estrato y nivel educativo de los estudiantes de ambas carreras.