Es un procedimiento de muestreo en el que el objetivo de la población se separa en segmentos exclusivos, homogéneos (estratos), y luego de una muestra aleatoria simple se selecciona de cada segmento (estratos).
# Definimos parámetros
N <- 10000 # Población total
n <- 370 # Tamaño de la muestra total
# Proporciones de los estratos
N_hombres <- 5000 # Número de hombres
N_mujeres <- 5000 # Número de mujeres
# Tamaño de la muestra en cada estrato (proporcional)
n_hombres <- (N_hombres / N) * n
n_mujeres <- (N_mujeres / N) * n
# Resultados
cat("Tamaño de muestra para hombres:", round(n_hombres), "\n")
## Tamaño de muestra para hombres: 185
cat("Tamaño de muestra para mujeres:", round(n_mujeres), "\n")
## Tamaño de muestra para mujeres: 185
#Interpretación de Resultados
#1. 185 Personas fueron seleccionados en el estrato genero hombre, que son el
#50% de la población
#2. 185 Personas fueron seleccionados en el estrato genero mujeres, que son
#el 50% de la población
#Muestra de Parametro
library(readxl)
Base_Datos3 <- read_excel("Base_Datos3.xlsx")
View(Base_Datos3)
Edad_3 <- Base_Datos3$Edad
Edad_6 <- mean(Edad_3)
Edad_6
## [1] 39.12
#Interpretación de Resultados
#La edad promedio del grupo es de 39.12
N_Hijos <- Base_Datos3$`Número de hijos`
N_Hijos2 <- mean(N_Hijos)
N_Hijos2
## [1] 1.43
#Interpretación de Resultados
#El promedio de hijos de la población es de 1.43
Estrato_ID <- Base_Datos3$Estrato
Estrato_10 <- mean(Estrato_ID)
Estrato_10
## [1] 2.99
#Interpretación de Resultados
#La mayoria de la población se encuentra en el estrato 3
#Desviación Standar del parametro
desviacion_Edad <- sd(Edad_3)
desviacion_Edad
## [1] 11.10763
#Interpretación de Resultados
#Con un sd de 11.1 lo que nos suguiere que la mayoria de la edad estan en el
#rango de 11.1 años por arriba o abajo de la media.
desviacion_Hijos <- sd(N_Hijos)
desviacion_Hijos
## [1] 1.112418
#Interpretación de Resultados
#con un sd de 1.11, la mayoria esta en este rango de numeros de hijos por arriba
#o abajo de la media.
desviacion_Estrato <- sd(Estrato_ID)
desviacion_Estrato
## [1] 1.259269
#Interpretación de Resultados
#con un sd de 1.25, la mayoria esta en este estrato socieconomico por arriba
#o abajo de la media.
#Sesgo y la consistencia por muestreo aleatorio simple.
# Parámetros
N <- 100 # Tamaño de la población
Z <- 1.96 # Valor Z para un nivel de confianza del 95%
p <- 0.5 # Proporción de éxito esperada
q <- 1 - p # Proporción de fracaso
E <- 0.05 # Margen de error
# Cálculo del tamaño de muestra
n <- (Z^2 * p * q * N) / ((E^2 * (N - 1)) + (Z^2 * p * q))
n
## [1] 79.50989
library(readxl)
Base_Datos4 <- read_excel("Base_Datos4.xlsx")
View(Base_Datos4)
Edad_4 <- Base_Datos4$Edad
Edad_8 <- mean(Edad_4)
Edad_8
## [1] 38.75
#Interpretación de Resultados
#La edad promedio de la muestra es de 38.75
N_Hijos_3 <- Base_Datos4$`Número de hijos`
N_Hijos6 <- mean(N_Hijos_3)
N_Hijos6
## [1] 1.45
#Interpretación de Resultados
#El promedio de la muestra de numeros hijos es de 1.45
Estrato_ID1 <- Base_Datos4$Estrato
Estrato_12 <- mean(Estrato_ID1)
Estrato_12
## [1] 2.9875
#Interpretación de Resultados
#La mayoria de la muestra se encuentra en el estrato 3
#Desviación Standar
desviacion_Edad_4 <- sd(Edad_4)
desviacion_Edad_4
## [1] 11.25594
#Interpretación de Resultados
#Con un sd de 11.25 la mayoria de la edad se encuentra en este rango por arriba
#o abajo de la media.
desviacion_Hijos_3 <- sd(N_Hijos_3)
desviacion_Hijos_3
## [1] 1.135169
#Interpretación de Resultados
#con un sd de 1.13, la mayoria esta en este rango de numeros de hijos por arriba
#o abajo de la media.
desviacion_Estrato1 <- sd(Estrato_ID1)
desviacion_Estrato1
## [1] 1.257824
#Interpretación de Resultados
#con un sd de 1.25, la mayoria de la muestra esta en este estrato socieconomico
#por arriba o abajo de la media.
# Check the value of x using an if statement
if (Edad_6 != Edad_8) {
print("Si hay sesgo en el estimador de Media de Edad")
} else {
print("El estimador de media de Edad es insesgado")
}
## [1] "Si hay sesgo en el estimador de Media de Edad"
if (N_Hijos2 != N_Hijos6) {
print("Si hay sesgo en el estimador de Media de Número de Hijos")
} else {
print("El estimador de media de Número de Hijos es insesgado")
}
## [1] "Si hay sesgo en el estimador de Media de Número de Hijos"
if (Estrato_10 != Estrato_12) {
print("Si hay sesgo en el estimador de Media de Estrato")
} else {
print("El estimador de media de Estrato es insesgado")
}
## [1] "Si hay sesgo en el estimador de Media de Estrato"
library(readxl)
Base_Datos5 <- read_excel("Base_Datos5.xlsx")
View(Base_Datos5)
Edad_5 <- Base_Datos5$Edad
Edad_10 <- mean(Edad_5)
Edad_10
## [1] 39.25
N_Hijos_4 <- Base_Datos5$`Número de hijos`
N_Hijos8 <- mean(N_Hijos_4)
N_Hijos8
## [1] 1.4125
Estrato_ID2 <- Base_Datos5$Estrato
Estrato_15 <- mean(Estrato_ID2)
Estrato_15
## [1] 2.9875
#Desviación Standar
desviacion_Edad_5 <- sd(Edad_5)
desviacion_Edad_5
## [1] 10.79791
desviacion_Hijos_4 <- sd(N_Hijos_4)
desviacion_Hijos_4
## [1] 1.110294
desviacion_Estrato2 <- sd(Estrato_ID2)
desviacion_Estrato2
## [1] 1.257824
#Varianza
varianza_1 <- var(Edad_3)
varianza_1
## [1] 123.3794
varianza_2 <- var(Edad_4)
varianza_2
## [1] 126.6962
varianza_3 <- var(Edad_5)
varianza_3
## [1] 116.5949
if (varianza_2 < varianza_3) {
print("Es eficiente")
} else {
print("No es eficiente")
}
## [1] "No es eficiente"
#Interpretacion de Resultados
#Se presenta un sesgo medio eficiente lo que sugiere, que el valor esperado no presenta similitud con el valor real del parámetro, presentando varianza baja.
#Para este caso arroja ineficiencia en las varianzas, lo que nos sugiera que
#las estimaciones pueden fluctuar.
muestras4 <- Base_Datos4$Estrato
estimador_cons <- sum(muestras4) / length(muestras4)
print(estimador_cons)
## [1] 2.9875
Poblacion4 <- Base_Datos3$Estrato
estimador_cons <- sum(Poblacion4) / length(Poblacion4)
print(estimador_cons)
## [1] 2.99
#Interpretacion de Resultados
#La variable estrato presenta consistencia porque nos permite inferiir que a
#medida que aumenta la muetra, esta se aproxima al valor real del parametro.
# Alturas de una muestra
Edad_E_puntual <- Base_Datos4$Edad
# Estimador puntual de la media
Edad_M_puntual <- mean(Edad_E_puntual)
# Imprimir el resultado
cat("Estimador Puntual de la Media:", Edad_M_puntual, "\n")
## Estimador Puntual de la Media: 38.75
## INTERVALO DE CONFIANZA
# Intervalo de confianza del 95% para la media
Intervalo_C <- t.test(Edad_E_puntual)$conf.int
# Imprimir el resultado
cat("Intervalo de Confianza del 95% para la Media:", Intervalo_C, "\n")
## Intervalo de Confianza del 95% para la Media: 36.24511 41.25489
#Interpretacion de Resultados
#La edad promedio de la poblacion es de 38.75 y el Intervalo de confianza sugiere que si hacemos estimaciones el valor real de la media estara en este rango
#36.24 41.25
# Generar una muestra de datos
datos <- rnorm(80, mean = 1.45, sd = 1.13)
# Función de verosimilitud para una distribución normal
log_likelihood <- function(par, data) {
mu <- par[1]
sigma <- par[2]
-sum(dnorm(data, mean = mu, sd = sigma, log = TRUE))
}
# Encontrar estimadores de máxima verosimilitud
inicializacion <- c(mean(datos), sd(datos))
estimadores_mle <- optim(par = inicializacion, fn = log_likelihood, data = datos)
# Resultados
cat("Estimador MLE para la media:", estimadores_mle$par[1], "\n")
## Estimador MLE para la media: 1.306026
cat("Estimador MLE para la desviación estándar:", estimadores_mle$par[2], "\n")
## Estimador MLE para la desviación estándar: 1.247841
#Interpretacion de Resultados
#Como los resultados son iguales a la media y desviación estandar población,
#Podemos concluir que se pueden inferir resultados de la muestra sobre la
#Poblacion
# Calcular el error estándar de la media
tamano_muestra <- length(Base_Datos4$Edad)
tamano_muestra
## [1] 80
error_estandar <- desviacion_Edad_4 / sqrt(tamano_muestra)
error_estandar
## [1] 1.258452
# Calcular el valor crítico de la distribución t
nivel_confianza <- 0.95
nivel_confianza
## [1] 0.95
valor_critico <- qt((1 + nivel_confianza) / 2, df = tamano_muestra - 1)
valor_critico
## [1] 1.99045
# Calcular el margen de error
margen_error <- valor_critico * error_estandar
margen_error
## [1] 2.504887
# Calcular el intervalo de confianza
intervalo_confianza <- c(Edad_8 - margen_error, Edad_8 + margen_error)
intervalo_confianza
## [1] 36.24511 41.25489
# Mostrar resultados
cat("Intervalo de confianza del", nivel_confianza * 100, "% para la media:", intervalo_confianza)
## Intervalo de confianza del 95 % para la media: 36.24511 41.25489
#Interpretacion de Resultados
#EL Intervalo de confianza del 95 % para la media de nuestra muestra de la
#variable edad es 36.34704 41.15296
##EJEMPLO
# De "100" personas encuestadas seleccionamos 80 al azar, y se registraron que 11 tienen 3 hijo
# Personas encuestadas
Hogar_1 <- 27
tamano_muestra <- 80
proporcion_Hogar_1 <- Hogar_1 / tamano_muestra
proporcion_Hogar_1
## [1] 0.3375
calcular un intervalo de confianza del 95% para la proporción de clientes satisfechos
# Intervalo de confianza para la proporción
nivel_confianza <- 0.95
# Calcular el error estándar de la proporción
error_estandar_proporcion <- sqrt((proporcion_Hogar_1 * (1 -
proporcion_Hogar_1)) / tamano_muestra)
error_estandar_proporcion
## [1] 0.05286702
# Calcular el valor crítico de la distribución normal estándar
valor_critico <- qnorm((1 + nivel_confianza) / 2)
valor_critico
## [1] 1.959964
# Calcular el margen de error
margen_error_proporcion <- valor_critico * error_estandar_proporcion
margen_error_proporcion
## [1] 0.1036175
# Calcular el intervalo de confianza
intervalo_confianza_proporcion <- c(proporcion_Hogar_1 - margen_error_proporcion, proporcion_Hogar_1 + margen_error_proporcion)
intervalo_confianza_proporcion
## [1] 0.2338825 0.4411175
# Mostrar resultados
cat("Intervalo de confianza del", nivel_confianza * 100, "% para la proporción de Hogar con 1 hijo:", intervalo_confianza_proporcion)
## Intervalo de confianza del 95 % para la proporción de Hogar con 1 hijo: 0.2338825 0.4411175
#Interpretacion de Resultados
#El Intervalo de confianza del 95 % para la proporción proporción de Hogar con 1
#hijo: 0.2338825 0.441117
##EJEMPLO
# De "100" personas encuestadas seleccionamos 80 al azar, y se registraron que 11 tienen 3 hijo
# Personas encuestadas
Hogar_3 <- 11
tamano_muestra <- 80
proporcion_Hogar_3 <- Hogar_3 / tamano_muestra
proporcion_Hogar_3
## [1] 0.1375
# Calcular el intervalo de confianza para la proporción
nivel_confianza <- 0.95
# Calcular el error estándar de la proporción
error_estandar_proporcion3 <- sqrt((proporcion_Hogar_3 * (1 -
proporcion_Hogar_3)) / tamano_muestra)
error_estandar_proporcion3
## [1] 0.03850223
# Calcular el valor crítico de la distribución normal estándar
valor_critico3 <- qnorm((1 + nivel_confianza) / 2)
valor_critico3
## [1] 1.959964
# Calcular el margen de error
margen_error_proporcion3 <- valor_critico3 * error_estandar_proporcion3
margen_error_proporcion3
## [1] 0.07546299
# Calcular el intervalo de confianza
intervalo_confianza_proporcion3<- c(proporcion_Hogar_3 - margen_error_proporcion3, proporcion_Hogar_3 + margen_error_proporcion3)
intervalo_confianza_proporcion3
## [1] 0.06203701 0.21296299
# Mostrar resultados
cat("Intervalo de confianza del", nivel_confianza * 100, "% para la proporción de Hogar con 3 hijo:", intervalo_confianza_proporcion3)
## Intervalo de confianza del 95 % para la proporción de Hogar con 3 hijo: 0.06203701 0.212963
#Interpretacion de Resultados
#El Intervalo de confianza del 95 % para la proporción proporción de Hogar con 3
#hijo: 0.06203701 0.212963
Estrato_ID1 <- Base_Datos4$Estrato
Estrato_12 <- mean(Estrato_ID1)
Estrato_12
## [1] 2.9875
desviacion_Estrato1 <- sd(Estrato_ID1)
desviacion_Estrato1
## [1] 1.257824
Estrato_ID2 <- Base_Datos5$Estrato
Estrato_15 <- mean(Estrato_ID2)
Estrato_15
## [1] 2.9875
desviacion_Estrato2 <- sd(Estrato_ID2)
desviacion_Estrato2
## [1] 1.257824
tamaño_muestra_1 <- length(Base_Datos4$Estrato)
tamaño_muestra_1
## [1] 80
tamaño_muestra_2 <- length(Base_Datos5$Estrato)
tamaño_muestra_2
## [1] 80
# Error estándar de la diferencia de medias
error_estandar_diferencia <- sqrt((desviacion_Estrato1^2 / tamaño_muestra_1) + (desviacion_Estrato2^2 / tamaño_muestra_2))
error_estandar_diferencia
## [1] 0.1988794
# Valor crítico de la distribución t
nivel_confianza_2<-0.95
valor_critico_2 <- qt((1 + nivel_confianza_2) / 2, df = tamaño_muestra_1 + tamaño_muestra_2 - 2)
valor_critico_2
## [1] 1.975092
# Margen de error
margen_error_diferencia <- valor_critico_2 * error_estandar_diferencia
margen_error_diferencia
## [1] 0.3928051
# Intervalo de confianza para la diferencia de medias
intervalo_confianza_diferencia <- c((Estrato_12 - Estrato_15) - margen_error_diferencia, (Estrato_12 - Estrato_15) + margen_error_diferencia)
intervalo_confianza_diferencia
## [1] -0.3928051 0.3928051
# Mostrar resultado
cat("Intervalo de confianza del", nivel_confianza_2 * 100, "% para la diferencia de medias:", intervalo_confianza_diferencia)
## Intervalo de confianza del 95 % para la diferencia de medias: -0.3928051 0.3928051
diferencia_media<-Estrato_12 - Estrato_15
diferencia_media
## [1] 0
#Interpretacion de Resultados
#Bajo este nivel No se puede inferir un 95% de confianza entre las medias de las
#variables
INTRODUCCIÓN
En una población de estudiantes de una universidad se quiere saber si los niveles de estres estan asociados al sexo de los estudiantes.
DESCRIPCIÓN DE DATOS - PRUEBA DE HIPOTESIS
Los niveles de estrés en los estudiantes de una universidad presentan asociación con el sexo.
METODOLOGÍA
Una vez recopilada la base de datos se procedio a verificar la normalidad de nuestros datos mediante que el grafico de Q-Q plot y la prueba de Kolmogorov-Smirnov y graficos de barras para las variables categoricas. Para determinar la asociacion entre el sexo y los niveles de estrés se utilizo la prueba no parametrica chi cuadradro.
POBLACIÓN
200 estudiantes de una universidad.
SELECCIÓN DE LA MUESTRA
Se trabajo con el total de la población
TIPOS DE VARIABLES: parametros - estimaciones
Variables categóricas y discretas
Estudio de estrés en estudiantes de una especialización de estadística de una universidad pública, en función del sexo
H₀: Los grados de estrés en los estudiantes de la especialización en estadística no difieren de manera significativa entre hombres y mujeres.
H₁: Los grados de estrés en los estudiantes de la especialización en estadística difieren de manera significativa entre hombres y mujeres.
n_estudiantes <- 200
sexo <- sample(c("Masculino", "Femenino"), n_estudiantes, replace = TRUE)
edad <- sample(20:30, n_estudiantes, replace = TRUE)
cantidad_materias <- sample(4:8, n_estudiantes, replace = TRUE)
ingresos <- sample(1000000:3000000, n_estudiantes, replace = TRUE)
estres <- sample(c("Bajo", "Moderado", "Alto"), n_estudiantes, replace = TRUE,
prob = c(0.3, 0.4, 0.3))
base_datos_prueba_hipotesis <- data.frame(ID_Estudiante = 1:n_estudiantes,
Sexo = sexo,
Edad = edad,
Cantidad_de_Materias = cantidad_materias,
Ingresos = ingresos,
Estres = estres)
print(base_datos_prueba_hipotesis)
## ID_Estudiante Sexo Edad Cantidad_de_Materias Ingresos Estres
## 1 1 Femenino 29 7 1081269 Bajo
## 2 2 Femenino 24 4 1341064 Moderado
## 3 3 Femenino 29 6 2319146 Moderado
## 4 4 Femenino 28 5 1173592 Alto
## 5 5 Femenino 22 6 1586162 Alto
## 6 6 Masculino 29 8 1059074 Moderado
## 7 7 Masculino 23 4 1135238 Alto
## 8 8 Femenino 29 4 2255396 Moderado
## 9 9 Femenino 26 5 2592091 Alto
## 10 10 Masculino 30 4 2736308 Moderado
## 11 11 Masculino 25 8 2249394 Alto
## 12 12 Masculino 26 4 1499380 Alto
## 13 13 Masculino 25 8 2763195 Bajo
## 14 14 Masculino 22 7 2389680 Moderado
## 15 15 Masculino 29 8 2560793 Bajo
## 16 16 Femenino 30 5 2567912 Bajo
## 17 17 Femenino 20 5 1623994 Moderado
## 18 18 Masculino 20 7 1872880 Moderado
## 19 19 Masculino 28 7 2746154 Alto
## 20 20 Femenino 29 5 2962195 Moderado
## 21 21 Femenino 28 7 1043431 Bajo
## 22 22 Femenino 29 7 2841081 Moderado
## 23 23 Masculino 28 6 2309509 Moderado
## 24 24 Femenino 20 8 1776334 Alto
## 25 25 Masculino 30 6 1207570 Alto
## 26 26 Masculino 26 8 1378861 Bajo
## 27 27 Femenino 25 8 2102765 Bajo
## 28 28 Masculino 20 7 1417247 Alto
## 29 29 Femenino 26 6 1325526 Moderado
## 30 30 Masculino 30 6 2911050 Alto
## 31 31 Masculino 23 5 2301790 Alto
## 32 32 Femenino 30 6 2777913 Moderado
## 33 33 Masculino 23 5 1644647 Moderado
## 34 34 Femenino 21 7 2828115 Bajo
## 35 35 Femenino 24 4 2527831 Moderado
## 36 36 Masculino 23 8 1337837 Bajo
## 37 37 Femenino 23 8 2366496 Moderado
## 38 38 Femenino 21 8 2649616 Alto
## 39 39 Femenino 20 5 2863193 Moderado
## 40 40 Femenino 26 6 1223761 Moderado
## 41 41 Masculino 21 5 1176297 Alto
## 42 42 Masculino 26 7 2382817 Alto
## 43 43 Femenino 28 6 2301383 Moderado
## 44 44 Femenino 27 8 2606417 Moderado
## 45 45 Femenino 21 6 2363755 Moderado
## 46 46 Femenino 20 4 2832186 Moderado
## 47 47 Masculino 24 6 2773026 Alto
## 48 48 Femenino 30 7 1646577 Moderado
## 49 49 Femenino 20 5 1202281 Bajo
## 50 50 Femenino 23 7 1002025 Bajo
## 51 51 Masculino 26 8 2356824 Bajo
## 52 52 Masculino 20 7 1881737 Alto
## 53 53 Femenino 20 5 2636290 Alto
## 54 54 Femenino 21 7 2397229 Moderado
## 55 55 Femenino 30 7 2717806 Bajo
## 56 56 Femenino 27 4 1239033 Bajo
## 57 57 Masculino 21 4 2005555 Moderado
## 58 58 Femenino 29 5 2025919 Moderado
## 59 59 Masculino 26 5 2495827 Bajo
## 60 60 Femenino 20 4 1154460 Moderado
## 61 61 Masculino 25 4 1336857 Moderado
## 62 62 Femenino 21 5 1925380 Bajo
## 63 63 Masculino 25 7 2090916 Bajo
## 64 64 Femenino 25 6 1219034 Alto
## 65 65 Masculino 27 7 1742346 Alto
## 66 66 Masculino 29 6 1618040 Bajo
## 67 67 Femenino 30 6 2157399 Moderado
## 68 68 Masculino 20 7 1485820 Moderado
## 69 69 Femenino 23 8 1910743 Bajo
## 70 70 Femenino 25 5 1319818 Moderado
## 71 71 Masculino 20 6 1781730 Bajo
## 72 72 Masculino 30 8 2074064 Bajo
## 73 73 Masculino 24 6 1674206 Moderado
## 74 74 Masculino 26 5 1710581 Moderado
## 75 75 Femenino 26 8 2454226 Bajo
## 76 76 Femenino 28 7 2122339 Alto
## 77 77 Femenino 26 4 1112855 Bajo
## 78 78 Femenino 30 5 1930539 Alto
## 79 79 Femenino 20 6 1311083 Alto
## 80 80 Femenino 25 5 2376080 Alto
## 81 81 Masculino 26 7 2814526 Moderado
## 82 82 Masculino 30 6 1956553 Alto
## 83 83 Masculino 28 5 2105900 Bajo
## 84 84 Femenino 29 4 2214745 Alto
## 85 85 Femenino 28 4 1876667 Bajo
## 86 86 Femenino 30 4 1856678 Bajo
## 87 87 Masculino 28 5 1961109 Alto
## 88 88 Masculino 25 8 2594648 Moderado
## 89 89 Femenino 30 5 2204330 Alto
## 90 90 Masculino 20 5 1238135 Alto
## 91 91 Femenino 27 8 2396528 Alto
## 92 92 Femenino 23 4 1271375 Alto
## 93 93 Masculino 27 6 2109487 Moderado
## 94 94 Masculino 29 4 2750344 Alto
## 95 95 Masculino 26 4 2016305 Alto
## 96 96 Femenino 28 5 1081726 Moderado
## 97 97 Femenino 29 7 1799071 Moderado
## 98 98 Masculino 29 5 1458617 Moderado
## 99 99 Femenino 25 7 2889354 Alto
## 100 100 Femenino 22 5 2705217 Moderado
## 101 101 Masculino 26 8 2069417 Moderado
## 102 102 Masculino 25 7 2138574 Alto
## 103 103 Femenino 28 8 2517941 Bajo
## 104 104 Femenino 20 7 2087455 Moderado
## 105 105 Femenino 26 8 2472534 Bajo
## 106 106 Masculino 26 8 1065317 Moderado
## 107 107 Masculino 21 7 2913626 Alto
## 108 108 Femenino 30 8 2403942 Moderado
## 109 109 Femenino 25 6 1950672 Moderado
## 110 110 Femenino 25 8 2521198 Moderado
## 111 111 Masculino 27 5 2397687 Alto
## 112 112 Masculino 20 7 2482116 Moderado
## 113 113 Masculino 26 7 2257282 Moderado
## 114 114 Femenino 29 8 1787194 Moderado
## 115 115 Masculino 21 4 2506621 Bajo
## 116 116 Femenino 21 4 1569997 Moderado
## 117 117 Masculino 23 5 1522226 Moderado
## 118 118 Femenino 25 6 2443189 Moderado
## 119 119 Masculino 26 7 1659890 Bajo
## 120 120 Femenino 22 7 1406426 Moderado
## 121 121 Femenino 28 8 2637779 Moderado
## 122 122 Masculino 20 8 2672291 Moderado
## 123 123 Masculino 22 7 2999863 Alto
## 124 124 Masculino 27 8 1150825 Alto
## 125 125 Masculino 29 8 2397956 Alto
## 126 126 Masculino 24 5 2872309 Alto
## 127 127 Masculino 20 6 1552057 Alto
## 128 128 Masculino 21 7 2175710 Bajo
## 129 129 Masculino 21 6 1525946 Moderado
## 130 130 Femenino 22 5 2264857 Bajo
## 131 131 Masculino 28 4 2173305 Moderado
## 132 132 Masculino 30 4 1987288 Bajo
## 133 133 Masculino 29 4 2440714 Bajo
## 134 134 Masculino 21 4 2336073 Bajo
## 135 135 Masculino 30 7 2355427 Moderado
## 136 136 Femenino 22 4 1524835 Bajo
## 137 137 Masculino 29 8 1052154 Alto
## 138 138 Femenino 23 4 1259292 Alto
## 139 139 Masculino 29 8 1452065 Bajo
## 140 140 Masculino 20 8 2586287 Alto
## 141 141 Masculino 30 8 1860979 Bajo
## 142 142 Masculino 27 8 2705734 Alto
## 143 143 Masculino 22 4 2239841 Moderado
## 144 144 Masculino 20 4 1697114 Bajo
## 145 145 Masculino 23 7 2006872 Moderado
## 146 146 Femenino 29 7 1359781 Bajo
## 147 147 Masculino 26 4 1890426 Moderado
## 148 148 Femenino 23 6 2608005 Bajo
## 149 149 Masculino 27 8 1294315 Moderado
## 150 150 Femenino 28 5 2753626 Alto
## 151 151 Masculino 30 8 1836039 Alto
## 152 152 Masculino 27 7 1511874 Moderado
## 153 153 Femenino 29 7 1264701 Alto
## 154 154 Femenino 29 4 2861436 Moderado
## 155 155 Femenino 24 6 1789262 Alto
## 156 156 Femenino 23 7 1742909 Moderado
## 157 157 Masculino 30 7 2805744 Moderado
## 158 158 Masculino 26 6 2678320 Bajo
## 159 159 Femenino 24 8 1573108 Bajo
## 160 160 Masculino 29 8 1930717 Moderado
## 161 161 Masculino 29 8 1390746 Moderado
## 162 162 Masculino 21 4 1283093 Bajo
## 163 163 Masculino 22 7 2625690 Bajo
## 164 164 Masculino 28 5 1311308 Bajo
## 165 165 Femenino 25 8 2863977 Bajo
## 166 166 Masculino 25 8 2446962 Bajo
## 167 167 Femenino 22 5 1075895 Moderado
## 168 168 Masculino 30 4 1460519 Bajo
## 169 169 Masculino 30 7 1286891 Moderado
## 170 170 Femenino 29 5 1623901 Bajo
## 171 171 Masculino 30 8 1489406 Alto
## 172 172 Femenino 20 4 1925260 Alto
## 173 173 Femenino 27 4 2253703 Alto
## 174 174 Femenino 23 5 2362847 Moderado
## 175 175 Femenino 20 7 2146462 Alto
## 176 176 Masculino 21 5 1325447 Moderado
## 177 177 Masculino 23 8 1956202 Moderado
## 178 178 Femenino 21 7 2078822 Moderado
## 179 179 Masculino 20 4 1112058 Bajo
## 180 180 Masculino 27 8 1158549 Alto
## 181 181 Masculino 23 8 1110014 Moderado
## 182 182 Masculino 22 8 1663005 Alto
## 183 183 Masculino 22 5 2269922 Moderado
## 184 184 Femenino 20 5 1241914 Alto
## 185 185 Masculino 29 5 2119178 Alto
## 186 186 Femenino 25 4 1977886 Moderado
## 187 187 Femenino 28 8 2186835 Alto
## 188 188 Masculino 26 5 1223480 Bajo
## 189 189 Femenino 26 7 2506030 Moderado
## 190 190 Masculino 24 6 1673204 Bajo
## 191 191 Femenino 29 8 2570296 Alto
## 192 192 Femenino 25 6 2180953 Moderado
## 193 193 Femenino 26 8 1153512 Alto
## 194 194 Masculino 22 6 2169261 Alto
## 195 195 Femenino 27 8 1070991 Moderado
## 196 196 Femenino 30 8 2167533 Alto
## 197 197 Femenino 22 6 2123831 Moderado
## 198 198 Femenino 22 8 2644162 Bajo
## 199 199 Femenino 23 5 2194438 Moderado
## 200 200 Masculino 21 8 2159658 Moderado
DESCRIPCIÓN DE LOS DATOS
media_hipotesis <- mean(base_datos_prueba_hipotesis$Edad)
media_hipotesis
## [1] 25.205
desviacion_hipotesis <- sd(base_datos_prueba_hipotesis$Edad)
desviacion_hipotesis
## [1] 3.38827
edad_hipotesis <- rnorm(200, mean = media_hipotesis, sd = desviacion_hipotesis)
# Q-Q Plot
#Nota: Para el el grafico Q-Q plot se tomo la variable edad, debido a que la variable de estudio, sexo y nivel de estres son categoricas
qqnorm(edad_hipotesis)
qqline(edad_hipotesis, col = "red")
#Interpretacion de Resultados
#Como se puede observar la mayoria de los puntos de centran cerca de la linea
#roja, indicandonos que la variable edad presenta una distribucion normal
#aceptable.
#Prueba Kolmogorov-Smirnov
Kolmogorov_hipotesis <- ks.test(base_datos_prueba_hipotesis$Edad, "pnorm", mean = media_hipotesis, sd = desviacion_hipotesis)
## Warning in ks.test.default(base_datos_prueba_hipotesis$Edad, "pnorm", mean =
## media_hipotesis, : ties should not be present for the one-sample
## Kolmogorov-Smirnov test
Kolmogorov_hipotesis
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: base_datos_prueba_hipotesis$Edad
## D = 0.12029, p-value = 0.006131
## alternative hypothesis: two-sided
#Interpretacion de Resultados
#Como la prueba de Kolmogorov-Smirnov dio como resultado 0.01141, nos indica
#que la variable edad se distribuye de forma normal
#Se realizara un Diagrama de Barras de las variables categoricas, sexo y nivel de
#estres para mirar su distribución.
sexo <- sample(c("M", "F"), size = 200, replace = TRUE)
sexo_factor <- factor(base_datos_prueba_hipotesis$Sexo)
# Diagrama de Barras
barplot(table(sexo_factor), main = "Diagrama de Barras", col = c("blue", "pink"),
xlab = "Sexo", ylab = "Frecuencia", border = "black")
#Interpretación de Resultados
#La mayoria de la población de estudio pertenece al sexo Masculino.
#Nivel de Estres
estres <- sample(c("B", "M", "A"), size = 200, replace = TRUE)
estres_factor <- factor(base_datos_prueba_hipotesis$Estres)
# Diagrama de Barras
barplot(table(estres_factor), main = "Diagrama de Barras", col = c("blue", "green", "red"),
xlab = "estres", ylab = "Frecuencia", border = "black")
#Interpretacion de Resultados
#La mayoria de los estudiantes, presentaron niveles de estres moderados.