TALLER 1, 2 y 3 - INFORME FINAL 1

MUESTREO ESTRATIFICADO

Es un procedimiento de muestreo en el que el objetivo de la población se separa en segmentos exclusivos, homogéneos (estratos), y luego de una muestra aleatoria simple se selecciona de cada segmento (estratos).

# Definimos parámetros

N <- 10000  # Población total
n <- 370    # Tamaño de la muestra total

# Proporciones de los estratos

N_hombres <- 5000  # Número de hombres
N_mujeres <- 5000  # Número de mujeres

# Tamaño de la muestra en cada estrato (proporcional)

n_hombres <- (N_hombres / N) * n
n_mujeres <- (N_mujeres / N) * n

# Resultados

cat("Tamaño de muestra para hombres:", round(n_hombres), "\n")

## Tamaño de muestra para hombres: 185

cat("Tamaño de muestra para mujeres:", round(n_mujeres), "\n")

## Tamaño de muestra para mujeres: 185

#Interpretación de Resultados

#1. 185 Personas fueron seleccionados en el estrato genero hombre, que son el 
#50% de la población 

#2. 185 Personas fueron seleccionados en el estrato genero mujeres, que son 
#el 50% de la población

#Muestra de Parametro

library(readxl)
Base_Datos3 <- read_excel("Base_Datos3.xlsx")
View(Base_Datos3)

Edad_3 <- Base_Datos3$Edad
Edad_6 <- mean(Edad_3)
Edad_6

## [1] 39.12

#Interpretación de Resultados
#La edad promedio del grupo es de 39.12


N_Hijos <- Base_Datos3$`Número de hijos`
N_Hijos2 <- mean(N_Hijos)
N_Hijos2

## [1] 1.43

#Interpretación de Resultados
#El promedio de hijos de la población es de 1.43

Estrato_ID <- Base_Datos3$Estrato
Estrato_10 <- mean(Estrato_ID)
Estrato_10

## [1] 2.99

#Interpretación de Resultados
#La mayoria de la población se encuentra en el estrato 3

#Desviación Standar del parametro

desviacion_Edad <- sd(Edad_3)
desviacion_Edad

## [1] 11.10763

#Interpretación de Resultados
#Con un sd de 11.1 lo que nos suguiere que la mayoria de la edad estan en el 
#rango de 11.1 años por arriba o abajo de la media.

desviacion_Hijos <- sd(N_Hijos)
desviacion_Hijos

## [1] 1.112418

#Interpretación de Resultados
#con un sd de 1.11, la mayoria esta en este rango de numeros de hijos por arriba
#o abajo de la media.

desviacion_Estrato <- sd(Estrato_ID)
desviacion_Estrato

## [1] 1.259269

#Interpretación de Resultados
#con un sd de 1.25, la mayoria esta en este estrato socieconomico por arriba
#o abajo de la media.


#Sesgo y la consistencia  por muestreo aleatorio simple.

# Parámetros
N <- 100      # Tamaño de la población
Z <- 1.96     # Valor Z para un nivel de confianza del 95%
p <- 0.5      # Proporción de éxito esperada
q <- 1 - p    # Proporción de fracaso
E <- 0.05     # Margen de error

# Cálculo del tamaño de muestra
n <- (Z^2 * p * q * N) / ((E^2 * (N - 1)) + (Z^2 * p * q))
n

## [1] 79.50989

library(readxl)
Base_Datos4 <- read_excel("Base_Datos4.xlsx")
View(Base_Datos4)

Edad_4 <- Base_Datos4$Edad
Edad_8 <- mean(Edad_4)
Edad_8

## [1] 38.75

#Interpretación de Resultados
#La edad promedio de la muestra es de 38.75

N_Hijos_3 <- Base_Datos4$`Número de hijos`
N_Hijos6 <- mean(N_Hijos_3)
N_Hijos6

## [1] 1.45

#Interpretación de Resultados
#El promedio de la muestra de numeros hijos es de 1.45

Estrato_ID1 <- Base_Datos4$Estrato
Estrato_12 <- mean(Estrato_ID1)
Estrato_12

## [1] 2.9875

#Interpretación de Resultados
#La mayoria de la muestra se encuentra en el estrato 3

#Desviación Standar

desviacion_Edad_4 <- sd(Edad_4)
desviacion_Edad_4

## [1] 11.25594

#Interpretación de Resultados
#Con un sd de 11.25 la mayoria de la edad se encuentra en este rango por arriba 
#o abajo de la media.

desviacion_Hijos_3 <- sd(N_Hijos_3)
desviacion_Hijos_3

## [1] 1.135169

#Interpretación de Resultados
#con un sd de 1.13, la mayoria esta en este rango de numeros de hijos por arriba
#o abajo de la media.

desviacion_Estrato1 <- sd(Estrato_ID1)
desviacion_Estrato1

## [1] 1.257824

#Interpretación de Resultados
#con un sd de 1.25, la mayoria de la muestra esta en este estrato socieconomico 
#por arriba o abajo de la media.


# Check the value of x using an if statement

if (Edad_6 != Edad_8) {
  print("Si hay sesgo en el estimador de Media de Edad")
} else {
  print("El estimador de media de Edad es insesgado")
}

## [1] "Si hay sesgo en el estimador de Media de Edad"

if (N_Hijos2 != N_Hijos6) {
  print("Si hay sesgo en el estimador de Media de Número de Hijos")
} else {
  print("El estimador de media de Número de Hijos es insesgado")
}

## [1] "Si hay sesgo en el estimador de Media de Número de Hijos"

if (Estrato_10 != Estrato_12) {
  print("Si hay sesgo en el estimador de Media de Estrato")
} else {
  print("El estimador de media de Estrato es insesgado")
}

## [1] "Si hay sesgo en el estimador de Media de Estrato"

library(readxl)
Base_Datos5 <- read_excel("Base_Datos5.xlsx")
View(Base_Datos5)


Edad_5 <- Base_Datos5$Edad
Edad_10 <- mean(Edad_5)
Edad_10

## [1] 39.25

N_Hijos_4 <- Base_Datos5$`Número de hijos`
N_Hijos8 <- mean(N_Hijos_4)
N_Hijos8

## [1] 1.4125

Estrato_ID2 <- Base_Datos5$Estrato
Estrato_15 <- mean(Estrato_ID2)
Estrato_15

## [1] 2.9875

#Desviación Standar

desviacion_Edad_5 <- sd(Edad_5)
desviacion_Edad_5

## [1] 10.79791

desviacion_Hijos_4 <- sd(N_Hijos_4)
desviacion_Hijos_4

## [1] 1.110294

desviacion_Estrato2 <- sd(Estrato_ID2)
desviacion_Estrato2

## [1] 1.257824

#Varianza

varianza_1 <- var(Edad_3)
varianza_1

## [1] 123.3794

varianza_2 <- var(Edad_4)
varianza_2

## [1] 126.6962

varianza_3 <- var(Edad_5)
varianza_3

## [1] 116.5949

if (varianza_2 < varianza_3) {
  print("Es eficiente")
} else {
  print("No es eficiente")
}

## [1] "No es eficiente"

#Interpretacion de Resultados

#Se presenta un sesgo medio eficiente lo que sugiere, que el valor esperado no presenta similitud con el valor real del parámetro, presentando varianza baja.

#Para este caso arroja ineficiencia en las varianzas, lo que nos sugiera que
#las estimaciones pueden fluctuar.

ESTIMACIÓN CONSISTENTE DE LA PROPORCIÓN

muestras4 <- Base_Datos4$Estrato
estimador_cons <- sum(muestras4) / length(muestras4)
print(estimador_cons)

## [1] 2.9875

Poblacion4 <- Base_Datos3$Estrato
estimador_cons <- sum(Poblacion4) / length(Poblacion4)
print(estimador_cons)

## [1] 2.99

#Interpretacion de Resultados

#La variable estrato presenta consistencia porque nos permite inferiir que a 
#medida que aumenta la muetra, esta se aproxima al valor real del parametro.

ESTIMACIÓN PUNTUAL

# Alturas de una muestra

Edad_E_puntual <- Base_Datos4$Edad

# Estimador puntual de la media

Edad_M_puntual <- mean(Edad_E_puntual)

# Imprimir el resultado

cat("Estimador Puntual de la Media:", Edad_M_puntual, "\n")

## Estimador Puntual de la Media: 38.75

## INTERVALO DE CONFIANZA

# Intervalo de confianza del 95% para la media

Intervalo_C <- t.test(Edad_E_puntual)$conf.int

# Imprimir el resultado

cat("Intervalo de Confianza del 95% para la Media:", Intervalo_C, "\n")

## Intervalo de Confianza del 95% para la Media: 36.24511 41.25489

#Interpretacion de Resultados
#La edad promedio de la poblacion es de 38.75 y el Intervalo de confianza sugiere que si hacemos estimaciones el valor real de la media estara en este rango
#36.24 41.25

# Generar una muestra de datos


datos <- rnorm(80, mean = 1.45, sd = 1.13)


# Función de verosimilitud para una distribución normal

log_likelihood <- function(par, data) {
  mu <- par[1]
  sigma <- par[2]
  -sum(dnorm(data, mean = mu, sd = sigma, log = TRUE))
}

# Encontrar estimadores de máxima verosimilitud

inicializacion <- c(mean(datos), sd(datos))
estimadores_mle <- optim(par = inicializacion, fn = log_likelihood, data = datos)

# Resultados

cat("Estimador MLE para la media:", estimadores_mle$par[1], "\n")

## Estimador MLE para la media: 1.306026

cat("Estimador MLE para la desviación estándar:", estimadores_mle$par[2], "\n")

## Estimador MLE para la desviación estándar: 1.247841

#Interpretacion de Resultados

#Como los resultados son iguales a la media y desviación estandar población, 
#Podemos concluir que se pueden inferir resultados de la muestra sobre la 
#Poblacion

Intervalo de Confianza para la Media

# Calcular el error estándar de la media

tamano_muestra <- length(Base_Datos4$Edad)
tamano_muestra

## [1] 80

error_estandar <- desviacion_Edad_4 / sqrt(tamano_muestra)
error_estandar

## [1] 1.258452

# Calcular el valor crítico de la distribución t

nivel_confianza <- 0.95
nivel_confianza

## [1] 0.95

valor_critico <- qt((1 + nivel_confianza) / 2, df = tamano_muestra - 1)
valor_critico

## [1] 1.99045

# Calcular el margen de error

margen_error <- valor_critico * error_estandar
margen_error

## [1] 2.504887

# Calcular el intervalo de confianza

intervalo_confianza <- c(Edad_8 - margen_error, Edad_8 + margen_error)
intervalo_confianza

## [1] 36.24511 41.25489

# Mostrar resultados

cat("Intervalo de confianza del", nivel_confianza * 100, "% para la media:", intervalo_confianza)

## Intervalo de confianza del 95 % para la media: 36.24511 41.25489

#Interpretacion de Resultados

#EL Intervalo de confianza del 95 % para la media de nuestra muestra de la
#variable edad es 36.34704 41.15296

##EJEMPLO

# De "100" personas encuestadas seleccionamos 80 al azar, y se registraron que 11 tienen 3 hijo

# Personas encuestadas

Hogar_1 <- 27
tamano_muestra <- 80
proporcion_Hogar_1 <- Hogar_1 / tamano_muestra
proporcion_Hogar_1

## [1] 0.3375

Intervalo de Confianza para la Proporción

calcular un intervalo de confianza del 95% para la proporción de clientes satisfechos

# Intervalo de confianza para la proporción

nivel_confianza <- 0.95

# Calcular el error estándar de la proporción

error_estandar_proporcion <- sqrt((proporcion_Hogar_1 * (1 - 
                    proporcion_Hogar_1)) / tamano_muestra)
error_estandar_proporcion

## [1] 0.05286702

# Calcular el valor crítico de la distribución normal estándar

valor_critico <- qnorm((1 + nivel_confianza) / 2)
valor_critico

## [1] 1.959964

# Calcular el margen de error

margen_error_proporcion <- valor_critico * error_estandar_proporcion
margen_error_proporcion

## [1] 0.1036175

# Calcular el intervalo de confianza

intervalo_confianza_proporcion <- c(proporcion_Hogar_1 - margen_error_proporcion, proporcion_Hogar_1 + margen_error_proporcion)
intervalo_confianza_proporcion

## [1] 0.2338825 0.4411175

# Mostrar resultados

cat("Intervalo de confianza del", nivel_confianza * 100, "% para la proporción de Hogar con 1 hijo:", intervalo_confianza_proporcion)

## Intervalo de confianza del 95 % para la proporción de Hogar con 1 hijo: 0.2338825 0.4411175

#Interpretacion de Resultados

#El Intervalo de confianza del 95 % para la proporción proporción de Hogar con 1 
#hijo: 0.2338825 0.441117

##EJEMPLO

# De "100" personas encuestadas seleccionamos 80 al azar, y se registraron que 11 tienen 3 hijo

# Personas encuestadas

Hogar_3 <- 11
tamano_muestra <- 80
proporcion_Hogar_3 <- Hogar_3 / tamano_muestra
proporcion_Hogar_3

## [1] 0.1375

# Calcular el intervalo de confianza para la proporción

nivel_confianza <- 0.95

# Calcular el error estándar de la proporción

error_estandar_proporcion3 <- sqrt((proporcion_Hogar_3 * (1 - 
                    proporcion_Hogar_3)) / tamano_muestra)
error_estandar_proporcion3

## [1] 0.03850223

# Calcular el valor crítico de la distribución normal estándar

valor_critico3 <- qnorm((1 + nivel_confianza) / 2)
valor_critico3

## [1] 1.959964

# Calcular el margen de error

margen_error_proporcion3 <- valor_critico3 * error_estandar_proporcion3
margen_error_proporcion3

## [1] 0.07546299

# Calcular el intervalo de confianza

intervalo_confianza_proporcion3<- c(proporcion_Hogar_3 - margen_error_proporcion3, proporcion_Hogar_3 + margen_error_proporcion3)
intervalo_confianza_proporcion3

## [1] 0.06203701 0.21296299

# Mostrar resultados

cat("Intervalo de confianza del", nivel_confianza * 100, "% para la proporción de Hogar con 3 hijo:", intervalo_confianza_proporcion3)

## Intervalo de confianza del 95 % para la proporción de Hogar con 3 hijo: 0.06203701 0.212963

#Interpretacion de Resultados
#El Intervalo de confianza del 95 % para la proporción proporción de Hogar con 3 
#hijo: 0.06203701 0.212963

Estrato_ID1 <- Base_Datos4$Estrato
Estrato_12 <- mean(Estrato_ID1)
Estrato_12

## [1] 2.9875

desviacion_Estrato1 <- sd(Estrato_ID1)
desviacion_Estrato1

## [1] 1.257824

Estrato_ID2 <- Base_Datos5$Estrato
Estrato_15 <- mean(Estrato_ID2)
Estrato_15

## [1] 2.9875

desviacion_Estrato2 <- sd(Estrato_ID2)
desviacion_Estrato2

## [1] 1.257824

tamaño_muestra_1 <- length(Base_Datos4$Estrato)
tamaño_muestra_1

## [1] 80

tamaño_muestra_2 <- length(Base_Datos5$Estrato)
tamaño_muestra_2

## [1] 80

# Error estándar de la diferencia de medias

error_estandar_diferencia <- sqrt((desviacion_Estrato1^2 / tamaño_muestra_1) + (desviacion_Estrato2^2 / tamaño_muestra_2))
error_estandar_diferencia

## [1] 0.1988794

# Valor crítico de la distribución t

nivel_confianza_2<-0.95
valor_critico_2 <- qt((1 + nivel_confianza_2) / 2, df = tamaño_muestra_1 + tamaño_muestra_2 - 2)
valor_critico_2

## [1] 1.975092

# Margen de error

margen_error_diferencia <- valor_critico_2 * error_estandar_diferencia
margen_error_diferencia

## [1] 0.3928051

# Intervalo de confianza para la diferencia de medias

intervalo_confianza_diferencia <- c((Estrato_12 - Estrato_15) - margen_error_diferencia, (Estrato_12 - Estrato_15) + margen_error_diferencia)
intervalo_confianza_diferencia

## [1] -0.3928051  0.3928051

# Mostrar resultado

cat("Intervalo de confianza del", nivel_confianza_2 * 100, "% para la diferencia de medias:", intervalo_confianza_diferencia)

## Intervalo de confianza del 95 % para la diferencia de medias: -0.3928051 0.3928051

diferencia_media<-Estrato_12 - Estrato_15
diferencia_media

## [1] 0

#Interpretacion de Resultados

#Bajo este nivel No se puede inferir un 95% de confianza entre las medias de las 
#variables

INFORME FINAL

INTRODUCCIÓN

En una población de estudiantes de una universidad se quiere saber si los niveles de estres estan asociados al sexo de los estudiantes.

DESCRIPCIÓN DE DATOS - PRUEBA DE HIPOTESIS

Los niveles de estrés en los estudiantes de una universidad presentan asociación con el sexo.

METODOLOGÍA

Una vez recopilada la base de datos se procedio a verificar la normalidad de nuestros datos mediante que el grafico de Q-Q plot y la prueba de Kolmogorov-Smirnov y graficos de barras para las variables categoricas. Para determinar la asociacion entre el sexo y los niveles de estrés se utilizo la prueba no parametrica chi cuadradro.

POBLACIÓN

200 estudiantes de una universidad.

SELECCIÓN DE LA MUESTRA

Se trabajo con el total de la población

TIPOS DE VARIABLES: parametros - estimaciones

Variables categóricas y discretas

PRUEBA DE HIPOTESIS

Estudio de estrés en estudiantes de una especialización de estadística de una universidad pública, en función del sexo

H₀: Los grados de estrés en los estudiantes de la especialización en estadística no difieren de manera significativa entre hombres y mujeres.
H₁: Los grados de estrés en los estudiantes de la especialización en estadística difieren de manera significativa entre hombres y mujeres.

n_estudiantes <- 200  

sexo <- sample(c("Masculino", "Femenino"), n_estudiantes, replace = TRUE)

edad <- sample(20:30, n_estudiantes, replace = TRUE)

cantidad_materias <- sample(4:8, n_estudiantes, replace = TRUE)

ingresos <- sample(1000000:3000000, n_estudiantes, replace = TRUE)

estres <- sample(c("Bajo", "Moderado", "Alto"), n_estudiantes, replace = TRUE,
                 prob = c(0.3, 0.4, 0.3))

base_datos_prueba_hipotesis <- data.frame(ID_Estudiante = 1:n_estudiantes, 
                         Sexo = sexo, 
                         Edad = edad, 
                         Cantidad_de_Materias = cantidad_materias, 
                         Ingresos = ingresos, 
                         Estres = estres)

print(base_datos_prueba_hipotesis)

##     ID_Estudiante      Sexo Edad Cantidad_de_Materias Ingresos   Estres
## 1               1  Femenino   29                    7  1081269     Bajo
## 2               2  Femenino   24                    4  1341064 Moderado
## 3               3  Femenino   29                    6  2319146 Moderado
## 4               4  Femenino   28                    5  1173592     Alto
## 5               5  Femenino   22                    6  1586162     Alto
## 6               6 Masculino   29                    8  1059074 Moderado
## 7               7 Masculino   23                    4  1135238     Alto
## 8               8  Femenino   29                    4  2255396 Moderado
## 9               9  Femenino   26                    5  2592091     Alto
## 10             10 Masculino   30                    4  2736308 Moderado
## 11             11 Masculino   25                    8  2249394     Alto
## 12             12 Masculino   26                    4  1499380     Alto
## 13             13 Masculino   25                    8  2763195     Bajo
## 14             14 Masculino   22                    7  2389680 Moderado
## 15             15 Masculino   29                    8  2560793     Bajo
## 16             16  Femenino   30                    5  2567912     Bajo
## 17             17  Femenino   20                    5  1623994 Moderado
## 18             18 Masculino   20                    7  1872880 Moderado
## 19             19 Masculino   28                    7  2746154     Alto
## 20             20  Femenino   29                    5  2962195 Moderado
## 21             21  Femenino   28                    7  1043431     Bajo
## 22             22  Femenino   29                    7  2841081 Moderado
## 23             23 Masculino   28                    6  2309509 Moderado
## 24             24  Femenino   20                    8  1776334     Alto
## 25             25 Masculino   30                    6  1207570     Alto
## 26             26 Masculino   26                    8  1378861     Bajo
## 27             27  Femenino   25                    8  2102765     Bajo
## 28             28 Masculino   20                    7  1417247     Alto
## 29             29  Femenino   26                    6  1325526 Moderado
## 30             30 Masculino   30                    6  2911050     Alto
## 31             31 Masculino   23                    5  2301790     Alto
## 32             32  Femenino   30                    6  2777913 Moderado
## 33             33 Masculino   23                    5  1644647 Moderado
## 34             34  Femenino   21                    7  2828115     Bajo
## 35             35  Femenino   24                    4  2527831 Moderado
## 36             36 Masculino   23                    8  1337837     Bajo
## 37             37  Femenino   23                    8  2366496 Moderado
## 38             38  Femenino   21                    8  2649616     Alto
## 39             39  Femenino   20                    5  2863193 Moderado
## 40             40  Femenino   26                    6  1223761 Moderado
## 41             41 Masculino   21                    5  1176297     Alto
## 42             42 Masculino   26                    7  2382817     Alto
## 43             43  Femenino   28                    6  2301383 Moderado
## 44             44  Femenino   27                    8  2606417 Moderado
## 45             45  Femenino   21                    6  2363755 Moderado
## 46             46  Femenino   20                    4  2832186 Moderado
## 47             47 Masculino   24                    6  2773026     Alto
## 48             48  Femenino   30                    7  1646577 Moderado
## 49             49  Femenino   20                    5  1202281     Bajo
## 50             50  Femenino   23                    7  1002025     Bajo
## 51             51 Masculino   26                    8  2356824     Bajo
## 52             52 Masculino   20                    7  1881737     Alto
## 53             53  Femenino   20                    5  2636290     Alto
## 54             54  Femenino   21                    7  2397229 Moderado
## 55             55  Femenino   30                    7  2717806     Bajo
## 56             56  Femenino   27                    4  1239033     Bajo
## 57             57 Masculino   21                    4  2005555 Moderado
## 58             58  Femenino   29                    5  2025919 Moderado
## 59             59 Masculino   26                    5  2495827     Bajo
## 60             60  Femenino   20                    4  1154460 Moderado
## 61             61 Masculino   25                    4  1336857 Moderado
## 62             62  Femenino   21                    5  1925380     Bajo
## 63             63 Masculino   25                    7  2090916     Bajo
## 64             64  Femenino   25                    6  1219034     Alto
## 65             65 Masculino   27                    7  1742346     Alto
## 66             66 Masculino   29                    6  1618040     Bajo
## 67             67  Femenino   30                    6  2157399 Moderado
## 68             68 Masculino   20                    7  1485820 Moderado
## 69             69  Femenino   23                    8  1910743     Bajo
## 70             70  Femenino   25                    5  1319818 Moderado
## 71             71 Masculino   20                    6  1781730     Bajo
## 72             72 Masculino   30                    8  2074064     Bajo
## 73             73 Masculino   24                    6  1674206 Moderado
## 74             74 Masculino   26                    5  1710581 Moderado
## 75             75  Femenino   26                    8  2454226     Bajo
## 76             76  Femenino   28                    7  2122339     Alto
## 77             77  Femenino   26                    4  1112855     Bajo
## 78             78  Femenino   30                    5  1930539     Alto
## 79             79  Femenino   20                    6  1311083     Alto
## 80             80  Femenino   25                    5  2376080     Alto
## 81             81 Masculino   26                    7  2814526 Moderado
## 82             82 Masculino   30                    6  1956553     Alto
## 83             83 Masculino   28                    5  2105900     Bajo
## 84             84  Femenino   29                    4  2214745     Alto
## 85             85  Femenino   28                    4  1876667     Bajo
## 86             86  Femenino   30                    4  1856678     Bajo
## 87             87 Masculino   28                    5  1961109     Alto
## 88             88 Masculino   25                    8  2594648 Moderado
## 89             89  Femenino   30                    5  2204330     Alto
## 90             90 Masculino   20                    5  1238135     Alto
## 91             91  Femenino   27                    8  2396528     Alto
## 92             92  Femenino   23                    4  1271375     Alto
## 93             93 Masculino   27                    6  2109487 Moderado
## 94             94 Masculino   29                    4  2750344     Alto
## 95             95 Masculino   26                    4  2016305     Alto
## 96             96  Femenino   28                    5  1081726 Moderado
## 97             97  Femenino   29                    7  1799071 Moderado
## 98             98 Masculino   29                    5  1458617 Moderado
## 99             99  Femenino   25                    7  2889354     Alto
## 100           100  Femenino   22                    5  2705217 Moderado
## 101           101 Masculino   26                    8  2069417 Moderado
## 102           102 Masculino   25                    7  2138574     Alto
## 103           103  Femenino   28                    8  2517941     Bajo
## 104           104  Femenino   20                    7  2087455 Moderado
## 105           105  Femenino   26                    8  2472534     Bajo
## 106           106 Masculino   26                    8  1065317 Moderado
## 107           107 Masculino   21                    7  2913626     Alto
## 108           108  Femenino   30                    8  2403942 Moderado
## 109           109  Femenino   25                    6  1950672 Moderado
## 110           110  Femenino   25                    8  2521198 Moderado
## 111           111 Masculino   27                    5  2397687     Alto
## 112           112 Masculino   20                    7  2482116 Moderado
## 113           113 Masculino   26                    7  2257282 Moderado
## 114           114  Femenino   29                    8  1787194 Moderado
## 115           115 Masculino   21                    4  2506621     Bajo
## 116           116  Femenino   21                    4  1569997 Moderado
## 117           117 Masculino   23                    5  1522226 Moderado
## 118           118  Femenino   25                    6  2443189 Moderado
## 119           119 Masculino   26                    7  1659890     Bajo
## 120           120  Femenino   22                    7  1406426 Moderado
## 121           121  Femenino   28                    8  2637779 Moderado
## 122           122 Masculino   20                    8  2672291 Moderado
## 123           123 Masculino   22                    7  2999863     Alto
## 124           124 Masculino   27                    8  1150825     Alto
## 125           125 Masculino   29                    8  2397956     Alto
## 126           126 Masculino   24                    5  2872309     Alto
## 127           127 Masculino   20                    6  1552057     Alto
## 128           128 Masculino   21                    7  2175710     Bajo
## 129           129 Masculino   21                    6  1525946 Moderado
## 130           130  Femenino   22                    5  2264857     Bajo
## 131           131 Masculino   28                    4  2173305 Moderado
## 132           132 Masculino   30                    4  1987288     Bajo
## 133           133 Masculino   29                    4  2440714     Bajo
## 134           134 Masculino   21                    4  2336073     Bajo
## 135           135 Masculino   30                    7  2355427 Moderado
## 136           136  Femenino   22                    4  1524835     Bajo
## 137           137 Masculino   29                    8  1052154     Alto
## 138           138  Femenino   23                    4  1259292     Alto
## 139           139 Masculino   29                    8  1452065     Bajo
## 140           140 Masculino   20                    8  2586287     Alto
## 141           141 Masculino   30                    8  1860979     Bajo
## 142           142 Masculino   27                    8  2705734     Alto
## 143           143 Masculino   22                    4  2239841 Moderado
## 144           144 Masculino   20                    4  1697114     Bajo
## 145           145 Masculino   23                    7  2006872 Moderado
## 146           146  Femenino   29                    7  1359781     Bajo
## 147           147 Masculino   26                    4  1890426 Moderado
## 148           148  Femenino   23                    6  2608005     Bajo
## 149           149 Masculino   27                    8  1294315 Moderado
## 150           150  Femenino   28                    5  2753626     Alto
## 151           151 Masculino   30                    8  1836039     Alto
## 152           152 Masculino   27                    7  1511874 Moderado
## 153           153  Femenino   29                    7  1264701     Alto
## 154           154  Femenino   29                    4  2861436 Moderado
## 155           155  Femenino   24                    6  1789262     Alto
## 156           156  Femenino   23                    7  1742909 Moderado
## 157           157 Masculino   30                    7  2805744 Moderado
## 158           158 Masculino   26                    6  2678320     Bajo
## 159           159  Femenino   24                    8  1573108     Bajo
## 160           160 Masculino   29                    8  1930717 Moderado
## 161           161 Masculino   29                    8  1390746 Moderado
## 162           162 Masculino   21                    4  1283093     Bajo
## 163           163 Masculino   22                    7  2625690     Bajo
## 164           164 Masculino   28                    5  1311308     Bajo
## 165           165  Femenino   25                    8  2863977     Bajo
## 166           166 Masculino   25                    8  2446962     Bajo
## 167           167  Femenino   22                    5  1075895 Moderado
## 168           168 Masculino   30                    4  1460519     Bajo
## 169           169 Masculino   30                    7  1286891 Moderado
## 170           170  Femenino   29                    5  1623901     Bajo
## 171           171 Masculino   30                    8  1489406     Alto
## 172           172  Femenino   20                    4  1925260     Alto
## 173           173  Femenino   27                    4  2253703     Alto
## 174           174  Femenino   23                    5  2362847 Moderado
## 175           175  Femenino   20                    7  2146462     Alto
## 176           176 Masculino   21                    5  1325447 Moderado
## 177           177 Masculino   23                    8  1956202 Moderado
## 178           178  Femenino   21                    7  2078822 Moderado
## 179           179 Masculino   20                    4  1112058     Bajo
## 180           180 Masculino   27                    8  1158549     Alto
## 181           181 Masculino   23                    8  1110014 Moderado
## 182           182 Masculino   22                    8  1663005     Alto
## 183           183 Masculino   22                    5  2269922 Moderado
## 184           184  Femenino   20                    5  1241914     Alto
## 185           185 Masculino   29                    5  2119178     Alto
## 186           186  Femenino   25                    4  1977886 Moderado
## 187           187  Femenino   28                    8  2186835     Alto
## 188           188 Masculino   26                    5  1223480     Bajo
## 189           189  Femenino   26                    7  2506030 Moderado
## 190           190 Masculino   24                    6  1673204     Bajo
## 191           191  Femenino   29                    8  2570296     Alto
## 192           192  Femenino   25                    6  2180953 Moderado
## 193           193  Femenino   26                    8  1153512     Alto
## 194           194 Masculino   22                    6  2169261     Alto
## 195           195  Femenino   27                    8  1070991 Moderado
## 196           196  Femenino   30                    8  2167533     Alto
## 197           197  Femenino   22                    6  2123831 Moderado
## 198           198  Femenino   22                    8  2644162     Bajo
## 199           199  Femenino   23                    5  2194438 Moderado
## 200           200 Masculino   21                    8  2159658 Moderado

RESULTADOS

DESCRIPCIÓN DE LOS DATOS

media_hipotesis <- mean(base_datos_prueba_hipotesis$Edad)
media_hipotesis

## [1] 25.205

desviacion_hipotesis <- sd(base_datos_prueba_hipotesis$Edad)
desviacion_hipotesis

## [1] 3.38827

edad_hipotesis <- rnorm(200, mean = media_hipotesis, sd = desviacion_hipotesis)

# Q-Q Plot

#Nota: Para el el grafico Q-Q plot se tomo la variable edad, debido a que la variable de estudio, sexo y nivel de estres son categoricas

qqnorm(edad_hipotesis)
qqline(edad_hipotesis, col = "red")

#Interpretacion de Resultados
#Como se puede observar la mayoria de los puntos de centran cerca de la linea
#roja, indicandonos que la variable edad presenta una distribucion normal
#aceptable. 

#Prueba Kolmogorov-Smirnov


Kolmogorov_hipotesis <- ks.test(base_datos_prueba_hipotesis$Edad, "pnorm", mean = media_hipotesis, sd = desviacion_hipotesis)

## Warning in ks.test.default(base_datos_prueba_hipotesis$Edad, "pnorm", mean =
## media_hipotesis, : ties should not be present for the one-sample
## Kolmogorov-Smirnov test

Kolmogorov_hipotesis

## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  base_datos_prueba_hipotesis$Edad
## D = 0.12029, p-value = 0.006131
## alternative hypothesis: two-sided

#Interpretacion de Resultados
#Como la prueba de Kolmogorov-Smirnov dio como resultado 0.01141, nos indica 
#que la variable edad se distribuye de forma normal

#Se realizara un Diagrama de Barras de las variables categoricas, sexo y nivel de 
#estres para mirar su distribución.

sexo <- sample(c("M", "F"), size = 200, replace = TRUE)


sexo_factor <- factor(base_datos_prueba_hipotesis$Sexo)

# Diagrama de Barras

barplot(table(sexo_factor), main = "Diagrama de Barras", col = c("blue", "pink"), 
        xlab = "Sexo", ylab = "Frecuencia", border = "black")

#Interpretación de Resultados
#La mayoria de la población de estudio pertenece al sexo Masculino.

#Nivel de Estres

estres <- sample(c("B", "M", "A"), size = 200, replace = TRUE)


estres_factor <- factor(base_datos_prueba_hipotesis$Estres)

# Diagrama de Barras

barplot(table(estres_factor), main = "Diagrama de Barras", col = c("blue", "green", "red"),
                                                                    
        xlab = "estres", ylab = "Frecuencia", border = "black")

#Interpretacion de Resultados
#La mayoria de los estudiantes, presentaron niveles de estres moderados.