1. Revisar los datos

En la tabla de datos disponible aquí se encuentran datos de las estaturas de un grupo anterior de la especialización en estadística aplicada

2. Estimación de parámetros

Estime la media, desviación estándar de cada género y la proporción de hombres y mujeres del curso.

library(readxl)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
df <- read_excel("taller3.xlsx") #Carga de los datos
df_hombres <- df %>% filter(df$Genero == 0) # Hombres
df_mujeres <- df %>%  filter(Genero == 1) # Mujeres

Media Hombres.

t.test(df_hombres$Estatura,var.equal = F,conf.level = 0.95)
## 
##  One Sample t-test
## 
## data:  df_hombres$Estatura
## t = 148.39, df = 15, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  171.5007 176.4993
## sample estimates:
## mean of x 
##       174

La estatura de los Hombres que estudian estadistica aplicada se encuentra entre \((171.50 , 176.49)\) con un nivel de confianza del 95%.

Media mujeres:

t.test(df_mujeres$Estatura,var.equal = F,conf.level = 0.95)
## 
##  One Sample t-test
## 
## data:  df_mujeres$Estatura
## t = 78.471, df = 5, p-value = 6.368e-09
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  156.3707 166.9626
## sample estimates:
## mean of x 
##  161.6667

La estatura de las mujeres que cursan la especializacion en estadistica aplicada se encuentra entre \((156.37,166.96)\) con un nivel de confianza del 95%

Varianza hombres:

'sd^2' = var(df_hombres$Estatura)
n=  length(df_hombres$Estatura)
alfhaMedios= 0.05/2
ls2 = ((n-1)*`sd^2`)/qchisq(alfhaMedios,df = (n-1))
li2 = ((n-1)*`sd^2`)/qchisq(1-alfhaMedios,df = (n-1) )

Varianza Mujeres:

'sdm^2' = var(df_mujeres$Estatura)
nm=  length(df_mujeres$Estatura)
alfhaMedios= 0.05/2
lsm2 = ((nm-1)*`sd^2`)/qchisq(alfhaMedios,df = (n-1))
lim2 = ((nm-1)*`sd^2`)/qchisq(1-alfhaMedios,df = (n-1))

3. Hipótesis

Escriba la hipótesis nula y alternativa de la estatura de cada género con referencia al artículo del Tiempo.

\[ H_o: \mu = 176 \\ H_a: \mu \neq176 \]

\[ H_o: \mu = 160 \\ H_a: \mu \neq 160 \]

Realizar los respectivos contrastes y concluir:

Para Hombres:

t.test(df_hombres$Estatura,mu = 176,var.equal = F,conf.level = 0.95,alternative = "t")
## 
##  One Sample t-test
## 
## data:  df_hombres$Estatura
## t = -1.7056, df = 15, p-value = 0.1087
## alternative hypothesis: true mean is not equal to 176
## 95 percent confidence interval:
##  171.5007 176.4993
## sample estimates:
## mean of x 
##       174

Existe evidencia suficiente para rechar la hipotesis de que la media de estatura de los hombres es diferente a

t.test(df_mujeres$Estatura,mu = 160,var.equal = F,conf.level = 0.95,alternative = "t")
## 
##  One Sample t-test
## 
## data:  df_mujeres$Estatura
## t = 0.80898, df = 5, p-value = 0.4553
## alternative hypothesis: true mean is not equal to 160
## 95 percent confidence interval:
##  156.3707 166.9626
## sample estimates:
## mean of x 
##  161.6667

No existe evidencia suficiente para rechar la hipotesis nula, por lo tanto no podemos concluir si es verdadero o no.

4 .Hipótesis diferencia de estatura entre géneros

Ahora ponga a prueba la hipótesis de diferencia de altura de ambos géneros en el curso. para ver si la altura media de las mujeres es igual a la altura media de los hombres.

\[ H_o: muH \neq muM \\ H_a: muH = muM \]

Concluya y escriba las consecuencias de la decisión

t.test(df_hombres$Estatura,df_mujeres$Estatura,alternative = "t",var.equal = F,conf.level = 0.95)
## 
##  Welch Two Sample t-test
## 
## data:  df_hombres$Estatura and df_mujeres$Estatura
## t = 5.2028, df = 8.468, p-value = 0.0006835
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##   6.919012 17.747654
## sample estimates:
## mean of x mean of y 
##  174.0000  161.6667

5. Cáncer de mama

Considere el conjunto de datos en Kaggle sobre Datos reales sobre el cáncer de mama aquí