Se emplea un subconjunto del conjunto de datos con dos
variables cuantitativas (petal_length,
petal_width) y una variable cualitativa
(species). La base permite comparar métricas entre
dos categorías de species (setosa
y versicolor).
| species | petal_length_media | petal_length_mediana | petal_length_sd | petal_width_media | petal_width_mediana | petal_width_sd |
|---|---|---|---|---|---|---|
| setosa | 1.46 | 1.50 | 0.17 | 0.25 | 0.2 | 0.11 |
| versicolor | 4.26 | 4.35 | 0.47 | 1.33 | 1.3 | 0.20 |
Comentario (breve): En promedio, una de las especies tiende a mostrar pétalos más largos/anchos; la desviación estándar indica la variabilidad dentro de cada grupo.
El coeficiente de correlación entre petal_length y
petal_width es 0.98, indicando una
relación lineal positiva y de magnitud
suficiente para el objetivo del proyecto.
df <- readr::read_delim( “C:/Users/ghhg5/OneDrive/Escritorio/iris_dataset estadistica aplicada.csv”, delim = “;”, show_col_types = FALSE )
La base seleccionada cumple con el requisito de comparar
variables cuantitativas según una variable
cualitativa con dos categorías. Los indicadores y gráficos
muestran diferencias entre especies y una relación lineal entre
petal_length y petal_width con
correlación 0.98.
A continuación se presentan los análisis requeridos sobre
intervalos de confianza (IC) y pruebas de
hipótesis, considerando las dos variables cuantitativas
(petal_length, petal_width) y la variable
cualitativa (species).
| Variable | Media | Desviación Estándar | IC 95% Inferior | IC 95% Superior |
|---|---|---|---|---|
| Petal Length | 2.861 | 1.450 | 2.573 | 3.149 |
| Petal Width | 0.786 | 0.565 | 0.674 | 0.898 |
| species | n | media_length | sd_length | error_length | IC_inf | IC_sup |
|---|---|---|---|---|---|---|
| setosa | 50 | 1.462 | 0.174 | 0.049 | 1.413 | 1.511 |
| versicolor | 50 | 4.260 | 0.470 | 0.134 | 4.126 | 4.394 |
| Comparación | Diferencia de medias | IC 95% Inferior | IC 95% Superior |
|---|---|---|---|
| Setosa - Versicolor (Petal Length) | -2.798 | -2.939 | -2.657 |
| species | n | Proporción | IC_inf | IC_sup |
|---|---|---|---|---|
| setosa | 50 | 0.5 | 0.404 | 0.596 |
| versicolor | 50 | 0.5 | 0.404 | 0.596 |
##
## One Sample t-test
##
## data: iris_dos$petal_length
## t = -0.95892, df = 99, p-value = 0.3399
## alternative hypothesis: true mean is not equal to 3
## 95 percent confidence interval:
## 2.573378 3.148622
## sample estimates:
## mean of x
## 2.861
##
## Two Sample t-test
##
## data: petal_length by species
## t = -39.493, df = 98, p-value < 2.2e-16
## alternative hypothesis: true difference in means between group setosa and group versicolor is not equal to 0
## 95 percent confidence interval:
## -2.938597 -2.657403
## sample estimates:
## mean in group setosa mean in group versicolor
## 1.462 4.260