1) Base de datos y variable de comparación

Se emplea un subconjunto del conjunto de datos con dos variables cuantitativas (petal_length, petal_width) y una variable cualitativa (species). La base permite comparar métricas entre dos categorías de species (setosa y versicolor).

2) Indicadores estadísticos por especie

Estadísticos descriptivos por especie
species petal_length_media petal_length_mediana petal_length_sd petal_width_media petal_width_mediana petal_width_sd
setosa 1.46 1.50 0.17 0.25 0.2 0.11
versicolor 4.26 4.35 0.47 1.33 1.3 0.20

Comentario (breve): En promedio, una de las especies tiende a mostrar pétalos más largos/anchos; la desviación estándar indica la variabilidad dentro de cada grupo.

3) Relación lineal entre variables cuantitativas

El coeficiente de correlación entre petal_length y petal_width es 0.98, indicando una relación lineal positiva y de magnitud suficiente para el objetivo del proyecto.

4) Gráficos estadísticos

Histograma por especie (longitud del pétalo)

Dispersión (longitud vs. ancho del pétalo)

5) Diagrama de cajas (longitud del pétalo)

df <- readr::read_delim( “C:/Users/ghhg5/OneDrive/Escritorio/iris_dataset estadistica aplicada.csv”, delim = “;”, show_col_types = FALSE )

Conclusión breve

La base seleccionada cumple con el requisito de comparar variables cuantitativas según una variable cualitativa con dos categorías. Los indicadores y gráficos muestran diferencias entre especies y una relación lineal entre petal_length y petal_width con correlación 0.98.

6) Intervalos de confianza y pruebas de hipótesis

A continuación se presentan los análisis requeridos sobre intervalos de confianza (IC) y pruebas de hipótesis, considerando las dos variables cuantitativas (petal_length, petal_width) y la variable cualitativa (species).

6.1 Estimaciones puntuales e intervalos de confianza por variable

Estimaciones puntuales e intervalos de confianza (toda la muestra)
Variable Media Desviación Estándar IC 95% Inferior IC 95% Superior
Petal Length 2.861 1.450 2.573 3.149
Petal Width 0.786 0.565 0.674 0.898
Intervalos de confianza de Petal Length por especie
species n media_length sd_length error_length IC_inf IC_sup
setosa 50 1.462 0.174 0.049 1.413 1.511
versicolor 50 4.260 0.470 0.134 4.126 4.394
Intervalo de confianza para la diferencia de medias (dos poblaciones)
Comparación Diferencia de medias IC 95% Inferior IC 95% Superior
Setosa - Versicolor (Petal Length) -2.798 -2.939 -2.657
Proporción por especie con intervalos de confianza al 95%
species n Proporción IC_inf IC_sup
setosa 50 0.5 0.404 0.596
versicolor 50 0.5 0.404 0.596
## 
##  One Sample t-test
## 
## data:  iris_dos$petal_length
## t = -0.95892, df = 99, p-value = 0.3399
## alternative hypothesis: true mean is not equal to 3
## 95 percent confidence interval:
##  2.573378 3.148622
## sample estimates:
## mean of x 
##     2.861
## 
##  Two Sample t-test
## 
## data:  petal_length by species
## t = -39.493, df = 98, p-value < 2.2e-16
## alternative hypothesis: true difference in means between group setosa and group versicolor is not equal to 0
## 95 percent confidence interval:
##  -2.938597 -2.657403
## sample estimates:
##     mean in group setosa mean in group versicolor 
##                    1.462                    4.260