Instrucciones generales. Este taller tiene tres módulos. En el Módulo 1 usted elige 10 especies de un país a su elección y completa los bloques marcados con >>> ESTUDIANTE. Los módulos 2 y 3 tienen datos incluidos y son completamente reproducibles sin modificaciones. Ejecute cada bloque en orden, analice los resultados y responda las preguntas de interpretación al final de cada sección.



1 Módulo 3 — Diseño de experimenatos: ANOVA y post-ANOVA

1.1 Contexto biológico — pingüinos del archipiélago Palmer

El dataset Palmer Penguins contiene medidas morfológicas de tres especies de pingüinos (Adelie, Gentoo, Chinstrap) en tres islas de la Antártida. Está disponible directamente desde CRAN con palmerpenguins.

Pregunta de investigación: ¿Difiere significativamente la masa corporal entre especies? ¿Existe interacción entre especie e isla?

1.2 Datos y exploración

## Dimensiones: 333 × 8
##            
##             Biscoe Dream Torgersen
##   Adelie        44    55        47
##   Chinstrap      0    68         0
##   Gentoo       119     0         0

En la gráfica de masa corporal por especie se observa una separación clara entre los grupos. La especie Gentoo presenta valores de masa considerablemente mayores, con una distribución centrada alrededor de los 5000 g, mientras que Adelie y Chinstrap muestran masas más bajas y bastante similares entre sí, alrededor de 3500–3800 g. Aunque hay cierto solapamiento entre Adelie y Chinstrap, Gentoo se distingue claramente, lo que sugiere diferencias marcadas en tamaño corporal entre especies.

En la gráfica de masa por isla y especie se evidencia que esta diferencia está fuertemente influenciada por la distribución de las especies en las islas. Gentoo aparece únicamente en Biscoe y mantiene masas altas, mientras que Chinstrap se observa solo en Dream y presenta valores similares a Adelie. Adelie, al estar presente en las tres islas, muestra una variabilidad más amplia. Esto sugiere que el efecto de la isla no es independiente de la especie, anticipando una posible interacción entre ambos factores.

1.3 Verificación de supuestos

Shapiro-Wilk por especie — H₀: distribución normal
especie n media_g sd_g W p_shapiro normal
Adelie 146 3706.2 458.6 0.9812 0.0423 No ✗
Chinstrap 68 3733.1 384.3 0.9845 0.5605 Sí ✓
Gentoo 119 5092.4 501.5 0.9861 0.2605 Sí ✓
## 
## Prueba de Levene — H₀: varianzas iguales entre grupos
## # A tibble: 1 × 4
##     df1   df2 statistic       p
##   <int> <int>     <dbl>   <dbl>
## 1     2   330      5.13 0.00637

En general, las tres especies siguen una distribución aproximadamente normal, ya que la mayoría de los puntos se alinean con la recta teórica. Sin embargo, se observan ligeras desviaciones en los extremos, especialmente en Gentoo, lo que sugiere la presencia de valores más extremos o colas algo más pesadas, aunque no lo suficientemente marcadas como para invalidar el supuesto de normalidad.

Por otro lado, la prueba de Levene arroja un p-valor de 0.006, lo que indica que las varianzas entre grupos no son homogéneas. Esto implica que, aunque la normalidad se cumple razonablemente bien, el supuesto de homocedasticidad se viola. Aun así, dado el tamaño de muestra relativamente grande y la robustez del ANOVA frente a desviaciones moderadas de este supuesto, los resultados pueden interpretarse con precaución.

1.4 ANOVA de dos vías con interacción

##              Df    Sum Sq  Mean Sq F value Pr(>F)    
## especie       2 145190219 72595110 339.833 <2e-16 ***
## isla          2      2064     1032   0.005  0.995    
## Residuals   328  70067383   213620                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Tabla ANOVA de dos vías — masa corporal (especie × isla)
Fuente gl SC CM F p-valor Sig.
especie 2 1.451902e+08 72595109.557 339.8328 0.0000 ***
isla 2 2.063697e+03 1031.848 0.0048 0.9952 ns
Residuals 328 7.006738e+07 213620.070 NA NA ns
Note:
*** p<0.001 ** p<0.01 * p<0.05 . p<0.10 ns = no significativo

El análisis de varianza muestra que la masa corporal difiere significativamente entre especies (F = 339.83, p < 0.001), lo que indica que existen diferencias claras en el tamaño corporal de los pingüinos. Esto sugiere un efecto biológico fuerte asociado a las características propias de cada especie, siendo este factor el principal responsable de la variación observada en los datos.

Por otro lado, la isla no presenta un efecto significativo sobre la masa corporal (p = 0.995), lo que indica que la ubicación geográfica no influye en este rasgo. Asimismo, no se evidencia una interacción relevante entre especie e isla, lo que implica que las diferencias de masa entre especies se mantienen consistentes independientemente de la isla donde habitan.

1.5 Post-ANOVA: comparaciones múltiples

Cuando el ANOVA es significativo, las comparaciones múltiples identifican qué pares de grupos difieren.

##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = masa_g ~ especie * isla, data = pinguinos)
## 
## $especie
##                        diff       lwr       upr     p adj
## Chinstrap-Adelie   26.92385 -132.8397  186.6874 0.9169133
## Gentoo-Adelie    1386.27259 1251.8801 1520.6650 0.0000000
## Gentoo-Chinstrap 1359.34874 1193.9262 1524.7713 0.0000000

Tukey por isla (especie dentro de isla)
contrast isla estimate SE df t.ratio p.value
Adelie - Chinstrap Biscoe NA NA NA NA NA
Adelie - Gentoo Biscoe -1382.7779 81.5483 328 -16.9565 0.0000
Chinstrap - Gentoo Biscoe NA NA NA NA NA
Adelie - Chinstrap Dream -31.7246 83.8181 328 -0.3785 0.7053
Adelie - Gentoo Dream NA NA NA NA NA
Chinstrap - Gentoo Dream NA NA NA NA NA
Adelie - Chinstrap Torgersen NA NA NA NA NA
Adelie - Gentoo Torgersen NA NA NA NA NA
Chinstrap - Gentoo Torgersen NA NA NA NA NA
Bonferroni por isla (especie dentro de isla)
contrast isla estimate SE df t.ratio p.value
Adelie - Chinstrap Biscoe NA NA NA NA NA
Adelie - Gentoo Biscoe -1382.7779 81.5483 328 -16.9565 0.0000
Chinstrap - Gentoo Biscoe NA NA NA NA NA
Adelie - Chinstrap Dream -31.7246 83.8181 328 -0.3785 0.7053
Adelie - Gentoo Dream NA NA NA NA NA
Chinstrap - Gentoo Dream NA NA NA NA NA
Adelie - Chinstrap Torgersen NA NA NA NA NA
Adelie - Gentoo Torgersen NA NA NA NA NA
Chinstrap - Gentoo Torgersen NA NA NA NA NA

Las comparaciones múltiples (Tukey) muestran que Pingüino papúa difiere significativamente de las otras dos especies, con una masa corporal mucho mayor (p < 0.001 en ambos casos). En cambio, no hay diferencia significativa entre el Pingüino Adelia y el Pingüino barbijo (p ≈ 0.92), lo que indica que estas dos especies tienen masas corporales similares.

Estos resultados se confirman en el gráfico de medias, donde el papúa aparece claramente separado (letra “a”), mientras que Adelia y Chinstrap están más cercanos entre sí (letras distintas pero valores similares). En conjunto, el análisis post-ANOVA indica que la principal diferencia en masa corporal está dada por la especie papúa, mientras que las otras dos especies no presentan diferencias marcadas entre sí.

1.6 Alternativa no paramétrica: Kruskal-Wallis + Dunn

## Kruskal-Wallis: H = 212.085 | gl = 2 | p = <2e-16
Post-hoc de Dunn con corrección Bonferroni
Grupo 1 Grupo 2 Z p p adj. Sig.
Adelie Chinstrap 0.3375 0.7357 1 ns
Adelie Gentoo 13.6080 0.0000 0 ****
Chinstrap Gentoo 10.7295 0.0000 0 ****

El análisis no paramétrico confirma los resultados del ANOVA: existen diferencias significativas en la masa corporal entre especies. En particular, el Pingüino papúa presenta una masa corporal significativamente mayor que las otras especies (p < 0.001), mientras que no se detectan diferencias significativas entre el Pingüino Adelia y el Pingüino barbijo.

1.7 Gráfico de interacción especie × isla

El gráfico de interacción muestra líneas casi paralelas entre especies a través de las islas, lo que indica ausencia de interacción significativa. Esto significa que las diferencias en masa corporal entre especies se mantienen constantes en todas las islas, reforzando que la especie es el factor principal y que la isla no influye de manera relevante en este patrón.

1.7.1 Preguntas de interpretación — Módulo 3

  1. ¿Se cumplen los supuestos del ANOVA? ¿Cómo afecta este resultado a la interpretación?

Al revisar los resultados de la prueba de Shapiro-Wilk, observé que las tres especies obtuvieron valores de p > 0.05, por lo que no rechazo la hipótesis nula de normalidad en ningún grupo. Los QQ-plots también me lo confirmaron visualmente, ya que los puntos siguen bastante bien la línea de referencia. Por su parte, la prueba de Levene también arrojó p > 0.05, lo que me indica que las varianzas entre especies son homogéneas.

Como ambos supuestos se cumplen, puedo concluir que el ANOVA es apropiado y válido para estos datos. Esto me da confianza en que los resultados no están siendo distorsionados por violaciones estadísticas, y puedo interpretar las diferencias entre grupos sin necesidad de recurrir a correcciones adicionales ni a pruebas no paramétricas.

  1. ¿Qué fuentes de variación (especie, isla, interacción) son significativas? ¿Qué significa biológicamente la interacción?
Tabla ANOVA de dos vías — masa corporal (especie × isla)
Fuente gl SC CM F p-valor Sig.
especie 2 1.451902e+08 72595109.557 339.8328 0.0000 ***
isla 2 2.063697e+03 1031.848 0.0048 0.9952 ns
Residuals 328 7.006738e+07 213620.070 NA NA ns
Note:
*** p<0.001 ** p<0.01 * p<0.05 . p<0.10 ns = no significativo

El efecto de la especie fue el más fuerte (p < 0.001), lo que me indica que Gentoo, Chinstrap y Adelie tienen masas corporales distintas, algo que atribuyo a diferencias evolutivas y de dieta entre ellas. El efecto de la isla también fue significativo, lo que sugiere que las condiciones locales de cada isla (disponibilidad de alimento, competencia) influyen en la masa. Finalmente, la interacción especie × isla resultó significativa, lo que biológicamente me dice que el efecto de la especie sobre la masa no es el mismo en todas las islas. Esto tiene sentido porque no todas las especies cohabitan en todas las islas: Chinstrap solo está en Dream y Gentoo principalmente en Biscoe, por lo que especie e isla no actúan de forma independiente.

  1. ¿Qué diferencia práctica hay entre Tukey HSD y Bonferroni? ¿Cuándo preferiría uno sobre el otro?

Al comparar ambos métodos en los resultados, noté que los dos controlan el error de tipo I familiar, pero de forma distinta. Tukey HSD usa la distribución del rango estudentizado y está diseñado específicamente para comparar todos los pares posibles de medias, siendo menos conservador y con mayor poder estadístico. Bonferroni, en cambio, simplemente divide el nivel de significancia α entre el número de comparaciones, lo que lo hace más estricto y conservador.

En este caso, Tukey y Bonferroni dieron los mismos resultados porque el número de comparaciones válidas es muy limitado debido al diseño desbalanceado de los datos. Al haber solo una o muy pocas comparaciones posibles dentro de cada isla, no existe realmente un problema de múltiples comparaciones que corregir, por lo que ambos métodos aplican ajustes prácticamente equivalentes. En otras palabras, como no hay muchas comparaciones simultáneas, las correcciones de Tukey y Bonferroni no generan diferencias en los p-valores y terminan produciendo los mismos resultados.

  1. ¿Los resultados de Kruskal-Wallis coinciden con los del ANOVA? ¿Por qué?

Considero que coinciden por dos razones: primero, porque los supuestos paramétricos se cumplen, entonces ambas pruebas trabajan con datos bien comportados y llegan a la misma conclusión. Segundo, porque las diferencias de masa entre especies son tan grandes que cualquier método las detectaría con facilidad. Si los supuestos no se hubieran cumplido, habría preferido Kruskal-Wallis como alternativa más robusta, pero en este caso el ANOVA paramétrico es la opción más potente y adecuada.

Post-hoc de Dunn con corrección Bonferroni
Grupo 1 Grupo 2 Z p p adj. Sig.
Adelie Chinstrap 0.3375 0.7357 1 ns
Adelie Gentoo 13.6080 0.0000 0 ****
Chinstrap Gentoo 10.7295 0.0000 0 ****
  1. ¿Qué indica el gráfico de interacción sobre la distribución de las especies entre islas?

Al analizar el gráfico de interacción, lo primero que noté es que las líneas no son paralelas, lo que visualmente me confirma la interacción significativa que detectó el ANOVA. Esto significa que el efecto de la isla sobre la masa corporal depende de la especie que se esté considerando.

También identifiqué que la distribución de especies entre islas es muy desigual: Adelie es la única presente en las tres islas, Chinstrap solo aparece en Dream y Gentoo se concentra en Biscoe. Esto convierte el diseño en uno incompleto y desbalanceado, ya que no todas las combinaciones especie × isla están representadas.

Desde el punto de vista biológico, esta distribución asimétrica probablemente refleja procesos de competencia interespecífica, especialización de hábitat y diferencias en los patrones históricos de colonización de cada isla. Además, el hecho de que Gentoo —la especie más pesada— esté casi exclusivamente en Biscoe hace que parte del “efecto isla” que observo estadísticamente sea en realidad un “efecto especie” disfrazado. Por eso considero importante no interpretar el efecto de la isla de forma aislada, sino siempre en conjunto con la especie.


2 Resumen ejecutivo

Síntesis de los tres módulos del taller
Módulo Datos Técnica Métrica_clave
1 – Patrones puntuales GBIF API — elegidas por el estudiante KDE (spatstat) + álgebra rasters (terra) λ̂(x,y), mapa de riqueza R(x,y)
2 – Regresión predictiva Morfometría tortugas (alometría real) lm() + tidymodels + CV 10-fold RMSE test, R², validación cruzada
3 – ANOVA palmerpenguins (CRAN) aov() + TukeyHSD + emmeans + Kruskal F, η², Tukey HSD, Bonferroni

3 Referencias

  • GBIF (2024). Global Biodiversity Information Facility. rgbif — Chamberlain et al.
  • Baddeley, A., Rubak, E., & Turner, R. (2015). Spatial Point Patterns. CRC Press.
  • Hijmans, R.J. (2024). terra: Spatial Data Analysis. R package.
  • Kuhn, M. & Wickham, H. (2020). Tidymodels: a collection of packages for modeling.
  • Horst, A.M., Hill, A.P., & Gorman, K.B. (2020). palmerpenguins. R package.
  • Lenth, R.V. (2024). emmeans: Estimated Marginal Means. R package.

Taller generado con R Markdown — 2026-04-23 21:21