1.ANOVA (Análisis de varianza)

técnica estadística que compara las medias de tres o más grupos para determinar si existen diferencias significativas entre ellas.

Identificar la base de datos

En este caso, no se realizará la exportación de datos desde un archivo externo, ya que la base de datos empleada es de tamaño reducido.
Por esta razón, se optó por ingresar la información de manera manual dentro del mismo entorno de trabajo.
Esta decisión facilita el manejo y la comprensión de los datos, evitando procesos adicionales de carga o lectura de archivos.

# Cargar librerías necesarias
library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)
library(car)
## Warning: package 'car' was built under R version 4.5.2
## Cargando paquete requerido: carData
## Warning: package 'carData' was built under R version 4.5.2
## 
## Adjuntando el paquete: 'car'
## The following object is masked from 'package:dplyr':
## 
##     recode
# Datos
Germinación_Pepino <- data.frame(
  Tratamiento = rep(c("T1","T2","T3"), each = 3),
  Replica = c("1.1","1.2","1.3","2.1","2.2","2.3","3.1","3.2","3.3"),
  Germinadas = c(6, 11, 3, 5, 2, 6, 2, 4, 4) #Es el total de germidado por réplica
)

2.Estadistica Aplicada

Como tenemos tres grupos independientes que son los tratamientos T1,T2 Y T3 a comparar y una variable numérica se aplica la prueba estadistica de ANOVA:

se realiza un Análisis de Varianza ANOVA para determinar si los distintos tratamientos producen diferencias significativas en el número de semillas germinadas.

modelo <- aov(Germinadas ~ Tratamiento, data=Germinación_Pepino)
summary(modelo)
##             Df Sum Sq Mean Sq F value Pr(>F)
## Tratamiento  2  17.56   8.778   1.197  0.365
## Residuals    6  44.00   7.333

Análisis de resultados ANOVA

A continuación, se presentan los elementos principales del análisis de varianza (ANOVA):

  • Df: grados de libertad.
  • Sum Sq / Mean Sq: suma y media de cuadrados (medidas de variación).
  • F value: valor de la prueba F (mide las diferencias entre grupos).
  • Pr(>F): p-valor (nivel de significancia estadística).

Criterio de decisión: - Si el p-valor < 0.05, existen diferencias significativas entre los tratamientos.
- Si el p-valor > 0.05, no hay diferencias estadísticas entre ellos.

Resultado del modelo

En este caso, el valor p = 0.365 es mayor que 0.05, lo cual indica que no existen diferencias estadísticamente significativas entre los tratamientos evaluados.

En otras palabras, los distintos tratamientos aplicados no influyeron de manera significativa en la cantidad de semillas germinadas de Cucumis sativus (pepino).

Grafico Box-plot

ggplot(Germinación_Pepino, aes(x = Tratamiento, y = Germinadas, fill = Tratamiento)) +
  geom_boxplot() +
  labs(title = "Germinación por Tipo de Sustrato",
       y = "Semillas Germinadas",
       x = "Tratamiento") +
  theme_minimal()

3.Comparación Entre las Herramientas Utilizadas (Ventajas y Limitaciones)

Tabla Comparativa: Ventajas y Limitaciones de SPSS, Minitab y RStudio

Herramienta Ventajas Limitaciones
SPSS - Interfaz gráfica amigable e intuitiva.
- Amplia gama de análisis estadísticos.
- Fácil exportación de resultados.
- Ideal para usuarios principiantes.
- Requiere licencia paga.
- Poca flexibilidad para personalizar análisis.
- Limitado en automatización y gráficos avanzados.
- Procesamiento lento en grandes bases de datos.
Minitab - Excelente para control de calidad y análisis industrial.
- Interfaz sencilla y práctica.
- Automatiza cálculos estadísticos complejos.
- Ideal para ingeniería y procesos productivos.
- Es de pago.
- Poca personalización.
- Limitado en gráficos interactivos.
- Menor compatibilidad con otros lenguajes.
RStudio - Software libre y gratuito.
- Altamente flexible mediante paquetes (dplyr, ggplot2, etc.).
- Ideal para análisis avanzados y reproducibles con R Markdown.
- Amplia comunidad y soporte.
- Requiere conocimientos de programación.
- Curva de aprendizaje más alta.
- Menos intuitivo para principiantes.
- Algunos paquetes requieren configuración adicional.