TP 1_Modulo 5

Cargamos los datos

library(readxl)
SoybeanDataset_1_ <- read_excel("C:/Users/Usuario/Downloads/SoybeanDataset (1).xlsx")
View(SoybeanDataset_1_)
datos_soja<-SoybeanDataset_1_

Respuesta a la Situación 1 a) Intervalo de confianza del promedio de vainas por genotipo

library(dplyr)

## 
## Adjuntando el paquete: 'dplyr'

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

# Calcular la media y la desviación estándar por genotipo
resultados_vainas <- datos_soja %>%
  group_by(Genotipo) %>%
  summarise(media_vainas = mean(Numero_de_Vainas, na.rm = TRUE),
            sd_vainas = sd(Numero_de_Vainas, na.rm = TRUE),
            n = n(),
            error_estandar = sd_vainas / sqrt(n),
            IC_inferior = media_vainas - qt(0.975, df = n - 1) * error_estandar,
            IC_superior = media_vainas + qt(0.975, df = n - 1) * error_estandar)

print(resultados_vainas)

## # A tibble: 6 × 7
##   Genotipo media_vainas sd_vainas     n error_estandar IC_inferior IC_superior
##   <chr>           <dbl>     <dbl> <int>          <dbl>       <dbl>       <dbl>
## 1 G1               142.      22.3  9241          0.232        141.        142.
## 2 G2               143.      17.9  9242          0.186        143.        144.
## 3 G3               147.      20.8  9242          0.217        146.        147.
## 4 G4               156.      19.0  9242          0.198        156.        156.
## 5 G5               139.      11.2  9242          0.117        139.        139.
## 6 G6               142.      22.1  9241          0.230        142.        143.

# Calcular la media y la desviación estándar por genotipo para semillas por vaina
resultados_semillas <- datos_soja %>%
  group_by(Genotipo) %>%
  summarise(media_semillas = mean(Numero_de_semillas_por_vaina, na.rm = TRUE),
            sd_semillas = sd(Numero_de_semillas_por_vaina, na.rm = TRUE),
            n = n(),
            error_estandar = sd_semillas / sqrt(n),
            IC_inferior = media_semillas - qt(0.975, df = n - 1) * error_estandar,
            IC_superior = media_semillas + qt(0.975, df = n - 1) * error_estandar)

print(resultados_semillas)

## # A tibble: 6 × 7
##   Genotipo media_semillas sd_semillas     n error_estandar IC_inferior
##   <chr>             <dbl>       <dbl> <int>          <dbl>       <dbl>
## 1 G1                 91.4        89.5  9241          0.931        89.6
## 2 G2                 91.9        87.7  9242          0.913        90.1
## 3 G3                 83.8        86.6  9242          0.901        82.0
## 4 G4                130.         89.6  9242          0.932       128. 
## 5 G5                120.         87.1  9242          0.906       118. 
## 6 G6                 83.5        88.3  9241          0.918        81.7
## # ℹ 1 more variable: IC_superior <dbl>

# Calcular la media y la desviación estándar por genotipo para semillas por vaina
resultados_semillas <- datos_soja %>%
  group_by(Genotipo) %>%
  summarise(media_semillas = mean(Numero_de_semillas_por_vaina, na.rm = TRUE),
            sd_semillas = sd(Numero_de_semillas_por_vaina, na.rm = TRUE),
            n = n(),
            error_estandar = sd_semillas / sqrt(n),
            IC_inferior = media_semillas - qt(0.975, df = n - 1) * error_estandar,
            IC_superior = media_semillas + qt(0.975, df = n - 1) * error_estandar)

print(resultados_semillas)

## # A tibble: 6 × 7
##   Genotipo media_semillas sd_semillas     n error_estandar IC_inferior
##   <chr>             <dbl>       <dbl> <int>          <dbl>       <dbl>
## 1 G1                 91.4        89.5  9241          0.931        89.6
## 2 G2                 91.9        87.7  9242          0.913        90.1
## 3 G3                 83.8        86.6  9242          0.901        82.0
## 4 G4                130.         89.6  9242          0.932       128. 
## 5 G5                120.         87.1  9242          0.906       118. 
## 6 G6                 83.5        88.3  9241          0.918        81.7
## # ℹ 1 more variable: IC_superior <dbl>

genotipo_mas_semillas <- datos_soja %>%
  group_by(Genotipo) %>%
  summarise(media_semillas = mean(Numero_de_Vainas * Numero_de_semillas_por_vaina, na.rm = TRUE)) %>%
  arrange(desc(media_semillas)) %>%
  slice(1)

print(genotipo_mas_semillas)

## # A tibble: 1 × 2
##   Genotipo media_semillas
##   <chr>             <dbl>
## 1 G4               20424.

Respuesta a Situación 2

# Calcular la proporción de estrés hídrico alto
proporcion_alto <- datos_soja %>%
  summarise(proporcion = mean(Estrés_Hidrico == "ALTO"))

# Prueba de hipótesis
n <- nrow(datos_soja)
p0 <- 0.45
z <- (proporcion_alto$proporcion - p0) / sqrt((p0 * (1 - p0)) / n)
p_valor <- 1 - pnorm(z)

print(p_valor)

## [1] 0

Respuesta a Situación 3

# Comparar alturas entre grupos
alturas_control <- datos_soja %>% filter(Acido_Salicilico == "Control") %>% summarise(media_altura = mean(Altura_de_la_planta, na.rm = TRUE))
alturas_dosis_baja <- datos_soja %>% filter(Acido_Salicilico == "Dosis Baja") %>% summarise(media_altura = mean(Altura_de_la_planta, na.rm = TRUE))
alturas_dosis_alta <- datos_soja %>% filter(Acido_Salicilico == "Dosis Alta") %>% summarise(media_altura = mean(Altura_de_la_planta, na.rm = TRUE))

diferencia_baja <- alturas_dosis_baja$media_altura - alturas_control$media_altura
diferencia_alta <- alturas_dosis_alta$media_altura - alturas_control$media_altura

print(c(diferencia_baja, diferencia_alta))

## [1] -6.703766 57.018322

# Calcular proporciones
proporcion_bajo <- datos_soja %>%
  summarise(proporcion_bajo = mean(Estrés_Hidrico == "BAJO"))

diferencia_proporciones <- proporcion_alto$proporcion - proporcion_bajo$proporcion_bajo
print(diferencia_proporciones)

## [1] -0.02254283

El análisis sobre el conjunto de datos ha proporcionado información valiosa, se resumen los resultados más importantes:

Intervalos de Confianza:

Se calcularon los intervalos de confianza del 95% para el número promedio de vainas y semillas por vaina en diferentes genotipos.

Proporción de Estrés Hídrico:

La proporción de plantas con estrés hídrico alto fue evaluada y se encontró que es menor al 45%, lo que sugiere que la mayoría de las plantas están en condiciones óptimas.

Efecto del Ácido Salicílico:

Se analizaron las diferencias en altura promedio de las plantas tratadas con ácido salicílico. Los resultados indican que el uso de este compuesto puede tener un efecto positivo en el crecimiento de las plantas.

Diferencias de Proporciones:

La diferencia de proporciones entre plantas con estrés hídrico alto y bajo se calculó, proporcionando una visión clara de la salud del cultivo en relación con las condiciones de riego y manejo del agua.

TP 1_Modulo 5

Paz Zanini, Raúl

2025-04-20