Taller DE

R Markdown

library(collapsibleTree)


#Liquido= concentracion
#Tableta= concentracion
#Capsula= concentracion

#tipo = c(Liquido, Tableta, Capsula)
#concentracion = c("c_alta", "c_bajo", "c_medio")
#medicamento = tipo

#Farmacia_A= medicamento
#Farmacia_B= medicamento
#Farmacia_C= medicamento
#Farmacia_D= medicamento
#Farmacia_E= medicamento

#recomendaciones = data.frame(Farmacia_A, Farmacia_B, Farmacia_C, Farmacia_D, Farmacia_E)
#collapsibleTree(recomendaciones, c("Farmacia_A", "Farmacia_B", "Farmacia_C", "Farmacia_D", "Farmacia_E"))
#recomendaciones
#Farma= 5
#Medica= 3
#Concentra=3

#Combinaciones= c(Farma*Medica*Concentra)
#Combinaciones

#Farma_2= 5
#Medica_2= 3
#Concentra_2=2

#Combinaciones_2= c(Farma_2*Medica_2*Concentra_2)
#Combinaciones_2

Punto 1

Una muestra aleatoria de 64 bolsas con fibra de coco para cultivo de Arándanos (de una capacidad de 20 lit) pesan en promedio 4.5 kg. Genere los datos de la muestra usando rnorm(64;4.35;0.15) fijando su semilla con su número de cédula y pruebe la hipótesis de que el peso es inferior a 4.5 kg. Utilice un α=0.05. Concluya desde un punto de vista agronómico y explique una razón por la cual un peso inferior puede ser un problema desde un punto de vista del riego o dosificación de agroquímicos.

set.seed(1000271731)
muestra_a=rnorm(64,4.35,0.15)
mean(muestra_a)

## [1] 4.336961

hist(muestra_a)
abline(v=mean(muestra_a), lwd= 2, col="dark red")

\(H_o= \mu_{experimental} \geq 4.5\)

\(H_a= \mu_{experimental}<4.5\)

\(\alpha = 0.05\)

set.seed(1000271731)
sim_1= replicate(5000, rnorm(64,4.35,0.15))
dim(sim_1)

## [1]   64 5000

#curve(dt(sim_1, df=4999),add=T, col="green")

cuantile_t= qt(p= 0.05, df= 5000-1, lower.tail = T)
cuantile_t

## [1] -1.645158

x_d= seq(-4,4, by = 0.01)
plot(x_d, dt(x_d, df= 5000-1), type = "l")
abline(v= cuantile_t, col= "green")

x_c= (cuantile_t * (sd(muestra_a)/sqrt(64))+4.5)
x_c

## [1] 4.469434

medias = colMeans(sim_1)
length(medias)

## [1] 5000

hist(medias, xlim = c(4.26, 4.51), freq = F)
abline(v=mean(muestra_a), lwd=2, col="dark red")
abline(v=4.5,lwd=2 ,col="dark blue")
abline(v=x_c, lwd= 2,col= "dark green")

\(*Existen \thinspace pruebas \thinspace suficientes \thinspace para \thinspace Rechaza \thinspace la \thinspace H_o\)

La Hipotesis nula se recahza ya que el valor maximo al cual se puede bajar la media esta por encima de la media experimental o tomada de campo.

Para el parametro de dosificación esto presenta un problema el cual puede llegar a causar daños daños significativos para la planta ya que se calcula los datos con una media de 4.5kg siendo que esta media es un poco inferior y que difiere de 4.5kg por lo que si puede llevar a consecuencias en los cultivos.

Punto 2

Se supone que una máquina mezcla granos partidos de arroz con granos completos en bolsas de 1/4 Kg a razón de 1:24. Se observa que una bolsa contiene 6000 granos enteros y 350 granos partidos. A un nivel de significancia de 0.05 pruebe la hipótesis de que la máquina mezcladora de granos está excediendo la cantidad de granos partidos y por ende no se está manteniendo la razón 1:24

\(H_o= Razon_{mezcla} = 1:24\)

\(H_a= Razon_{mezcla} \neq 1:24\)

\(\alpha = 0.05\)

set.seed(1000271731)
n<- 6350
x<- c(350, 6000)
Prob<- c(1/24, 23/24)
test_chi <- chisq.test(x, p=Prob)
Pvalor <- test_chi$p.value
Pvalor

## [1] 8.131924e-08

if_else(Pvalor > 0.05, "No existen datos suficientes para rechazar la H_0, (La mezcaldora mantiene la relacion 1:24)", "Existen pruebas suficientes para rechazar la H_0, (La mezcaldora no mantiene la relacion 1:24)")

## [1] "Existen pruebas suficientes para rechazar la H_0, (La mezcaldora no mantiene la relacion 1:24)"

Punto 3

Las muestras de agua se toman del agua utilizada para refrigeración cuando se vierte desde una central eléctrica a un río. Se ha determinado que la temperatura media del agua descargada sea como máximo de 65° C para que no haya efectos negativos en el ecosistema del río. Para investigar si la central cumple la normativa que prohíbe una temperatura media del agua superior a este valor los investigadores tomarán 50 muestras de agua según un protocolo de muestreo y registrarán la temperatura de cada muestra. Los datos resultantes se utilizarán para probar las hipótesis H0:µ=65 contra Ha: H0:µ>65. En el contexto de este ejemplo, describa los errores de tipo I y Tipo II. ¿Qué tipo de error consideraría más grave? Explique. Genere con rnorm (50;65.8;0.3) los datos de la muestra con una semilla asociada a su cédula. Contraste las hipótesis antes formuladas usando α=0.05

\(H_o= \mu_{ecosistema} = 65^{\circ}\)

\(H_a= \mu_{ecosistema}> 65^{\circ}\)

\(\alpha = 0.05\)

Errores

El error de tipo I: Ocurre cuando se rechaza la hipótesis nula aunque esta sea verdadera. La probabilidad de cometer un error de tipo I es α, que es el nivel de significancia que se establece para la prueba de hipótesis. Un α de 0.05 indica que se está dispuesto a aceptar una probabilidad de 5% de estar equivocado al rechazar la hipótesis nula. Para reducir este riesgo, debe utilizar un valor menor para α.

El error de tipo II: Es cuando la hipótesis nula es falsa, pero no es rechazada, depende del verdadero valor del parámetro. Se hace menor cuanto mayor sea n. Puede reducir el riesgo de cometer un error de tipo II al asegurarse de que la prueba tenga suficiente potencia. Para ello, el tamaño de la muestra debe ser lo suficientemente grande como para detectar una diferencia práctica cuando esta realmente exista.

El error mas grave es el tipo II, y en este contexto, no rechazar la hipotesis nula, aunque sea falsa, supondria decir que la temperatura del agua añadida al rio, no generara problemas, pero realmente si lo hara, dañando significativamente el ecosistema, ademas se estaria incumpliendo la normativa, dandole problemas a la empresa y a los investigadores que tomaron las muestras.

set.seed(1000271731)
var_norm = rnorm(50, 65.8, 0.3)
mean(var_norm)

## [1] 65.80143

hist(var_norm , freq = F)
abline(v = mean(var_norm), lwd= 4, col= "red")

replicator = replicate(10000, rnorm(50, 65.8, 0.3))
dim(replicator)

## [1]    50 10000

cuantile_t2= qt(p= 0.05, df= 10000-1, lower.tail = F)

x_c2 = (cuantile_t2 * (sd(var_norm)/sqrt(50))+65)
x_c2

## [1] 65.06591

means_2 = colMeans(replicator)
length(means_2)

## [1] 10000

hist(means_2, xlim = c(64.8, 66),  freq = F)
abline(v=mean(var_norm), lwd=2, col="dark red")
abline(v=65,lwd=2 ,col="dark blue")
abline(v=x_c2, lwd= 2,col= "dark green")

#### Se rechaza la H_0 ya que como se observa en la grafica se aleja considerablemente nuestra media indicada con el color rojo de lo maximo que podiamos subirnos, linea indicada con el color verde

Punto 4

Un agricultor afirma que el rendimiento medio del maíz de la variedad Local supera el rendimiento medio de la variedad alóctona en al menos 0.5 ton/ha. Para comprobar esta afirmación, se plantan 2 hectáreas de cada variedad y se cultivan en condiciones similares. La variedad Local produjo en promedio 5.8 ton/ha con una desviación estándar de 0,58 ton/ha, mientras que la otra variedad rindió en promedio 5.1ton/ha con una desviación estándar de 0.45 ton/ha. Prueba la afirmación del agricultor utilizando un nivel de significación de 0,05. Con los datos dados genere con rnorm de R las muestras de tamaño según la densidad de siembra que considere según la literatura para las 5 hectáreas. Aunque las medidas y las desviaciones obtenidas de las simulaciones pueden diferir de los datos, use los datos simulados para el contraste de hipótesis para un α=0.05

\(H_o= \mu_{Local} - \mu_{aloctona} \geq 0.5\)

\(H_a= \mu_ - \mu_{aloctona} < 0.5\)

\(\alpha = 0.05\)

set.seed(1000271731)
local_norm = rnorm(50000, 5.8, 0.58)
variedad_alocto = rnorm(50000, 5.1, 0.45)

mean(local_norm)

## [1] 5.802708

mean(variedad_alocto)

## [1] 5.099139

hist(local_norm, freq = F)
abline(v = mean(local_norm), lwd= 2, col="dark red")

test = t.test(x= local_norm, y= variedad_alocto, alternative = "less", mu=0.5, paired = T, conf.level = 0.95)
valor_p = test$p.value
if_else(valor_p>0.05, "No existen datos suficientes para rechazar la H_0, (La variedad local tiene un rendimiento medio mayor al menos por 0.5 Ton/ha)", "Existen pruebas suficientes para rechazar la H_0, (La variedad local no tiene un rendimiento medio mayor al menos por 0.5 Ton/ha)")

## [1] "No existen datos suficientes para rechazar la H_0, (La variedad local tiene un rendimiento medio mayor al menos por 0.5 Ton/ha)"

Punto 5

La porosidad a granel se define como el porcentaje de volumen del espacio intergranular respecto al volumen total de grano a granel. El porcentaje de espacio vacío de los diferentes granos a granel suele ser necesario en los estudios de secado, estudios de flujo de aire y flujo de calor de los granos. La porosidad depende de (a) la forma, (b) las dimensiones y (c) la rugosidad de la superficie del grano. En maíz se conoce una porosidad media de 42.5% (medido con el método de desplazamiento del mercurio). Se toman 30 muestras y se obtiene una media y una desviación estándar de la muestra para una semilla dada por su número de cédula(CC) de mean(rnorm (30;45;2)) y sd(rnorm (30;45;2)). Use un α=0.05 para probar la hipótesis de que la porosidad es mayor al valor conocido históricamente para el cultivo de una variedad específica

\(H_o= \mu_{Porosidad_maiz} > 42.5\)

\(H_a= \mu_{Porosidad_maiz} < 42.5\)

\(\alpha = 0.05\)

set.seed(1000271731)
variable= rnorm(30, 45, 2)
mean(variable)

## [1] 44.81285

sd(variable)

## [1] 1.735498

hist(variable, freq= F)
abline(v= mean(variable), lwd= 2, col = "Dark Red")

replicator_2 = replicate(10000, rnorm(30, 45, 2))
dim(replicator_2)

## [1]    30 10000

q_t= qt(p= 0.05, df= 10000-1, lower.tail = F)
q_t

## [1] 1.645006

x_c3 = (q_t * (sd(variable)/sqrt(30))+42.5)
x_c3

## [1] 43.02123

means_3 = colMeans(replicator_2)
length(means_3)

## [1] 10000

hist(means_3, xlim = c(42, 46), freq = F)
abline(v=mean(variable), lwd=2, col="dark red")
abline(v=42.5,lwd=2 ,col="dark blue")
abline(v=x_c3, lwd= 2,col= "dark green")

No se rechaza la H_0 ya que la media es mayor a 42.5 el cual es el historico del maiz, ademas de ello la linea del historico (linea de color azul) y de la porosidad encontrada (linea de color rojo) estan a una distacia significativa, tanto que no entran en el rango para rechazar la H_0 indicada con color verde

Punto 6

set.seed(1000271731)
banano = expand.grid(x = 1:12,
                     y = 1:10)
estado = round(runif(120,0,1.2))
enfermas = ifelse(estado==0, 'Sana', 'Enferma');enfermas

##   [1] "Sana"    "Enferma" "Enferma" "Enferma" "Sana"    "Enferma" "Sana"   
##   [8] "Sana"    "Sana"    "Enferma" "Enferma" "Sana"    "Enferma" "Enferma"
##  [15] "Sana"    "Enferma" "Sana"    "Enferma" "Sana"    "Sana"    "Sana"   
##  [22] "Enferma" "Sana"    "Enferma" "Sana"    "Enferma" "Sana"    "Sana"   
##  [29] "Enferma" "Sana"    "Enferma" "Sana"    "Enferma" "Enferma" "Enferma"
##  [36] "Enferma" "Enferma" "Sana"    "Enferma" "Enferma" "Enferma" "Sana"   
##  [43] "Sana"    "Enferma" "Enferma" "Enferma" "Enferma" "Enferma" "Sana"   
##  [50] "Enferma" "Enferma" "Enferma" "Sana"    "Enferma" "Sana"    "Enferma"
##  [57] "Sana"    "Enferma" "Enferma" "Sana"    "Enferma" "Sana"    "Enferma"
##  [64] "Sana"    "Enferma" "Enferma" "Sana"    "Sana"    "Enferma" "Enferma"
##  [71] "Enferma" "Sana"    "Sana"    "Sana"    "Enferma" "Sana"    "Enferma"
##  [78] "Enferma" "Sana"    "Enferma" "Sana"    "Sana"    "Enferma" "Sana"   
##  [85] "Enferma" "Enferma" "Enferma" "Sana"    "Sana"    "Enferma" "Enferma"
##  [92] "Sana"    "Enferma" "Enferma" "Sana"    "Enferma" "Enferma" "Enferma"
##  [99] "Enferma" "Enferma" "Sana"    "Enferma" "Sana"    "Enferma" "Sana"   
## [106] "Sana"    "Sana"    "Sana"    "Enferma" "Sana"    "Sana"    "Sana"   
## [113] "Enferma" "Sana"    "Sana"    "Sana"    "Enferma" "Sana"    "Enferma"
## [120] "Enferma"

color_estado = ifelse(estado==0, 'green', 'red')

total_enfermas = 0
for (i in enfermas){
  if (i == 'Enferma'){
    total_enfermas = total_enfermas + 1
  }else{
    next
  }
}
porcentaje = round(total_enfermas *0.1)

prevalencia = round(100* total_enfermas/length(estado),2);prevalencia

## [1] 55

plot(banano,
     col = color_estado)
grid(nx = 12,
     ny = 10,
     lty = 2,
     col = 'blue',
     equilogs = T)

muestra = sample(estado, size = 48)
enfermas_muestra = 0
for (i in muestra){
  if (i == 1){
    enfermas_muestra = enfermas_muestra + 1
  }else{
    next
  }
}

prevalencia_2 = round(100* enfermas_muestra/length(muestra),2);prevalencia_2

## [1] 68.75

enfermas_2 = enfermas
color_estado2 = color_estado
set.seed(1000271731)
random = round(runif(20,1,120));random

##  [1]  34  82  88  51  18  95  14  33  40  55 107  18  75  58  45  75  37 107  35
## [20]  32

cuenta1 = 0
for (i in random){
  if (cuenta1 != porcentaje){
    if(enfermas_2[i] == "Sana"){
      cuenta1 = cuenta1 + 1
      enfermas_2[i] = 'Enferma'
    }else{
      next
    }
  }else{
    break
  }
}

cuenta2 = 0
for (i in random){
  if (cuenta2 != porcentaje){
    if(color_estado2[i] == 'green'){
      cuenta2 = cuenta2 + 1
      color_estado2[i] = 'red'
    }else{
      next
    }
  }else{
    break
  }
}

plot(banano,
     col = color_estado2)
grid(nx = 12,
     ny = 10,
     lty = 2,
     col = 'blue',
     equilogs = T)

Taller DE_2

Juan Sebastian Herrera Reales

4/12/2021

R Markdown

Punto 1

La Hipotesis nula se recahza ya que el valor maximo al cual se puede bajar la media esta por encima de la media experimental o tomada de campo.

Punto 2

Punto 3

Errores

Punto 4

Punto 5

Punto 6