#MUESTREO ESTRATIFICADO

#Tamaño de muestra para estimar la proporción de artículos defectuosos por turno de fabricación

#Función cálculo

f_sam_prop = function(Ni, pi, ti, e, z = 1.96)
{ N = sum(Ni) #Tamaño de la población
  L = length(Ni) # L: número de estratos
  qi = 1 - pi # q : 1-p: proporción de NO defectuosos
  ai = Ni/N #a: Pesos
  D = (e/z)**2
  
  numer = sum(Ni**2 * pi * qi / ai)
  denom = (N**2 * D) + sum(Ni*pi*qi)
  
  n = ceiling(numer/denom)
  
  #asignación proporcional por estrato
  ni =  round(ai * n) # Tamaño de muestra por estrato
  ki =  floor(ti/ni) # Tiempo de muestreo sistemático por estrato
  
  return(list(ni, ki))
  }
f_sam_prop(Ni = c(11000, 4000),
           pi = c(0.09, 0.08),
           ti = c(480, 480), # Tiempo de operación en minutos
           e = 0.05)
## [[1]]
## [1] 89 33
## 
## [[2]]
## [1]  5 14

#Proporción defectuosas jornada diurna y noctura

a = 11/15*0.07 + 4/15*0.06

(11/15*0.07)/a
## [1] 0.7623762
(4/15*0.06)/a
## [1] 0.2376238

#De acuerdo con los resultados arrojados, la proporción de defectuosas en la jornada diurna es de 0.76, mientras que en la jornada nocturna es de 0.24

#MUESTREO ESPACIAL

#Creación conjunto de datos e híbridos
palmas = expand.grid(x = seq(0, 112, 7), 
                     y = seq(0, 144, 9))

set.seed(123)

#Información auxiliar (producción anterior)
p_racimo_u = rnorm(289, 17, 1.8) # Peso promedio de racimo último
p_racimo_p = rnorm(289, 17, 1.8) # Peso promedio de racimo penúltimo
CaMg_h17 = runif(289, 1.8, 2.0) # Relación calcio-magnesio Hoja 17
CaMg_s = runif(289, 1.2, 1.4) # Relación calcio-magnesio suelo
hibrid = rep(c('h1', 'h2'), c(144, 145))
df = data.frame (palmas,
                 p_racimo_u, p_racimo_p,
                 CaMg_h17, CaMg_s, hibrid)
head(df)
##    x y p_racimo_u p_racimo_p CaMg_h17   CaMg_s hibrid
## 1  0 0   15.99114   17.30252 1.813162 1.350780     h1
## 2  7 0   16.58568   19.10309 1.970874 1.212619     h1
## 3 14 0   19.80567   18.89753 1.902082 1.288496     h1
## 4 21 0   17.12692   19.06147 1.842000 1.300134     h1
## 5 28 0   17.23272   15.96056 1.875169 1.254049     h1
## 6 35 0   20.08712   20.60447 1.841473 1.319760     h1
library(clhs)
res = clhs(df, size=15, progress = FALSE, simple = TRUE)
## Warning: NAs introducidos por coerción
sort(res)
##  [1]  15  35  64  72 101 115 136 167 178 203 209 232 244 263 281
res2 = ifelse(res>= 145, "Dh1", "Dh2")

df[res, 'muestreo'] = res2
df$muestreo[is.na(df$muestreo)] = 'no muestreadas'

table(res2)
## res2
## Dh1 Dh2 
##   8   7
#Gráfico híbrido 1 e híbrido 2
library(ggplot2)

ggplot(df)+
  aes(x,y, fill= muestreo)+
  geom_tile(color = 'white')

table(res2)
## res2
## Dh1 Dh2 
##   8   7
#Media de los conjuntos estudiados en la producción anterior
mean(df$p_racimo_u)
## [1] 17.02191
mean(df$p_racimo_p)
## [1] 17.09966
mean(df$CaMg_h17)
## [1] 1.896053
mean(df$CaMg_s)
## [1] 1.301732
#Media de los ultimos racimos respecto al híbrido 1
mean(df$p_racimo_u[df$muestreo == 'Dh1'])
## [1] 16.8841
#Media de los penúltimos racimos respecto al híbrido 1
mean(df$p_racimo_p[df$muestreo == 'Dh1'])
## [1] 16.6609
#Media de CaMg_17 respecto al híbrido 1
mean(df$CaMg_h17[df$muestreo == 'Dh1'])
## [1] 1.913406
#Media de CaMg_s racimo respecto al híbrido 1
mean(df$CaMg_s[df$muestreo == 'Dh2'])
## [1] 1.294711
#Media de los últimos racimos respecto al híbrido 2
mean(df$p_racimo_u[df$muestreo == 'Dh2'])
## [1] 16.45443
#Media de los penúltimos racimos respecto al híbrido 2
mean(df$p_racimo_p[df$muestreo == 'Dh2'])
## [1] 16.63345
#Media de CaMg_h17 respecto al híbrido 2
mean(df$CaMg_h17[df$muestreo == 'Dh2'])
## [1] 1.866905
#Media de CaMg_s respecto al híbrido 2
mean(df$CaMg_s[df$muestreo == 'Dh2'])
## [1] 1.294711