Recordando probabilidad y Conteos

1.

Un producto químico para controlar una enfermedad en plantas se puede adquirir en 5 diferentes laboratorios y en forma de líquido, comprimidos o cápsulas, todas en concentración normal o alta. ¿De cuántas formas diferentes puede un agrónomo recomendar el producto a un cliente que declara que en su cultivo está presente la enfermedad?

Con \(n_1=5\) (laboratorios), \(n_2=3\) (formas) y \(n_3=2\) (concentraciones), tenemos mediante las regla \(n_1n_2n_3=(5)(3)(2)=30\) formas diferentes de recomendar el producto a un cliente que declara que en su cultivo está presente la enfermedad

n1 <- 5
n2 <- 3
n3 <- 2 
p1<- n1*n2*n3
paste('Existen',p1,'formas diferentes de recomendar el producto a un cliente que declara que en su cultivo está presente la enfermedad')
## [1] "Existen 30 formas diferentes de recomendar el producto a un cliente que declara que en su cultivo está presente la enfermedad"

Si decide no utilizar una concentración alta ¿de cuantas formas puede recomendarlo?

n_3<-1
p2<- n1*n2*n_3
paste('Existen',p2,'formas diferentes de recomendar el producto a un cliente que declara que en su cultivo está presente la enfermedad')
## [1] "Existen 15 formas diferentes de recomendar el producto a un cliente que declara que en su cultivo está presente la enfermedad"

2.

¿De cuántas formas distintas se puede responder una prueba de falso-verdadero que consta de 10 preguntas? Recuerde que lo hará completamente al azar.

En la primera pregunta se puede marcar falso o verdadero tenemos que \(n_1=2\), y en las 9 preguntas restantes se puede hacer lo mismo tenemos \(n_2=2\), \(n_3=2\), \(n_4=2\)\(n_10=2\), por lo que \(n_1n_2n_3n_3...n_{10}=2^{10}\)

p3<-2^10
paste('Existen',p3,'formas distintas de responder la prueba de falso-verdadero')
## [1] "Existen 1024 formas distintas de responder la prueba de falso-verdadero"

3.

Un estudio en California concluyó que siguiendo siete sencillas reglas para la salud un hombre y una mujer pueden prolongar su vida 11 y 7 años en promedio, respectivamente. Estas 7 reglas son: no fumar, hacer ejercicio de manera habitual, moderar su consumo de alcohol, dormir siete u ocho horas, mantener el peso adecuado, desayunar y no ingerir alimentos entre comidas. De cuántas formas puede una persona adoptar cinco de estas reglas: a) ¿Si la persona actualmente infringe las siete reglas?

Nos interesa saber el número de formas en las que una persona adoptar cinco (\(r\)) de las siete reglas(\(n\)) sin importar el orden, po lo tanot se trata de una combinación.

\[\binom{n}{r} = \binom{7}{5} \]

c1<-nsamp(7,5,replace=F,ordered = F)
paste("Las cinco reglas se pueden adoptar de",c1,"diferentes formas")
## [1] "Las cinco reglas se pueden adoptar de 21 diferentes formas"
  1. ¿Si la persona nunca bebe y siempre desayuna?

Si la persona nunca bebe y siempre desayuna, es decir cumple con dos de las 7 reglas \(n=5\) y por lo tanto solo se tienen que adoptar 3 reglas más, es decir que, \(r=3\).

\[\binom{n}{r} = \binom{5}{3} \]

c2<-nsamp(5,3,replace=F,ordered = F)
paste("Las cinco reglas se pueden adoptar de",c2,"diferentes formas")
## [1] "Las cinco reglas se pueden adoptar de 10 diferentes formas"

4.

En un estudio médico los pacientes se clasifican de 8 formas de acuerdo con su tipo sanguíneo: AB+,AB-, A+, A-,B+,B- , O+ u O- ; y también de acuerdo con su presión sanguínea: baja, normal o alta. Encuentre el número de formas en las que se puede clasificar a un paciente por estos dos criterios.

Tenemos que \(n_1=8\) tipos sanguíneos y \(n_2=3\) niveles de presión sanguínea, por lo tanto existen \(n_1n_2\) formas de clasificar a un paciente por estos criterios.

p4<-8*3
paste('Existen',p4,'formas de clasificar a un paciente por estos criterios')
## [1] "Existen 24 formas de clasificar a un paciente por estos criterios"

5.

¿De cuántas maneras se pueden plantar 5 árboles diferentes en un círculo manteniendo la misma distancia entre ellos? ¿ de cuantas formas en una línea?

El numero de permutaciones de \(n=5\) árboles ordenados en un círculo es \((n-1)!=(5-1)!=4!\)

p5<-factorial(4)
paste('Existen',p5,'formas de plantar los 5 árboles en un círculo manteniendo la misma distancia entre ellos')
## [1] "Existen 24 formas de plantar los 5 árboles en un círculo manteniendo la misma distancia entre ellos"

El numero de permutaciones de \(n=5\) árboles ordenados en un línea es \(n!=5!\)

p6<-factorial(5)
paste('Existen',p6,'formas de plantar los 5 árboles en línea manteniendo la misma distancia entre ellos')
## [1] "Existen 120 formas de plantar los 5 árboles en línea manteniendo la misma distancia entre ellos"

6.

¿Cuántas permutaciones distintas se pueden hacer con las letras de la palabra AGRONOMIA?

Tenemos 9 letras en total, donde 2 letras (A, O) aparecen dos veces cada una y las letras G, R, N, M y I aparecen una vez cada una.

\[\binom{9}{2,2,1,1,1,1,1} = \frac{9!}{2!2!1!1!1!1!1} \]

Pr<-function(n,k){
    if (n==sum(k))
        {
        Pr<-factorial(n)/prod(factorial(k))
    }
    else
        {
        Pr<-'NAN'
    }
    return(Pr)
}
Pr(9,c(2,2,1,1,1,1,1))
## [1] 90720
  • Se pueden hacer 90720 permutaciones distintas con las letras de la palabra AGRONOMIA.

7.

La probabilidad de que un AGRÓNOMO diagnostique de manera correcta una enfermedad específica es 0.7. Dado que el AGRÓNOMO hace un diagnóstico incorrecto, la probabilidad de que el dueño del cultivo le entable una demanda legal es 0.9. ¿Cuál es la probabilidad de que el agrónomo haga un diagnóstico incorrecto y sea demandado?

Si consideramos los eventos:

\(A:\)el agrónomo hace un diagnóstico correcto

\(B:\)el dueño del cultivo le entable una demanda legal al agrónomo

La probabilidad de que el agrónomo haga un diagnóstico incorrecto (\(A'\)) y sea demandado (\(B\)) es igual a la probabilidad de que el agrónomo haga un diagnóstico incorrecto (\(A'\)) multiplicada por la probabilidad condicional de que lo demanden (\(B\)) dado que hace un diagnóstico incorrecto (\(A'\)).

\[P(A'\cap B)=P(A')P(B|A')\] * \(P(A')=1-P(A)=1-0.7=0.3\)

  • \(P(B|A')=0.9\)
prob1<-0.3*0.9;prob1
## [1] 0.27

La probabilidad de que el agrónomo haga un diagnóstico incorrecto y sea demandado es 0.27

8.

Existe una extraña enfermedad con prevalencia de 1/500. Se dispone de una prueba para detectarla en campo, pero por supuesto, ésta no es infalible. Un resultado correcto positivo (una planta que realmente tiene la enfermedad) ocurre 95% de las veces; en tanto que un resultado falso positivo (una planta que no tiene la enfermedad) ocurre 1% de las veces. Si una palma es elegida al azar y se somete a prueba y se obtiene un resultado positivo, ¿cuál es la probabilidad de que realmente tenga la enfermedad?

Si consideramos los eventos:

\(P:\) se obtiene un resultado positivo en prueba

\(E:\) la planta tiene la enfermedad

La probabilidad de que realmente tenga la enfermedad dado que se obtiene un resultado positivo en la prueba es:

\[P(E|P)= \frac {P(E \cap P)}{P(P)} siempre \ que \ P(P)>0 \] Donde:

  • \(P(E \cap P)=P(E)P(P|E)\)

  • \(P(P)=P(E)P(P|E)+P(E')P(P|E')\)

Entonces:

\[(E|P)= \frac {P(E)P(P|E)}{P(E)P(P|E)+P(E')P(P|E')}\] Donde:

  • \(P(E)= \frac{1}{500}\)

  • \(P(E')=0.01\)

  • \(P(E')=1-\frac{1}{500}\)

  • \(P(P|E)=0.95\)

  • $P(P|E’)=0.01)

Reemplazando:

\[(E|P)= \frac {\frac{1}{500}\cdot 0.95}{\frac{1}{500}\cdot 0.95+(1-\frac{1}{500})\cdot 0.01}\]

(1/500)*0.95
## [1] 0.0019
(1-(1/500))*0.01
## [1] 0.00998
0.0019/(0.0019+0.00998)
## [1] 0.1599327

La probabilidad de que realmente tenga la enfermedad dado que se obtiene un resultado positivo en la prueba es del 0.16 aproximadamente.

9.

Las mediciones en los sistemas de sensoramiento remoto o proximal (geomática) para agricultura de precisión siempre están sujetos a variación, algunas veces más que otras. Hay muchas estructuras para los errores de medición y los estadísticos e interesados en el tema pasan mucho tiempo modelándolos. Suponga que el error de medición X de cierta cantidad física (conductividad eléctrica del suelo) es determinado por la siguiente función de densidad:

\[f(x)=\left\lbrace\begin{array}{c} k(3-x^2),-1\leq x\leq 1, \\ 0,~~~~~~~~~~~~~~en~otro~caso \end{array}\right.\]

á) Determine k para que \(f(x)\) sea una función de densidad válida.

Para que la función \(f(x)\) sea una función de densidad para la variable aleatoria continua \(X\) debe cumplir:

\[ \int_{-\infty} ^\infty f(x)=1\] por lo tanto,

\[1=k\int_{-1} ^1 (3-x^2)~dx=k \left( \int_{-1} ^1 3~dx-\int_{-1} ^1 x^2~dx\right)= k\left(3x-\frac{x^3}{3}\right) \biggm|_{-1}^1=\frac{16}{3}k\] Entonces,

\[k=\frac{3}{16}\]

  1. Calcule la probabilidad de que un error aleatorio en la medición de la conductividad sea menor que 1/2.

La función de distribución acumulativa \(F(x)\), de una variable aleatoria continua \(X\) con función de densidad \(f(x)\), es:

\[F(x)=P(X\leq x)=\int_{-\infty} ^x f(t)~dt,~para~ -\infty<x<\infty\] Para \(-1\leq x<1\):

\[F(x)=\frac{3}{16}\cdot \int_{-1} ^x (3-t^2) dt=\frac{3}{16}\cdot \left(3t-\frac{t^3}{3}\right)\biggm|_{-1}^x=\frac{9}{16}x-\frac{1}{16}x^3+\frac{1}{2}\]

Entonces, \[P\left(X< \frac{1}{2}\right)=\left(\frac{9}{16}\right)\left(\frac{1}{2}\right)-\frac{1}{16}\left(\frac{1}{2}\right)^3+\frac{1}{2}\]

(9/16)*(1/2)-(1/16)*((1/2)^3)+(1/2)
## [1] 0.7734375
  1. Una medición específica resulta indeseable si la magnitud del error (es decir, |x|) es mayor que 0.8. ¿Cuál es la probabilidad de que esto ocurra?

\[P(|X|> x)=P(X<x)+P(X> x)\]

integrate(function(x) (3/16)*(3-x^2), lower = -1, upper = -0.8)
## 0.082 with absolute error < 9.1e-16
integrate(function(x) (3/16)*(3-x^2), lower = 0.8, upper = 1)
## 0.082 with absolute error < 9.1e-16
0.082+0.082
## [1] 0.164

La probabilidad de que la magnitud del error sea mayor que 0.8 es de 0.164

10.

Dos expertos en detectar la severidad de una enfermedad de cierto cultivo usando escalas diagramáticas examinan lotes de plantas y asignan a cada una puntuación según la escala de tres puntos. Sea X la puntuación dada por el experto A y Y la dada por el experto B. La siguiente tabla presenta la distribución conjunta para X y Y.

Calcule el valor esperado o media de las puntuaciones de X y Y así como la varianza de cada una. Calcule la media conjunta de ambos expertos.

## Valor esperado de X

1*(0.1+0.05+0.02)+2*(0.10+0.35+0.05)+3*(0.03+0.10+0.20)
## [1] 2.16
## Valor esperado de X^2

1^2*(0.1+0.05+0.02)+2^2*(0.10+0.35+0.05)+3^2*(0.03+0.10+0.20)
## [1] 5.14
## Varianza de X

5.14-2.16^2
## [1] 0.4744
## Valor esperado de Y

1*(0.1+0.1+0.03)+2*(0.05+0.35+0.1)+3*(0.02+0.05+0.20)
## [1] 2.04
## Valor esperado de Y^2

1^2*(0.1+0.1+0.03)+2^2*(0.05+0.35+0.1)+3^2*(0.02+0.05+0.20)
## [1] 4.66
## Varianza de Y

4.66-2.04^2
## [1] 0.4984
## Media conjunta

(1*1*0.1)+(1*2*0.05)+(1*3*0.2)+(2*1*0.1)+(2*2*0.35)+(2*3*0.05)+(3*1*0.03)+(3*1*0.03)+(3*2*0.1)+(3*3*0.2)
## [1] 5.28

11.

De acuerdo con la teoría genética, cierta cruza de conejillos de Indias tendrá crías rojas, negras y blancas en la proporción 8:4:4. Calcule la probabilidad de que, de 8 crías, 5 sean rojas, 2 negras y 1 sea blanca

Distribución multinomial

Total crías: 8

Proporción 8:4:4

Probabilidad:\(P(r)=1/2\), \(P(n)=1/4\), \(P(b)=1/4\)

dmultinom(x=c(5,2,1), prob = c(1/2,1/4,1/4))
## [1] 0.08203125

La probabilidad de que, de 8 crías, 5 sean rojas, 2 negras y 1 sea blanca es de 0.082 o del 8.2%.

12.

Una máquina llena 1000 latas de semillas por hora, de entre las cuales 30 resultan incompletas en el llenado según norma. Cada hora se elige al azar una muestra de 30 latas y se verifica su contenido. Denote con X el número de latas seleccionadas con llenado insuficiente. Encuentre la probabilidad de encontrar al menos una de las latas maestreadas con llenado incompleto.

Distribución hipergeométrica

  • \(dhyper(x,n,N-n,k)\)

\(N=1000\)

\(n=30\)

\(k=30\)

1-dhyper(0,30,1000-30,30)
## [1] 0.6044605
  • \(dbinom(x,n,prob); prob=k/N\)
1-dbinom(0,30,0.03)
## [1] 0.5989929

La probabilidad de encontrar al menos una de las latas maestreadas con llenado incompleto es 0.6.

13.

La probabilidad de que una planta de cierto lote tenga cierto disturbio en las hojas es de 0.3. Calcule la probabilidad de que la décima planta de ese lote seleccionada al azar sea la quinta que tiene el disturbio.

Usando la distribución binomial negativa (Tipo II): \(b*(x; k, p)\)

\(x=10\)

\(k=5\)

\(p=0.3\)

dnbinomII<- function(x,k,p){choose((x-1),(k-1))*(p^k)*((1-p)^(x-k))}
dnbinomII(10,5,0.3)
## [1] 0.05145967

Usando la distribución binomial negativa (Tipo I):\(b*(x-k; k, p)\) donde \(x-k\)=fracasos.

dnbinom(5,5,0.3 )
## [1] 0.05145967

La probabilidad de que la décima planta de ese lote seleccionada al azar sea la quinta que tiene el disturbio es del 0.0515

14.

Un agrónomo inocula a varias plantas (una a la vez) el virus que produce cierta enfermedad, hasta que encuentra a 2 que contraen la enfermedad. Si la probabilidad de contraer la enfermedad es de 1/6, ¿cuál es la probabilidad de que tenga que inocular a 8 plantas?

\(x=8\)

\(k=2\)

\(p=\frac{1}{6}\)

dnbinomII(8,2,0.166666)
## [1] 0.06511884

Usando la distribución binomial negativa (Tipo I):\(b*(x-k; k, p)\) donde \(x-k\)=fracasos.

dnbinom(6,2,0.166666)
## [1] 0.06511884

La probabilidad de que el agrónomo tenga que inocular a 8 plantas es del 0.0651.

15.

Se estima que el número promedio de ratas de campo por hectárea en un cultivo de maíz de 5 hectáreas es 10. Calcule la probabilidad de que se encuentren menos de 7 ratas de campo

  1. en una hectárea dada

Distribución de Poisson

Con \(\mu=10\), se calcula la probabilidad de que se encuentren menos de 7 ratas de campo, es decir, \(P(X<7)=P(X\leq6)\):

ppois(6,10,lower.tail = TRUE)
## [1] 0.1301414

La probabilidad de que se encuentren menos de 7 ratas de campo es del 0.1301 (aproximadamente).

  1. en 2 de las siguientes 3 hectáreas que se inspeccionen.

Distribución de binomial

\(p=0.1301414, x=2, n=3\),

dbinom(2,3,0.1301414)
## [1] 0.04419782

La probabilidad de que se encuentren menos de 7 ratas de campo en 2 de las siguientes 3 hectáreas que se inspeccionen es del 0.0442 (aproximadamente).

16.

El gerente de la cafetería de una facultad sabe que en promedio llegan a su cafetería 100 personas por hora (entre las 11am y 1 de la tarde). Para el intervalo considerado,

  1. Calcule la probabilidad de que en un periodo determinado de 3 minutos nadie entre a la cafetería.

Tenemos que en promedio llegan 100 personas por hora a la cafetería, por lo que podemos decir que en promedio llegan 5 personas por 3 minutos transcurridos, es decir, \(\lambda t=5\). La probabilidad de que en un periodo determinado de 3 minutos nadie entra a la cafetería es: \(P(X=0)\) donde \(x=0\).

dpois(0,5)
## [1] 0.006737947
  1. Calcule la probabilidad de que en un periodo dado de 3 minutos entren más de 5 personas.

La probabilidad de que en un periodo dado de 3 minutos entren más de 5 personas es \(P(X>5)=1-P(X\leq5)\)

ppois(5,5,lower.tail = FALSE)
## [1] 0.3840393
1-ppois(5,5,lower.tail =TRUE )
## [1] 0.3840393
  1. Si por protocolo de seguridad no deben entrar más de 20 personas en un período de 5 min, ¿Cuál es la probabilidad de que ocurra esto?

si en promedio llegan 5 personas por cada 3 minutos, entonces podemos decir que en promedio llegan 1.67 personas por minuto, por lo que en 5 minutos, en promedio llegan 8.33 personas.

\(\lambda t=8.33\) y se debe calcular \(P(X\leq20)\)

ppois(20,8.33,lower.tail =TRUE )
## [1] 0.9998386

La probabilidad de que esto ocurra es alta; razonando, transcurridos 6 minutos, en promedio, solo habrán llegado 10 personas, por lo cual tiene sentido esta alta probabilidad.

17.

En una investigación se determinó que el tiempo de supervivencia, en semanas, de un insecto cuando se le somete a cierta exposición de radiación gamma tiene una distribución gamma con \(\alpha=5\) y \(\beta=10\). a) ¿Cuál es el tiempo medio de supervivencia de insecto seleccionado al azar del tipo que se utilizó en el experimento?

El tiempo de supervivencia esperado es \(E(X)=\alpha\cdot\beta=(5)(10)=50\) semanas.

  1. ¿Cuál es la desviación estándar del tiempo de supervivencia?

La desviación estándar del tiempo de supervivencia es \[ \sqrt{\sigma^2}=\sqrt{\alpha\cdot\beta^2}=\sqrt{500}=22.36\]

  1. ¿Cuál es la probabilidad de que un insecto sobreviva más de 30 semanas?

La probabilidad de que un insecto sobreviva más de 30 semanas ES \(P(X>30)=0.815\)

pgamma(30, 5, scale = 10, lower.tail = F)
## [1] 0.8152632

18.

Se sabe que la tasa promedio de uso de agua (en miles de litros por hora) en cierta comunidad implica la distribución logarítmica normal con los parámetros \(\mu=5\) y \(\sigma=2\).Para propósitos de planeación es importante tener información sobre los periodos de alto consumo. ¿Cuál es la probabilidad de que, para cualquier hora determinada, se usen 50,000 litros de agua?

La probabilidad de que, para cualquier hora determinada, se usen 50,000 litros de agua es \(P(X>50,000)=0.00181\)

plnorm(q=50000, meanlog=5, sdlog=2, lower.tail = F)
## [1] 0.001807785

19.

El tiempo que le toma a un usuario de computadora leer su correo electrónico, en segundos, se distribuye como una variable aleatoria logarítmica normal con \(\mu=1.8\) y \(\sigma=4.0\).

  1. ¿Cuál es la probabilidad de que el usuario lea el correo durante más de 20 segundos? ¿Y por más de un minuto?

La probabilidad de que el usuario lea el correo durante más de 20 segundos es \(P(X>20)=0.3825\) y la probabilidad de que el usuario lea el correo durante por más de un minuto es \(P(X>60)=0.2831\)

plnorm(q=20, meanlog=1.8, sdlog=4, lower.tail = F)
## [1] 0.3824956
plnorm(q=60, meanlog=1.8, sdlog=4, lower.tail = F)
## [1] 0.2831239

Pruebas de Hipótesis

1.

Una muestra aleatoria de 64 bolsas con fibra de coco para cultivo de Arándanos (de una capacidad de 20 lit) pesan en promedio 4.5 kg. Genere los datos de la muestra usando \(rnorm(64;4.35;0.15)\) fijando su semilla con su número de cédula y pruebe la hipótesis de que el peso es inferior a 4.5 kg. Utilice un \(\alpha=0.05\). Concluya desde un punto de vista agronómico y explique una razón por la cual un peso inferior puede ser un problema desde un punto de vista del riego o dosificación de agroquímicos.

\[H_0:\mu_{fibra~de~coco}\geq4.5~kg \\ H_a:\mu_{fibra~de~coco}<4.5~kg\] Datos:

\(\mu = 4.5\), media teórica

\(\sigma = 0.15\)

\(n = 64\)

\(\alpha = 0.05\)

set.seed(1006944258)
fib_c <- rnorm(64,4.35,0.15)
head (fib_c)
## [1] 4.516718 4.260592 4.192553 4.443962 4.279860 4.145033
summary(fib_c)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   4.081   4.249   4.309   4.362   4.481   4.761
hist(fib_c,border = 4,col = "white" )
abline(v = mean(fib_c), col = "red")
abline(v = 4.5, col = '#00FF00')
text(x = 4.4, y = 15, label = "μfib") 
text(x = 4.52, y = 15, label = "μ")

boxplot(fib_c, col = "white", 
        border = 4,
        ylab = 'peso de la bolsa')
points(mean(fib_c), col = "red", pch = 15)
points( 4.5, col = "#00FF00", pch = 15)

  • Supuestos de validez: \(n > 30\) o normalidad, nuestro \(n = 64\) por lo que se cumple el primer supuesto.
tt_fib <- t.test(fib_c, mu = 4.5,alternative = "less" )
tt_fib
## 
##  One Sample t-test
## 
## data:  fib_c
## t = -6.4795, df = 63, p-value = 7.995e-09
## alternative hypothesis: true mean is less than 4.5
## 95 percent confidence interval:
##      -Inf 4.397919
## sample estimates:
## mean of x 
##  4.362491
pvalor_t <- tt_fib$p.value
pvalor_t
## [1] 7.994789e-09
ifelse(pvalor_t>0.05, 'No rechazo Ho', 'Rechazo Ho')
## [1] "Rechazo Ho"

Al rechazar la hipótesis nula podemos concluir que el peso medio de las bolsas con fibra de coco es menor que 4.5 kg con un \(valor~p = 7.994789^{-9}\). Esto se evidenciaba por medio del diagrama de caja y el histograma.

La fibra de coco ayuda a retener la humedad, por lo tanto un peso inferior puede ser un problema desde el punto de vista de riego, ya que, si se retiene menor cantidad de agua en el suelo se debe aumentar la frecuencia de riego. sin embargo, la cantidad de agua necesaria también depende de condiciones climáticas y fisiológicas, por lo tanto habría que evaluar estos aspectos en el cultivo para estar seguros de que el peso inferior de fibra de coco realmente puede representar un problema.

2.

Se supone que una máquina mezcla granos partidos de arroz con granos completos en bolsas de 1/4 Kg a razón de 1:24. Se observa que una bolsa contiene 6000 granos enteros y 350 granos partidos. A un nivel de significancia de significancia de 0.05 pruebe la hipótesis de que la máquina mezcladora de granos está excediendo la cantidad de granos partidos y por ende no se está manteniendo la razón 1:24.

  • Hipótesis:

\[H_0: Se~mantiene~la~razón~1:24 \\ H_a: No~se~mantiene~la~razón~1:24\] Datos:

  • \(\alpha=0.05\)
  • Observados: 6000 granos enteros y 350 granos partidos
  • Proporciones: 1/25, 24/25
obs <- c(6000, 350)
prop <-c( 1/25, 24/25)
p_chi<- chisq.test(obs, p = prop)
p_chi
## 
##  Chi-squared test for given probabilities
## 
## data:  obs
## X-squared = 135402, df = 1, p-value < 2.2e-16
pvalor_chi = p_chi$p.value

ifelse(pvalor_chi<0.05, 'Rechazo Ho', 'No Rechazo Ho')
## [1] "Rechazo Ho"

Decisión: rechazar la \(H_0\); la máquina mezcladora de granos está excediendo la cantidad de granos partidos y por ende no se está manteniendo la razón 1:24.

3.

Las muestras de agua se toman del agua utilizada para refrigeración cuando se vierte desde una central eléctrica a un río. Se ha determinado que la temperatura media del agua descargada sea como máximo de 65° C para que no haya efectos negativos en el ecosistema del río. Para investigar si la central cumple la normativa que prohíbe una temperatura media del agua superior a este valor los investigadores tomarán 50 muestras de agua según un protocolo de muestreo y registrarán la temperatura de cada muestra. Los datos resultantes se utilizarán para probar las hipótesis H0:µ=65 contra Ha: H0:µ>65. En el contexto de este ejemplo, describa los errores de tipo I y Tipo II. ¿Qué tipo de error consideraría más grave? Explique. Genere con rnorm (50;65.8;0.3) los datos de la muestra con una semilla asociada a su cédula. Contraste las hipótesis antes formuladas usando \(\alpha=0.05\).

  • Hipótesis

\[H_0: \mu \leq 65 \\ H_0: \mu > 65\]

  • Error tipo I: Se rechaza la hipótesis nula (\(H_0\)) cuando es verdadera.

se rechaza la hipótesis nula, es decir, se rechaza que la temperatura media del agua descargada es igual a 65 °C, aun cuando esta es verdadera.

  • Error tipo II: No se rechaza la hipótesis nula (\(H_0\)) cuando es falsa.

No se rechaza la hipótesis nula, es decir que, la evidencia señala que la temperatura media del agua descargada es igual a 65 °C, aun cuando esto es falso.

Considero que el error mas grave es el error tipo II, ya que si se concluye que la temperatura media del agua descargada es igual a 65 °C, se incurriría en el error de pensar que la central cumple la normativas que prohíbe una temperatura media del agua superior y por tanto los efectos negativos en el ecosistema pasaran desapercibidos; por otro lado si se incurre en el error de tipo I, posiblemente se evalué nuevamente la situación o se tomen medidas al respecto, innecesariamente, pero es algo de lo cual la central se puede recuperar.

  • Prueba de hipótesis

\(\alpha=0.05\)

set.seed(1006944258)
datos_a <- rnorm(50,65.8,0.3) #n = 50 muestras , media= 65.8°C , desviación estándar= 0.3 °C  
datos_a
##  [1] 66.13344 65.62118 65.48511 65.98792 65.65972 65.39007 65.75591 66.11991
##  [9] 65.69705 65.87145 65.87241 65.71686 65.97418 66.55598 65.55191 65.45156
## [17] 66.10550 65.64292 66.22670 65.37321 66.60112 65.65569 66.31736 65.59746
## [25] 65.63650 66.62118 65.98770 65.94972 65.39794 65.63140 65.60623 65.86565
## [33] 65.69975 65.40356 66.51376 65.71948 66.33716 65.60907 66.09971 66.21838
## [41] 65.48630 66.17572 65.57310 66.04627 65.87229 66.13243 65.49170 66.03818
## [49] 66.05032 66.19355
summary(datos_a)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   65.37   65.61   65.87   65.87   66.12   66.62
boxplot(datos_a, col = "white", 
        border = 4,
        ylab = 'Temperatura del agua',
        ylim=c(64.5,67))

points(65, col = "#00FF00", pch = 15) # Temperatura media normativa
points(mean(datos_a), col = "red",pch = 15) # Temperatura de las muestras

tt_a <- t.test(datos_a, mu = 65,alternative = "greater" )
tt_a
## 
##  One Sample t-test
## 
## data:  datos_a
## t = 18.194, df = 49, p-value < 2.2e-16
## alternative hypothesis: true mean is greater than 65
## 95 percent confidence interval:
##  65.79386      Inf
## sample estimates:
## mean of x 
##  65.87443
pvalor_tta = tt_a$p.value

ifelse(pvalor_tta<0.05, 'Rechazo Ho', 'No Rechazo Ho')
## [1] "Rechazo Ho"

Decisión: rechazar la \(H_0\); con un nivel se significancia de 0.05,la evidencia señala que la temperatura media del agua descargada es mayor a los 65 °C.

4.

Un agricultor afirma que el rendimiento medio del maíz de la variedad Local supera el rendimiento medio de la variedad alóctona en al menos 0.5 ton/ha. Para comprobar esta afirmación, se plantan 2 hectáreas de cada variedad y se cultivan en condiciones similares. La variedad Local produjo en promedio 5.8 ton/ha con una desviación estándar de 0,58 ton/ha, mientras que la otra variedad rindió en promedio 5.1ton/ha con una desviación estándar de 0.45 ton/ha. Prueba la afirmación del agricultor utilizando un nivel de significación de 0,05. Con los datos dados genere con rnorm de R las muestras de tamaño según la densidad de siembra que considere según la literatura para las 5 hectáreas. Aunque las medidas y las desviaciones obtenidas de las simulaciones pueden diferir de los datos, use los datos simulados para el contraste de hipótesis para un \(\alpha=0.05\).

La comparación del rendimiento medio se puede evaluar probando la siguiente hipotesis:

\[H_0: \mu_{L}- \mu_{A}\geq0.5 \\ H_a: \mu_{L}- \mu_{A} <0.5 \] Densidad de siembra del maíz: 80000 plantas/ha

# Datos
set.seed(1006944258)
maiz_vl <- rnorm(80000,5.8,0.58)
maiz_va <- rnorm(80000,5.1,0.45)
# Descriptiva de los datos
summary(maiz_vl)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   3.421   5.409   5.799   5.799   6.190   8.148
summary(maiz_va)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   3.088   4.796   5.100   5.100   5.404   6.966
boxplot(cbind(maiz_vl, maiz_va), 
        col = "white", 
        border = 4,
        ylab = 'Rendimiento del Maiz',
        xlab = 'Variedad')

        

points(mean(maiz_vl), col = "#00FF00", pch = 15)
points(2, mean(maiz_va), col = "red",pch = 15) 

# Test de varianza
var_t1 <- var.test(x = maiz_vl, y =maiz_va)
var_t1 
## 
##  F test to compare two variances
## 
## data:  maiz_vl and maiz_va
## F = 1.6487, num df = 79999, denom df = 79999, p-value < 2.2e-16
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  1.625964 1.671664
## sample estimates:
## ratio of variances 
##           1.648656
pvalor_vart = var_t1$p.value
ifelse(pvalor_vart<0.05, 'Rechazo Ho', 'No Rechazo Ho')
## [1] "Rechazo Ho"

Decisión: rechazar la \(H_0\); con un nivel se significancia de 0.05,la evidencia señala que existen diferencias significativas entre las varianzas de los dos conjuntos de datos.

# prueba t (supuesto: normalidad)
tt2 <- t.test(x = maiz_vl, y = maiz_va, var.equal = FALSE, mu = 0.5, alternative = 'less')
tt2
## 
##  Welch Two Sample t-test
## 
## data:  maiz_vl and maiz_va
## t = 76.395, df = 150945, p-value = 1
## alternative hypothesis: true difference in means is less than 0.5
## 95 percent confidence interval:
##       -Inf 0.7024285
## sample estimates:
## mean of x mean of y 
##  5.798582  5.100420
pvalor_tt2 = tt2$p.value
ifelse(pvalor_tt2<0.05, 'Rechazo Ho', 'No Rechazo Ho')
## [1] "No Rechazo Ho"

Decisión: No rechazar la \(H_0\); con un nivel se significancia de 0.05,la evidencia señala que el rendimiento medio de maíz de la variedad local supera el rendimiento medio de la variedad alóctona en más de 0.5 ton/ha.

t.test(x = maiz_vl, y = maiz_va, var.equal = FALSE, mu = 0.5, alternative = 'greater')
## 
##  Welch Two Sample t-test
## 
## data:  maiz_vl and maiz_va
## t = 76.395, df = 150945, p-value < 2.2e-16
## alternative hypothesis: true difference in means is greater than 0.5
## 95 percent confidence interval:
##  0.6938952       Inf
## sample estimates:
## mean of x mean of y 
##  5.798582  5.100420

5.

La porosidad a granel se define como el porcentaje de volumen del espacio intergranular respecto al volumen total de grano a granel. El porcentaje de espacio vacío de los diferentes granos a granel suele ser necesario en los estudios de secado, estudios de flujo de aire y flujo de calor de los granos. La porosidad depende de (a) la forma, (b) las dimensiones y (c) la rugosidad de la superficie del grano. En maíz se conoce una porosidad media de 42.5% (medido con el método de desplazamiento del mercurio). Se toman 30 muestras y se obtiene una media y una desviación estándar de la muestra para una semilla dada por su número de cédula(CC) de mean(rnorm (30;45;2)) y sd(rnorm (30;45;2)). Use un \(\alpha=0.05\) para probar la hipótesis de que la porosidad es mayor al valor conocido históricamente para el cultivo de una variedad específica.

  • Hipótesis:

\[H_0: \mu_{porosidad} \leq 42.5 \\ H_a: \mu_{porosidad}> 42.5\]

# Datos
set.seed(1006944258)
poros <- rnorm(30,45,2)
poros
##  [1] 47.22290 43.80789 42.90071 46.25282 44.06480 42.26711 44.70605 47.13271
##  [9] 44.31369 45.47633 45.48271 44.44576 46.16121 50.03989 43.34605 42.67707
## [17] 47.03668 43.95279 47.84468 42.15471 50.34080 44.03795 48.44907 43.64976
## [25] 43.91001 50.47452 46.25136 45.99811 42.31959 43.87599
summary(poros)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   42.15   43.82   44.58   45.35   46.84   50.47
hist(poros,border = 4,col = "white" )
abline(v = mean(poros), col = "red")
abline(v = 42.5, col = '#00FF00')
text(x = 45.9, y = 5.5, label = "μporos") 
text(x = 42.6, y = 5.5, label = "μ")

Observando el histograma y el diagrama de caja, la porosidad media de las muestras es mayor que la porosidad media conocida para el maíz.

boxplot(poros, col = "white", 
        border = 4,
        ylab = 'Porosidad (%)')
points(mean(poros), col = "red", pch = 15)
points( 42.5, col = "#00FF00", pch = 15)

# prueba t (supuesto: n> 30 o normalidad)

ttest_3 <- t.test(poros, mu = 42.5,alternative = "greater" )
ttest_3 
## 
##  One Sample t-test
## 
## data:  poros
## t = 6.5621, df = 29, p-value = 1.725e-07
## alternative hypothesis: true mean is greater than 42.5
## 95 percent confidence interval:
##  44.61437      Inf
## sample estimates:
## mean of x 
##  45.35312
pvalor_tt3 = ttest_3$p.value
ifelse(pvalor_tt3<0.05, 'Rechazo Ho', 'No Rechazo Ho')
## [1] "Rechazo Ho"

Decisión: Rechazar la \(H_0\); con un nivel se significancia de 0.05,la evidencia señala que la porosidad es mayor al valor conocido históricamente para el cultivo de una variedad específica.

6.

Con la función expand.grid de R cree una rejilla de 10 filas y 12 columnas y con grid cierre la cuadrícula para que se perciban las 120 celdas. Genere unos datos con la función round(runif(120,0,1.2),0) genere el estado de unas plantas que caen un por celda. El cero representa las sanas y el 1 las enfermas. Pinte un color para cada caso diferente de modo que en la imagen se perciban sanas y enfermas. Asuma la prevalencia total de la enfermedad como la medida de referencia inicial (parámetro) para comparar con los muestreos. Tome muestras aleatorias de tamaño 10:80 y estime la prevalencia en cada caso ( use sample de R). Grafique la prevalencia contra tamaño de muestra y muestre el alejamiento de cada prevalencia con el verdadero valor conocido inicialmente. Haga una nueva rejilla enfermando un 10% adicional a las que estaban enfermas inicialmente asumiendo que ninguna enferma pasa al estado sana, solo sanas pasan a enfermas. Una vez tenga las dos rejillas, calcule para los mismos tamaños de muestra la nueva prevalencia y estime las incidencias asumiendo que cada imagen tiene una separación de 12 días. Haga los gráficos respectivos. Saque las conclusiones respecto del tamaño de muestra. Suponga que muestrear una planta tiene un costo de 20 mil pesos y se tiene un presupuesto de a lo sumo un millón de pesos para cada muestreo. Una vez tenga todos los resultados haga un muestro hipercubo-latino condicionado con la librería clhs de R y ponga como tamaño de muestra el que queda definido por el presupuesto. Muestre en las rejillas en todos los casos las plantas muestreadas de forma aleatoria y espacial. Estime todas las prevalencias e incidencias con este muestreo. Compare ambos resultados y comente las diferencias encontradas y diga la razón que tiene para seleccionar uno de estos como el más conveniente.

# Datos
set.seed(1006944258)
rejilla <- expand.grid(x = seq(0,77,by = 7),
            y = seq(0,99, by =11))

estado_1 <- round(runif(120,0,1.2),0)

estado_nom <- ifelse(estado_1 == 0, 'Sana', 'Enferma')
estado_col <- ifelse(estado_1 == 0, 'green', 'red')
df <- data.frame(rejilla, estado_1, estado_nom, estado_col)

plot(rejilla, pch = 8, col = estado_col)

valores_i <- table(estado_nom) # sanas=0, enfermas=1
valores_i
## estado_nom
## Enferma    Sana 
##      58      62

Asumiendo la prevalencia total de la enfermedad como la medida de referencia inicial:

valores_i/120
## estado_nom
##   Enferma      Sana 
## 0.4833333 0.5166667
100*valores_i[1]/sum(valores_i)
##  Enferma 
## 48.33333
n_muestras <- sample(10:80,40,replace=F) 
n_muestras
##  [1] 69 44 45 10 20 56 51 26 78 22 77 14 18 28 73 61 15 31 53 38 37 60 68 59 24
## [26] 75 32 50 65 64 79 76 48 34 66 80 23 74 47 63
enf_muest = NULL

for(i in n_muestras){
  muestra = clhs(x = rejilla, size = i) 
  enf_muest = c(enf_muest, table(estado_nom[muestra])['Enferma']/i)
  prev_i = table(estado_nom[muestra])/i 
  cat('\nn_muestra:',i,'\n')
  print(prev_i)
}
## 
## n_muestra: 69 
## 
##   Enferma      Sana 
## 0.4782609 0.5217391 
## 
## n_muestra: 44 
## 
##   Enferma      Sana 
## 0.4318182 0.5681818 
## 
## n_muestra: 45 
## 
##   Enferma      Sana 
## 0.5555556 0.4444444 
## 
## n_muestra: 10 
## 
## Enferma    Sana 
##     0.2     0.8 
## 
## n_muestra: 20 
## 
## Enferma    Sana 
##    0.55    0.45 
## 
## n_muestra: 56 
## 
##   Enferma      Sana 
## 0.4821429 0.5178571 
## 
## n_muestra: 51 
## 
##   Enferma      Sana 
## 0.4313725 0.5686275 
## 
## n_muestra: 26 
## 
##   Enferma      Sana 
## 0.5384615 0.4615385 
## 
## n_muestra: 78 
## 
## Enferma    Sana 
##     0.5     0.5 
## 
## n_muestra: 22 
## 
##   Enferma      Sana 
## 0.5909091 0.4090909 
## 
## n_muestra: 77 
## 
##   Enferma      Sana 
## 0.4675325 0.5324675 
## 
## n_muestra: 14 
## 
##   Enferma      Sana 
## 0.2857143 0.7142857 
## 
## n_muestra: 18 
## 
##   Enferma      Sana 
## 0.4444444 0.5555556 
## 
## n_muestra: 28 
## 
##   Enferma      Sana 
## 0.3571429 0.6428571 
## 
## n_muestra: 73 
## 
##   Enferma      Sana 
## 0.4657534 0.5342466 
## 
## n_muestra: 61 
## 
##   Enferma      Sana 
## 0.4590164 0.5409836 
## 
## n_muestra: 15 
## 
## Enferma    Sana 
##     0.4     0.6 
## 
## n_muestra: 31 
## 
##   Enferma      Sana 
## 0.4193548 0.5806452 
## 
## n_muestra: 53 
## 
##   Enferma      Sana 
## 0.4528302 0.5471698 
## 
## n_muestra: 38 
## 
##   Enferma      Sana 
## 0.4473684 0.5526316 
## 
## n_muestra: 37 
## 
##   Enferma      Sana 
## 0.4864865 0.5135135 
## 
## n_muestra: 60 
## 
##   Enferma      Sana 
## 0.5166667 0.4833333 
## 
## n_muestra: 68 
## 
##   Enferma      Sana 
## 0.5294118 0.4705882 
## 
## n_muestra: 59 
## 
##   Enferma      Sana 
## 0.4576271 0.5423729 
## 
## n_muestra: 24 
## 
##   Enferma      Sana 
## 0.5416667 0.4583333 
## 
## n_muestra: 75 
## 
##   Enferma      Sana 
## 0.5333333 0.4666667 
## 
## n_muestra: 32 
## 
## Enferma    Sana 
## 0.59375 0.40625 
## 
## n_muestra: 50 
## 
## Enferma    Sana 
##    0.52    0.48 
## 
## n_muestra: 65 
## 
##   Enferma      Sana 
## 0.5076923 0.4923077 
## 
## n_muestra: 64 
## 
## Enferma    Sana 
## 0.40625 0.59375 
## 
## n_muestra: 79 
## 
##   Enferma      Sana 
## 0.4556962 0.5443038 
## 
## n_muestra: 76 
## 
## Enferma    Sana 
##     0.5     0.5 
## 
## n_muestra: 48 
## 
##   Enferma      Sana 
## 0.4791667 0.5208333 
## 
## n_muestra: 34 
## 
##   Enferma      Sana 
## 0.6176471 0.3823529 
## 
## n_muestra: 66 
## 
##   Enferma      Sana 
## 0.4393939 0.5606061 
## 
## n_muestra: 80 
## 
## Enferma    Sana 
##  0.5375  0.4625 
## 
## n_muestra: 23 
## 
##   Enferma      Sana 
## 0.6086957 0.3913043 
## 
## n_muestra: 74 
## 
##   Enferma      Sana 
## 0.5675676 0.4324324 
## 
## n_muestra: 47 
## 
##   Enferma      Sana 
## 0.5319149 0.4680851 
## 
## n_muestra: 63 
## 
##   Enferma      Sana 
## 0.5238095 0.4761905
plot(n_muestras, enf_muest, pch = 16)
text(n_muestras, enf_muest, n_muestras, pos = 4, cex = 0.6)
abline(h = table(estado_nom)['Enferma']/120, col = 'red')

sanas <- which(df$estado_1 == 0) 

nuevas_enfermas <- sample(sanas, size = 12)

estado_2 <- estado_1

estado_2[nuevas_enfermas] = 1
rejilla_2 <- expand.grid(x = seq(0,77,by = 7),
            y = seq(0,99, by =11))

estado_nom_2 <- ifelse(estado_2 == 0, 'Sana', 'Enferma')
estado_col_2 <- ifelse(estado_2 == 0, 'green', 'red')

df_2 <- data.frame(rejilla_2, estado_2, estado_nom_2, estado_col_2)

plot(rejilla_2, pch = 8, col = estado_col_2 )

valores_i_2 <- table(estado_nom_2)
valores_i_2
## estado_nom_2
## Enferma    Sana 
##      70      50
valores_i_2/120
## estado_nom_2
##   Enferma      Sana 
## 0.5833333 0.4166667
# Prevalencia de la enfermedad (%)
100*valores_i_2[1]/sum(valores_i_2)
##  Enferma 
## 58.33333
  • Incidencia
nuevas_enfermas <- estado_2 - df$estado_1
nuevas_enfermas
##   [1] 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0
##  [38] 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0
##  [75] 0 0 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0
## [112] 0 0 0 0 0 0 0 0 0
nuevos_casos <- which(nuevas_enfermas == 1)
length(nuevos_casos)
## [1] 12
## Separación de 12 días 

incidencia_1 <- length(nuevos_casos)/12
incidencia_1 
## [1] 1
incidencia_2 <- length(nuevos_casos)/(120-(length(which(estado_2 == 1))+length(nuevos_casos)))
incidencia_2  
## [1] 0.3157895
incidencia_2*100
## [1] 31.57895

CONCLUSIONES

  • Se tiene 1 caso nuevo por día.

  • La incidencia corresponde a 31.6 casos nuevos (nuevas enfermas) por cada 100 plantas.

  • Entre mas grande es el tamaño de la muestra mas nos acercamos al valor real de prevalencia.

  • Si muestrear una planta tiene un costo de 20 mil pesos y se tiene un presupuesto de 1 millón de pesos se podrían muestrear 50 plantas, que parece ser un buen tamaño de muestra, según la gráfica de prevalencia contra tamaño de muestra.

## Muestreo en hipercubo latino

p_muest <- rejilla[clhs(x = rejilla, size = 50), ]
p_muest
##      x  y
## 118 63 99
## 12  77  0
## 24  77 11
## 13   0 11
## 77  28 66
## 62   7 55
## 89  28 77
## 119 70 99
## 57  56 44
## 108 77 88
## 6   35  0
## 59  70 44
## 46  63 33
## 100 21 88
## 96  77 77
## 44  49 33
## 25   0 22
## 109  0 99
## 26   7 22
## 4   21  0
## 35  70 22
## 116 49 99
## 19  42 11
## 74   7 66
## 52  21 44
## 9   56  0
## 91  42 77
## 63  14 55
## 31  42 22
## 79  42 66
## 102 35 88
## 113 28 99
## 98   7 88
## 67  42 55
## 83  70 66
## 64  21 55
## 95  70 77
## 54  35 44
## 68  49 55
## 42  35 33
## 87  14 77
## 5   28  0
## 69  56 55
## 20  49 11
## 101 28 88
## 47  70 33
## 81  56 66
## 106 63 88
## 61   0 55
## 94  63 77
plot(rejilla$x, rejilla$y, pch = 8, col = estado_col)
points(p_muest$x, p_muest$y, cex = 2)

df_p_muest <- merge(x = df, y = p_muest)

t_enfermas <- sum(df_p_muest $estado_1)
t_enfermas
## [1] 21
t_sanas <- 50 - t_enfermas
t_sanas
## [1] 29

Enfermas: 21 Sanas: 29

# Prevalencia 

t_enfermas/(t_enfermas+t_sanas)
## [1] 0.42
plot(rejilla_2$x, rejilla_2$y, pch = 8, col = estado_col_2) 
points(p_muest$x, p_muest$y, cex = 2)

df2_p_muest <- merge(x = df_2, y = p_muest)

t_enfermas_2 <- sum(df2_p_muest $ estado_2)
t_enfermas_2
## [1] 25
t_sanas_2 <- 50 - t_enfermas_2
t_sanas_2
## [1] 25

Enfermas:25 sana: 25

# Prevalencia 
  
t_enfermas_2/(t_enfermas_2+t_sanas_2)
## [1] 0.5
# Incidencia (Separación de 12 días )
(t_enfermas_2-t_enfermas)/12
## [1] 0.3333333
((t_enfermas_2-t_enfermas)/ (t_sanas_2+(t_enfermas_2-t_enfermas)))*100
## [1] 13.7931

CONCLUSIONES

  • Se tiene 0.33 caso nuevo por día.

  • La incidencia corresponde a 13.8 casos nuevos (nuevas enfermas) por cada 100 plantas.

Prevalencia real

\(\hat{p}_1=0.48\)

\(\hat{p}_2=0.58\)

\(n = 50\)

\(\hat{p}_1=0.42\)

\(\hat{p}_2=0.5\)

Incidencia real

\(\hat \lambda_{t}=1\)

\(\hat \lambda_{casos~en~riesgo}=0.315\)

\(n = 50\)

\(\hat \lambda_{t}=0.33\)

\(\hat \lambda_{casos~en~riesgo}=0.138\)

  • El tamaño de muestra correspondiente a 50 proporciona valores aproximados a los reales para la prevalencia y se ajusta al presupuesto. Por otro lado, al calcular la incidencia con este muestreo parece alejarse más del valor real, sin embargo, cabe resaltar que en la incidencia refleja el número de casos nuevos en un periodo de tiempo dado, por lo tanto se esperan estas diferencias.
sample.size.prop(e = 0.1, P = 0.5, N = 120, level = 0.95)
## 
## sample.size.prop object: Sample size for proportion estimate
## With finite population correction: N=120, precision e=0.1 and expected proportion P=0.5
## 
## Sample size needed: 54

Como se puede apreciar el tamaño de muestra utilizado (\(n=50\)) esta “cerca” del requerido para un \(N=120\), precisión \(e=0.1\) y proporción esperada \(P=0.5\).