1 PROBLEMA 1

1.1 Estimación del valor de π

## Solucion

# Paso 1

# se crea la funcion para estimar π
estimacion=function(n){
  x=runif(n,0,1)
  y=runif(n,0,1)
  d=(x-0.5)^2+(y-0.5)^2
  c=sum(d<0.25)/n
}

# paso 2

# se genera la semilla de puntos
set.seed(123)

# se genera una muestra con 1.000 datos
n=1000
pi_4=estimacion(n)
pi=pi_4*4
pi

## [1] 3.2

print(paste("para una muestra de 1000 datos el valor aproximado de pi es:", pi))

## [1] "para una muestra de 1000 datos el valor aproximado de pi es: 3.2"

# guardar los datos generados en un dataframe
x=runif(n,0,1)
y=runif(n,0,1)
coordenadas=data.frame(x,y) 

# Grafico de la estimacion de pi con 1000 datos
library(ggplot2)
library(ggforce)
ggplot(coordenadas, aes(x = x, y = y)) +
  geom_point() +  # Agrega puntos al gráfico
  geom_circle(aes(x0 = 0.5, y0 = 0.5, r = 0.5), color = "blue", fill = NA, linewidth = 1) +  # Agrega un círculo
  xlim(0, 1) +     # Establece límites en el eje x
  ylim(0, 1) +     # Establece límites en el eje y
  ggtitle("Gráfico de Dispersión con Círculo de Diámetro 1") +
  xlab("Eje X") +
  ylab("Eje Y")

como se puede observar se obtiene una representacion grafica de la estimacion de π/4 con 1000 datos de muestra. Nota: para las siguientes simulaciones que conlleva muestras superiores a 1000 datos, no se hara representacion grafica ya que el calculo computacional, asi como su visualizacion no es tan eficiente.

set.seed(123)
# se genera una muestra con 10.000 de datos
n=10000
pi_4=estimacion(n)
pi=pi_4*4
pi

## [1] 3.1576

print(paste("para una muestra de 10.000 datos el valor aproximado de pi es:", pi))

## [1] "para una muestra de 10.000 datos el valor aproximado de pi es: 3.1576"

# se genera una muestra con 100.000 de datos
n=100000
pi_4=estimacion(n)
pi=pi_4*4
pi

## [1] 3.14296

print(paste("para una muestra de 100.000 datos el valor aproximado de pi es:", pi))

## [1] "para una muestra de 100.000 datos el valor aproximado de pi es: 3.14296"

como se logra evidenciar en los 3 procesos anteriores, a medida que se va aumentando la muestra, la estimacion del valor de pi, se va aproximando a su verdadero valor.

2 PROBLEMA 2

2.1 Propiedades de los estimadores

La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son. insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.

Sean X1 , X2 , X3 y X4, una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:

\[ \hat\theta_{1}=\frac{X_{1}+X_{2}}{6}+\frac{X_{3}+X_{4}}{3} \] \[ \hat\theta_{2}=\frac{X_{1}+X_{2}+X_{3}+X_{4}}{5} \] \[ \hat\theta_{3}=\frac{X_{1}+X_{2}+X_{3}+X_{4}}{4} \] \[ \hat\theta_{4}=\frac{min\{X_{1}+X_{2}+X_{3}+X_{4}\}+max{\{X_{1}+X_{2}+X_{3}+X_{4}\}}}{2} \]

2.2 Solución

2.2.1 Para muestra n=20

library(ggplot2)
set.seed(7428)
lambda=2
funcion = function(ttotal){
  x = rexp(4, rate = 1/lambda)
  t1=(((x[1]+x[2])/6) + ((x[3]+x[4])/3))
  t2=((x[1]+2*x[2]+3*x[3]+4*x[4])/5)
  t3=((x[1]+x[2]+x[3]+x[4])/4)
  t4=((min(x)+max(x))/2)
  ttotal=c(t1,t2,t3,t4)
  return(ttotal)
}
resultados = sapply(rep(1:20),funcion)

dataf= t(data.frame(resultados))

boxplot(dataf, main = "Boxplots por Columna n=20", col = c("red", "blue", "green", "purple"), names = c("tetha1", "tetha2", "tetha3", "tetha4"))
abline(h=lambda,  col="purple")

promedios_por_columna <- colMeans(dataf)

nombres_columnas <- c("tetha1", "tetha2", "tetha3", "tetha4")

promedios_por_columna_redondeados <- round(promedios_por_columna, digits = 3)


mensaje_concatenado <- paste("Promedios por columna:", nombres_columnas, "=", promedios_por_columna_redondeados)


print(mensaje_concatenado)

## [1] "Promedios por columna: tetha1 = 1.754"
## [2] "Promedios por columna: tetha2 = 3.737"
## [3] "Promedios por columna: tetha3 = 1.781"
## [4] "Promedios por columna: tetha4 = 2.119"

varianzas_por_columna <- apply(dataf, 2, var)
varianzas_por_columna_redondeados = round(varianzas_por_columna, digits = 3)
mensaje_concatenado <- paste("Varianza por columna:", nombres_columnas, "=", varianzas_por_columna_redondeados)
print(mensaje_concatenado)

## [1] "Varianza por columna: tetha1 = 0.862"
## [2] "Varianza por columna: tetha2 = 4.117"
## [3] "Varianza por columna: tetha3 = 1.053"
## [4] "Varianza por columna: tetha4 = 1.635"

De acuerdo a los resultados obtenidos para una muestra n=20 y observando el grafico, se puede afirmar que θ₁ y θ₃ son posiblemente insesgados y que θ₁ es el mas eficiente debido a su menor varianza

2.2.2 Para muestra n=50

library(ggplot2)
set.seed(7428)
lambda=2
funcion = function(ttotal){
  x = rexp(4, rate = 1/lambda)
  t1=(((x[1]+x[2])/6) + ((x[3]+x[4])/3))
  t2=((x[1]+2*x[2]+3*x[3]+4*x[4])/5)
  t3=((x[1]+x[2]+x[3]+x[4])/4)
  t4=((min(x)+max(x))/2)
  ttotal=c(t1,t2,t3,t4)
  return(ttotal)
}
resultados = sapply(rep(1:50),funcion)

dataf= t(data.frame(resultados))

boxplot(dataf, main = "Boxplots por Columna n=50", col = c("red", "blue", "green", "purple"), names = c("tetha1", "tetha2", "tetha3", "tetha4"))
abline(h=lambda,  col="purple")

promedios_por_columna <- colMeans(dataf)

nombres_columnas <- c("tetha1", "tetha2", "tetha3", "tetha4")

promedios_por_columna_redondeados <- round(promedios_por_columna, digits = 3)

mensaje_concatenado <- paste("Promedios por columna:", nombres_columnas, "=", promedios_por_columna_redondeados)

print(mensaje_concatenado)

## [1] "Promedios por columna: tetha1 = 1.911"
## [2] "Promedios por columna: tetha2 = 3.89" 
## [3] "Promedios por columna: tetha3 = 1.919"
## [4] "Promedios por columna: tetha4 = 2.272"

varianzas_por_columna <- apply(dataf, 2, var)
varianzas_por_columna_redondeados = round(varianzas_por_columna, digits = 3)
mensaje_concatenado <- paste("Varianza por columna:", nombres_columnas, "=", varianzas_por_columna_redondeados)
print(mensaje_concatenado)

## [1] "Varianza por columna: tetha1 = 1.36" 
## [2] "Varianza por columna: tetha2 = 5.656"
## [3] "Varianza por columna: tetha3 = 1.25" 
## [4] "Varianza por columna: tetha4 = 2.286"

Se repite la tendencia, parece que el estimador θ₁ sigue siendo el más prometedor en términos de ser insesgado y eficiente, seguido de cerca por θ₃.

2.2.3 Para muestra n=100

library(ggplot2)
set.seed(7428)
lambda=2
funcion = function(ttotal){
  x = rexp(4, rate = 1/lambda)
  t1=(((x[1]+x[2])/6) + ((x[3]+x[4])/3))
  t2=((x[1]+2*x[2]+3*x[3]+4*x[4])/5)
  t3=((x[1]+x[2]+x[3]+x[4])/4)
  t4=((min(x)+max(x))/2)
  ttotal=c(t1,t2,t3,t4)
  return(ttotal)
}
resultados = sapply(rep(1:100),funcion)

dataf= t(data.frame(resultados))

boxplot(dataf, main = "Boxplots por Columna n=100", col = c("red", "blue", "green", "purple"), names = c("tetha1", "tetha2", "tetha3", "tetha4"))
abline(h=lambda,  col="purple")

promedios_por_columna <- colMeans(dataf)

nombres_columnas <- c("tetha1", "tetha2", "tetha3", "tetha4")

promedios_por_columna_redondeados <- round(promedios_por_columna, digits = 3)

mensaje_concatenado <- paste("Promedios por columna:", nombres_columnas, "=", promedios_por_columna_redondeados)

print(mensaje_concatenado)

## [1] "Promedios por columna: tetha1 = 1.799"
## [2] "Promedios por columna: tetha2 = 3.631"
## [3] "Promedios por columna: tetha3 = 1.808"
## [4] "Promedios por columna: tetha4 = 2.11"

varianzas_por_columna <- apply(dataf, 2, var)
varianzas_por_columna_redondeados = round(varianzas_por_columna, digits = 3)
mensaje_concatenado <- paste("Varianza por columna:", nombres_columnas, "=", varianzas_por_columna_redondeados)
print(mensaje_concatenado)

## [1] "Varianza por columna: tetha1 = 1.12" 
## [2] "Varianza por columna: tetha2 = 4.851"
## [3] "Varianza por columna: tetha3 = 1.007"
## [4] "Varianza por columna: tetha4 = 1.607"

Con una muestra n=100, θ₁ y θ₃: Continúan pareciendo posiblemente insesgados.Y la varianza más baja sigue siendo la de θ₁,lo que lo convierte en el mas eficiente, seguida por θ₃, θ₄ y θ₂, en orden descendente. ### Para muestra n=1000

library(ggplot2)
set.seed(7428)
lambda=2
funcion = function(ttotal){
  x = rexp(4, rate = 1/lambda)
  t1=(((x[1]+x[2])/6) + ((x[3]+x[4])/3))
  t2=((x[1]+2*x[2]+3*x[3]+4*x[4])/5)
  t3=((x[1]+x[2]+x[3]+x[4])/4)
  t4=((min(x)+max(x))/2)
  ttotal=c(t1,t2,t3,t4)
  return(ttotal)
}
resultados = sapply(rep(1:1000),funcion)

dataf= t(data.frame(resultados))

boxplot(dataf, main = "Boxplots por Columna n=1000", col = c("red", "blue", "green", "purple"), names = c("tetha1", "tetha2", "tetha3", "tetha4"))
abline(h=lambda,  col="purple")

promedios_por_columna <- colMeans(dataf)

nombres_columnas <- c("tetha1", "tetha2", "tetha3", "tetha4")

promedios_por_columna_redondeados <- round(promedios_por_columna, digits = 3)

mensaje_concatenado <- paste("Promedios por columna:", nombres_columnas, "=", promedios_por_columna_redondeados)

print(mensaje_concatenado)

## [1] "Promedios por columna: tetha1 = 1.959"
## [2] "Promedios por columna: tetha2 = 3.909"
## [3] "Promedios por columna: tetha3 = 1.964"
## [4] "Promedios por columna: tetha4 = 2.297"

varianzas_por_columna <- apply(dataf, 2, var)
varianzas_por_columna_redondeados = round(varianzas_por_columna, digits = 3)
mensaje_concatenado <- paste("Varianza por columna:", nombres_columnas, "=", varianzas_por_columna_redondeados)
print(mensaje_concatenado)

## [1] "Varianza por columna: tetha1 = 1.096"
## [2] "Varianza por columna: tetha2 = 4.627"
## [3] "Varianza por columna: tetha3 = 0.976"
## [4] "Varianza por columna: tetha4 = 1.574"

Finalmente, con una muestra de mil se termian de comprobar queel estimador θ₁ sigue siendo el más prometedor en términos de ser insesgado y eficiente, seguido de cerca por θ₃. Los estimadores θ₂ y θ₄ continúan mostrando sesgo y menor eficiencia en comparación con θ₁ y θ₃.

2.3 CONCLUSIONES PROBLEMA 2

Los resultados mostraron que los estimadores θ₁ y θ₃ parecen ser los más insesgados, ya que sus sesgos tienden a ser cercanos a cero o incluso negativos en algunos casos. Además, los estimadores θ₂ y θ₄ tienden a mostrar sesgo, ya que sus promedios están significativamente alejados del valor verdadero del parámetro.

Ahora bien, en términos de eficiencia, el estimador θ₁ ha mostrado consistentemente la menor varianza o mediana de varianza, lo que sugiere que es el estimador más eficiente en comparación con los otros. Los estimadores θ₃, θ₄ y θ₂, en ese orden, siguen a θ₁ en términos de eficiencia.

En cuanto a la consistencia, se pudo observar durante el diferente número de muestras cómo el estimador θ₁ es el más consistente, ya que tiende a ser insesgado y tener la menor varianza en comparación con los otros estimadores.

3 PROBLEMA 3

3.1 Teorema del Límite Central

El Teorema del Límite Central es uno de los más importantes en la inferencia estadística y habla sobre la convergencia de los estimadores como la proporción muestral a la distribución normal. Algunos autores afirman que esta aproximación es bastante buena a partir del umbral n>30

A continuación se describen los siguientes pasos para su verificación:

Realice una simulación en la cual genere una población de n=1000 (Lote), donde el porcentaje de individuos (supongamos plantas) enfermas sea del 50%.
Genere una función que permita: Obtener una muestra aleatoria de la población y
Calcule el estimador de la proporción muestral pˆ para un tamaño de muestra dado n . Repita el escenario anterior (b) n=500 veces y analice los resultados en cuanto al comportamiento de los 500 resultados del estimador pˆ. ¿Qué tan simétricos o sesgados son los resultados obtenidos? y ¿qué se puede observar en cuanto a la variabilidad?. Realice en su informe un comentario sobre los resultados obtenidos.
Repita los puntos b y c para tamaños de muestra n=5, 10, 15, 20, 30, 50, 60, 100, 200, 500. Compare los resultados obtenidos para los diferentes tamaños de muestra en cuanto a la normalidad. Utilice pruebas de bondad y ajuste (shapiro wilks :shspiro.test()) y métodos gráficos (gráfico de normalidad: qqnorm()). Comente en su informe los resultados obtenidos.
Repita toda la simulación (puntos a – d), pero ahora para lotes con 10% de plantas enfermas y de nuevo para lotes con un 90% de plantas enfermas. Concluya sobre los resultados del ejercicio.

3.1.1 Para 50% de las plantas enfermas

# Generar una población de 1000 elementos con 500 unos y 500 ceros
poblacion <- sample(c(rep(1, 500), rep(0, 500)))
suppressWarnings(library(e1071))

library(moments)


table(poblacion)

## poblacion
##   0   1 
## 500 500

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}

resultadostlc = sapply(rep(1:5),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.93157, p-value = 0.6071

par(mfrow = c(1, 3))

hist(resultadostlc, main = "Histograma de n=5", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")


qqnorm(resultadostlc)
qqline(resultadostlc, col = "red")  


plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: 0.567720278926305"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.00876356092008266"

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}

resultadostlc = sapply(rep(1:10),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.89788, p-value = 0.2076

par(mfrow = c(1, 3))

hist(resultadostlc, main = "Histograma de n=10", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")

qqnorm(resultadostlc)
qqline(resultadostlc, col = "red")  # Añadir una línea de referencia

plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: 0.268948975034785"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.0187723200484117"

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}

resultadostlc = sapply(rep(1:15),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.95223, p-value = 0.5602

par(mfrow = c(1, 3))


hist(resultadostlc, main = "Histograma de n=15", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")

qqnorm(resultadostlc)
qqline(resultadostlc, col = "red")  # Añadir una línea de referencia

plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: 0.115901310046338"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.0144907195259915"

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}

resultadostlc = sapply(rep(1:20),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.95607, p-value = 0.4687

par(mfrow = c(1, 3))

hist(resultadostlc, main = "Histograma de n=20", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")


qqnorm(resultadostlc)
qqline(resultadostlc, col = "red")  # Añadir una línea de referencia

plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: -0.227753066845844"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.0176026313822379"

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}

resultadostlc = sapply(rep(1:30),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.94139, p-value = 0.09913

par(mfrow = c(1, 3))

hist(resultadostlc, main = "Histograma de n=30", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")

qqnorm(resultadostlc)
qqline(resultadostlc, col = "red")  # Añadir una línea de referencia

plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: 0.833972846622353"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.0154002537671285"

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}

resultadostlc = sapply(rep(1:50),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.98423, p-value = 0.7383

par(mfrow = c(1, 3))

hist(resultadostlc, main = "Histograma de n=50", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")

qqnorm(resultadostlc)
qqline(resultadostlc, col = "red")  # Añadir una línea de referencia


plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: 0.0191172061797712"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.0146705313399317"

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}

resultadostlc = sapply(rep(1:60),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.98251, p-value = 0.5433

par(mfrow = c(1, 3))

hist(resultadostlc, main = "Histograma de n=60", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")

qqnorm(resultadostlc)
qqline(resultadostlc, col = "red")  # Añadir una línea de referencia

plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: -0.190851536447406"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.0175251554471374"

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}

resultadostlc = sapply(rep(1:100),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.98245, p-value = 0.2052

par(mfrow = c(1, 3))

hist(resultadostlc, main = "Histograma de n=100", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")


qqnorm(resultadostlc)
qqline(resultadostlc, col = "red")  # Añadir una línea de referencia

plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: 0.19057570565341"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.0174584181309867"

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}

resultadostlc = sapply(rep(1:200),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.99126, p-value = 0.2703

par(mfrow = c(1, 3))

hist(resultadostlc, main = "Histograma de n=200", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")

qqnorm(resultadostlc)
qqline(resultadostlc, col = "red")  # Añadir una línea de referencia

plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: -0.0617764229342195"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.0158156432959372"

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}

resultadostlc = sapply(rep(1:500),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.99516, p-value = 0.1203

par(mfrow = c(1, 3))

hist(resultadostlc, main = "Histograma de n=500", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")

qqnorm(resultadostlc)
qqline(resultadostlc, col = "red")  # Añadir una línea de referencia

plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: 0.110869700279067"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.0162796700000529"

El resultado del test de Shapiro-Wilk aplicado a todas las muestras sugiere que no hay suficiente evidencia para rechazar la hipótesis nula de que los datos se distribuyen normalmente. Esto indica que, en todos los casos examinados, los datos muestran características consistentes con una distribución normal.

3.1.2 Para 10% de las plantas enfermas

poblacion2 <- sample(c(rep(1, 100), rep(0, 900)))

table(poblacion2)

## poblacion2
##   0   1 
## 900 100

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}

resultadostlc = sapply(rep(1:5),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.96939, p-value = 0.8713

par(mfrow = c(1, 3))

hist(resultadostlc, main = "Histograma de n=5", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")

qqnorm(resultadostlc)
qqline(resultadostlc, col = "red")  # Añadir una línea de referencia

plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: -0.213180710750197"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.029879759035173"

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}

resultadostlc = sapply(rep(1:10),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.97103, p-value = 0.9002

par(mfrow = c(1, 3))

hist(resultadostlc, main = "Histograma de n=10", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")

qqnorm(resultadostlc)
qqline(resultadostlc, col = "red")  # Añadir una línea de referencia

plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: 0.19243642228177"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.0126929551764399"

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}

resultadostlc = sapply(rep(1:15),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.89512, p-value = 0.08018

par(mfrow = c(1, 3))

hist(resultadostlc, main = "Histograma de n=15", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")

qqnorm(resultadostlc)
qqline(resultadostlc, col = "red")  # Añadir una línea de referencia

plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: 1.16620448725347"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.0182365410254091"

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}

resultadostlc = sapply(rep(1:20),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.9451, p-value = 0.2988

par(mfrow = c(1, 3))

hist(resultadostlc, main = "Histograma de n=20", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")

qqnorm(resultadostlc)
qqline(resultadostlc, col = "red")  # Añadir una línea de referencia

plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: -0.287282389190553"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.0145453917462759"

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}

resultadostlc = sapply(rep(1:30),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.97297, p-value = 0.6231

par(mfrow = c(1, 3))

hist(resultadostlc, main = "Histograma de n=30", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")

qqnorm(resultadostlc)
qqline(resultadostlc, col = "red")  # Añadir una línea de referencia

plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: 0.111484633383816"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.0166645056070211"

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}

resultadostlc = sapply(rep(1:50),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.97615, p-value = 0.4033

par(mfrow = c(1, 3))

hist(resultadostlc, main = "Histograma de n=50", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")

qqnorm(resultadostlc)
qqline(resultadostlc, col = "red")  

plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: 0.382687374377109"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.0151078301093256"

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}

resultadostlc = sapply(rep(1:60),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.98072, p-value = 0.4596

par(mfrow = c(1, 3))

hist(resultadostlc, main = "Histograma de n=60", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")

qqnorm(resultadostlc)
qqline(resultadostlc, col = "red") 

plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: -0.390908917017473"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.0180248102711439"

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}

resultadostlc = sapply(rep(1:100),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.98665, p-value = 0.4143

par(mfrow = c(1, 3))

hist(resultadostlc, main = "Histograma de n=100", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")

qqnorm(resultadostlc)
qqline(resultadostlc, col = "red")  

plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: 0.142873438885429"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.0144045307126093"

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}

resultadostlc = sapply(rep(1:200),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.99476, p-value = 0.7145

par(mfrow = c(1, 3))

hist(resultadostlc, main = "Histograma de n=200", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")

qqnorm(resultadostlc)
qqline(resultadostlc, col = "red")  

plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: 0.109057647768758"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.0168007058956749"

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}

resultadostlc = sapply(rep(1:500),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.99519, p-value = 0.1239

par(mfrow = c(1, 3))

hist(resultadostlc, main = "Histograma de n=500", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")

qqnorm(resultadostlc)
qqline(resultadostlc, col = "red")  

plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: -0.0296575514560397"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.0166620979175501"

De acuerdo al test de Shapiro-Wilk aplicado a todas las muestras, se evidencia que en todos los casos los datos podrían provenir de una distribución normal.

3.1.3 Para 90% de las plantas enfermas

poblacion3 <- sample(c(rep(1, 900), rep(0, 100)))

table(poblacion3)

## poblacion3
##   0   1 
## 100 900

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}
resultadostlc = sapply(rep(1:5),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.9176, p-value = 0.5146

par(mfrow = c(1, 3))
hist(resultadostlc, main = "Histograma de n=5", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")
qqnorm(resultadostlc)
qqline(resultadostlc, col = "red")  # Añadir una línea de referencia
plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: -0.744978775553681"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.0123612297122899"

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}
resultadostlc = sapply(rep(1:10),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.9543, p-value = 0.7194

par(mfrow = c(1, 3))
hist(resultadostlc, main = "Histograma de n=10", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")
qqnorm(resultadostlc)
qqline(resultadostlc, col = "red")  # Añadir una línea de referencia
plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: 0.207065329057881"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.0235287058717644"

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}
resultadostlc = sapply(rep(1:15),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.95569, p-value = 0.6181

par(mfrow = c(1, 3))
hist(resultadostlc, main = "Histograma de n=15", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")
qqnorm(resultadostlc)
qqline(resultadostlc, col = "red")  # Añadir una línea de referencia
plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: 0.412958592990587"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.0171957912901744"

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}
resultadostlc = sapply(rep(1:20),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.93896, p-value = 0.2292

par(mfrow = c(1, 3))
hist(resultadostlc, main = "Histograma de n=20", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")
qqnorm(resultadostlc)
qqline(resultadostlc, col = "red")  # Añadir una línea de referencia
plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: -0.460191468566803"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.0152467425338902"

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}
resultadostlc = sapply(rep(1:30),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.98235, p-value = 0.8839

par(mfrow = c(1, 3))
hist(resultadostlc, main = "Histograma de n=30", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")
qqnorm(resultadostlc)
qqline(resultadostlc, col = "red")  # Añadir una línea de referencia
plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: -0.18557833177047"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.0138338249462569"

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}
resultadostlc = sapply(rep(1:50),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.98258, p-value = 0.6646

par(mfrow = c(1, 3))
hist(resultadostlc, main = "Histograma de n=50", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")
qqnorm(resultadostlc)
qqline(resultadostlc, col = "red")  # Añadir una línea de referencia
plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: 0.0767625063057896"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.0186803836870092"

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}
resultadostlc = sapply(rep(1:60),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.97148, p-value = 0.1723

par(mfrow = c(1, 3))
hist(resultadostlc, main = "Histograma de n=60", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")
qqnorm(resultadostlc)
qqline(resultadostlc, col = "red")  # Añadir una línea de referencia
plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: -0.317561818926909"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.0180531231158846"

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}
resultadostlc = sapply(rep(1:100),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.98091, p-value = 0.1564

par(mfrow = c(1, 3))
hist(resultadostlc, main = "Histograma de n=100", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")
qqnorm(resultadostlc)
qqline(resultadostlc, col = "red")  # Añadir una línea de referencia
plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: -0.405428110639319"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.0167766070900688"

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}
resultadostlc = sapply(rep(1:200),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.99505, p-value = 0.7574

par(mfrow = c(1, 3))
hist(resultadostlc, main = "Histograma de n=200", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")
qqnorm(resultadostlc)
qqline(resultadostlc, col = "red")  # Añadir una línea de referencia
plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: 0.0388922012799985"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.015024321989903"

muestratlc <- function(media){
  r=sample(poblacion, size = 500, replace = FALSE)
  media <- mean(r)
  return(media)}
resultadostlc = sapply(rep(1:500),muestratlc)

resultadosaphiro <- shapiro.test(resultadostlc)
resultadosaphiro

## 
##  Shapiro-Wilk normality test
## 
## data:  resultadostlc
## W = 0.99352, p-value = 0.03055

par(mfrow = c(1, 3))
hist(resultadostlc, main = "Histograma de n=500", xlab = "Valores", ylab = "Frecuencia", col = "lightblue")
qqnorm(resultadostlc)
qqline(resultadostlc, col = "red")  # Añadir una línea de referencia
plot(density(resultadostlc), main = "Densidad de las medias de las muestras", xlab = "Media", ylab = "Densidad")

par(mfrow = c(1, 1))

asimetria <- skewness(resultadostlc)
variabilidad <- sd(resultadostlc)
print(paste("Asimetría de los resultados:", asimetria))

## [1] "Asimetría de los resultados: -0.229064643412936"

print(paste("Desviación estándar de los resultados:", variabilidad))

## [1] "Desviación estándar de los resultados: 0.0160469131874542"

De acuerdo al test de Shapiro-Wilk aplicado a todas las muestras, se evidencia que en la mayoria de los casos los datos podrían provenir de una distribución normal, sin embargo en la ultima muestra de n=500 ocurre algo curioso de acuerdo al resultado se sugiere que los datos no siguen una distribución normal.

3.2 CONCLUSIONES

Los resultados de los tres casos indican una simetría en los datos, con asimetrías que, aunque ligeramente negativas o positivas en algunos casos, se mantienen cercanas a cero. Este patrón sugiere una distribución equilibrada alrededor de la media, donde las pequeñas desviaciones de la simetría se presentan de manera inconsistente. Estos hallazgos resaltan la robustez de la simetría en los datos, proporcionando una comprensión más profunda de su comportamiento en diferentes escenarios de muestreo.
Se observa una notable concentración de los datos alrededor de la media en los tres casos, lo que se evidencia en las desviaciones estándar cercanas a cero. Este fenómeno indica una baja dispersión de los datos y resalta la consistencia en la tendencia de los valores a agruparse alrededor de la medida central.
Además, se destaca que, independientemente de si se utilizan casos extremos, como el 90% o el 10% de plantas enfermas, se observa una tendencia marcada a que la distribución de los datos adopte la forma de una distribución normal a medida que aumenta el tamaño de la muestra. Este fenómeno refuerza la validez y la importancia del teorema del límite central
Estos ejercicios de simulación juegan un papel fundamental en el estudio de fenómenos estadísticos, ya que proporcionan una herramienta práctica y poderosa para observar y comprender cómo se comportan los datos en diferentes escenarios. Al permitirnos simular situaciones de muestreo en entornos controlados, estos ejercicios nos brindan la oportunidad de visualizar de manera directa la influencia del tamaño de la muestra en la distribución de los datos y en la validez de los resultados.

4 PROBLEMA 4

4.1 Estimacion Boostrap

# Punto 4 Solucion

x=c( 7.69, 4.97, 4.56, 6.49, 4.34, 6.24, 4.45) # datos para la muestra
boot=sample(x,7000,replace=TRUE)   # se extraen 7000 muestras
b=matrix(boot,nrow=1000,ncol=7)    # se construye una matriz de 1000 filas x 7 columnas 
c=matrix(apply(b,1,mean))                 # se calculan 1000 medias por fila

ic1=quantile(c, probs=c(0.025, 0.975)) # se calcula Intervalo de Confianza por el método 1
ic1

##     2.5%    97.5% 
## 4.741179 6.392179

print(paste("Con el metodo 1 el intervalo de confianza al 95% es:", ic1))

## [1] "Con el metodo 1 el intervalo de confianza al 95% es: 4.74117857142857"
## [2] "Con el metodo 1 el intervalo de confianza al 95% es: 6.39217857142857"

ic2=c(2*mean(c)-ic1[2], 2*mean(c)-ic1[1]) # se calcula Intervalo de Confianza por el método 2
ic2

##   97.5%    2.5% 
## 4.62719 6.27819

print(paste("Con el metodo 2 el intervalo de confianza al 95% es:", ic2))

## [1] "Con el metodo 2 el intervalo de confianza al 95% es: 4.62719"
## [2] "Con el metodo 2 el intervalo de confianza al 95% es: 6.27819"

# Representacion grafica de los intervalos de confianza por el metodo 1 y 2
hist(c, las=1, main=" ", ylab = " ", xlab = " ", col="#034A94")
abline(v=ic1, col="#FF7F00",lwd=2)
abline(v=ic2, col="#0EB0C6",lwd=2)
title(main = "Histograma con Intervalos de Confianza Metodo Boostrap", col.main = "black", font.main = 2)

como se puede observar en el grafico de histograma, las 2 estimaciones de los intervalos de confianza al 95% llevada a cabo por los 2 metodos de boostrap arrojan valores muy similares, por lo que podemos concluir que los 2 metodos son confiables y sobre todo porque al realizar dicha prueba se utilizo una muestra bastante representativa.

Actividad 2 - Metodos y Simulacion Estadistica

Giovanny Ortega Solarte Y Samuel Coronado Cobos

2024-03-17