Teorema del Límite Central

Para el desarrollo de este ejercicio se realiza una simulación la cual genera una población de 1.000 datos (supongamos plantas), las cuales van a variar la probabilidad de estar enfermas entre un 50%, 10% y 90% de plantas enfermas, con el objetivo de validar el Teorema del Límite Central calculando la media 500 veces para unas muestras aleatorias de la población de tamaño n = 5, 10, 15, 20, 30, 50, 60, 100, 200, 500.

Porcentaje de plantas enfermas 50%

Para evidenciar el Teorema del Límite Central en este primer ejercicio cuando el porcentaje de planta enfermas es 50%, se decide tomar una muestra de tamaño n=1.000. Con esto evidenciamos mediante un histograma y con el gráfico de normalidad que esta muestra se aproxima a la distribución normal, sabiendo desde un principio que la función utilizada no tiene una distribución normal. Así mismo, realizando el test de Shapiro-Wilks se evidencia un p valor de 0,751 el cual es mayor a 0,05 por lo que los datos siguen una distribución normal como se puede observar en los siguientes gráficos.

Muestra principal de tamaño n=1000

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.99776, p-value = 0.751

Muestra de tamaño n = 5

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.92851, p-value = 1.05e-14

Para una muestra de tamaño n=5 obtenemos mediante los gráficos y el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 10

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.96678, p-value = 3.278e-09

Para una muestra de tamaño n=10 obtenemos mediante los gráficos y el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 15

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.97086, p-value = 2.046e-08

Para una muestra de tamaño n=15 obtenemos mediante los gráficos y el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 20

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.98064, p-value = 3.327e-06

Para una muestra de tamaño n=20 obtenemos mediante los gráficos y el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 30

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.98329, p-value = 1.655e-05

Para una muestra de tamaño n=30 obtenemos mediante los gráficos y el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 50

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.98817, p-value = 0.0004509

Para una muestra de tamaño n=50 obtenemos mediante los gráficos y el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 60

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.98991, p-value = 0.001649

Para una muestra de tamaño n=60 obtenemos mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05. Sin embargo, mediante el histograma podemos identificar que a medida que va aumentando el tamaño de la muestra, se va acercando a una distribución normal.

Muestra de tamaño n = 100

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.9925, p-value = 0.01302

Para una muestra de tamaño n=100 obtenemos mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05. Sin embargo, mediante el histograma podemos identificar que a medida que va aumentando el tamaño de la muestra, se va acercando a una distribución normal.

Muestra de tamaño n = 200

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.99549, p-value = 0.1577

Para una muestra de tamaño n=200 obtenemos mediante los gráficos y el test de Shapiro-Wilks que sigue una distribución normal debido a que el p valor obtenido es mayor que 0,05.

Muestra de tamaño n = 500

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.99576, p-value = 0.1968

Para una muestra de tamaño n=500 obtenemos mediante los gráficos y el test de Shapiro-Wilks que sigue una distribución normal debido a que el p valor obtenido es mayor que 0,05.

Porcentaje de plantas enfermas 10%

Para evidenciar el Teorema del Límite central en este primer ejercicio cuando el porcentaje de planta enfermas es 10%, se decide tomar una muestra de tamaño n=1.000. Con esto evidenciamos mediante un histograma y con el gráfico de normalidad que esta muestra se aproxima a la distribución normal, sabiendo desde un principio que la función utilizada no tiene una distribución normal. Así mismo, realizando el test de Shapiro-Wilks se evidencia un p valor de 0,3173 el cual es mayor a 0,05 por lo que los datos siguen una distribución normal como se puede observar en los siguientes gráficos.

Muestra principal de tamaño n=1000

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.99638, p-value = 0.3173

Muestra de tamaño n = 5

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.68821, p-value < 2.2e-16

Para una muestra de tamaño n=5 obtenemos mediante los gráficos que los datos presentan un sesgo a la derecha, y se identifica mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 10

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.82027, p-value < 2.2e-16

Para una muestra de tamaño n=10 obtenemos mediante los gráficos que los datos presentan un sesgo a la derecha, y se identifica mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 15

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.88687, p-value < 2.2e-16

Para una muestra de tamaño n=15 obtenemos mediante los gráficos que los datos presentan un sesgo a la derecha, y se identifica mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 20

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.92034, p-value = 1.346e-15

Para una muestra de tamaño n=20 obtenemos mediante los gráficos que los datos presentan un sesgo a la derecha, y se identifica mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 30

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.94667, p-value = 1.961e-12

Para una muestra de tamaño n=30 obtenemos mediante los gráficos que los datos presentan un sesgo a la derecha, y se identifica mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 50

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.96508, p-value = 1.587e-09

Para una muestra de tamaño n=50 obtenemos mediante los gráficos que los datos presentan un sesgo a la derecha, y se identifica mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 60

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.9621, p-value = 4.714e-10

Para una muestra de tamaño n=60 obtenemos mediante los gráficos que los datos presentan un sesgo a la derecha, y se identifica mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 100

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.98001, p-value = 2.31e-06

Para una muestra de tamaño n=100 obtenemos mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05. Sin embargo mediante el histograma podemos identificar que a medida que va aumentando el tamaño de la muestra, se va acercando a una distribución normal sin importar que con una menor muestra presentan sesgo a la derecha.

Muestra de tamaño n = 200

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.98941, p-value = 0.001132

Para una muestra de tamaño n=200 obtenemos mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05. Sin embargo mediante el histograma podemos identificar que a medida que va aumentando el tamaño de la muestra, se va acercando a una distribución normal sin importar que con una menor muestra presentan sesgo a la derecha.

Muestra de tamaño n = 500

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.99449, p-value = 0.06877

Para una muestra de tamaño n=500 obtenemos mediante los gráficos y el test de Shapiro-Wilks que sigue una distribución normal debido a que el p valor obtenido es mayor que 0,05.

Porcentaje de plantas enfermas 90%

Para evidenciar el Teorema del Límite Central en este primer ejercicio cuando el porcentaje de planta enfermas es 90%, se decide tomar una muestra de tamaño n=1.000. Con esto evidenciamos mediante un histograma y con el gráfico de normalidad que esta muestra se aproxima a la distribución normal, sabiendo desde un principio que la función utilizada no tiene una distribución normal. Así mismo, realizando el test de Shapiro-Wilks se evidencia un p valor de 0,3173 el cual es mayor a 0,05 por lo que los datos siguen una distribución normal como se puede observar en los siguientes gráficos.

Muestra principal de tamaño n=1000

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.99638, p-value = 0.3173

Muestra de tamaño n = 5

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.68821, p-value < 2.2e-16

Para una muestra de tamaño n=5 obtenemos mediante los gráficos que los datos presentan un sesgo a la izquierda, y se identifica mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 10

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.82027, p-value < 2.2e-16

Para una muestra de tamaño n=10 obtenemos mediante los gráficos que los datos presentan un sesgo a la izquierda, y se identifica mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 15

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.88687, p-value < 2.2e-16

Para una muestra de tamaño n=15 obtenemos mediante los gráficos que los datos presentan un sesgo a la izquierda, y se identifica mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 20

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.92034, p-value = 1.346e-15

Para una muestra de tamaño n=20 obtenemos mediante los gráficos que los datos presentan un sesgo a la izquierda, y se identifica mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 30

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.94667, p-value = 1.961e-12

Para una muestra de tamaño n=30 obtenemos mediante los gráficos que los datos presentan un sesgo a la izquierda, y se identifica mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 50

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.96508, p-value = 1.587e-09

Para una muestra de tamaño n=50 obtenemos mediante los gráficos que los datos presentan un sesgo a la izquierda, y se identifica mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 60

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.9621, p-value = 4.714e-10

Para una muestra de tamaño n=60 obtenemos mediante los gráficos que los datos presentan un sesgo a la izquierda, y se identifica mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 100

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.98001, p-value = 2.31e-06

Muestra de tamaño n = 200

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.98941, p-value = 0.001132

Muestra de tamaño n = 500

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.99449, p-value = 0.06877

Para una muestra de tamaño n=500 obtenemos mediante los gráficos y el test de Shapiro-Wilks que sigue una distribución normal debido a que el p valor obtenido es mayor que 0,05.

Ejercicio 3

Jhonny Alejandro Cardenas Rojas y Sergio Villarreal Trujillo

2024-03-16

Teorema del Límite Central

Porcentaje de plantas enfermas 50%

Muestra principal de tamaño n=1000

Muestra de tamaño n = 5

Muestra de tamaño n = 10

Muestra de tamaño n = 15

Muestra de tamaño n = 20

Muestra de tamaño n = 30

Muestra de tamaño n = 50

Muestra de tamaño n = 60

Muestra de tamaño n = 100

Muestra de tamaño n = 200

Muestra de tamaño n = 500

Porcentaje de plantas enfermas 10%

Muestra principal de tamaño n=1000

Muestra de tamaño n = 5

Muestra de tamaño n = 10

Muestra de tamaño n = 15

Muestra de tamaño n = 20

Muestra de tamaño n = 30

Muestra de tamaño n = 50

Muestra de tamaño n = 60

Muestra de tamaño n = 100

Muestra de tamaño n = 200

Muestra de tamaño n = 500

Porcentaje de plantas enfermas 90%

Muestra principal de tamaño n=1000

Muestra de tamaño n = 5

Muestra de tamaño n = 10

Muestra de tamaño n = 15

Muestra de tamaño n = 20

Muestra de tamaño n = 30

Muestra de tamaño n = 50

Muestra de tamaño n = 60

Muestra de tamaño n = 100

Muestra de tamaño n = 200

Muestra de tamaño n = 500

Conclusiones