Teorema del Límite Central

Para el desarrollo de este ejercicio se realiza una simulación la cual genera una población de 1.000 datos (supongamos plantas), las cuales van a variar la probabilidad de estar enfermas entre un 50%, 10% y 90% de plantas enfermas, con el objetivo de validar el Teorema del Límite Central calculando la media 500 veces para unas muestras aleatorias de la población de tamaño n = 5, 10, 15, 20, 30, 50, 60, 100, 200, 500.

Porcentaje de plantas enfermas 50%

Para evidenciar el Teorema del Límite Central en este primer ejercicio cuando el porcentaje de planta enfermas es 50%, se decide tomar una muestra de tamaño n=1.000. Con esto evidenciamos mediante un histograma y con el gráfico de normalidad que esta muestra se aproxima a la distribución normal, sabiendo desde un principio que la función utilizada no tiene una distribución normal. Así mismo, realizando el test de Shapiro-Wilks se evidencia un p valor de 0,751 el cual es mayor a 0,05 por lo que los datos siguen una distribución normal como se puede observar en los siguientes gráficos.

Muestra principal de tamaño n=1000

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.99776, p-value = 0.751

Muestra de tamaño n = 5

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.92851, p-value = 1.05e-14

Para una muestra de tamaño n=5 obtenemos mediante los gráficos y el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 10

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.96678, p-value = 3.278e-09

Para una muestra de tamaño n=10 obtenemos mediante los gráficos y el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 15

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.97086, p-value = 2.046e-08

Para una muestra de tamaño n=15 obtenemos mediante los gráficos y el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 20

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.98064, p-value = 3.327e-06

Para una muestra de tamaño n=20 obtenemos mediante los gráficos y el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 30

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.98329, p-value = 1.655e-05

Para una muestra de tamaño n=30 obtenemos mediante los gráficos y el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 50

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.98817, p-value = 0.0004509

Para una muestra de tamaño n=50 obtenemos mediante los gráficos y el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 60

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.98991, p-value = 0.001649

Para una muestra de tamaño n=60 obtenemos mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05. Sin embargo, mediante el histograma podemos identificar que a medida que va aumentando el tamaño de la muestra, se va acercando a una distribución normal.

Muestra de tamaño n = 100

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.9925, p-value = 0.01302

Para una muestra de tamaño n=100 obtenemos mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05. Sin embargo, mediante el histograma podemos identificar que a medida que va aumentando el tamaño de la muestra, se va acercando a una distribución normal.

Muestra de tamaño n = 200

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.99549, p-value = 0.1577

Para una muestra de tamaño n=200 obtenemos mediante los gráficos y el test de Shapiro-Wilks que sigue una distribución normal debido a que el p valor obtenido es mayor que 0,05.

Muestra de tamaño n = 500

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.99576, p-value = 0.1968

Para una muestra de tamaño n=500 obtenemos mediante los gráficos y el test de Shapiro-Wilks que sigue una distribución normal debido a que el p valor obtenido es mayor que 0,05.

Porcentaje de plantas enfermas 10%

Para evidenciar el Teorema del Límite central en este primer ejercicio cuando el porcentaje de planta enfermas es 10%, se decide tomar una muestra de tamaño n=1.000. Con esto evidenciamos mediante un histograma y con el gráfico de normalidad que esta muestra se aproxima a la distribución normal, sabiendo desde un principio que la función utilizada no tiene una distribución normal. Así mismo, realizando el test de Shapiro-Wilks se evidencia un p valor de 0,3173 el cual es mayor a 0,05 por lo que los datos siguen una distribución normal como se puede observar en los siguientes gráficos.

Muestra principal de tamaño n=1000

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.99638, p-value = 0.3173

Muestra de tamaño n = 5

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.68821, p-value < 2.2e-16

Para una muestra de tamaño n=5 obtenemos mediante los gráficos que los datos presentan un sesgo a la derecha, y se identifica mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 10

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.82027, p-value < 2.2e-16

Para una muestra de tamaño n=10 obtenemos mediante los gráficos que los datos presentan un sesgo a la derecha, y se identifica mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 15

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.88687, p-value < 2.2e-16

Para una muestra de tamaño n=15 obtenemos mediante los gráficos que los datos presentan un sesgo a la derecha, y se identifica mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 20

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.92034, p-value = 1.346e-15

Para una muestra de tamaño n=20 obtenemos mediante los gráficos que los datos presentan un sesgo a la derecha, y se identifica mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 30

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.94667, p-value = 1.961e-12

Para una muestra de tamaño n=30 obtenemos mediante los gráficos que los datos presentan un sesgo a la derecha, y se identifica mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 50

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.96508, p-value = 1.587e-09

Para una muestra de tamaño n=50 obtenemos mediante los gráficos que los datos presentan un sesgo a la derecha, y se identifica mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 60

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.9621, p-value = 4.714e-10

Para una muestra de tamaño n=60 obtenemos mediante los gráficos que los datos presentan un sesgo a la derecha, y se identifica mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 100

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.98001, p-value = 2.31e-06

Para una muestra de tamaño n=100 obtenemos mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05. Sin embargo mediante el histograma podemos identificar que a medida que va aumentando el tamaño de la muestra, se va acercando a una distribución normal sin importar que con una menor muestra presentan sesgo a la derecha.

Muestra de tamaño n = 200

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.98941, p-value = 0.001132

Para una muestra de tamaño n=200 obtenemos mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05. Sin embargo mediante el histograma podemos identificar que a medida que va aumentando el tamaño de la muestra, se va acercando a una distribución normal sin importar que con una menor muestra presentan sesgo a la derecha.

Muestra de tamaño n = 500

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.99449, p-value = 0.06877

Para una muestra de tamaño n=500 obtenemos mediante los gráficos y el test de Shapiro-Wilks que sigue una distribución normal debido a que el p valor obtenido es mayor que 0,05.

Porcentaje de plantas enfermas 90%

Para evidenciar el Teorema del Límite Central en este primer ejercicio cuando el porcentaje de planta enfermas es 90%, se decide tomar una muestra de tamaño n=1.000. Con esto evidenciamos mediante un histograma y con el gráfico de normalidad que esta muestra se aproxima a la distribución normal, sabiendo desde un principio que la función utilizada no tiene una distribución normal. Así mismo, realizando el test de Shapiro-Wilks se evidencia un p valor de 0,3173 el cual es mayor a 0,05 por lo que los datos siguen una distribución normal como se puede observar en los siguientes gráficos.

Muestra principal de tamaño n=1000

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.99638, p-value = 0.3173

Muestra de tamaño n = 5

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.68821, p-value < 2.2e-16

Para una muestra de tamaño n=5 obtenemos mediante los gráficos que los datos presentan un sesgo a la izquierda, y se identifica mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 10

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.82027, p-value < 2.2e-16

Para una muestra de tamaño n=10 obtenemos mediante los gráficos que los datos presentan un sesgo a la izquierda, y se identifica mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 15

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.88687, p-value < 2.2e-16

Para una muestra de tamaño n=15 obtenemos mediante los gráficos que los datos presentan un sesgo a la izquierda, y se identifica mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 20

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.92034, p-value = 1.346e-15

Para una muestra de tamaño n=20 obtenemos mediante los gráficos que los datos presentan un sesgo a la izquierda, y se identifica mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 30

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.94667, p-value = 1.961e-12

Para una muestra de tamaño n=30 obtenemos mediante los gráficos que los datos presentan un sesgo a la izquierda, y se identifica mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 50

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.96508, p-value = 1.587e-09

Para una muestra de tamaño n=50 obtenemos mediante los gráficos que los datos presentan un sesgo a la izquierda, y se identifica mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 60

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.9621, p-value = 4.714e-10

Para una muestra de tamaño n=60 obtenemos mediante los gráficos que los datos presentan un sesgo a la izquierda, y se identifica mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05.

Muestra de tamaño n = 100

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.98001, p-value = 2.31e-06

Para una muestra de tamaño n=100 obtenemos mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05. Sin embargo mediante el histograma podemos identificar que a medida que va aumentando el tamaño de la muestra, se va acercando a una distribución normal sin importar que con una menor muestra presentan sesgo a la izquierda.

Muestra de tamaño n = 200

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.98941, p-value = 0.001132

Para una muestra de tamaño n=100 obtenemos mediante el test de Shapiro-Wilks que no sigue una distribución normal debido a que el p valor obtenido es menor que 0,05. Sin embargo mediante el histograma podemos identificar que a medida que va aumentando el tamaño de la muestra, se va acercando a una distribución normal sin importar que con una menor muestra presentan sesgo a la izquierda.

Muestra de tamaño n = 500

## 
##  Shapiro-Wilk normality test
## 
## data:  Media
## W = 0.99449, p-value = 0.06877

Para una muestra de tamaño n=500 obtenemos mediante los gráficos y el test de Shapiro-Wilks que sigue una distribución normal debido a que el p valor obtenido es mayor que 0,05.

Conclusiones

En el transcurso de las evaluaciones realizadas, se pudo evidenciar de manera significativa la confirmación del Teorema del Límite Central. Conforme se incrementó el tamaño de la muestra, se observó una notable aproximación de la distribución de las medias hacia una distribución normal, en concordancia con los postulados del mencionado teorema. Este fenómeno fue visualmente comprobado mediante la utilización de histogramas superpuestos con una distribución normal, así como mediante la inspección de gráficos de normalidad. Adicionalmente, se llevó a cabo una validación estadística mediante pruebas de normalidad. Estos resultados sustentan la efectividad y la validez del Teorema del Límite Central en el campo de la inferencia estadística, ofreciendo un fundamento sólido para la extrapolación de conclusiones sobre la población a partir de muestras amplias, inclusive cuando la distribución original de la población no sea normal.