1 Problema 3: Teorema del límite central

En una planta de fabricación de componentes electrónicos, se modela el tiempo (meses) de funcionamiento continuo de una máquina antes de necesitar mantenimiento mediante una distribución Exponencial. El análisis ha determinado que el tiempo hasta el primer mantenimiento sigue una distribución Exponencial con parámetro λ=0.16 .

A continuación, se presentan una serie de actividades para explorar esta distribución y su aplicación en el contexto del mantenimiento predictivo.

1.1 a. Cálculo de la media y varianza de la población:

Determinar la media y la varianza de la poblacion de los tiempos \(X\) hasta que se requiere mantenimiento de las maquinas en este contexto.

Se calcula la media con la formula de la distribucion exponencia \(E[X]= \frac{1}{λ}\) y la varianza \(Var(X)= \frac{1}{λ^2}\), tal como se observa a continuacion:

## Media de la poblacion: 6.25
## Varianza de la poblacion: 39.0625

Estos valores permiten concluir que, en promedio, las máquinas tardan 6.25 meses en requerir mantenimiento. Sin embargo, la elevada variabilidad observada, con una varianza de 39.06, evidencia que los tiempos reales pueden diferir considerablemente de ese valor promedio. Esto implica que algunas máquinas podrían necesitar mantenimiento mucho antes de lo esperado, mientras que otras podrían funcionar durante periodos significativamente más largos.

Lo que podemos concluir además es que confiar únicamente en el promedio resulta insuficiente para la planificación del mantenimiento, ya que no refleja la dispersión y la incertidumbre inherente al proceso. La alta variabilidad obliga a considerar estrategias más robustas, como el monitoreo continuo y el uso de modelos predictivos complementarios, que permitan anticipar escenarios extremos y garantizar una gestión eficiente de los recursos. De este modo, la distribución exponencial ofrece un marco inicial para comprender el comportamiento de las máquinas, pero su aplicación práctica exige reconocer que el promedio no basta para tomar decisiones confiables en un entorno tan incierto.”

Por tanto, el promedio por sí solo no resulta suficiente para planificar adecuadamente el mantenimiento, ya que no refleja la incertidumbre ni la amplitud de la variabilidad del proceso. En consecuencia, se hace necesario complementar este análisis con estrategias de seguimiento más robustas, como el monitoreo continuo, la evaluación periódica del estado de los equipos y el uso de modelos predictivos, con el fin de anticipar fallos y optimizar la asignación de recursos. En este sentido, la distribución exponencial proporciona una base útil para modelar el comportamiento del tiempo hasta el mantenimiento, pero su interpretación debe considerar no solo la media, sino también la variabilidad inherente al fenómeno.

1.2 b.Gráfico de la curva de densidad:

Se realiza la grafica de la función de densidad de la distribución Exponencial que describe la población, en la figura 1.

El parámetro λ en la gráfica refleja que la función de densidad decrece rápidamente desde el inicio del tiempo, lo que significa que existe una alta probabilidad de que el mantenimiento se requiera antes de alcanzar el promedio. Aunque después de este punto la probabilidad sigue existiendo, la mayor parte de los casos se concentra en valores menores al promedio, evidenciando que la mayoría de las máquinas tienden a necesitar mantenimiento en un tiempo relativamente corto.

Al agregar la linea en la media \(6.25\) se busca identificar que tanto disminuye la probabilidad antes o despues de esta, lo que se logra evidenciar es que esta probabilibad ya ha caido significativa mente antes de este promedio, y eso lo confirma la alta varianza, exisite la posibilidad que maquinas requieran mantenimiento antes de la media y algunas como se evidencia en la figura lo requieran mucho despues ya que la probabilidad sigue disminuyendo luego de la media pero aun exisite probabilidad.

Figura Curva de densidad de la distribución exponencial

Figure 1: Figura Curva de densidad de la distribución exponencial

1.3 c.Comparación de parámetros, estimadores y estimaciones:

Toma 10 muestras aleatorias de tamaño n=200 de la población Exponencial de parámetro λ usando la función rexp(n, rate=lambda) de R y establece una semilla como por ejemplo set.seed(123) para asegurar la reproducibilidad de los resultados. Para cada muestra:

##               [,1]      [,2]      [,3]      [,4]      [,5]      [,6]      [,7]
## promedio  6.358218  6.586633  6.113032  5.647913  6.502918  6.215543  5.779389
## varianza 33.455272 43.358428 38.127961 27.984386 38.440973 29.307329 33.357912
##               [,8]      [,9]     [,10]
## promedio  7.056103  6.061255  6.606662
## varianza 44.020566 30.950489 34.563076

Elabora un histograma e interpreta la distribución de los datos: En la figura 2 se ilustran el histograma y las estadísticas muestrales (medias y varianzas) derivadas de las 10 muestras.

Calcula la media y varianza muestral y compara con los valores poblacionales.

Parámetros: Los valores de media y varianza de los tiempos son los parametros poblacionales.

Estimadores: para los estimadores se utilizan las formulas de promedio muestral y de la varianza asi:

Media muestral \(\bar{X}=\frac{1}{n}\sum_{i=1}^n Xi\)

Varianza muestral \(S^2=\frac{1}{n-1}\sum_{i=1}^n (Xi-\bar{X})\)

Estimaciones: la mayoria de las medias muestrales promedios tienden a oscilar en torno a 6 lo cual es consistente del valor teorico \(E[X]=1/λ = 6.25\)

las varianzas muestrales \(S^2=39.0625\) presentan mayor dispersion pero algunas tienen a la varianza teorica \(Var(X)= \frac{1}{λ^2}=39.0625\)

Figura histogramas de las medias y varianzas de las muestras n=10

Figure 2: Figura histogramas de las medias y varianzas de las muestras n=10

1.4 d.Aplicación del Teorema del Límite Central para n=200:

Genera 100 muestras de tamaño n=200 de la población Exponencial.

Calcula la media muestral de cada muestra y elabora un histograma de las 100 medias muestrales.

Obtén el promedio y la varianza de estas 100 medias muestrales.

Aplica un test de normalidad (α=0.05) a las 100 medias muestrales e interpreta los resultados.

Explica cómo se evidencia el Teorema del Límite Central en el comportamiento de las medias muestrales, considerando:

Distribución de las medias muestrales.

Comparación de la media y varianza muestral con las esperadas.

## Promedio de las medias muestrales: 6.280165
## Varianza de las medias muestrales: 0.1832382
## Test de Shapiro-Wilk:
## 
##  Shapiro-Wilk normality test
## 
## data:  medias_muestrales
## W = 0.9896, p-value = 0.6323

Para la siguiente la imagen 3 las medias muestrales rondan al rededor de 6.28 lo que suguiere que la distribucion de las medias es simectrica centrada respecto a este numero. por lo cual se concluye que siguen un comportamient cercano a una distribucion normal.

Figura histogramas de las 100 muestras

Figure 3: Figura histogramas de las 100 muestras

Ademas los valores de promedio y varianza de las 100 medias muestrales \(\bar{X}=6.28016\) y \(Var(X)= 0.18323\) presentan una gran proximidad a los valores teoricos \(E[X]= μ\) \(E[X]= μ =6.25\) y \(Var(X)= \frac{σ^2}{n}\) \(Var(X)=\frac{39.0625}{200}=0.195312\) esto suguiere que \(\bar{Xn}≈N(μ,\frac{σ^2}{n})\)

Resultados de los tests de normalidad Los valores−p obtenidos en los tests fueron:

Shapiro-Wilk: \(valor−p=0.6323\)

Kolmogorov-Smirnov: \(valor−p=0.7958\)

Dado que en ambos casos el valor−p es mayor a \(α=0.05\) ,no se rechaza la hipótesis nula, lo que indica que las sumas muestrales pueden considerarse como provenientes de una distribución normal con un nivel de significancia del 5% (\(α=0.05\)).

1.5 e.Aplicación del Teorema del Límite Central variando n:

Repite el análisis anterior extrayendo 100 muestras de cada uno de los siguientes tamaños: n= 5, 10, 80, 200, 500 y 2,000.

Para cada tamaño de muestra n:

Calcula el promedio y la varianza de las 100 medias muestrales.

Elabora un histograma de las 100 medias muestrales.

Aplica un test de normalidad (\(α=0.05\)) y discute los resultados.

Concluye sobre la relación entre el tamaño muestral y la validez del Teorema del Límite Central, analizando:

Comportamiento de la distribución de las medias muestrales.

Convergencia de la media y varianza muestral hacia los valores teóricos.

## 
## -----------------------------------
## Resultados para n = 5 
## Promedio de sumas muestrales: 6.425516 
## Varianza de sumas muestrales: 7.853884 
## Test de Shapiro-Wilk: valor-p = 0.000961813 
## Test de Kolmogorov-Smirnov: valor-p = 0.1617372 
## 
## -----------------------------------
## Resultados para n = 10 
## Promedio de sumas muestrales: 6.072722 
## Varianza de sumas muestrales: 3.361678 
## Test de Shapiro-Wilk: valor-p = 0.05327266 
## Test de Kolmogorov-Smirnov: valor-p = 0.6929525 
## 
## -----------------------------------
## Resultados para n = 80 
## Promedio de sumas muestrales: 6.251424 
## Varianza de sumas muestrales: 0.5224825 
## Test de Shapiro-Wilk: valor-p = 0.009299761 
## Test de Kolmogorov-Smirnov: valor-p = 0.6886493 
## 
## -----------------------------------
## Resultados para n = 200 
## Promedio de sumas muestrales: 6.257727 
## Varianza de sumas muestrales: 0.1942466 
## Test de Shapiro-Wilk: valor-p = 0.4584167 
## Test de Kolmogorov-Smirnov: valor-p = 0.7374513 
## 
## -----------------------------------
## Resultados para n = 500 
## Promedio de sumas muestrales: 6.27762 
## Varianza de sumas muestrales: 0.104481 
## Test de Shapiro-Wilk: valor-p = 0.190082 
## Test de Kolmogorov-Smirnov: valor-p = 0.5704532 
## 
## -----------------------------------
## Resultados para n = 2000 
## Promedio de sumas muestrales: 6.263977 
## Varianza de sumas muestrales: 0.01929314 
## Test de Shapiro-Wilk: valor-p = 0.8100434 
## Test de Kolmogorov-Smirnov: valor-p = 0.8972626

La figura 4 presenta los histogramas de las medias de las 100 muestras obtenidas a partir de los tamaños n= 5, 10, 80, 200, 500 y 2,000. se observa que con tamaño a medida que se aumenta el tamaño se vuelve la grafica mas simetrica y esta centrada a los valores de \(μ\) lo que suguiere que las medias muestrales siguen un comportamiento aproximadamente normal a lo que predice el teorema del limite central. Los valores de promedio y varianza de las 100 medias presentan alta coincidencia con lo esperado para:

\(E[X]= μ\). \(Var(X)=\frac{σ^2}{n}\).

Para \(n=5\)

\(\bar{X} = 6.425516\), \(S^2 =7.833884\)

Valores esperados

\(E[X]= 6.25\), \(Var(X)=7.8125\)

Para \(n=2000\)

\(\bar{X} = 6.263977\), \(S^2 =0.01929314\)

Valores esperados

\(E[X]= 6.25\), \(Var(X)=0.0195311\)

Comportamiento de la varianza en las medias muestrales, esta disminuye con el aumento de la muestra eso es correcto ya que la varianza se divide entre el tamaño lo que genera cada vez un valor mas pequeño. consistente con su relacion teorica \(Var(X)=\frac{σ^2}{n}\).

Analisis de los resultados por tamaño de muestra:

\(n=5\) Con muestras muy pequeñas Shapiro-Wilk puede detectar desviaciones por discreción o asimetría; sin embargo la evidencia no es concluyente.

\(n=10\) la normalidad empieza a aparecer, pero aún hay incertidumbre

\(n=80\) Discrepancia entre pruebas; Shapiro-Wilk puede ser más sensible a pequeñas desviaciones de normalidad en muestras moderadas. El CLT sugiere que la distribución de la media debería aproximarse a normal.

\(n=200\) buena concordancia con normalidad de las medias muestrales; CLT ya opera bien.

\(n=500\) Normalidad aceptable; varianza de las medias pequeña.

\(n=2000\) Las medias muestrales se comportan como normales y la varianza es muy pequeña, como predice \(\frac{σ^2}{n}\)

Figura histogramas de n= 5, 10, 80, 200, 500 y 2,000.

Figure 4: Figura histogramas de n= 5, 10, 80, 200, 500 y 2,000.