Actividad Colaborativa N°2: Inferencia Estadística


Universidad de Manizales

Facultad de Ciencias e Ingenieria

Programa de Ingeniería de Sistemas Virtual

Estudiante: Juan Jose Pareja Ruiz

Curso: Probabilidades

Profesor: Jairo Pineda Agudelo


Descripción del Problema y Contexto

En un laboratorio de control de calidad de una fábrica que produce chips, se toma una muestra del último lote con el fin de analizar la velocidad de respuesta a un estímulo eléctrico. La muestra está conformada por 10 unidades, cuyos tiempos de respuesta, medidos en milisegundos, serán organizados y presentados en una tabla de datos ordenada.

Con base en esta información, se realizarán los siguientes pasos:


Primera Parte

Se definirán los estadígrafos necesarios para la construcción del informe al laboratorio de control de calidad, en particular los relacionados con la medida de tendencia central y de variabilidad apropiada.

Distribución de Frecuencias Gráfico de Barras

Medidas de Tendencia Central

( Media, Mediana, Moda )

Medidas de Variabilidad

( Rango, Varianza, Desviación Estándar, Coeficiente de Variación )


Conclusión Sobre el Gráfico de Barras y las Medidas de Tendencia Central y las Medidas de Variabilidad

Distribución de Frecuencias Gráfico de Barras

La gráfica de barras muestra la distribución de frecuencias de los tiempos de respuesta medidos en milisegundos. Se observa que la mayor concentración de datos se encuentra entre aproximadamente 2.6 ms y 2.7 ms, ya que estos intervalos presentan la frecuencia más alta. Esto indica que el sistema mantiene tiempos de respuesta relativamente estables y consistentes, sin variaciones extremas. Además, los valores restantes se distribuyen de forma equilibrada entre 2.3 ms y 3.1 ms, lo que sugiere un rendimiento uniforme y eficiente. En conclusión, el comportamiento del sistema parece ser estable, con tiempos de respuesta rápidos y poca dispersión en los datos.

Las Medidas de Tendencia Central (Media, Mediana y Moda)

Las medidas de tendencia central muestran que los tiempos medidos se concentran en un rango estrecho. La cercanía entre la media (2.72 ms) y la mediana (2.7 ms) sugiere que la distribución no presenta una asimetría marcada. La existencia de dos modas 2.6 ms y 2.7 ms indica que estos son los tiempos que se repiten con mayor frecuencia.

Las Medidas de Variabilidad (Rango, Varianza, Desviación Estándar y Coeficiente de Variación)

Las medidas de variabilidad indican una dispersión baja en los datos analizados. El rango de 0.8 ms y la desviación estándar de 0.2394 ms muestran que los valores se concentran cerca de la media, mientras que la varianza de 0.0573 ms² confirma que la dispersión es reducida. El coeficiente de variación de 8.8031 %, al ser inferior al 10 %, evidencia homogeneidad en los datos y poca fluctuación relativa entre las mediciones. En conjunto, estos resultados sugieren que el proceso estudiado presenta un comportamiento consistente, lo que respalda la representatividad de los datos para el análisis estadístico realizado.


Segunda Parte

Se harán los análisis pertinentes para la variable indicada. Las gráficas pueden ser realizadas en el programa R, y puestas como imagen en el documento a enviar. Esos análisis descriptivos serán complementados con el análisis inferencial correspondiente con un intervalo del 95% y una prueba de hipótesis sobre la media poblacional igual a 2,7 milisegundos con un nivel de significancia del 5%.

Distribución de los Datos Histograma de Frecuencias

Conclusión Histograma de Frecuencias

El histograma muestra que la mayor concentración de tiempos de respuesta se ubica en el intervalo 2.6 y 2.7 ms, coincidiendo con las modas identificadas. El resto de los intervalos presenta frecuencias iguales, lo que indica una distribución aproximadamente uniforme.


Estructura y Dispersión de los Datos Diagrama de Caja (Boxplot)

Calculo e Interpretación de la Estructura del Diagrama de Caja

Conclusión Sobre el Diagrama de Caja

El diagrama de caja muestra que los tiempos de respuesta se distribuyen sin valores atípicos evidentes, lo que refleja estabilidad en los datos. La mediana de 2.7 ms se ubica ligeramente por encima del centro del rango intercuartílico, lo que sugiere una leve asimetría hacia valores más altos. El rango entre Q1 (2.6 ms) y Q3 (2.9 ms) indica que el 50% central de los datos se concentra en un intervalo de apenas 0.3 ms, evidenciando baja dispersión. La diferencia entre el mínimo (2.3 ms) y el máximo (3.1 ms) confirma que la variabilidad total del conjunto es reducida.


Estimación por Intervalo de Confianza al 95%

Calculo e Interpretación del Intervalo de Confianza

Conclusión del Intervalo de Confianza

La media muestral obtenida fue de 2.72 ms, lo que representa el estimador puntual de la media poblacional de los tiempos de respuesta del sistema. El intervalo de confianza al 95% establece que la media poblacional real se encuentra entre 2.5487 ms y 2.8913 ms, con un ancho de 0.3426 ms, lo que indica que la estimación es relativamente precisa en relación con la media obtenida.

El error estándar de 0.0757 ms refleja que la media muestral es un estimador preciso de la media poblacional, dado que la variabilidad esperada entre muestras es baja. Por su parte, el valor t crítico de 2.2622 con 9 grados de libertad corresponde al nivel de confianza del 95% empleado para construir el intervalo, y es resultado de trabajar con una muestra pequeña bajo el supuesto de distribución normal.

En conjunto, estos resultados indican que los tiempos de respuesta del sistema son estables y consistentes. El intervalo de confianza es estrecho respecto a la media, lo que sugiere que la muestra analizada ofrece una estimación confiable del comportamiento poblacional del sistema, y que la media de 2.72 ms puede considerarse representativa de los tiempos de respuesta reales.


Prueba de Hipótesis Sobre la Media Poblacional (μ = 2.7 ms, α = 5%)

Calculo e Interpretación de la Prueba de Hipótesis

Conclusión de la Prueba de Hipótesis

Con un nivel de significancia del 5% (α = 0.05), se realizó una prueba t bilateral para evaluar si la media poblacional es igual a 2.7 ms.

La media muestral fue 2.72 ms, muy cercana al valor hipotético de 2.7 ms, por lo que la diferencia entre ambas es mínima y no representa un cambio importante. El estadístico t observado fue 0.264, valor que se encuentra dentro de la zona de no rechazo, ya que es menor en valor absoluto que el t crítico ±2.262 (gl = 9), el cual define el límite necesario para rechazar la hipótesis nula en una prueba bilateral al 95% de confianza. Además, el valor p obtenido fue 0.7976, muy superior a 0.05, lo que indica que la diferencia observada puede atribuirse al azar y no representa evidencia estadísticamente significativa.

Asimismo, el intervalo de confianza del 95% para la media poblacional fue [2.5487, 2.8913] ms, lo que significa que existe un 95% de confianza en que la media real de los tiempos de respuesta se encuentre dentro de ese rango. Dado que el valor hipotético μ = 2.7 ms se encuentra dentro del intervalo, esto refuerza la consistencia con la hipótesis nula.

Por lo tanto, no se rechaza la hipótesis nula (H₀). Con la evidencia disponible y considerando que el tamaño muestral es pequeño (n = 10), no existe evidencia suficiente para rechazar que la media poblacional sea igual a 2.7 ms.


Tercera Parte

Se obtendrán a lo menos tres conclusiones sobre los análisis hechos en la segunda parte.

Conclusiones Sobre los Análisis Hechos en la Segunda Parte

1. Los chips del lote analizado responden dentro de un rango aceptable y consistente

Al examinar los 10 chips de la muestra, se encontró que sus tiempos de respuesta oscilan entre 2.3 ms y 3.1 ms, con un promedio de 2.72 ms y una desviación estándar de apenas 0.24 ms. Esto indica que el lote es bastante homogéneo: los chips no presentan variaciones drásticas entre sí, lo que es una señal positiva para el control de calidad de la fábrica. El coeficiente de variación del 8.8% confirma que la dispersión es baja en relación al promedio.

2. Con un 95% de confianza, el tiempo de respuesta promedio del lote completo estaría entre 2.55 ms y 2.89 ms

A partir de los 10 chips analizados, se puede estimar que si se tomara el lote completo de producción, el tiempo de respuesta promedio real estaría en ese rango. Este intervalo es más amplio de lo ideal, precisamente porque la muestra es pequeña. Si la fábrica quisiera una estimación más precisa para tomar decisiones de producción, lo más recomendable sería analizar un mayor número de unidades.

3. No hay evidencia para afirmar que los chips están fuera del estándar de 2.7 ms

La prueba realizada buscaba determinar si el tiempo de respuesta promedio del lote difería del valor de referencia de 2.7 ms establecido como estándar. Los resultados muestran que la diferencia entre el promedio muestral (2.72 ms) y ese valor de referencia es tan pequeña que perfectamente puede deberse al azar propio de tomar solo 10 unidades. En consecuencia, el lote cumple estadísticamente con el estándar de tiempo de respuesta, y no hay razón para rechazarlo o someterlo a una revisión adicional con base en este criterio.