Este documento presenta la resolución de los ejercicios de la Sección 1-2 de Estadística. Se trabaja con conjuntos de datos reales relacionados con ingeniería y control de calidad, y se exploran métodos de visualización como:
El objetivo es analizar la distribución, identificar valores atípicos y evaluar patrones de frecuencia, facilitando la interpretación de datos para la toma de decisiones.
Descripción: Se registraron 8 mediciones del diámetro interno de anillos de pistón (en mm). Se busca observar la dispersión de los datos y posibles valores atípicos.
diametros <- c(74.001, 74.003, 74.015, 74.000, 74.005, 74.002, 74.005, 74.004)
stripchart(diametros,
method="stack",
pch=19,
col="steelblue",
main="Diagrama de Puntos: Diámetro de Anillos",
xlab="Diámetro (mm)",
offset=0.5,
at=0)
summary(diametros)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 74.00 74.00 74.00 74.00 74.00 74.02
Interpretación: La mayoría de los diámetros se concentran entre 74.000 y 74.005 mm. El valor 74.015 mm se considera un posible valor atípico, lo que podría indicar un error de medición o una pieza fuera de especificación.
Descripción: Se mide la resistencia (kN) de tubos con tapas soldadas. Se busca evaluar la uniformidad y detectar valores extremos.
resistencia <- c(96, 96, 102, 102, 102, 104, 104, 108, 126, 126,
128, 128, 140, 156, 160, 160, 164, 170)
stripchart(resistencia,
method="stack",
pch=19,
col="darkgreen",
main="Resistencia de Tubos Circulares",
xlab="Resistencia (kN)",
offset=0.5,
at=0)
summary(resistencia)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 96.0 102.5 126.0 126.2 152.0 170.0
Interpretación: Se observa un grupo central de valores entre 96 y 108 kN, mientras que valores como 126, 128, 140, 156, 160, 164 y 170 kN son más altos, representando valores atípicos o extremos. Esto indica que algunas muestras tienen resistencia significativamente mayor, lo que puede afectar la calidad de la producción.
Descripción: Se analizan 80 mediciones de octanaje de gasolina. Se construye la distribución de frecuencias y un histograma para identificar la dispersión, concentración y posibles valores fuera de rango.
octanaje <- c(88.5,87.7,83.4,86.7,87.5,91.5,88.6,100.3,96.5,93.3,
94.7,91.1,91.0,94.2,87.8,89.9,88.3,87.6,84.3,86.7,
84.3,86.7,88.2,90.8,88.3,98.8,94.2,92.7,93.2,91.0,
90.1,93.4,88.5,90.1,89.2,88.3,85.3,87.9,88.6,90.9,
89.0,96.1,93.3,91.8,92.3,90.4,90.1,93.0,88.7,89.9,
89.8,89.6,87.4,88.4,88.9,91.2,89.3,94.4,92.7,91.8,
91.6,90.4,91.1,92.6,89.8,90.6,91.1,90.4,89.3,89.7,
90.3,91.6,90.5,93.7,92.7,92.2,92.2,91.2,91.0,92.2,
90.0,90.7)
tabla_frec <- table(cut(octanaje, breaks=8))
tabla_frec
##
## (83.4,85.5] (85.5,87.6] (87.6,89.7] (89.7,91.8] (91.8,94] (94,96.1]
## 4 6 20 30 14 4
## (96.1,98.2] (98.2,100]
## 2 2
hist(octanaje,
breaks=8,
col="orange",
border="white",
main="Histograma de Octanaje (8 clases)",
xlab="Octanaje",
ylab="Frecuencia")
Interpretación: Los octanajes se concentran entre 87 y 94, con algunos valores más altos (hasta 100). La distribución es ligeramente asimétrica a la derecha, lo que indica que hay pocas mediciones fuera del rango central. El histograma permite identificar la frecuencia de cada intervalo, útil para control de calidad y ajustes de producción.
Descripción: Se registraron el número de ciclos hasta la falla de 60 piezas. Se utiliza un diagrama de tallo y hoja para evaluar la dispersión y detectar valores extremos.
ciclos <- c(1115,1567,1223,1782,1055,798,1016,2100,910,1501,
1310,1883,375,1522,1764,1020,1102,1594,1730,1238,
1540,1203,2265,1792,1330,865,1605,2023,1102,990,
1502,1270,1910,1000,1608,2130,706,1315,1578,1468,
1258,1015,1018,1820,1535,1421,2215,1269,758,1512,
1315,845,1452,1940,1781,1109,785,1260,1416,1750,
1085,1674,1890,1120,1750,1481,885,1888,1560,1642)
stem(ciclos, scale=2)
##
## The decimal point is 2 digit(s) to the right of the |
##
## 3 | 8
## 4 |
## 5 |
## 6 |
## 7 | 169
## 8 | 0579
## 9 | 19
## 10 | 0222269
## 11 | 00122
## 12 | 0246677
## 13 | 1223
## 14 | 22578
## 15 | 0012446789
## 16 | 1147
## 17 | 3556889
## 18 | 2899
## 19 | 14
## 20 | 2
## 21 | 03
## 22 | 27
Interpretación: La mayoría de las piezas fallan entre 1000 y 1800 ciclos, pero 5 piezas superan los 2000 ciclos, representando aproximadamente el 7% del total. Esto puede indicar material más resistente o variabilidad en el proceso de fabricación.
Descripción: Se registran defectos en piezas y se construye un diagrama de Pareto para identificar las causas que concentran la mayoría de problemas.
defectos <- c(30,21,8,6,5,4,4,3)
nombres <- c("Fuera de contorno","Subajustadas","Falta agujeros",
"Fuera de secuencia","No lubricadas","Abolladuras",
"Picaduras","Rebabas")
names(defectos) <- nombres
defectos <- sort(defectos, decreasing=TRUE)
porcentaje_acumulado <- cumsum(defectos)/sum(defectos)*100
bp <- barplot(defectos,
las=2,
col="indianred",
ylim=c(0,max(defectos)*1.25),
main="Diagrama de Pareto",
ylab="Frecuencia")
par(new=TRUE)
plot(bp, porcentaje_acumulado, type="b", pch=19, col="blue",
axes=FALSE, xlab="", ylab="", ylim=c(0,100))
axis(4, at=seq(0,100,20), labels=paste0(seq(0,100,20),"%"))
mtext("Porcentaje acumulado (%)", side=4, line=2)
Interpretación: Las dos primeras categorías representan más del 60% de los defectos. Las primeras cuatro categorías alcanzan aproximadamente el 80%, mostrando que pocas causas concentran la mayoría de los problemas. Esto confirma el principio de Pareto, útil para priorizar acciones correctivas en control de calidad.
```