Introducción

Este documento presenta la resolución de los ejercicios de la Sección 1-2 de Estadística. Se trabaja con conjuntos de datos reales relacionados con ingeniería y control de calidad, y se exploran métodos de visualización como:

  • Diagramas de puntos (stripcharts)
  • Diagramas de tallo y hoja
  • Histogramas
  • Diagramas de Pareto

El objetivo es analizar la distribución, identificar valores atípicos y evaluar patrones de frecuencia, facilitando la interpretación de datos para la toma de decisiones.


Ejercicio 1-1: Diámetro de Anillos de Pistón

Descripción: Se registraron 8 mediciones del diámetro interno de anillos de pistón (en mm). Se busca observar la dispersión de los datos y posibles valores atípicos.

diametros <- c(74.001, 74.003, 74.015, 74.000, 74.005, 74.002, 74.005, 74.004)

stripchart(diametros,
           method="stack",
           pch=19,
           col="steelblue",
           main="Diagrama de Puntos: Diámetro de Anillos",
           xlab="Diámetro (mm)",
           offset=0.5,
           at=0)

summary(diametros)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   74.00   74.00   74.00   74.00   74.00   74.02

Interpretación: La mayoría de los diámetros se concentran entre 74.000 y 74.005 mm. El valor 74.015 mm se considera un posible valor atípico, lo que podría indicar un error de medición o una pieza fuera de especificación.


Ejercicio 1-4: Resistencia de Tubos Circulares

Descripción: Se mide la resistencia (kN) de tubos con tapas soldadas. Se busca evaluar la uniformidad y detectar valores extremos.

resistencia <- c(96, 96, 102, 102, 102, 104, 104, 108, 126, 126,
                 128, 128, 140, 156, 160, 160, 164, 170)

stripchart(resistencia,
           method="stack",
           pch=19,
           col="darkgreen",
           main="Resistencia de Tubos Circulares",
           xlab="Resistencia (kN)",
           offset=0.5,
           at=0)

summary(resistencia)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    96.0   102.5   126.0   126.2   152.0   170.0

Interpretación: Se observa un grupo central de valores entre 96 y 108 kN, mientras que valores como 126, 128, 140, 156, 160, 164 y 170 kN son más altos, representando valores atípicos o extremos. Esto indica que algunas muestras tienen resistencia significativamente mayor, lo que puede afectar la calidad de la producción.


Ejercicios 1-7 y 1-11: Octanaje de Gasolina

Descripción: Se analizan 80 mediciones de octanaje de gasolina. Se construye la distribución de frecuencias y un histograma para identificar la dispersión, concentración y posibles valores fuera de rango.

octanaje <- c(88.5,87.7,83.4,86.7,87.5,91.5,88.6,100.3,96.5,93.3,
              94.7,91.1,91.0,94.2,87.8,89.9,88.3,87.6,84.3,86.7,
              84.3,86.7,88.2,90.8,88.3,98.8,94.2,92.7,93.2,91.0,
              90.1,93.4,88.5,90.1,89.2,88.3,85.3,87.9,88.6,90.9,
              89.0,96.1,93.3,91.8,92.3,90.4,90.1,93.0,88.7,89.9,
              89.8,89.6,87.4,88.4,88.9,91.2,89.3,94.4,92.7,91.8,
              91.6,90.4,91.1,92.6,89.8,90.6,91.1,90.4,89.3,89.7,
              90.3,91.6,90.5,93.7,92.7,92.2,92.2,91.2,91.0,92.2,
              90.0,90.7)

tabla_frec <- table(cut(octanaje, breaks=8))
tabla_frec
## 
## (83.4,85.5] (85.5,87.6] (87.6,89.7] (89.7,91.8]   (91.8,94]   (94,96.1] 
##           4           6          20          30          14           4 
## (96.1,98.2]  (98.2,100] 
##           2           2
hist(octanaje,
     breaks=8,
     col="orange",
     border="white",
     main="Histograma de Octanaje (8 clases)",
     xlab="Octanaje",
     ylab="Frecuencia")

Interpretación: Los octanajes se concentran entre 87 y 94, con algunos valores más altos (hasta 100). La distribución es ligeramente asimétrica a la derecha, lo que indica que hay pocas mediciones fuera del rango central. El histograma permite identificar la frecuencia de cada intervalo, útil para control de calidad y ajustes de producción.


Ejercicio 1-8: Fallas en Piezas de Aluminio

Descripción: Se registraron el número de ciclos hasta la falla de 60 piezas. Se utiliza un diagrama de tallo y hoja para evaluar la dispersión y detectar valores extremos.

ciclos <- c(1115,1567,1223,1782,1055,798,1016,2100,910,1501,
            1310,1883,375,1522,1764,1020,1102,1594,1730,1238,
            1540,1203,2265,1792,1330,865,1605,2023,1102,990,
            1502,1270,1910,1000,1608,2130,706,1315,1578,1468,
            1258,1015,1018,1820,1535,1421,2215,1269,758,1512,
            1315,845,1452,1940,1781,1109,785,1260,1416,1750,
            1085,1674,1890,1120,1750,1481,885,1888,1560,1642)

stem(ciclos, scale=2)
## 
##   The decimal point is 2 digit(s) to the right of the |
## 
##    3 | 8
##    4 | 
##    5 | 
##    6 | 
##    7 | 169
##    8 | 0579
##    9 | 19
##   10 | 0222269
##   11 | 00122
##   12 | 0246677
##   13 | 1223
##   14 | 22578
##   15 | 0012446789
##   16 | 1147
##   17 | 3556889
##   18 | 2899
##   19 | 14
##   20 | 2
##   21 | 03
##   22 | 27

Interpretación: La mayoría de las piezas fallan entre 1000 y 1800 ciclos, pero 5 piezas superan los 2000 ciclos, representando aproximadamente el 7% del total. Esto puede indicar material más resistente o variabilidad en el proceso de fabricación.


Ejercicio 1-16: Diagrama de Pareto

Descripción: Se registran defectos en piezas y se construye un diagrama de Pareto para identificar las causas que concentran la mayoría de problemas.

defectos <- c(30,21,8,6,5,4,4,3)
nombres <- c("Fuera de contorno","Subajustadas","Falta agujeros",
             "Fuera de secuencia","No lubricadas","Abolladuras",
             "Picaduras","Rebabas")

names(defectos) <- nombres
defectos <- sort(defectos, decreasing=TRUE)

porcentaje_acumulado <- cumsum(defectos)/sum(defectos)*100

bp <- barplot(defectos,
              las=2,
              col="indianred",
              ylim=c(0,max(defectos)*1.25),
              main="Diagrama de Pareto",
              ylab="Frecuencia")

par(new=TRUE)
plot(bp, porcentaje_acumulado, type="b", pch=19, col="blue",
     axes=FALSE, xlab="", ylab="", ylim=c(0,100))

axis(4, at=seq(0,100,20), labels=paste0(seq(0,100,20),"%"))
mtext("Porcentaje acumulado (%)", side=4, line=2)

Interpretación: Las dos primeras categorías representan más del 60% de los defectos. Las primeras cuatro categorías alcanzan aproximadamente el 80%, mostrando que pocas causas concentran la mayoría de los problemas. Esto confirma el principio de Pareto, útil para priorizar acciones correctivas en control de calidad.

```