Trabajo Estadística I.
Universidad de Córdoba.
Programa Ingeniería Industrial
Abraham David Padilla Naranjo Y Samuel Funieles Avila
En esta nueva publicación que realizaremos se hará la
transcripción del primer trabajo de Estadística I, que será tomado como
nota final del segundo corte, con el objetivo de poder
profundizar sobre el uso de R, Rstudio y sobre la utilizad de
RMarkdow.
1. De las siguientes variables indique cuales son
cualitativas (ordinal o nominal), o cuantitativa(discreta o
continua).
| Tiempo de falla de un articulo |
Cuantitativa continua |
| Profesión de una persona |
Cualitativa nominal |
| Número de cliente en espera de
atención |
Cuantitativa discreta |
| Clasificación tipo de clientes |
Cualitativa nominal |
| Calificación de la calidad de un
producto |
Cualitativa ordinal |
| Cantidad de artículos
defectuosos |
Cuantitativa discreta |
2. Se les pidió a 20 consumidores que probaran una nueva
marca de café y que las calificarán del 1 al 10 de acuerdo con su gusto,
donde 1 es de poco gusto y 10 es excesivamente delicioso las
puntuaciones fueron.
La fila donde van los numeros del 1 al 20(CON) es los consumidores
de la marca del cafe.
La fila que esta debajo son las puntuaciones que le dio cada
persona(PUN).
| PUN |
6 |
4 |
8 |
5 |
6 |
8 |
7 |
4 |
7 |
6 |
5 |
6 |
6 |
7 |
8 |
7 |
9 |
7 |
5 |
6 |
Construya una tabla de frecuencia simple y dibuje el diagrama de
barra.
P <-c(6, 4, 8, 5, 6, 8, 7, 4, 7, 6, 5, 6, 6, 7, 8, 7, 9, 7, 5, 6)
#Tabla de frecuencia.
tabla_frec <- table(P)
#####Frecuencias de la tabla.
fre_abso <- cumsum(tabla_frec)
fre_rela <- prop.table(tabla_frec)
fre_relat_acum <-cumsum(fre_rela)
#####Tabla creada completamente.
ta_compl <-(data.frame(Puntuacion = names(tabla_frec),
fi = as.numeric(tabla_frec),Fi = fre_abso,hi = as.numeric(fre_rela),Hi = fre_relat_acum*100))
knitr::kable(ta_compl, caption = "Tabla de Frecuencia Puntuacion del cafe")
Tabla de Frecuencia Puntuacion del cafe
| 4 |
4 |
2 |
2 |
0.10 |
10 |
| 5 |
5 |
3 |
5 |
0.15 |
25 |
| 6 |
6 |
6 |
11 |
0.30 |
55 |
| 7 |
7 |
5 |
16 |
0.25 |
80 |
| 8 |
8 |
3 |
19 |
0.15 |
95 |
| 9 |
9 |
1 |
20 |
0.05 |
100 |
Diagrama de barra.
barplot(tabla_frec,main = "Grafica puntuacion del cafe ",xlab = "Puntaje",ylab = "Votos",col = "yellow",
ylim = c(0, max(tabla_frec) + 1))

3. Los siguientes datos representan la vida útil, en meses,
de dos tipos de baterias.
| Marca B |
30.6 |
22.7 |
26.8 |
38.7 |
28.9 |
44.4 |
36.4 |
40.2 |
35.9 |
37.3 |
53.2 |
45.0 |
36.7 |
45.2 |
25.3 |
(i) Calcule La media, mediana y desviación típica
para el tiempo de vida de las baterias para cada marcas.
(ii) Hallar los cuartiles 1 y 3 , para los tiempo
de vida registrados en ambas marcas.
(iii) gráfique los boxplot para los datos de ambas
marcas en un mismo plano, compare y concluya con lo presentado en ambos
gráficos.
MA <- c(33.7, 34.5, 26.3, 32.8, 27.6, 30.4, 31.9, 41.4, 35.0, 31.5, 27.2, 35.4, 29.7, 39.2, 36.4)
MB <- c(30.6, 22.7, 26.8, 38.7, 28.9, 44.4, 36.4, 40.2, 35.9, 37.3, 53.2, 45.0, 36.7, 45.2, 25.3)
(ii) Hallar cuartiles 1 y 3.
Cuartil 1 y 3 Marca A.
#Cuartil 1 - Es el cuartil correspondiente al 25%.
quantile(MA,0.25)
## 25%
## 30.05
#Cuartil 3 - Es el cuartil correspondiente al 75%.
quantile(MA,0.75)
## 75%
## 35.2
Cuartil 1 y 3 Marca B.
#Cuartil 1 - Es el cuartil correspondiente al 25%.
quantile(MB,0.25)
## 25%
## 29.75
#Cuartil 3 - Es el cuartil correspondiente al 75%.
quantile(MB,0.75)
## 75%
## 42.3
(iii) Graficos Boxplot.
par(mfrow = c(1, 2))
#Grafico Marca A.
boxplot(MA,col ="pink",main= "Marca A") #Izquierda.
#Grafico Marca B
boxplot(MB,col= "orange", main= "Marca B") #Derecha.

Conclusiones:
En base a los datos del diagrama, se puede concluir que la marca B
tiene una vida útil promedio más larga y una variabilidad de vida útil
menor que la marca A. Esto significa que los productos de la marca B son
más confiables y duran más tiempo en promedio que los productos de la
marca A. Sin embargo, es importante tener en cuenta que la vida útil
real de un producto puede variar dependiendo de varios factores, como el
uso que se le dé y las condiciones en las que se almacene.
Conclusiones:
1 El consumo de energía de los establecimientos comerciales
varía considerablemente. La tabla muestra que el consumo de energía de
los establecimientos comerciales varía entre 227 kWh y 545 kWh durante
el período de estudio esto significa que algunos establecimientos
consumen más del doble de energía que otros.
2 La mayoría de los establecimientos comerciales se
encuentran en el rango de consumo de 280 kWh a 439 kWh. Concluimos de
los resultados dados por la tabla que 18 de los 30 establecimientos
comerciales (60%) se encuentran en este rango de consumo. Esto sugiere
que este es el rango de consumo más común para los establecimientos
comerciales.
3 Los establecimientos comerciales con un consumo de
energía superior a 439 kWh representan el 20% del total, mediante el
analisis de la tabla muestra que 6 de los 30 establecimientos
comerciales (20%) se encuentran en este rango de consumo. Esto sugiere
que estos establecimientos son los que más energía consumen y que
representan una oportunidad significativa para el ahorro de
energía.
(iii) Realizar el histograma de frecuencia y el
gráfico de la ojiva “menor que”.
#Histograma
hist(datcon, main = "Grafico Histograma Consumo", ylab = "Locales Comerciales(Fi)", xlab = "Energia consumida(Kwh)", col = "#FFDEAD")

#Ojiva
plot(datcon, type = "o", main = "Grafico Ojiva Consumo", xlab = "Locales comerciales(Fi)", ylab = "Energia consumida(Kwh)",col = "#D02090")

(iv) calcule el coeficiente de Asimetría para datos
agrupados, ¿parecen ser los datos asimetricos? explique su
respuesta.
#A) Debemos hallar la desviacion estandar.
de <-round(sd(datcon), 3)
de
## [1] 87.291
#B) Hallamos el coeficiente de asimetria.
CAf <- round(3*(med - mediana)/de, 3)
CAf
## [1] 0.126
Según el valor obtenido podemos deducir que los datos son simetricos
aunque tienen un pequeño margen de asimtria positiva; esto porque el
coeficiente es cero (lo que indica simetria) pero no es un cero cerado
entonces por eso decimos que tiende a la asimetria.