Ejercicios del mundo real:
3-84 ¿Qué reacción tendría usted si un aficionado al fútbol americano
le dijera lo siguiente? “Los Raiders de Rockland tienen un promedio de
3.6 yardas de recorrido por tierra. Como sólo necesitan 10 yardas para
anotar y tienen cuatro oportunidades para lograrlo, la anotación es
segura, siempre y cuando mantengan su forma de jugar por tierra.”
La afirmación es incorrecta porque ignora completamente la
variabilidad en yardas ganadas por carrera.
3-86 A continuación, se tienen 3 partes del presupuesto de defensa de
un año, a cada una de éstas se le asignó, por parte del Congreso
mexicano, la misma cantidad de financiamiento: Salario de oficiales
(total). Mantenimiento de la flota aérea. Adquisiciones de alimentos
(total).
Salarios de funcionarios: A; mantenimiento de flota: C;
adquisiciones de alimentos: B.
Tomando en cuenta la distribución de posibles resultados para los
gastos reales en cada una de éstas áreas, haga corresponder cada sección
a una de las curvas de la siguiente figura, fundamente su respuesta.
La compañía podría contratar representantes de ventas con menos
experiencia mientras que los vendedores establecidos aumentan a sus
niveles de ventas. Otra posibilidad es que se contraten representantes
de ventas sin experiencia y otros altamente experimentados al mismo
tiempo.
3-92
El 30 de junio de 1992, la capitalización de nueve mercados de
valores del Pacífico y Asia fue:
# Crear un data frame con los datos
datos <- data.frame(
Pais = c("Filipinas", "Indonesia", "Tailandia", "Singapur", "Malasia", "Corea del Sur", "Taiwan", "Hong Kong", "Australia"),
Capitalizacion = c(17, 21, 44, 50, 79, 86, 140, 178, 203)
)
# Instalar y cargar el paquete knitr para utilizar la función kable
library(knitr)
# Utilizar la función kable para crear una tabla
kable(datos, caption = "Capitalización de países (en miles de millones de dólares)")
Capitalización de países (en miles de millones de
dólares)
| Filipinas |
17 |
| Indonesia |
21 |
| Tailandia |
44 |
| Singapur |
50 |
| Malasia |
79 |
| Corea del Sur |
86 |
| Taiwan |
140 |
| Hong Kong |
178 |
| Australia |
203 |
Ejercicios del mundo real
# Crear un data frame con los datos
datos <- data.frame(
Pais = c("Filipinas", "Indonesia", "Tailandia", "Singapur", "Malasia", "Corea del Sur", "Taiwan", "Hong Kong", "Australia"),
Capitalizacion = c(17, 21, 44, 50, 79, 86, 140, 178, 203)
)
# a)
media <- mean(datos$Capitalizacion)
cat("a) La media de la capitalización es:", media, "\n")
## a) La media de la capitalización es: 90.88889
# b)
maximo <- max(datos$Capitalizacion)
cat("b) El valor máximo de la capitalización es:", maximo, "\n")
## b) El valor máximo de la capitalización es: 203
# c)
moda <- unique(datos$Capitalizacion[duplicated(datos$Capitalizacion)])
if (length(moda) == 0) {
cat("c) No hay moda para datos sin agrupar.\n")
} else {
cat("c) La moda de la capitalización es:", moda, "\n")
}
## c) No hay moda para datos sin agrupar.
# d)
mediana <- median(datos$Capitalizacion)
cat("d) La mediana de la capitalización es:", mediana, "\n")
## d) La mediana de la capitalización es: 79
# e)
desviacion_estandar <- sd(datos$Capitalizacion)
cat("e) La desviación estándar de la capitalización es:", desviacion_estandar, "\n")
## e) La desviación estándar de la capitalización es: 67.96036
# Histograma:
hist(datos$Capitalizacion,
main = "Histograma de la Capitalización",
xlab = "Capitalización (en miles de millones de dólares)",
col = "Green",
border = "black")

3-100
Matthews, Young y Asociados, una agencia de consultorías de Chapell
Hill, tiene los siguientes registros que indican el número de días que
cada uno de sus 10 consultores de planta cobró el último año:
212 220 230 210 228 229 231 219 221 222
a) Sin calcular el valor de las medidas, ¿cuál de ellas cree usted
que le daría una mayor
La desviación estándar proporciona más información sobre la
distribución de los datos que el rango, ya que tiene en cuenta la
variabilidad de todos los datos y no solo la diferencia entre el valor
máximo y mínimo.
b) Calcule: Rango, Varianza y Desviación Estándar.
datos <- c(212, 220, 230, 210, 228, 229, 231, 219, 221, 222)
rango <- max(datos) - min(datos)
varianza <- var(datos)
desviacion_estandar <- sd(datos)
cat("b) El rango es:", rango,
", la varianza es:", varianza,
", y la desviación estándar es:", desviacion_estandar, "\n")
## b) El rango es: 21 , la varianza es: 54.17778 , y la desviación estándar es: 7.360556
c) Tomando en cuenta la dificultad y el tiempo para calcular cada
medida que revisó en el
inciso a), ¿cuál sugeriría como la mejor?
d) ¿Qué haría que usted cambiara su opinión al respecto?
omo los datos tienen una dispersión bastante pareja, el alcance es
una medida razonable de la variabilidad.
###3-106
Allison Barett realiza análisis estadísticos para un equipo de
carreras automovilísticas. A
A continuación, se presentan las cifras en kilómetros por litro del
gasto de combustible de sus automóviles en las carreras recientes:
4.77 6.11 6.11 5.05 5.99 4.91 5.27 6.01 5.75 4.89 6.05 5.22 6.02 5.24
6.11 5.02
# Datos de kilómetros por litro del gasto de combustible
km_por_litro <- c(4.77, 6.11, 6.11, 5.05, 5.99, 4.91, 5.27, 6.01,
5.75, 4.89, 6.05, 5.22, 6.02, 5.24, 6.11, 5.02)
# Crear una tabla con los datos
tabla <- data.frame(km_por_litro)
# Mostrar la tabla
tabla
## km_por_litro
## 1 4.77
## 2 6.11
## 3 6.11
## 4 5.05
## 5 5.99
## 6 4.91
## 7 5.27
## 8 6.01
## 9 5.75
## 10 4.89
## 11 6.05
## 12 5.22
## 13 6.02
## 14 5.24
## 15 6.11
## 16 5.02
Incisos a-f
# Datos de kilómetros por litro del gasto de combustible
km_por_litro <- c(4.77, 6.11, 6.11, 5.05, 5.99, 4.91, 5.27, 6.01,
5.75, 4.89, 6.05, 5.22, 6.02, 5.24, 6.11, 5.02)
# a) Cálculo de la mediana
mediana <- median(km_por_litro)
mediana
## [1] 5.51
# b) Cálculo de la media
media <- mean(km_por_litro)
media
## [1] 5.5325
# c) Agrupar los datos en 5 clases de igual tamaño
histograma <- hist(km_por_litro, breaks = 5)

histograma
## $breaks
## [1] 4.6 4.8 5.0 5.2 5.4 5.6 5.8 6.0 6.2
##
## $counts
## [1] 1 2 2 3 0 1 1 6
##
## $density
## [1] 0.3125 0.6250 0.6250 0.9375 0.0000 0.3125 0.3125 1.8750
##
## $mids
## [1] 4.7 4.9 5.1 5.3 5.5 5.7 5.9 6.1
##
## $xname
## [1] "km_por_litro"
##
## $equidist
## [1] TRUE
##
## attr(,"class")
## [1] "histogram"
# Intervalo del valor de consumo de combustible para la clase modal
intervalo_modal <- histograma$mids[which.max(histograma$counts)]
intervalo_modal
## [1] 6.1
# d) La mediana puede ser una mejor medida para servirle a Allison cuando haga un pedido de combustible ya que es menos sensible a valores extremos.
# e) Cálculo del rango
rango <- max(km_por_litro) - min(km_por_litro)
rango
## [1] 1.34
# f) Cálculo de la varianza
varianza <- var(km_por_litro)
varianza
## [1] 0.27466
# g) Cálculo de la desviación estándar
desviacion_estandar <- sd(km_por_litro)
desviacion_estandar
## [1] 0.5240801
# Conclusión: Las medidas de dispersión indican que hay cierta variabilidad en el consumo de combustible de los automóviles en las carreras recientes.
Capítulo 8: Prueba de hipótesis de una sola muestra.
Paso 1: Plantear la hipótesis nula y la hipótesis alternativa de la
prueba de hipótesis1.
H0: x̄ = µ
H1: x ≠ µ
Paso 2: Establecer el nivel de significación alfa (α) deseado1.
Paso 3: Calcular el estadístico de la prueba de hipótesis1.
Paso 4: Determinar los valores críticos de la prueba de hipótesis
para averiguar la región de rechazo y la región de aceptación de la
prueba de hipótesis1.
Paso 5: Tomar la decisión si se debe aceptar o rechazar la hipótesis
nula2.
####8-64
Inspectores del gobierno, al investigar los cargos levantados contra
una embotelladora de bebidas no alcohólicas, de Texas, que no llenaba
adecuadamente sus productos, han muestreado 200 botellas y encontraron
que el promedio de llenado es de 31.7 onzas líquidas (aproximadamente
930 ml.) Se anuncia que las botellas contienen 32 onzas líquidas (946.33
ml.). Se sabe que la desviación estándar de la población es de 1.5 onzas
líquidas (44.36 ml.). ¿Deberían concluir los inspectores, al nivel de
significancia de 2%, que las botellas están siendo llenadas con menos
contenido, y emitir una sanción?
n <- 200
media_muestral <- 31.7
media_poblacional <- 32
desviacion_estandar_poblacional <- 1.5
nivel_significancia <- 0.02
# Cálculo del estadístico de prueba
z <- (media_muestral - media_poblacional) / (desviacion_estandar_poblacional / sqrt(n))
# Cálculo del valor p
valor_p <- pnorm(z)
# Conclusión
if (valor_p < nivel_significancia) {
print("Los inspectores deberían concluir que las botellas están siendo llenadas con menos contenido y emitir una sanción.")
} else {
print("Los inspectores no tienen suficiente evidencia para concluir que las botellas están siendo llenadas con menos contenido.")
}
## [1] "Los inspectores deberían concluir que las botellas están siendo llenadas con menos contenido y emitir una sanción."
Gráfica:
# Datos del problema
n <- 200
media_muestral <- 31.7
media_poblacional <- 32
desviacion_estandar_poblacional <- 1.5
nivel_significancia <- 0.02
# Cálculo del estadístico de prueba
z <- (media_muestral - media_poblacional) / (desviacion_estandar_poblacional / sqrt(n))
# Cálculo del valor crítico
z_critico <- qnorm(nivel_significancia)
# Crear una gráfica de significancia
x <- seq(-4, 4, length = 1000)
y <- dnorm(x)
plot(x, y, type = "l", xlab = "z", ylab = "Densidad de probabilidad")
abline(v = z_critico, col = "red")
polygon(c(z_critico, x[x <= z_critico], min(x)), c(0, y[x <= z_critico], 0), col = "red")

