
Tema 4.- Prueba de hipótesis (t de
student)
R Markdown
##8-70 ####Drive-a-Lemon, renta automóviles en buenas condiciones
mecánicas, pero más antiguos que aquellos que rentan las grandes cadenas
nacionales de renta de coches. Como resultado, anuncia que sus tarifas
son considerablemente más bajas que las de sus grandes competidores. Una
encuesta en la industria estableció que el cargo total promedio por
renta en una de las mayores compañías es de $77.38 dólares. Una muestra
aleatoria de 18 transacciones realizadas por Drive-a-Lemon mostró un
cargo total promedio de $87.61, con una desviación estándar de la
muestra de $19.48. Verifique que, con un nivel de significancia de
0.025, el cargo total promedio de Drive-a- Lemon es más alto que el de
las grandes compañías. ¿Indica este resultado que las tarifas de Drive-
a-Lemon, no son más bajas que las de las grandes cadenas nacionales?
Justifique su respuesta.
Respuesta:
Paso 1. Plantear Hipótesis
H0: = X bar
H1: = X bar
Paso 2. Nivel de Signficiancia y Grados de Libertad
α = 0.025 | γ = 25
Paso 3. Zona de Aceptación/Rechazo
t de tabla = 2.110
Paso 4. Función
t <- (87.61-77.38)/(19.48/sqrt(18))
t
## [1] 2.22804
Paso 5. Conclusión
Se rechaza H0. t = 2.228 (x 87.61), tU 2.110 (xU 87.07), de modo
que se rechaza la hipótesis nula. Sin embargo, si Drive-a-Lemon no tiene
la misma presencia a nivel nacional que las principales cadenas del
país, entonces una comparación de sus tasas promedio con el promedio
nacional de las grandes cadenas puede conducir a una conclusión
errónea.

ANOVA (t de student)
Ejercicios Mezclas | ANOVA
#install.packages("stats")
library(stats)
#file.choose()
resistencia <- read.csv("/Users/genarorodriguezalcantara/Desktop/Tec/Diagnóstico para líneas de acción/ANOVA Mezclas.csv")
resistencia$Mezcla <- as.factor(resistencia$Mezcla)
qf(.95,df1=3,df=20)
## [1] 3.098391
anoval <- aov(Valor ~ Mezcla, data=resistencia)
summary(anoval)
## Df Sum Sq Mean Sq F value Pr(>F)
## Mezcla 3 127375 42458 25.09 5.53e-07 ***
## Residuals 20 33839 1692
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Ejercicios Grado | ANOVA (t de
student)
Ejercicios Grado | ANOVA
#file.choose()
manchado <- read.csv("/Users/genarorodriguezalcantara/Desktop/Tec/Diagnóstico para líneas de acción/ANOVA Grado.csv")
manchado$Mezcla <- as.factor(manchado$Manchado)
qf(.99,df1=2,df=12)
## [1] 6.926608
anoval2 <- aov(Valor ~ Mezcla, data=manchado)
summary(anoval2)
## Df Sum Sq Mean Sq F value Pr(>F)
## Mezcla 2 0.0609 0.03043 0.987 0.401
## Residuals 12 0.3701 0.03084

ANOVA (t de student)
Ejercicio 1 | Regresión Lineal Simple
#install.packages("ggplot2")
#library(ggplot2)
x <- c(0.2,0.5,1,2,3)
y <- c(8,10,18,35,60)
regresión <- lm(y~x)
summary(regresión)
##
## Call:
## lm(formula = y ~ x)
##
## Residuals:
## 1 2 3 4 5
## 3.0591 -0.5354 -1.8596 -3.5079 2.8438
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.211 2.451 0.494 0.65510
## x 18.648 1.450 12.863 0.00101 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.341 on 3 degrees of freedom
## Multiple R-squared: 0.9822, Adjusted R-squared: 0.9763
## F-statistic: 165.5 on 1 and 3 DF, p-value: 0.001014
plot(x,y,pch=16,cex=1.3,col="cyan",main="Ejercicio 1")
abline(lm(y~x))

plot(regresión)




x2 <- c(-6,-3,0,3,6,9,12,15,20,25)
y2 <- c(2,2.8,3.9,4.2,5.8,6.2,7.5,8.2,9.3,10.9)
regresión2 <- lm(y2~x2)
summary(regresión2)
##
## Call:
## lm(formula = y2 ~ x2)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.41088 -0.12507 -0.03329 0.14807 0.32493
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 3.746694 0.101162 37.04 3.10e-10 ***
## x2 0.288062 0.008087 35.62 4.22e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.2438 on 8 degrees of freedom
## Multiple R-squared: 0.9937, Adjusted R-squared: 0.993
## F-statistic: 1269 on 1 and 8 DF, p-value: 4.223e-10
plot(x2,y2,pch=16,cex=1.3,col="cyan",main="Ejercicio 2")
abline(lm(y2~x2))

plot(regresión2)




11-26 (t de
student)
En un estudio se compararon los efectos de cuatro promociones
mensuales sobre las ventas. A continuación, presentamos las ventas
unitarias de 5 tiendas que utilizaron las 4 promociones en meses
diferentes:
Marca
| 4.4 |
5.8 |
4.8 |
2.9 |
4.6 |
| 4.6 |
5.2 |
5.9 |
2.7 |
4.3 |
| 4.5 |
4.9 |
4.9 |
2.9 |
3.8 |
| 4.1 |
4.7 |
4.6 |
3.9 |
5.2 |
| 3.8 |
4.6 |
4.3 |
4.3 |
4.4 |
- Calcule el número medio de horas de alivio para cada marca y
determine la gran media.
# a)
antiacidos <- read.csv("/Users/genarorodriguezalcantara/Desktop/Tec/Diagnóstico para líneas de acción/antiacidos.csv")
antiacidos$marca <- as.factor(antiacidos$marca)
qf(.95,df1 = 4,df2 = 20)
## [1] 2.866081
anovaacido <- aov(horas ~ marca, data=antiacidos)
summary(anovaacido)
## Df Sum Sq Mean Sq F value Pr(>F)
## marca 4 9.006 2.2514 7.653 0.000655 ***
## Residuals 20 5.884 0.2942
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# F = 7.65, Fu = 2.87, de forma que rechazamos H0.
# Las marcas producen una cantidad de alivio significativamente
# Las marcas A-E tienen medias 4.28, 5.04, 4.90, 3.34 y 4.46. La gran media es 4.404.

11-38 (t de
student)
En la ciudad de Bigville, una cadena de comida rápida está
adquiriendo una mala reputación debido a que tardan mucho en servir a
los clientes. Como la cadena tiene cuatro restaurantes en esa ciudad,
quiere saber si los cuatro restaurantes tienen el mismo tiempo promedio
de servicio. Uno de los dueños de la cadena ha decidido visitar cada
local y registrar el tiempo de servicio para 5 clientes escogidos al
azar. En sus cuatro visitas al medio día registró los siguientes tiempos
de servicio en minutos:
| Restaurante 1 |
3 |
4 |
5.5 |
3.5 |
4 |
| Restaurante 2 |
3 |
3.5 |
4.5 |
4 |
5.5 |
| Restaurante 3 |
2 |
3.5 |
5 |
6.5 |
6 |
| Restaurante 4 |
3 |
4 |
5.5 |
2.5 |
3 |
Utilice un nivel de significancia de 0.05, ¿todos los
restaurantes tienen el mismo tiempo medio de servicio?
Según sus resultados, ¿deberá el dueño hacer algunas
recomendaciones a cualquiera de los administradores de los
restaurantes?
restaurante <- read.csv("/Users/genarorodriguezalcantara/Desktop/Tec/Diagnóstico para líneas de acción/restaurante.csv")
restaurante$restaurante <- as.factor(restaurante$restaurante)
qf(.95, df1 = 3, df2 = 16)
## [1] 3.238872
anovarestaurante <- aov(tiempo ~ restaurante, data=restaurante)
summary(anovarestaurante)
## Df Sum Sq Mean Sq F value Pr(>F)
## restaurante 3 2.538 0.8458 0.509 0.682
## Residuals 16 26.600 1.6625
# No rechazamos H0.
# Los tiempos medios de servicio no son significativamente diferentes.
# F 0.51, Fu 3.24, no rechazamos H0. Los tiempos medios de servicio no son significativamente diferentes.
# b)
# Debido a que ningún restaurante es peor que los otros, cualquier recomendación tendría que hacerse a todos los administradores

12-64 (t de
student)
Un arrendador está interesado en ver si las rentas de sus
departamentos son las comunes. Para esto tomó una muestra aleatoria de
11 rentas y tamaños de departamentos en complejos de departamentos
similares. Los datos son los siguientes:
| Número de recámaras |
2 |
1 |
3 |
2 |
2 |
2 |
2 |
1 |
1 |
2 |
2 |
|
|
- Desarrolle la ecuación de estimación que mejor describa estos
datos.
- Calcule el coeficiente de determinación.
- Pronostique la renta para un departamento de dos recámaras.
# a)
renta <- c(230,190,450,310,218,185,340,245,125,350,280)
recamaras <- c(2,1,3,2,2,2,2,1,1,2,2)
regresiónrenta <- lm(renta ~ recamaras)
summary(regresiónrenta)
##
## Call:
## lm(formula = renta ~ recamaras)
##
## Residuals:
## Min 1Q Median 3Q Max
## -101.80 -51.35 19.10 50.25 74.10
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 55.00 63.19 0.870 0.40667
## recamaras 115.90 33.13 3.498 0.00675 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 63.19 on 9 degrees of freedom
## Multiple R-squared: 0.5762, Adjusted R-squared: 0.5291
## F-statistic: 12.23 on 1 and 9 DF, p-value: 0.006746
# Renta = 55.00 + 115.90 * Recámaras
# b)
# r2 = 0.5762
# c)
recamaras1 <- 2
renta1 <- 55+115.90*recamaras1
renta1
## [1] 286.8
# $286.8
