Tema 4. T de Student

Ejercicio en clase 2
pagos <- c(107,92,97,95,105,101,91,99,95,104)
t.test(pagos,y=NULL,alternative="two.sided",mu=100,paired=FALSE,var.equal=FALSE,con.level=0.90)
##
## One Sample t-test
##
## data: pagos
## t = -0.79888, df = 9, p-value = 0.4449
## alternative hypothesis: true mean is not equal to 100
## 95 percent confidence interval:
## 94.63566 102.56434
## sample estimates:
## mean of x
## 98.6
Si es de una cola, alternative puede ser: “less” o “greater”
Si p value es mayor a 0,10 (por significancia del 10%) no se rechaza
H0
Conclusión: no se rechaza H0
Intervalo de Confianza entre: 95 y 101 USD
8-70
Drive-a-Lemon, renta automóviles en buenas condiciones mecánicas,
pero más antiguos que aquellos que rentan las grandes cadenas nacionales
de renta de coches. Como resultado, anuncia que sus tarifas son
considerablemente más bajas que las de sus grandes competidores. Una
encuesta en la industria estableció que el cargo total promedio por
renta en una de las mayores compañías es de $77.38 dólares. Una muestra
aleatoria de 18 transacciones realizadas por Drive-a-Lemon mostró un
cargo total promedio de $87.61, con una desviación estándar de la
muestra de $19.48. Verifique que, con un nivel de significancia de
0.025, el cargo total promedio de Drive-a-Lemon es más alto que el de
las grandes compañías. ¿Indica este resultado que las tarifas de
Drive-a-Lemon, no son más bajas que las de las grandes cadenas
nacionales? Justifique su respuesta.
RESPUESTA
Paso 1:
H0 = x barra
H1 µ ≠ x barra
Paso 2:
α = 0.023
g.dl = 17
Paso 3:
t de tablas = 2.110
Paso 4:
t <- (87.61-77.38)/(19.48/sqrt(18))
t
## [1] 2.22804
Paso 5:
Se rechaza la hipótesis nula. Sin embargo, si Drive-a-Lemon no tiene
la misma presencia a nivel nacional que las principales cadenas del
país, entonces una comparación de sus tasas
Tema 5. Anova

Ejercicio en clase 1
resistencia <- read.csv("C:\\Users\\alfon\\Downloads\\ANOVA Mezclas.csv")
resistencia$Mezcla <- as.factor(resistencia$Mezcla)
qf(.95,df1=3,df=20)
## [1] 3.098391
anova1 <- aov(Valor ~ Mezcla, data=resistencia)
summary(anova1)
## Df Sum Sq Mean Sq F value Pr(>F)
## Mezcla 3 127375 42458 25.09 5.53e-07 ***
## Residuals 20 33839 1692
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Ejercicio en clase 2
manchado <- read.csv("C:\\Users\\alfon\\Downloads\\ANOVA Grado.csv")
manchado$Manchado <- as.factor(manchado$Manchado)
qf(.99,df1=2,df2=12)
## [1] 6.926608
anova2 <- aov(Valor ~ Manchado, data=manchado)
summary(anova2)
## Df Sum Sq Mean Sq F value Pr(>F)
## Manchado 2 0.0609 0.03043 0.987 0.401
## Residuals 12 0.3701 0.03084
Tema 6. Regresión lineal simple

Ejercico 1
x <- c(0.2,0.5,1,2,3)
y <- c(8,10,18,35,60)
regresion <- lm(y~x)
summary(regresion)
##
## Call:
## lm(formula = y ~ x)
##
## Residuals:
## 1 2 3 4 5
## 3.0591 -0.5354 -1.8596 -3.5079 2.8437
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.211 2.451 0.494 0.65510
## x 18.648 1.450 12.863 0.00101 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.341 on 3 degrees of freedom
## Multiple R-squared: 0.9822, Adjusted R-squared: 0.9763
## F-statistic: 165.5 on 1 and 3 DF, p-value: 0.001014
plot(x,y, pch = 16, cex = 1.3, col="blue", main = "Ejercicio1")
abline(lm(y ~ x))





Ejercicio 2
a <- c(-6,-3,0,3,6,9,12,15,20,25)
b <- c(2,2.8,3.9,4.2,5.8,6.2,7.5,8.2,9.3,10.9)
regresion2 <- lm(b~-a)
summary(regresion2)
##
## Call:
## lm(formula = b ~ -a)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.080 -2.105 -0.080 1.945 4.820
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 6.0800 0.9183 6.621 9.69e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.904 on 9 degrees of freedom
plot(a,b, pch = 16, cex = 1.3, col="blue", main = "Ejercicio2")
abline(lm(b ~ a))



## hat values (leverages) are all = 0.1
## and there are no factor predictors; no plot no. 5


Ejercicios del Mundo Real

11-26
Un estudio compara el número de horas de alivio que proporcionan
cinco marcas de antiácidos administrados a 25 personas diferentes, cada
una con acidez estomacal considerada fuerte. Los resultados son los
siguientes:
| 4.4 |
5.8 |
4.8 |
2.9 |
4.6 |
| 4.6 |
5.2 |
5.9 |
2.7 |
4.3 |
| 4.5 |
4.9 |
4.9 |
2.9 |
3.8 |
| 4.1 |
4.7 |
4.6 |
3.9 |
5.2 |
| 3.8 |
4.6 |
4.3 |
4.3 |
4.4 |
a) Calcule el cociente F. Para un nivel de significancia de
0.05
antiacidos <- read.csv("C:\\Users\\alfon\\Downloads\\antiacidos.csv")
antiacidos$marca <- as.factor(antiacidos$marca)
qf(.95,df=4,df2=20)
## [1] 2.866081
anova3 <- aov(horas ~ marca, data=antiacidos)
F 7.65, Fu 2.87, de forma que rechazamos H0.
Las marcas producen una cantidad de alivio significativamente
diferente.
11-38
En la ciudad de Bigville, una cadena de comida rápida está
adquiriendo una mala reputación debido a que tardan mucho en servir a
los clientes. Como la cadena tiene cuatro restaurantes en esa ciudad,
quiere saber si los cuatro restaurantes tienen el mismo tiempo promedio
de servicio. Uno de los dueños de la cadena ha decidido visitar cada
local y registrar el tiempo de servicio para 5 clientes escogidos al
azar. En sus cuatro visitas al medio día registró los siguientes tiempos
de servicio en minutos:
| 3 |
3 |
2 |
3 |
| 4 |
3.5 |
3.5 |
4 |
| 5.5 |
4.5 |
5 |
5.5 |
| 3.5 |
4 |
6.5 |
2.5 |
| 4 |
5.5 |
6 |
3 |
a) Utilice un nivel de significancia de 0.05, ¿todos los
restaurantes tienen el mismo tiempo medio de servicio?
restaurante <- read.csv("C:\\Users\\alfon\\Downloads\\restaurante.csv")
restaurante$restaurante <- as.factor(restaurante$restaurante)
qf(.95,df1=3,df2=16)
## [1] 3.238872
anova4 <- aov(tiempo ~ restaurante, data=restaurante)
summary(anova4)
## Df Sum Sq Mean Sq F value Pr(>F)
## restaurante 3 2.538 0.8458 0.509 0.682
## Residuals 16 26.600 1.6625
b) Según sus resultados, ¿deberá el dueño hacer algunas
recomendaciones a cualquiera de los administradores de los
restaurantes?
Debido a que ningún restaurante es peor que los otros,
cualquier recomendación tendría que hacerse a todos los
administradores
12-64
Un arrendador está interesado en ver si las rentas de sus
departamentos son las comunes. Para esto tomó una muestra aleatoria de
11 rentas y tamaños de departamentos en complejos de departamentos
similares. Los datos son los siguientes:
| 230 |
2 |
| 190 |
1 |
| 450 |
3 |
| 310 |
2 |
| 218 |
2 |
| 185 |
2 |
| 340 |
2 |
| 245 |
1 |
| 125 |
1 |
| 350 |
2 |
| 280 |
2 |
#a) Desarrolle la ecuación de estimación que mejor describa estos datos
renta <- c(230, 190, 450,310,218,185,340,245,125,350,280)
recamaras <- c(2,1,3,2,2,2,2,1,1,2,2)
regresion3 <- lm (renta~recamaras)
summary(regresion3)
##
## Call:
## lm(formula = renta ~ recamaras)
##
## Residuals:
## Min 1Q Median 3Q Max
## -101.80 -51.35 19.10 50.25 74.10
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 55.00 63.19 0.870 0.40667
## recamaras 115.90 33.13 3.498 0.00675 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 63.19 on 9 degrees of freedom
## Multiple R-squared: 0.5762, Adjusted R-squared: 0.5291
## F-statistic: 12.23 on 1 and 9 DF, p-value: 0.006746
#b) Calcule el error estándar de la estimación para esta relación.
# r2 = 0.5762
#c) Para un mes con gastos de $28,000 en espectaculares, desarrolle un intervalo de confianza del 95% para las ventas mensuales esperadas ese mes.
recamaras1 <- 2
renta1 <- 55+115.90*recamaras1
renta1
## [1] 286.8
