Tema 4. T student

## Sesion 3
pago <- c(107,92,97,95,105,101,91,99,95,104)
t.test(pago,y=NULL,alternative="two.sided",mu=100,paired=FALSE,var.equal=FALSE,conf.level=0.90)
##
## One Sample t-test
##
## data: pago
## t = -0.79888, df = 9, p-value = 0.4449
## alternative hypothesis: true mean is not equal to 100
## 90 percent confidence interval:
## 95.38755 101.81245
## sample estimates:
## mean of x
## 98.6
# Si es de una cola, alternativa puede ser: less o greater
# si es p value es mayor a 0.10 no se rechaza H0.
# Conclusion: No se rechaza H0.
# Intervalo de confianza: Entre 95 y 101 dolares
# 8-70
### Drive-a-Lemon, renta automóviles en buenas condiciones mecánicas, pero más antiguos que aquellos que rentan las grandes cadenas nacionales de renta de coches. Como resultado, anuncia que sus tarifas son considerablemente más bajas que las de sus grandes competidores. Una encuesta en la industria estableció que el cargo total promedio por renta en una de las mayores compañías es de $77.38 dólares. Una muestra aleatoria de 18 transacciones realizadas por Drive-a-
### Lemon mostró un cargo total promedio de $87.61, con una desviación estándar de la muestra de $19.48. Verifique que, con un nivel de significancia de 0.025, el cargo total promedio de Drive-a- Lemon es más alto que el de las grandes compañías. ¿Indica este resultado que las tarifas de Drive- a-Lemon, no son más bajas que las de las grandes cadenas nacionales? Justifique su respuesta.
# Respuesta
# Paso 1: Plantear hipotesis
## H0: µ = x bar
## H1:µ > x bar
# Paso 2. Nivel de significancia y grados de Libertad
# = 0.025
# GL = 17
# Paso 3.Zona de Aceptacion/Rechazo
# t de tablas = 2.110
# Paso 4. Funcion
t <- (87.61-77.38)/(19.48/sqrt(18))
t
## [1] 2.22804
# Paso 5. CONCLUSION
# se Rechaza H0
# t = 2.28 (xbar= 87.61), tU = 2.110 (xbarU = 87.07), de modo que se rechazala hipotesis nula.
Tema 5. Anova

#install.packages("stats")
library(stats)
#Ejercicio 1
#file.choose()
resistencia <- read.csv("C:\\Users\\sebastian\\Downloads\\ANOVA Mezclas.csv")
resistencia$Mezcla <- as.factor(resistencia$Mezcla)
qr(.95,df1=3,df=20)
## $qr
## [,1]
## [1,] 0.95
##
## $rank
## [1] 1
##
## $qraux
## [1] 0.95
##
## $pivot
## [1] 1
##
## attr(,"class")
## [1] "qr"
anova1 <- aov(Valor~Mezcla, data=resistencia)
summary(anova1)
## Df Sum Sq Mean Sq F value Pr(>F)
## Mezcla 3 127375 42458 25.09 5.53e-07 ***
## Residuals 20 33839 1692
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#Ejercicio 2
file.choose()
## [1] "C:\\Users\\sebastian\\Documents\\TEC universidad\\Tec cuarto semestre LIT\\Diagnóstico para líneas de acción\\Modulo de RAUL\\WORSHOP2.Rmd"
resistencia <- read.csv("C:\\Users\\sebastian\\Downloads\\ANOVA Mezclas.csv")
resistencia$Mezcla <- as.factor(resistencia$Mezcla)
qr(.99,df1=2,df=12)
## $qr
## [,1]
## [1,] 0.99
##
## $rank
## [1] 1
##
## $qraux
## [1] 0.99
##
## $pivot
## [1] 1
##
## attr(,"class")
## [1] "qr"
anova2 <- aov(Valor~Mezcla, data=resistencia)
summary(anova2)
## Df Sum Sq Mean Sq F value Pr(>F)
## Mezcla 3 127375 42458 25.09 5.53e-07 ***
## Residuals 20 33839 1692
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Tema 6. Regresion lineal simpple

#Regresion lineal simple
#Ejercicio 1
x <- c(0.2,0.5,1,2,3)
y <-c(8,10,18,25,60)
re <- lm(x~y)
summary(re)
##
## Call:
## lm(formula = x ~ y)
##
## Residuals:
## 1 2 3 4 5
## -0.30077 -0.10438 -0.01881 0.61856 -0.19459
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.086340 0.303196 0.285 0.7943
## y 0.051804 0.009876 5.246 0.0135 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.4172 on 3 degrees of freedom
## Multiple R-squared: 0.9017, Adjusted R-squared: 0.8689
## F-statistic: 27.52 on 1 and 3 DF, p-value: 0.01349
plot(x,y,pch = 16, cex = 1.3, col="blue", main = "Ejercicio 1")
abline(lm(x~y))





#Ejercicio 2
a <- c(-6,-3,0,3,6,9,12,15,20,25)
b <-c(2,2.8,3.9,4.2,5.8,6.2,7.5,8.2,9.3,10.9)
regresion1 <- lm(a~b)
summary(regresion1)
##
## Call:
## lm(formula = a ~ b)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.13408 -0.53806 0.09497 0.43261 1.38547
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -12.87430 0.64642 -19.92 4.21e-08 ***
## b 3.44972 0.09684 35.62 4.22e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.8437 on 8 degrees of freedom
## Multiple R-squared: 0.9937, Adjusted R-squared: 0.993
## F-statistic: 1269 on 1 and 8 DF, p-value: 4.223e-10
plot(a,b,pch = 16, cex = 1.3, col="blue", main = "Ejercicio 2")
abline(lm(b~a))





Ejercicio del mundo

11-26
Un estudio compara el número de horas de alivio que proporcionan
cinco marcas de antiácidos administrados a 25 personas diferentes, cada
una con acidez estomacal considerada fuerte. Los resultados son los
siguientes:
| 4.4 |
5.8 |
4.8 |
2.9 |
4.6 |
| 4.6 |
5.2 |
5.9 |
2.7 |
4.3 |
| 4.5 |
4.9 |
4.9 |
2.9 |
3.8 |
| 4.1 |
4.7 |
4.6 |
3.9 |
5.2 |
| 3.8 |
4.6 |
4.3 |
4.3 |
4.4 |
a)Calcule el cociente F. Para un nivel de significancia de 0.05, ¿las
marcas producen cantidades significativamente diferentes de alivio a las
personas con acidez estomacal fuerte?
#a)
antiacidos <-read.csv("C:\\Users\\sebastian\\Downloads\\antiacidos.csv")
antiacidos$marca <- as.factor(antiacidos$marca)
qf(.95,df1=4,df2=20)
## [1] 2.866081
anova3 <-aov(horas ~ marca, data=antiacidos)
summary(anova3)
## Df Sum Sq Mean Sq F value Pr(>F)
## marca 4 9.006 2.2514 7.653 0.000655 ***
## Residuals 20 5.884 0.2942
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## F 7.65, Fu 2.87, de forma que rechazamos H0.
## Las marcas producen una cantidad de alivio significativamente diferente.
11-38
En la ciudad de Villagrande, una cadena de comida rápida está
adquiriendo una mala reputación debido a que tardan mucho en servirle a
los clientes. Como la cadena tiene 4 restaurantes en esta ciudad, se
tiene la preocupación si los 4 restaurantes tienen el mismo tiempo
promedio de servicio. Uno de los dueños de la cadena ha decidido visitar
cada uno de los locales y registrar el tiempo de servicio para 5
clientes escogidos al azar. En sus 4 visitas vespertinas registró los
siguientes tiempos de servicio en minutos:
| 3 |
4 |
5.5 |
3.5 |
| 3 |
3.5 |
4.5 |
4 |
| 2 |
3.5 |
5 6. |
5 |
| 3 |
4 5 |
.5 2. |
5 |
Utilizando un nivel de significancia de 0.05, ¿todos los
restaurantes tienen el mismo tiempo promedio de servicio?
Basándose en los resultados, ¿deberá el dueño hacer algunas
recomendaciones a cualquierade los administradores de los
restaurantes?
restaurante<-read.csv("C:\\Users\\sebastian\\Downloads\\restaurante.csv")
restaurante$restaurante <- as.factor(restaurante$restaurante)
qf(.95,df1=3,df2=16)
## [1] 3.238872
anova4 <- aov(tiempo ~ restaurante, data=restaurante)
summary(anova4)
## Df Sum Sq Mean Sq F value Pr(>F)
## restaurante 3 2.538 0.8458 0.509 0.682
## Residuals 16 26.600 1.6625
##a) F 0.51, Fu 3.24, no rechazamos H0. Los tiempos medios de servicio no son significativamente diferentes.
##b) Debido a que ningún restaurante es peor que los otros, cualquier recomendación tendría que hacerse a todos los administradores.
12-64
Un arrendador está interesado en ver si las rentas de sus
departamentos son las típicas. Para esto tomó una muestra aleatoria de
11 rentas y tamaños de departamentos en complejos de departamentos
similares. Los datos son los siguientes:
| 230 |
2 |
| 190 |
1 |
| 450 |
3 |
| 310 |
2 |
| 218 |
2 |
| 185 |
2 |
| 340 |
2 |
| 245 |
1 |
| 125 |
1 |
| 350 |
2 |
| 280 |
2 |
- Desarrolle la ecuación de estimación que mejor describa estos
datos.
- Calcule el coeficiente de determinación.
- Pronostique la renta para un departamento de dos recámaras.
# a)
renta <- c(230,190,450,310,218,185,340,245,125,350,280)
recamaras <- c(2,1,3,2,2,2,2,1,1,2,2)
regresion3 <- lm(renta~recamaras)
summary(regresion3)
##
## Call:
## lm(formula = renta ~ recamaras)
##
## Residuals:
## Min 1Q Median 3Q Max
## -101.80 -51.35 19.10 50.25 74.10
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 55.00 63.19 0.870 0.40667
## recamaras 115.90 33.13 3.498 0.00675 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 63.19 on 9 degrees of freedom
## Multiple R-squared: 0.5762, Adjusted R-squared: 0.5291
## F-statistic: 12.23 on 1 and 9 DF, p-value: 0.006746
# Renta = 55.00 + 115.90*Recamaras
# b)
# r2= 0.5762
# c)
recamaras1 <- 2
renta1 <- 55+155.90*recamaras1
renta1
## [1] 366.8
- F 0.51, Fu 3.24, no rechazamos H0. Los tiempos medios de servicio
no son significativamente diferentes.
- Debido a que ningún restaurante es peor que los otros, cualquier
recomendación tendría que hacerse a todos los administradores.
