#Prueba de hipotesis t de student
#Ejercicio
pagos <- c(107,92,97,95,105,101,91,99,95,104)
t.test(pagos,y=NULL,alternative="two.sided",mu=100,paired=FALSE,var.equal=FALSE,conf.level=0.90)
##
## One Sample t-test
##
## data: pagos
## t = -0.79888, df = 9, p-value = 0.4449
## alternative hypothesis: true mean is not equal to 100
## 90 percent confidence interval:
## 95.38755 101.81245
## sample estimates:
## mean of x
## 98.6
#Si es de cola, alternative puede ser ¡: "less" o "greater"
#Si p value es mayor a 0.10 (por significancia del 10%) no se rechaza HO
# Conclusión: No se rechaza HO
#Intervalo de confianza: Entre 95 y 101 dolres.
#8-70
#Drive-a-Lemon, renta automóviles en buenas condiciones mecánicas, pero más antiguos que
#aquellos que rentan las grandes cadenas nacionales de renta de coches. Como resultado, anuncia
#que sus tarifas son considerablemente más bajas que las de sus grandes competidores. Una
#encuesta en la industria estableció que el cargo total promedio por renta en una de las mayores
#compañías es de $77.38 dólares. Una muestra aleatoria de 18 transacciones realizadas por Drive-a-
#Lemon mostró un cargo total promedio de $87.61, con una desviación estándar de la muestra de
#$19.48. Verifique que, con un nivel de significancia de 0.025, el cargo total promedio de Drive-a-
#Lemon es más alto que el de las grandes compañías. ¿Indica este resultado que las tarifas de Drive-
#a-Lemon, no son más bajas que las de las grandes cadenas nacionales? Justifique su respuesta.
#Respuesta
#Paso 1. Plantear Hipotesis
# HO: μ = x bar
# H1: μ > x bar
#Paso 2 Nivel de significancia y grados de libertad
# α = 0.25
#GL = 17
#Paso 3. Zona de aceptación/Rechazo
# t de tablas = 2.110
#Paso 4. Función
t <- (87.61-77.38)/(19.48/sqrt(18))
t
## [1] 2.22804
#Paso 5. Conclusión
# Se rechaza HO
#t = 2.228 (xbar =)
#install.packages("stats")
library(stats)
#Ejercicio 1
resistencia <- read.csv("/Users/jorgemoctezuma/Desktop/Resistencia (1).csv")
resistencia$Caja <- as.factor(resistencia$Caja)
qf(.95,df1=3,df2=20)
## [1] 3.098391
anova1<- aov( Resistencia ~ Caja,data = resistencia)
summary(anova1)
## Df Sum Sq Mean Sq F value Pr(>F)
## Caja 3 127375 42458 25.09 5.53e-07 ***
## Residuals 20 33839 1692
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#Ejercicio 2
manchado <- read.csv("/Users/jorgemoctezuma/Desktop/mezcla.csv")
manchado$Mezcla <- as.factor(manchado$Mezcla)
qf(.99,df1=2,df2=12)
## [1] 6.926608
anova2<- aov( Manchado ~ Mezcla,data = manchado)
summary(anova2)
## Df Sum Sq Mean Sq F value Pr(>F)
## Mezcla 2 0.0609 0.03043 0.987 0.401
## Residuals 12 0.3701 0.03084
#Regresion lineal Simple
#Ejercicio 1
x<- c(0.2,0.5,1,2,3)
y<- c(8,10,18,35,60)
regresion<- lm(y~x)
summary(regresion)
##
## Call:
## lm(formula = y ~ x)
##
## Residuals:
## 1 2 3 4 5
## 3.0591 -0.5354 -1.8596 -3.5079 2.8437
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.211 2.451 0.494 0.65510
## x 18.648 1.450 12.863 0.00101 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.341 on 3 degrees of freedom
## Multiple R-squared: 0.9822, Adjusted R-squared: 0.9763
## F-statistic: 165.5 on 1 and 3 DF, p-value: 0.001014
plot(x,y,pch=16, cex= 1.3, col= "blue",main = "Ejercio 1 ")
abline (lm (y~x))
plot(regresion)
#Ejercicio 2
a <- c(-6,-3,0,3,6,9,12,15,20,25)
b <- c(2,2.8,3.9,4.2,5.8,6.2,7.5,8.2,9.3,10.9)
regresion2<- lm(a~b)
summary(regresion2)
##
## Call:
## lm(formula = a ~ b)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.13408 -0.53806 0.09497 0.43261 1.38547
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -12.87430 0.64642 -19.92 4.21e-08 ***
## b 3.44972 0.09684 35.62 4.22e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.8437 on 8 degrees of freedom
## Multiple R-squared: 0.9937, Adjusted R-squared: 0.993
## F-statistic: 1269 on 1 and 8 DF, p-value: 4.223e-10
plot(a,b,pch=16, cex= 1.3, col= "blue",main = "Ejercio 2 ")
abline (lm (a~b))
plot(regresion)
| Tipo de promoción | Ventas tienda 1 | Ventas tienda 2 | Ventas tienda 3 | Ventas tienda 4 | Ventas tienda 5 |
|---|---|---|---|---|---|
| Muestra gratis | 78 | 87 | 81 | 89 | 85 |
| Producto extra | 94 | 91 | 87 | 90 | 88 |
| Descuento | 73 | 78 | 69 | 83 | 76 |
| Reembolso | 79 | 83 | 78 | 69 | 81 |
promocion <- read.csv("/Users/jorgemoctezuma/Desktop/promo.csv")
promocion$Promocion <- as.factor(promocion$Promocion)
promocion$Tienda <- as.factor(promocion$Tienda)
qf(.99,df1 = 3,df2 = 16)
## [1] 5.292214
anova3 <- aov(Venta ~ Promocion + Tienda, data = promocion)
summary(anova3)
## Df Sum Sq Mean Sq F value Pr(>F)
## Promocion 3 612.1 204.05 9.524 0.0017 **
## Tienda 4 79.7 19.93 0.930 0.4788
## Residuals 12 257.1 21.43
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Un arrendador está interesado en ver si las rentas de sus departamentos son las comunes. Para esto tomó una muestra aleatoria de 11 rentas y tamaños de departamentos en complejos de departamentos similares. Los datos son los siguientes: | Renta | Número de recamaras | 230 | 2 190 | 1 450 | 3 310 | 2 218 | 2 185 | 2 340 | 2 245 | 1 125 | 1 350 | 2 280 | 2
renta <- c(230,190,450,310,218,185,340,245,125,350,280)
recamaras <- c(2,1,3,2,2,2,2,1,1,2,2)
regresion3 <- lm(renta ~ recamaras)
summary(regresion3)
##
## Call:
## lm(formula = renta ~ recamaras)
##
## Residuals:
## Min 1Q Median 3Q Max
## -101.80 -51.35 19.10 50.25 74.10
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 55.00 63.19 0.870 0.40667
## recamaras 115.90 33.13 3.498 0.00675 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 63.19 on 9 degrees of freedom
## Multiple R-squared: 0.5762, Adjusted R-squared: 0.5291
## F-statistic: 12.23 on 1 and 9 DF, p-value: 0.006746
# Renta = 55.00 +115.90*Recamaras
#b)
# r2 = 0.5762
#c)
recamaras1 <- 2
renta1 <- 55 + 115.90*recamaras1
renta1
## [1] 286.8
# $286.80