Tema 4, T de student

pagos<-c(107,92,97,95,105,101,91,99,95,104)
t.test(pagos, y= NULL, alternative="two.side",mu=100, paired=FALSE,conf.level=0.90)
## 
##  One Sample t-test
## 
## data:  pagos
## t = -0.79888, df = 9, p-value = 0.4449
## alternative hypothesis: true mean is not equal to 100
## 90 percent confidence interval:
##   95.38755 101.81245
## sample estimates:
## mean of x 
##      98.6
#si es de una cola, altermnatibva puede ser: "less" o "greater"
# si p value es mator a 0.05 no se rechaza H0.
#conclusion: no se rechaza H0
#intervalos de confianza: Entre 95 y 101 dolares. 


#8-70
#Drive-a-Lemon, renta automóviles en buenas condiciones mecánicas, pero más antiguos que aquellos que rentan las grandes cadenas nacionales de renta de coches. Como resultado, anuncia que sus tarifas son considerablemente más bajas que las de sus grandes competidores. Una encuesta en la industria estableció que el cargo total promedio por renta en una de las mayores compañías es de $77.38 dólares. Una muestra aleatoria de 18 transacciones realizadas por Drive-a-Lemon mostró un cargo total promedio de $87.61, con una desviación estándar de la muestra de $19.48. Verifique que, con un nivel de significancia de 0.025, el cargo total promedio de Drive-a-Lemon es más alto que el de las grandes compañías. ¿Indica este resultado que las tarifas de Drive-a-Lemon, no son más bajas que las de las grandes cadenas nacionales? Justifique su respuesta.

# Respiuesta:
#paso 1. Plantear hipotesis
#H0: μ =x bar
#H1: μ > x bar

#paso 2. Nivel de significancia y grados de libertad 
# α = 0.025
#GL=17
#Paso 3. Zona e3 Aceptacion/ rechazo
# t de tablas=m 2.110

#paso 4. Funcion 

t<-(8.61-77.38)/(19.48/sqrt(18))
t
## [1] -14.97774
#paso 5. conclusion 
# se rechaza H0

Tema 5, Anova

regresion Lineal Simple

#ejercicio 1 
x <- c(0.2,0.5,1,2,3)
y <- c(8,10,18,25,60)
regresion <- lm(y~x)
summary(regresion)
## 
## Call:
## lm(formula = y ~ x)
## 
## Residuals:
##        1        2        3        4        5 
##   3.6427   0.4209  -0.2820 -10.6879   6.9062 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)  
## (Intercept)   0.8761     5.6095   0.156   0.8858  
## x            17.4059     3.3181   5.246   0.0135 *
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 7.648 on 3 degrees of freedom
## Multiple R-squared:  0.9017, Adjusted R-squared:  0.8689 
## F-statistic: 27.52 on 1 and 3 DF,  p-value: 0.01349
plot(regresion)

plot(x,y, pch= 16, cex= 1.3, col= "blue", main = "Ejercicio 1")
abline(lm(y ~ x))

plot(regresion)

#ejercicio 2 
a <- c(-6,-3,0,3,6,9,12,15,20,25)
b <- c(2,2.8,3.9,4.2,5.8,6.2,7.5,8.2,9.3,10.9)
regresion2 <- lm(a~b)
summary(regresion2)
## 
## Call:
## lm(formula = a ~ b)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1.13408 -0.53806  0.09497  0.43261  1.38547 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -12.87430    0.64642  -19.92 4.21e-08 ***
## b             3.44972    0.09684   35.62 4.22e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.8437 on 8 degrees of freedom
## Multiple R-squared:  0.9937, Adjusted R-squared:  0.993 
## F-statistic:  1269 on 1 and 8 DF,  p-value: 4.223e-10
plot(regresion2)

plot(x,y, pch= 16, cex= 1.3, col= "red", main = "Ejercicio 2")
abline(lm(y ~ x))

plot(regresion2)

Ejercicios del Mundo

##11-26 Un estudio compara el número de horas de alivio que proporcionan cinco marcas de antiácidos administrados a 25 personas diferentes, cada una con acidez estomacal considerada fuerte. Los resultados son los siguientes:

A B C D E
4.4 5.8 4.8 2.9 4.6
4.6 5.2 5.9 2.7 4.3
4.5 4.9 4.9 2.9 3.8
4.1 4.7 4.6 3.9 5.2
3.8 4.6 4.3 4.3 4.4
  1. Calcule el número medio de horas de alivio para cada marca y determine la gran media.
#a)
antiacidos <- read.csv( "C:\\Users\\maria\\Downloads\\antiacidos.csv")
antiacidos$marca <- as.factor(antiacidos$marca)
qf(.95,df1 = 4,df2 = 20)
## [1] 2.866081
anova3 <- aov(horas ~ marca, data = antiacidos)
summary(anova3)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## marca        4  9.006  2.2514   7.653 0.000655 ***
## Residuals   20  5.884  0.2942                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

##11-38 En la ciudad de Bigville, una cadena de comida rápida está adquiriendo una mala reputación debido a que tardan mucho en servir a los clientes. Como la cadena tiene cuatro restaurantes en esa ciudad, quiere saber si los cuatro restaurantes tienen el mismo tiempo promedio de servicio. Uno de los dueños de la cadena ha decidido visitar cada local y registrar el tiempo de servicio para 5 clientes escogidos al azar. En sus cuatro visitas al medio día registró los siguientes tiempos de servicio en minutos:

Restaurante 1 Restaurante 2 Restaurante 3 Restaurante 4
3 3 2 3
4 3.5 3.5 4
5.5 4.5 5 5.5
3.5 4 6.5 2.5
4 5.5 6 3
  1. Utilice un nivel de significancia de 0.05, ¿todos los restaurantes tienen el mismo tiempo medio de servicio?
  2. Según sus resultados, ¿deberá el dueño hacer algunas recomendaciones a cualquiera de los administradores de los restaurantes?
restaurante<- read.csv("C:\\Users\\maria\\Downloads\\restaurante.csv")
restaurante$restaurante <- as.factor(restaurante$restaurante)
qf(.95,df1 = 3,df2 = 16)
## [1] 3.238872
anova4 <- aov(tiempo ~ restaurante, data = restaurante)
summary(anova4)
##             Df Sum Sq Mean Sq F value Pr(>F)
## restaurante  3  2.538  0.8458   0.509  0.682
## Residuals   16 26.600  1.6625

Un arrendador está interesado en ver si las rentas de sus departamentos son las comunes. Para esto tomó una muestra aleatoria de 11 rentas y tamaños de departamentos en complejos de departamentos similares. Los datos son los siguientes:

Renta Numero de recamaras
230 2
190 1
450 3
310 2
218 2
185 2
340 2
245 1
125 1
350 2
280 2
  1. Desarrolle la ecuación de estimación que mejor describa los datos.
  2. Grafique la ecuación de estimación en el diagrama de dispersión del inciso a)
renta <- c(230,190,450,310,218,185,340,245,125,350,280)
recamaras <- c(2,1,3,2,2,2,2,1,1,2,2)

regresion3 <- lm(renta ~ recamaras)
summary(regresion3)
## 
## Call:
## lm(formula = renta ~ recamaras)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -101.80  -51.35   19.10   50.25   74.10 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)   
## (Intercept)    55.00      63.19   0.870  0.40667   
## recamaras     115.90      33.13   3.498  0.00675 **
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 63.19 on 9 degrees of freedom
## Multiple R-squared:  0.5762, Adjusted R-squared:  0.5291 
## F-statistic: 12.23 on 1 and 9 DF,  p-value: 0.006746
#renta = 55.00 + 115.90 recamaras

#b)

#r2= 0.5762

#c
recamaras1 <- 2 
renta1 <- 55+115.90*recamaras1
renta1 
## [1] 286.8
#286.8