Tema 4. T de Student

pagos<-c(107,92,97,95,105,101,91,99,95,104)
t.test(pagos,y=NULL,alternative="two.sided",mu=100,paired=FALSE,var.equal,conf.level=0.90)
##
## One Sample t-test
##
## data: pagos
## t = -0.79888, df = 9, p-value = 0.4449
## alternative hypothesis: true mean is not equal to 100
## 90 percent confidence interval:
## 95.38755 101.81245
## sample estimates:
## mean of x
## 98.6
# Si es de una cola, alternative puede ser: "less" o "greater".
# Si p value es mayor a 0.10 (por significancia del 10%) no se rechaza H0.
# Conclusión: No se rechaza Ho.
# Intervalo de Confianza: Entre 95 y 101 dólares.
# Ejercicio 8-70
# Drive-a-Lemon, renta automóviles en buenas condiciones mecánicas, pero más antiguos que aquellos
# que rentan las grandes cadenas nacionales de renta de coches. Como resultado, anuncia que sus tarifas son
# considerablemente más bajas que las de sus grandes competidores. Una encuesta en la industria estableció
# que el cargo total promedio por renta en una de las mayores compañías es de $77.38 dólares. Una muestra aleatoria
# de 18 transacciones realizadas por Drive-a-Lemon mostró un cargo total promedio de $87.61, con una desviación
# estándar de la muestra de $19.48. Verifique que, con un nivel de significancia de 0.025, el cargo total promedio de
# Drive-a-Lemon es más alto que el de las grandes compañías. ¿Indica este resultado que las tarifas de Drive-a-Lemon,
# no son más bajas que las de las grandes cadenas nacionales? Justifique su respuesta.
# Respuesta:
# Paso 1. Plantear hipótesis
# H0: μ = x bar
# H1: μ > x bar
# Paso 2. Nivel de Significancia y Grados de Libertad
# α = 0.025
# GL = 17
# Paso 3. Zona de Aceptación/Rechazo
# t de tablas = 2.110
# Paso 4. Función
t<-(87.61-77.38)/(19.48/sqrt(18))
t
## [1] 2.22804
# Paso 5. Conclusión
# Se rechaza la Hipótesis Nula.
Tema 5. Anova/span>

# install.packages("Stats")
library(stats)
# Ejercicio 1
# file.choose()
resistencia<-read.csv("C:\\Users\\Catalina\\Documents\\ANOVA Mezclas.csv")
resistencia$Mezcla<-as.factor(resistencia$Mezcla)
qf(.9,df1=3,df=20)
## [1] 2.380087
anova1<-aov(Valor~Mezcla,data=resistencia)
summary(anova1)
## Df Sum Sq Mean Sq F value Pr(>F)
## Mezcla 3 127375 42458 25.09 5.53e-07 ***
## Residuals 20 33839 1692
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# Ejercicio 2
# file.choose()
manchado<-read.csv("C:\\Users\\Catalina\\Downloads\\ANOVA Grado.csv")
manchado$Manchado<-as.factor(manchado$Manchado)
qf(.99,df1=2,df2=12)
## [1] 6.926608
anova2<-aov(Valor~Manchado,data=manchado)
summary(anova2)
## Df Sum Sq Mean Sq F value Pr(>F)
## Manchado 2 0.0609 0.03043 0.987 0.401
## Residuals 12 0.3701 0.03084
Tema 6. Regresión Lineal
Simple

# Ejercicio 1
x<-c(0.2,0.5,1,2,3)
y<-c(8,10,18,35,60)
regresion<-lm(y~x)
summary(regresion)
##
## Call:
## lm(formula = y ~ x)
##
## Residuals:
## 1 2 3 4 5
## 3.0591 -0.5354 -1.8596 -3.5079 2.8437
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.211 2.451 0.494 0.65510
## x 18.648 1.450 12.863 0.00101 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.341 on 3 degrees of freedom
## Multiple R-squared: 0.9822, Adjusted R-squared: 0.9763
## F-statistic: 165.5 on 1 and 3 DF, p-value: 0.001014
plot(x, y, pch=16, cex=1.3, col="blue", main="Ejercicio1")
abline(lm(y~x))





# Ejercicio 2
a<-c(-6,-3,0,3,6,9,12,15,20,25)
b<-c(2,2.8,3.9,4.2,5.8,6.2,7.5,8.2,9.3,10.9)
regresion2<-lm(y~x)
summary(regresion2)
##
## Call:
## lm(formula = y ~ x)
##
## Residuals:
## 1 2 3 4 5
## 3.0591 -0.5354 -1.8596 -3.5079 2.8437
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.211 2.451 0.494 0.65510
## x 18.648 1.450 12.863 0.00101 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.341 on 3 degrees of freedom
## Multiple R-squared: 0.9822, Adjusted R-squared: 0.9763
## F-statistic: 165.5 on 1 and 3 DF, p-value: 0.001014




plot(a, b, pch=16, cex=1.3, col="blue", main="Ejercicio2")
abline(lm(b~a))





Tema 7. Ejercicios del Mundo
Real
[]C:\Users\Catalina\Documents\Estadistica-inferencial-min-e1533841676384-800x400.jpg
11-26
En un estudio se compararon los efectos de cuatro promociones
mensuales sobre las ventas. A continuación, presentamos las ventas
unitarias de 5 tiendas que utilizaron las 4 promociones en meses
diferentes:
| 4.4 |
5.8 |
4.8 |
2.9 |
4.6 |
|
| 4.6 |
5.2 |
5.9 |
2.7 |
4.3 |
|
| 4.5 |
4.9 |
4.9 |
2.9 |
3.8 |
|
| 4.1 |
4.7 |
4.6 |
3.9 |
5.2 |
|
| 3.8 |
4.6 |
4.3 |
4.3 |
4.4 |
|
- Calcule el cociente F. Para un nivel de significancia de 0.05, ¿las
marcas producen cantidades significativamente diferentes de alivio a las
personas con acidez estomacal fuerte?
# a)
antiacidos<-read.csv("C:\\Users\\Catalina\\Documents\\antiacidos.csv")
antiacidos$marca<-as.factor(antiacidos$marca)
qf(.95,df1=4,df=20)
## [1] 2.866081
anova3<-aov(horas~marca, data=antiacidos)
summary(anova3)
## Df Sum Sq Mean Sq F value Pr(>F)
## marca 4 9.006 2.2514 7.653 0.000655 ***
## Residuals 20 5.884 0.2942
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# F=7.65, Fu=2.87, de forma que rechazamos H0.
11-38
En la ciudad de Bigville, una cadena de comida rápida está
adquiriendo una mala reputación debido a que tardan mucho en servir a
los clientes. Como la cadena tiene cuatro restaurantes en esa ciudad,
quiere saber si los cuatro restaurantes tienen el mismo tiempo promedio
de servicio. Uno de los dueños de la cadena ha decidido visitar cada
local y registrar el tiempo de servicio para 5 clientes escogidos al
azar. En sus cuatro visitas al medio día registró los siguientes tiempos
de servicio en minutos:
| 3 |
3 |
2 |
3 |
| 4 |
3.5 |
3.5 |
4 |
| 5.5 |
4.5 |
5 |
5.5 |
| 3.5 |
4 |
6.5 |
2.5 |
| 4 |
5.5 |
6 |
3 |
- Utilice un nivel de significancia de 0.05, ¿todos los restaurantes
tienen el mismo tiempo medio de servicio?
- Según sus resultados, ¿deberá el dueño hacer algunas recomendaciones
a cualquiera de los administradores de los restaurantes?
# a)
restaurante<-read.csv("C:\\Users\\Catalina\\Documents\\restaurante.csv")
restaurante$restaurant<-as.factor(restaurante$restaurante)
qf(.95,df1=3,df2=16)
## [1] 3.238872
anova4<-aov(tiempo~restaurante,data=restaurante)
summary(anova4)
## Df Sum Sq Mean Sq F value Pr(>F)
## restaurante 1 0.123 0.1225 0.076 0.786
## Residuals 18 29.015 1.6119
# No rechazamos H0.
# Los tiempos medios de servicio no son significativamente diferentes.
# b)
# Debido a que ningún restaurant es peor que los otros, cualquier recomendación tendría que hacerese a todos los administradores.
12-64
Un arrendador está interesado en ver si las rentas de sus
departamentos son las comunes. Para esto tomó una muestra aleatoria de
11 rentas y tamaños de departamentos en complejos de departamentos
similares.
Los datos son los siguientes:
| 230 |
2 |
| 190 |
1 |
| 450 |
3 |
| 310 |
2 |
| 218 |
2 |
| 185 |
2 |
| 340 |
2 |
| 245 |
1 |
| 125 |
1 |
| 350 |
2 |
| 280 |
2 |
- Desarrolle la ecuación de estimación que mejor describa estos
datos.
- Calcule el coeficiente de determinación.
- Pronostique la renta para un departamento de dos recámaras.
# a)
renta<-c(230,190,450,310,218,185,340,245,125,350,280)
recamaras1<-c(2,1,3,2,2,2,2,1,1,2,2)
regresion3<-lm(renta~recamaras1)
summary(regresion3)
##
## Call:
## lm(formula = renta ~ recamaras1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -101.80 -51.35 19.10 50.25 74.10
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 55.00 63.19 0.870 0.40667
## recamaras1 115.90 33.13 3.498 0.00675 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 63.19 on 9 degrees of freedom
## Multiple R-squared: 0.5762, Adjusted R-squared: 0.5291
## F-statistic: 12.23 on 1 and 9 DF, p-value: 0.006746
# Renta = 55.00 + 115.90*Recamaras
# b)
# r2 = 0.5762
# c)
renta1<-55+115.90*recamaras1
renta1
## [1] 286.8 170.9 402.7 286.8 286.8 286.8 286.8 170.9 170.9 286.8 286.8
