La tabla presenta informacion sobre la razon ventas/efectivo en las industrias manufactureras de Estados Unidos, clasificadas por tamaño de activos del establecimiento de 1971 - I a 1973 - IV.(Informacion Trimestral). La razón ventas efectivo puede considerarase una medida de la velocidad del ingreso en el sector empresarial, es decir, el numero de veces que circula un dolar.
## Cargamos la data del ejercicio
data <- read.csv("Prob15.csv",sep=";",header = T,dec=".")
data
## AÑO TRIMESTRE X1...10 X10...25 X25...50 X50...100 X100...250
## 1 1971 I 6.696 6.929 6.858 6.966 7.819
## 2 1971 II 6.826 7.311 7.299 7.081 7.907
## 3 1971 III 6.338 7.035 7.082 7.145 7.691
## 4 1971 IV 6.272 6.265 6.874 6.485 6.778
## 5 1972 I 6.692 6.236 7.101 7.060 7.104
## 6 1972 II 6.818 7.010 7.719 7.009 8.064
## 7 1972 III 6.783 6.934 7.182 6.923 7.784
## 8 1972 IV 6.779 6.988 6.531 7.146 7.279
## 9 1973 I 7.291 7.428 7.272 7.571 7.583
## 10 1973 II 7.766 9.071 7.818 8.692 8.608
## 11 1973 III 7.733 8.357 8.090 8.357 7.680
## 12 1973 IV 8.316 7.621 7.766 7.867 7.666
## X250...1000 X1000.a.más
## 1 7.557 7.860
## 2 7.685 7.351
## 3 7.309 7.088
## 4 7.120 6.765
## 5 7.584 6.717
## 6 7.457 7.280
## 7 7.142 6.619
## 8 6.928 6.919
## 9 7.053 6.630
## 10 7.571 6.805
## 11 7.654 6.772
## 12 7.380 7.072
data1 <- data
## Se eliminara las dos primeras columnas
data1$AÑO <- NULL
data1$TRIMESTRE <- NULL
data1
## X1...10 X10...25 X25...50 X50...100 X100...250 X250...1000 X1000.a.más
## 1 6.696 6.929 6.858 6.966 7.819 7.557 7.860
## 2 6.826 7.311 7.299 7.081 7.907 7.685 7.351
## 3 6.338 7.035 7.082 7.145 7.691 7.309 7.088
## 4 6.272 6.265 6.874 6.485 6.778 7.120 6.765
## 5 6.692 6.236 7.101 7.060 7.104 7.584 6.717
## 6 6.818 7.010 7.719 7.009 8.064 7.457 7.280
## 7 6.783 6.934 7.182 6.923 7.784 7.142 6.619
## 8 6.779 6.988 6.531 7.146 7.279 6.928 6.919
## 9 7.291 7.428 7.272 7.571 7.583 7.053 6.630
## 10 7.766 9.071 7.818 8.692 8.608 7.571 6.805
## 11 7.733 8.357 8.090 8.357 7.680 7.654 6.772
## 12 8.316 7.621 7.766 7.867 7.666 7.380 7.072
Por cada tamaño de activos, calcule la media y la desviacion estandar de la razon ventas/efectivo
w <- matrix(0,7,2)
w[1,1]<- mean(data1[,1])
w[1,2]<- sd(data1[,1])
for(i in 2:7) w[i,1]<- mean(data1[,i])
for(i in 2:7) w[i,2]<- sd(data1[,i])
w<- data.frame(w)
r <- c("1-10","10-25","25-50","50-100","100-250","250-1000","1000 a mas")
w <- cbind(r,w)
colnames(w)<- c("Activos","Media","Desviacion Estandar")
w
## Activos Media Desviacion Estandar
## 1 1-10 7.025833 0.6213923
## 2 10-25 7.265417 0.8025794
## 3 25-50 7.299333 0.4627164
## 4 50-100 7.358500 0.6441816
## 5 100-250 7.663583 0.4673892
## 6 250-1000 7.370000 0.2563332
## 7 1000 a mas 6.989833 0.3651692
Grafique el valor de la media frente a las desviacion estandar obtenida en “a”, con el tamaño de activos como unidad de observacion.
library(ggplot2)
ggplot(w,aes(w$Media,w$`Desviacion Estandar`))+ geom_point()+labs(x ="MEDIA",y="DESVIACION ESTANDAR", title="MEDIA VS DESVIACION ESTANDAR")+
theme(plot.title = element_text(size = rel(1), colour = "blue"))
Con un modelo de regresion apropiado, determine si la desviacion etandar de la razon se incrementa con el valor de la media. De no ser asi,¿Cómo interpreta el resultado?
modelo<- lm(`Desviacion Estandar`~ Media,w)
summary(modelo)
##
## Call:
## lm(formula = `Desviacion Estandar` ~ Media, data = w)
##
## Residuals:
## 1 2 3 4 5 6 7
## 0.08765 0.28441 -0.05325 0.13206 -0.02490 -0.25504 -0.17092
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.9904 2.6378 0.375 0.723
## Media -0.0650 0.3621 -0.180 0.865
##
## Residual standard error: 0.2019 on 5 degrees of freedom
## Multiple R-squared: 0.006403, Adjusted R-squared: -0.1923
## F-statistic: 0.03222 on 1 and 5 DF, p-value: 0.8646
Respuesta: podemos observar que no hay relacion directa entre la desviacion y el promedio, por otro lado segun el modelo de regresion lineal simple por cada unidad que aumente el promedio la desviacion estandar disminuye en promedio 0.0650
Si hay una relacion estadisticamente significativa entre los dos, ¿Como transformaria la informacion de manera que no haya heterocedasticidad?
plot(modelo)
Existe heterocedasticidad, se puede corregir mediante Cuadrados Medios Ponderados