Para comenzar con este trabajo necesitamos una visión general de cómo puede afectar la proporción de hogares respecto a la renta neta media. Nosotros explicamos que los hogares unipersonales sean capacer de tener mayor o menor renta que los hogares pluripersonales; es decir que cuanto mayor sea la proporción de hogares unifamiliares mayor es la renta media porque, o suelen ser personas jóvenes que tienen un buen nivel de renta medio o jubilados que tienen una pensión media. Cuanto mayor sea la renta neta media, mayor número de hogares existirán.

min Q1 median Q3 max mean sd n missing
17838 26635.5 29464 31948.5 83812 30937.87 8433.664 126 0

Podemos observar, como hemos calculado, que la media de la renta neta sería un valor de 30937,87. El 25% de esta renta consistiría en un 26635,5 y que el 75% de esa renta sería un valor de 31948,5. Con esto veríamos que aunque la amplitud es desde (17838; a 83812) en nuestro caso habría muy pocos valores en los extremos de los intervalos, sino que estarían todos los valores en un momento central.

min Q1 median Q3 max mean sd n missing
14.24 22.2825 25.74 29.5775 38.64 25.74008 4.955353 126 0

Podemos observar, como hemos calculado, que la media de la proporcion de hogares sería un valor de 25.74008. El 25% de esta proporcion de hogares consistiría en un 22.2825 y que el 75% de esa proporcion sería un valor de 29.5775. Con esto veríamos que aunque la amplitud es desde (14.24; a 38.64) en nuestro caso habría muy pocos valores en los extremos de los intervalos, sino que estarían todos los valores en un momento central.En el caso de la proporcion de hogares el intervalo seria menos extenso que en la renta neta media

Nuestra Gráfica consiste en una grafica bimodal, cuyas dos modas estarian localizadas en los 24 y 28 hogares. Esta Grafica explica una relacion simetrica de la densidad de los hogares. Esto nos explica que la mayoria de los hogares estan situados entre los 22 y los 30 hogares.

Mientras que la grafica de los hogares es bimodal y simetrica, la grafica de la renta es unimodal y no es simetrica, por lo tanto la relacion entre ambos es inferior. La unica moda que existe en la renta seria en alrededor de los 30000 euros/unidades monetarias.

En esta grafica podemos ver la linealidad de nuestro modelo antes de estimarlo. En nuesstro caso observamos que tiene grandes rasgos de ser lineales como por ejemplo seria que ambas lineas tienen el mismo apuintamiento pero existen muchos datos atipicos ya que la mayoria de los datos no se situacion sobre nuestras lineas del modelo lineal o loess. Nuestra linea loess vemos que es mas recta y mas continua que la lineal. Pero para saber si el modelo es lineal, heterogeneo, normal…etc necesitaremos estimar el modelo.

## 
##  RESET test
## 
## data:  modelo1
## RESET = 0.11504, df1 = 2, df2 = 122, p-value = 0.8914

Aunque posiblemente observando solo las graficas no estariamos seguros de si nuestro modelo es lineal o no, nuestras graficas parecen representar linealidad pero no de la manera mas clara necesaria, por ello decidimos utilizar el test de reset para nuestro modelo en el que nos da nuestro p-valor. Este resultado al ser mayor que el grado de significacion decidimos no rechazar nuestra hipotesis nula y por lo tanto concluir que el modelo es lineal .

## 
##  studentized Breusch-Pagan test
## 
## data:  modelo1
## BP = 2.9836, df = 1, p-value = 0.08411

Al igual que respecto a la linealidad, nuestra heterogeneidad no queda claro si es o no, ya que en la grafica al existir tantos datos atipicos nos atreveriamos a decir que no seria heterogenea, pero para aclararnos realizamos el test de Breusch-pagan. Observando el modelo de Breusch-Pagan nuestro p-valor es mayor de nuevo que nuestro alfa por lo tanto no se rechaza la hipotesisnnula pero como es por una parte muy pequeña decidiremos considerar la grafica como si hubiese Heterocedasticidad.

## 
##  Shapiro-Wilk normality test
## 
## data:  rstudent(modelo1)
## W = 0.99034, p-value = 0.5285

Con el test de Shapiro somos capaces de estudiar la normalidad de un modelo. En este caso, como nuestro p-valor es mayor que el nivel de significación, podríamos decir que nuestro modelo es normal. Tal y como veíamos también en las gráficas, al no haber datos atípicos observamos que nuestro modelo es normal.

## No Studentized residuals with Bonferroni p < 0.05
## Largest |rstudent|:
##     rstudent unadjusted p-value Bonferroni p
## 42 -2.655389          0.0089704           NA

En esta gráfica representamos nuestro modelo y observamos que la mayoría de los datos son atípicos y no estarían concentrados respecto a nuestra línea. Esto determinaría que nuestro modelo no es claramente normal. Aquí observamos que a menor renta obtenemos mayores valores respecto a los hogares, por lo tanto, concluimos que la proporción de hogares depende del nivel de renta, como habíamos intuido desde el principio del trabajo.

\[\hat{ \text{ Hogares } } = \underset{(1.3511)}{32.6224}\text{}-\underset{(0)}{2e-04}\text{Renta},\, N=126,\, R^2=0.1433\]

term estimate std.error statistic p.value
(Intercept) 32.6223772 1.3510506 24.145933 0e+00
Renta -0.0002225 0.0000389 -5.722632 1e-07
Contraste boot strap
## 
## t test of coefficients:
## 
##                Estimate  Std. Error t value  Pr(>|t|)    
## (Intercept)  3.2622e+01  1.4130e+00 23.0874 < 2.2e-16 ***
## Renta       -2.2246e-04  4.1319e-05 -5.3839 3.512e-07 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Como conclusión a nuestro trabajo, hemos conseguido que nuestro modelo sea lineal, normal y heterogéneo. Por lo tanto, concluimos que nuestra primera hipótesis que realizamos al principio del trabajo se ha cumplido, es decir, que la proporción de hogares depende de la renta neta media.