Expansión de la CASEN sobre el CENSO compendio 2017

VE-CC-AJ

DataIntelligence

Lunes 12-07-2021

date: 21-07-2021

1 Censo Personas 2017


2 Análisis de regresión

3 Coeficiente de determinación

0.7229

4 Ecuación de regresión

\[ \hat Y = {\ 2621.971}^2 + 2 \ 2621.971 \ 1492.728 \sqrt{X}+ \ 1492.728^2 X \]


5 Análisis de regresión

6 Coeficiente de determinación

0.6452

7 Ecuación de regresión

\[ \hat Y = -85596834 + 59936823 \sqrt {X} \]


8 Análisis de regresión

9 Coeficiente de determinación

0.5608

10 Ecuación de regresión

\[ \hat Y = e^{16.08802 +0.8943158 \cdot ln{X}} \]


11 Análisis de regresión

11.1 región 04

12 Coeficiente de determinación

0.6716

13 Ecuación de regresión

\[ \hat Y = {\ 1644.978}^2 + 2 \ 1644.978 \ 2326.317 \sqrt{X}+ \ 2326.317^2 X \]


14 Análisis de regresión

14.1 región 05

15 Coeficiente de determinación

0.7669

16 Ecuación de regresión

\[ \hat Y = {\ 1212.349}^2 + 2 \ 1212.349 \ 2452.443 \sqrt{X}+ \ 2452.443^2 X \]


17 Análisis de regresión

17.1 región 06

18 Coeficiente de determinación

0.7519

19 Ecuación de regresión

\[ \hat Y = {\ 1489.315}^2 + 2 \ 1489.315 \ 2679.367 \sqrt{X}+ \ 2679.367^2 X \]


20 Análisis de regresión

20.1 región 07

21 Coeficiente de determinación

0.724

22 Ecuación de regresión

\[ \hat Y = \ 9781981 + \ 9728826 X^2 \]


23 Análisis de regresión

23.1 región 08

24 Coeficiente de determinación

0.7352

25 Ecuación de regresión

\[ \hat Y = {\ 1489.315}^2 + 2 \ 1489.315 \ 2679.367 \sqrt{X}+ \ 2679.367^2 X \]


26 Análisis de regresión

26.1 región 09

27 Coeficiente de determinación

0.547

28 Ecuación de regresión

\[ \hat Y = \ 17399422 + \ 5259096 X^2 \]


29 Análisis de regresión

29.1 región 10

30 Coeficiente de determinación

0.6611

31 Ecuación de regresión

\[ \hat Y = \17572146 + \4831427 X^2 \]


32 Análisis de regresión

32.1 región 11

33 Coeficiente de determinación

0.6576

34 Ecuación de regresión

\[ \hat Y = \-29404628 + \33840753 \sqrt {X} \]


35 Análisis de regresión

35.1 región 12

36 Coeficiente de determinación

0.8083

37 Ecuación de regresión

\[ \hat Y = -39111592 + 39931927 \sqrt {X} \]


38 Análisis de regresión

38.1 región 13

39 Coeficiente de determinación

0.8572

40 Ecuación de regresión

\[ \hat Y = {\ 1794.834}^2 + 2 \ 1794.834 \ 2221.198 \sqrt{X}+ \ 2221.198^2 X \]


41 Análisis de regresión

41.1 región 14

42 Coeficiente de determinación

0.5935

43 Ecuación de regresión

\[ \hat Y = \14572183 + \6731212 X^2 \]


44 Análisis de regresión

44.1 región 15

45 Coeficiente de determinación

0.7814

46 Ecuación de regresión

\[ \hat Y = e^{16.34088 +0.7457676 \cdot ln{X}} \]


47 Análisis de regresión

47.1 región 16

48 Coeficiente de determinación

0.7354

49 Ecuación de regresión

\[ \hat Y = \11027064 + \6574039 X^2 \]



50 Union total de las tablas urbanas

archivos_unidos <- dir("rural/", pattern = "*.rds")
receptaculo <- data.frame()
archivos_df <- as.data.frame(archivos_unidos) 
for (n in 1:nrow(archivos_df)) {
  
  nombres <- paste("rural/", archivos_df[n,], sep = "")
  cargado <- readRDS(nombres)


  identificar <- archivos_df[n,1]
  identificar <- str_replace(archivos_df[n,1], "_ESCOLARIDAD_r.rds","")
  cargado$identificador <- identificar
  receptaculo <- rbind(receptaculo,cargado)

  # print(receptaculo)
}

write_xlsx(receptaculo,"rural/censo_casen_rur_2017.xlsx")
write_csv2(receptaculo,"rural/censo_casen_rur_2017.csv")

51 Gráfica de la recta de regresión versus los valores verdaderos.

receptaculo_1 <- filter(receptaculo, receptaculo$identificador == "region_01" )
# receptaculo_1 <- receptaculo
est_ing <-  receptaculo_1$est_ing
frecuencia <- receptaculo_1$Freq.x

multipob <- receptaculo_1$multipob

data <- data.frame(est_ing, multipob, frecuencia)
library(plotly)
## Warning: package 'plotly' was built under R version 4.0.5
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:rio':
## 
##     export
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
fig <- plot_ly(x=data$frecuencia, y=data$est_ing) 
fig <- fig %>% add_trace(y=data$multipob, name = 'est_ing', mode = 'markers')
fig <- fig %>% add_trace(y=data$est_ing, name = 'est_ing', mode = 'markers')
fig
## No trace type specified:
##   Based on info supplied, a 'scatter' trace seems appropriate.
##   Read more about this trace type -> https://plotly.com/r/reference/#scatter
## Warning: Ignoring 9 observations
## No trace type specified:
##   Based on info supplied, a 'scatter' trace seems appropriate.
##   Read more about this trace type -> https://plotly.com/r/reference/#scatter
ggplot(receptaculo, aes(x = log(Freq.x) , y = log(Freq.y))) + geom_point() + stat_smooth(method = "lm", col = "red")
## `geom_smooth()` using formula 'y ~ x'