EVALUACION EU1U2

Importar datos

setwd("~/ESTADISTICA")
library(readr)
PIB <- read_csv("PIB.csv")
## 
## -- Column specification --------------------------------------------------------
## cols(
##   primarias = col_double(),
##   manufactura = col_double(),
##   inmobiliarias = col_double()
## )
head(PIB)
## # A tibble: 6 x 3
##   primarias manufactura inmobiliarias
##       <dbl>       <dbl>         <dbl>
## 1   371390.    1698488.       998787.
## 2   369425.    1678576.      1010400.
## 3   377071.    1671630.      1017815.
## 4   362920.    1681706.      1027499.
## 5   363635.    1698171.      1040847.
## 6   393408.    1737834.      1052990.

Análisis

prim <- PIB$primarias

inm <- PIB$inmobiliarias

Medidas de tendencia central

Media

mediaprim <- mean(prim)
mediaprim
## [1] 471505.8
mediainm <- mean(inm)
mediainm
## [1] 1570802

Mediana

medianaprim <- median(prim)
medianaprim
## [1] 470182.3
medianainm <- median(inm)
medianainm
## [1] 1582417

Moda

library(modeest)
mlv(prim, method="mfv")[1]
## [1] 351036.5
library(modeest)
mlv(inm, method="mfv")[1]
## [1] 998786.5

Cuartiles

summary(prim)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  351037  410631  470182  471506  520028  631653
summary(inm)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  998787 1261862 1582417 1570802 1870725 2074242

Rango intercuantil (IQR)

summary(prim)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  351037  410631  470182  471506  520028  631653
RIC <- IQR(prim)
RIC
## [1] 109397.8
#limite superios
Q3 <- 520028
limitesuperior <- (Q3+1.5*RIC)
limitesuperior 
## [1] 684124.7
# limite inferior
Q1 <- 410631 
limiteinferior <- (Q1-1.5*RIC)
limiteinferior
## [1] 246534.3
summary(inm)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  998787 1261862 1582417 1570802 1870725 2074242
RIC <- IQR(inm)
RIC
## [1] 608862.7
#limite superios
Q3 <- 1870725
limitesuperior <- (Q3+1.5*RIC)
limitesuperior 
## [1] 2784019
# limite inferior
Q1 <- 1261862 
limiteinferior <- (Q1-1.5*RIC)
limiteinferior
## [1] 348568

Grafico de caja y bigote

boxplot(prim)

boxplot(inm)

Distribucion de frecuencias

Tabla de frecuencias

library(fdth) #importar paquete
## 
## Attaching package: 'fdth'
## The following object is masked from 'package:modeest':
## 
##     mfv
## The following objects are masked from 'package:stats':
## 
##     sd, var
dist <- fdt(prim, breaks="Sturges")
dist
##             Class limits  f   rf rf(%)  cf  cf(%)
##  [347526.129,383831.592) 10 0.09  8.93  10   8.93
##  [383831.592,420137.055) 21 0.19 18.75  31  27.68
##  [420137.055,456442.518) 18 0.16 16.07  49  43.75
##  [456442.518,492747.981) 24 0.21 21.43  73  65.18
##  [492747.981,529053.444) 13 0.12 11.61  86  76.79
##  [529053.444,565358.907)  8 0.07  7.14  94  83.93
##   [565358.907,601664.37) 15 0.13 13.39 109  97.32
##   [601664.37,637969.833)  3 0.03  2.68 112 100.00
#f= frecuencia absoluta
#rf= frecuencia relativa
#rf(%) frecuencia relativa porcentual
#cf= frecuencia acumulada
#cf(%)=frecuencia acumulada porcentual
library(fdth) #importar paquete
dist <- fdt(inm, breaks="Sturges")
dist
##               Class limits  f   rf rf(%)  cf  cf(%)
##  [988798.6608,1127071.883) 13 0.12 11.61  13  11.61
##  [1127071.883,1265345.105) 16 0.14 14.29  29  25.89
##  [1265345.105,1403618.328) 13 0.12 11.61  42  37.50
##   [1403618.328,1541891.55) 11 0.10  9.82  53  47.32
##   [1541891.55,1680164.772) 13 0.12 11.61  66  58.93
##  [1680164.772,1818437.995) 10 0.09  8.93  76  67.86
##  [1818437.995,1956711.217) 15 0.13 13.39  91  81.25
##  [1956711.217,2094984.439) 21 0.19 18.75 112 100.00
#f= frecuencia absoluta
#rf= frecuencia relativa
#rf(%) frecuencia relativa porcentual
#cf= frecuencia acumulada
#cf(%)=frecuencia acumulada porcentual

Histogramas y poligonos de frecuencia

#histogramas
plot(dist, type="fh") #Histograma de frecuencias absolutas

plot(dist, type="rfh") #Histograma de frecuencias relativas

plot(dist, type="cfh") #Histograma de frecuencias acumuladas

#polígonos

plot(dist, type="fp") #polígono de frecuencias absolutas

plot(dist, type="rfp") # polígono de frecuencias relativas

plot(dist, type="cfp") # polígono de frecuencias acumuladas

Medidas de dispersion

Varianza

min(PIB$primarias,na.rm=TRUE)
## [1] 351036.5
min(PIB$inmobiliarias,na.rm=TRUE)
## [1] 998786.5

Desviacion estandar

max(PIB$primarias,na.rm=TRUE)
## [1] 631653.3
max(PIB$inmobiliarias,na.rm=TRUE)
## [1] 2074242

Grafico de dispersion

plot(prim)

plot(inm)

Analisis de correlacion

Regresion lineal

regresion <-lm(primarias~ inmobiliarias, data=PIB)
summary(regresion)
## 
## Call:
## lm(formula = primarias ~ inmobiliarias, data = PIB)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -75134 -10743   1269  11840  60587 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   1.532e+05  8.883e+03   17.24   <2e-16 ***
## inmobiliarias 2.027e-01  5.529e-03   36.65   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 19760 on 110 degrees of freedom
## Multiple R-squared:  0.9243, Adjusted R-squared:  0.9236 
## F-statistic:  1344 on 1 and 110 DF,  p-value: < 2.2e-16

Matriz de coeficientes de correlacion

cor(PIB)
##               primarias manufactura inmobiliarias
## primarias     1.0000000   0.8979538     0.9614170
## manufactura   0.8979538   1.0000000     0.9115337
## inmobiliarias 0.9614170   0.9115337     1.0000000

Matriz de diagramas de dispersion

pairs(PIB)

Esta fue una pequeña evaluacion sobre el crecimiento del Producto Interno Bruto (PIB) del año 1993 hasta el año 2020 en Mexico con respecto a las distintas actividades que se emplean, en esta ocasion, optamos por tomar las actividades primarias (Agricultura, cría y explotación de animales, aprovechamiento forestal, pesca y caza) y actividades inmobiliarias (Servicios inmobiliarios y de alquiler de bienes muebles e intangibles) para asi poder comparar una con otra empleando distintas herramientas. Al recorrer todo el trabajo nos podemos dar cuenta que las cantidades de las actividades inmobiliarias son mayores que las actividades primarias. En el año 2020 con la pandemia de COVID-19 podemos observar que los numeros varian constantemete. Las actividades primarias iniciaron el año con una cantidad de $587,682 y terminaron con una cantidad de $616,544 mientras que las actividades inmobiliarias iniciaron con $2,074,242 y terminaron con $2,069,002.