Evaluación EU1U2

Para esta evaluación se tomaron como base estos datos conseguidos de la base de datos del INEGI: https://www.inegi.org.mx/temas/pib/#Tabulados

Importar los Datos

conociendo los datos

setwd("~/E1LMV11")
library(readr)
PIB <- read_csv("PIB.CSV")
## 
## -- Column specification --------------------------------------------------------
## cols(
##   primarias = col_double(),
##   manufactura = col_double(),
##   inmobiliarias = col_double()
## )
View(PIB)
head(PIB)
## # A tibble: 6 x 3
##   primarias manufactura inmobiliarias
##       <dbl>       <dbl>         <dbl>
## 1   371390.    1698488.       998787.
## 2   369425.    1678576.      1010400.
## 3   377071.    1671630.      1017815.
## 4   362920.    1681706.      1027499.
## 5   363635.    1698171.      1040847.
## 6   393408.    1737834.      1052990.

El Producto Interno Bruto trimestral ofrece, en el corto plazo, una visión oportuna, completa y coherente de la evolución de las actividades económicas del país, proporcionando información oportuna y actualizada, para apoyar la toma de decisiones.

Ahora, tomamos todos los datos del crecimiento del PIB trimestral desde 1993 hasta 2020 y los acomodamos de esta forma por actividades:

Tenemos 3 actividades económicas:

Primarias: Agricultura, cría y explotación de animales, aprovechamiento forestal, pesca y caza Manufactura: Industrias manufactureras Inmobiliarias: Servicios inmobiliarios y de alquiler de bienes muebles e intangibles

Comparación de las actividades manufactureras e inmobiliarias

Variable que contenga los datos de las actividades manufactureras e inmobiliarias

inm <- PIB$inmobiliarias

man <- PIB$manufactura

Estadística descriptiva

La estadística descriptiva es una disciplina que se encarga de recoger, almacenar, ordenar, realizar tablas o gráficos y calcular parámetros básicos sobre el conjunto de datos.

Medidas de tendencia central

Las medidas de tendencia central son parámetros estadísticos que informan sobre el centro de la distribución de la muestra o población estadística.

Media

La media es el valor promedio de un conjunto de datos numéricos, calculada como la suma del conjunto de valores dividida entre el número total de valores.

mean(PIB$manufactura)
## [1] 2370180
mean(PIB$inmobiliarias)
## [1] 1570802

Mediana

La mediana es un estadístico de posición central que parte la distribución en dos, es decir, deja la misma cantidad de valores a un lado que a otro.

median(PIB$manufactura)
## [1] 2372057
median(PIB$inmobiliarias)
## [1] 1582417

Moda

La moda es el valor que tiene mayor frecuencia absoluta. Se puede hallar la moda para variables cualitativas y cuantitativas. Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas.

library(modeest)
mlv(PIB$manufactura, method = "mfv")
##   [1] 1591590 1630377 1671630 1678576 1681706 1698171 1698331 1698488 1737834
##  [10] 1760069 1766085 1769214 1781156 1796901 1812049 1888922 1921331 1977080
##  [19] 2021828 2087948 2100335 2111285 2152457 2152752 2157564 2166767 2183179
##  [28] 2188641 2212026 2218840 2224143 2231770 2234171 2239728 2242791 2243939
##  [37] 2245005 2246333 2249843 2251276 2253833 2254089 2283201 2296002 2316299
##  [46] 2316839 2320765 2325533 2329709 2331730 2331854 2342612 2344402 2351759
##  [55] 2364911 2366278 2377837 2387464 2413172 2421035 2422352 2428010 2439170
##  [64] 2442793 2444821 2456107 2457225 2468088 2470754 2472527 2473144 2473742
##  [73] 2474986 2483717 2491708 2502094 2522297 2540534 2558515 2558725 2563296
##  [82] 2570231 2575538 2590132 2593854 2636394 2681868 2686401 2727775 2733965
##  [91] 2752923 2770210 2770819 2772088 2774488 2787010 2805940 2834238 2837244
## [100] 2865578 2879245 2880133 2892737 2894845 2895683 2929393 2932418 2939272
## [109] 2939943 2953599 2978552 2981584
library(modeest)
mlv(PIB$inmobiliarias, method = "mfv")
##   [1]  998786.5 1010400.0 1017815.1 1027499.3 1040846.8 1052990.5 1061997.4
##   [8] 1071085.9 1081899.1 1090147.5 1100050.2 1108722.8 1121553.8 1130838.5
##  [15] 1140772.0 1148461.8 1152976.5 1162436.3 1169150.5 1176209.7 1180001.7
##  [22] 1188178.1 1194145.0 1202344.2 1214119.5 1227782.5 1241755.1 1252100.9
##  [29] 1265115.5 1277347.8 1289301.5 1300858.7 1315843.3 1328261.4 1336191.8
##  [36] 1345491.7 1346509.0 1354713.5 1368670.8 1378940.5 1395531.7 1402297.5
##  [43] 1420959.0 1435916.0 1449865.7 1466334.0 1471072.0 1471404.9 1484691.7
##  [50] 1496019.1 1501011.5 1515406.3 1539661.1 1560846.7 1568628.7 1578234.6
##  [57] 1586600.3 1608974.7 1626808.6 1637882.7 1645685.8 1665057.0 1672874.1
##  [64] 1673078.5 1678430.7 1679159.3 1699994.1 1702526.6 1713141.9 1728565.7
##  [71] 1752428.3 1762721.3 1777521.0 1779450.1 1792507.4 1813614.3 1822601.4
##  [78] 1829997.1 1842771.2 1843496.9 1847655.2 1852728.3 1857708.6 1867323.0
##  [85] 1880929.2 1886702.1 1901156.9 1912307.3 1918526.3 1942484.3 1946775.7
##  [92] 1957807.3 1958684.1 1977714.4 1985272.8 1997899.6 1998123.1 1998584.3
##  [99] 2006775.5 2018933.9 2029323.8 2029454.1 2038797.5 2043916.1 2045017.9
## [106] 2052070.5 2059907.9 2062074.7 2069001.6 2071895.5 2073988.6 2074242.0

Rango intercuartil (IQR)

El rango intercuartílico es un medida de dispersión de un conjunto de datos que expresa la diferencia o la distancia entre el primer y el tercer cuartil.

# Manufactura
summary(man)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## 1591590 2206180 2372058 2370180 2591063 2981584
IQR(man)
## [1] 384883.3
# Inmobiliario
summary(inm)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  998787 1261862 1582417 1570802 1870725 2074242
IQR(inm)
## [1] 608862.7

Rango y amplitud

Manufactura

maximo <- max(PIB$manufactura) #valor más grande
maximo
## [1] 2981584
minimo <- min(PIB$manufactura) #valor más chico
minimo
## [1] 1591590
rango <- (maximo-minimo) #amplitud 

Inmobiliarias

maximo <- max(PIB$inmobiliarias) #valor más grande
maximo
## [1] 2074242
minimo <- min(PIB$inmobiliarias) #valor más chico
minimo
## [1] 998786.5
rango <- (maximo-minimo) #amplitud
rango
## [1] 1075455

Gráfico de caja y bigote

boxplot(PIB$manufactura)

boxplot(PIB$manufactura)

### Distribución de frecuencias Manufactura

library(fdth) #importar paquete
## 
## Attaching package: 'fdth'
## The following object is masked from 'package:modeest':
## 
##     mfv
## The following objects are masked from 'package:stats':
## 
##     sd, var
dist <- fdt(PIB$manufactura, breaks="Sturges")
dist
##               Class limits  f   rf rf(%)  cf  cf(%)
##  [1575674.365,1755140.009)  9 0.08  8.04   9   8.04
##  [1755140.009,1934605.653)  8 0.07  7.14  17  15.18
##  [1934605.653,2114071.298)  5 0.04  4.46  22  19.64
##  [2114071.298,2293536.942) 21 0.19 18.75  43  38.39
##  [2293536.942,2473002.586) 27 0.24 24.11  70  62.50
##   [2473002.586,2652468.23) 16 0.14 14.29  86  76.79
##   [2652468.23,2831933.874) 11 0.10  9.82  97  86.61
##  [2831933.874,3011399.518) 15 0.13 13.39 112 100.00

Dist nos brinda una tabla con los cálculos de la distribución de frecuencias.

Ordenar datos de menor a mayor

sort(man)
##   [1] 1591590 1630377 1671630 1678576 1681706 1698171 1698331 1698488 1737834
##  [10] 1760069 1766085 1769214 1781156 1796901 1812049 1888922 1921331 1977080
##  [19] 2021828 2087948 2100335 2111285 2152457 2152752 2157564 2166767 2183179
##  [28] 2188641 2212026 2218840 2224143 2231770 2234171 2239728 2242791 2243939
##  [37] 2245005 2246333 2249843 2251276 2253833 2254089 2283201 2296002 2316299
##  [46] 2316839 2320765 2325533 2329709 2331730 2331854 2342612 2344402 2351759
##  [55] 2364911 2366278 2377837 2387464 2413172 2421035 2422352 2428010 2439170
##  [64] 2442793 2444821 2456107 2457225 2468088 2470754 2472527 2473144 2473742
##  [73] 2474986 2483717 2491708 2502094 2522297 2540534 2558515 2558725 2563296
##  [82] 2570231 2575538 2590132 2593854 2636394 2681868 2686401 2727775 2733965
##  [91] 2752923 2770210 2770819 2772088 2774488 2787010 2805940 2834238 2837244
## [100] 2865578 2879245 2880133 2892737 2894845 2895683 2929393 2932418 2939272
## [109] 2939943 2953599 2978552 2981584

Histogramas y poligonos de frecuencia

#Histogramas

plot(dist, type = "fh") # Histograma de frecuencia absoluta

plot(dist, type = "rfh") #Histograma de frecuencia relativa

plot(dist, type = "cfh") #Histograma de frecuencia acumulada

#Polígonos

plot(dist, type = "fp") # Polígono de frecuencia absoluta

plot(dist, type = "rfp") # Polígono de frecuencia relativa

plot(dist, type = "cfp") # Polígono de frecuencia acumulada

Medidas de dispersión

Las medidas de dispersión tratan, a través del cálculo de diferentes fórmulas, de arrojar un valor numérico que ofrezca información sobre el grado de variabilidad de una variable.

Varianza .La varianza es una medida de dispersión que representa la variabilidad de una serie de datos respecto a su media. Formalmente se calcula como la suma de los residuos al cuadrado divididos entre el total de observaciones.

var(PIB$manufactura, na.rm = TRUE)
## [1] 130102816410

Desviación estándar .La desviación estándar es la medida de dispersión más común, que indica qué tan dispersos están los datos con respecto a la media. Mientras mayor sea la desviación estándar, mayor será la dispersión de los datos.

sd(PIB$manufactura, na.rm = TRUE)
## [1] 360697.7

Gráfico de dispersión

Manufactura

plot(man)

library(fdth) #importar paquetes
dist <- fdt(inm, breaks = "Sturges")
dist
##               Class limits  f   rf rf(%)  cf  cf(%)
##  [988798.6608,1127071.883) 13 0.12 11.61  13  11.61
##  [1127071.883,1265345.105) 16 0.14 14.29  29  25.89
##  [1265345.105,1403618.328) 13 0.12 11.61  42  37.50
##   [1403618.328,1541891.55) 11 0.10  9.82  53  47.32
##   [1541891.55,1680164.772) 13 0.12 11.61  66  58.93
##  [1680164.772,1818437.995) 10 0.09  8.93  76  67.86
##  [1818437.995,1956711.217) 15 0.13 13.39  91  81.25
##  [1956711.217,2094984.439) 21 0.19 18.75 112 100.00

Ordenar datos de menor a mayor

sort(inm)
##   [1]  998786.5 1010400.0 1017815.1 1027499.3 1040846.8 1052990.5 1061997.4
##   [8] 1071085.9 1081899.1 1090147.5 1100050.2 1108722.8 1121553.8 1130838.5
##  [15] 1140772.0 1148461.8 1152976.5 1162436.3 1169150.5 1176209.7 1180001.7
##  [22] 1188178.1 1194145.0 1202344.2 1214119.5 1227782.5 1241755.1 1252100.9
##  [29] 1265115.5 1277347.8 1289301.5 1300858.7 1315843.3 1328261.4 1336191.8
##  [36] 1345491.7 1346509.0 1354713.5 1368670.8 1378940.5 1395531.7 1402297.5
##  [43] 1420959.0 1435916.0 1449865.7 1466334.0 1471072.0 1471404.9 1484691.7
##  [50] 1496019.1 1501011.5 1515406.3 1539661.1 1560846.7 1568628.7 1578234.6
##  [57] 1586600.3 1608974.7 1626808.6 1637882.7 1645685.8 1665057.0 1672874.1
##  [64] 1673078.5 1678430.7 1679159.3 1699994.1 1702526.6 1713141.9 1728565.7
##  [71] 1752428.3 1762721.3 1777521.0 1779450.1 1792507.4 1813614.3 1822601.4
##  [78] 1829997.1 1842771.2 1843496.9 1847655.2 1852728.3 1857708.6 1867323.0
##  [85] 1880929.2 1886702.1 1901156.9 1912307.3 1918526.3 1942484.3 1946775.7
##  [92] 1957807.3 1958684.1 1977714.4 1985272.8 1997899.6 1998123.1 1998584.3
##  [99] 2006775.5 2018933.9 2029323.8 2029454.1 2038797.5 2043916.1 2045017.9
## [106] 2052070.5 2059907.9 2062074.7 2069001.6 2071895.5 2073988.6 2074242.0

Histograma y poligonos de frecuencia

#Histogramas

plot(dist, type = "fh") # Histograma de frecuencia absoluta

plot(dist, type = "rfh") #Histograma de frecuencia relativa

plot(dist, type = "cfh") #Histograma de frecuencia acumulada

#Polígonos

plot(dist, type = "fp") # Polígono de frecuencia absoluta

plot(dist, type = "rfp") # Polígono de frecuencia relativa

plot(dist, type = "cfp") # Polígono de frecuencia acumulada

Medidas de dispersión

Varianza

var(PIB$inmobiliarias, na.rm = TRUE)
## [1] 1.15122e+11

Desviación estandar

sd(PIB$inmobiliarias, na.rm = TRUE)
## [1] 339296.4

Gráfico de dispersión

plot(inm)

Estadística inferencial

La rama de la Estadística encargada de hacer deducciones, es decir, inferir propiedades, conclusiones y tendencias, a partir de una muestra del conjunto. Su papel es interpretar, hacer proyecciones y comparaciones.

pairs(PIB)

Matriz de coeficientes de correlación

El coeficiente de correlación es la medida específica que cuantifica la intensidad de la relación lineal entre dos variables en un análisis de correlación.

cor(PIB)
##               primarias manufactura inmobiliarias
## primarias     1.0000000   0.8979538     0.9614170
## manufactura   0.8979538   1.0000000     0.9115337
## inmobiliarias 0.9614170   0.9115337     1.0000000
regresion <-lm(manufactura~ inmobiliarias, data=PIB)
summary(regresion)
## 
## Call:
## lm(formula = manufactura ~ inmobiliarias, data = PIB)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -714292  -87804   24752  100100  323637 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   8.480e+05  6.697e+04   12.66   <2e-16 ***
## inmobiliarias 9.690e-01  4.168e-02   23.25   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 149000 on 110 degrees of freedom
## Multiple R-squared:  0.8309, Adjusted R-squared:  0.8294 
## F-statistic: 540.5 on 1 and 110 DF,  p-value: < 2.2e-16

En conlusión el producto interno bruto (PIB) es un indicador fundamental para realizar actividades económicas, producción de bienes y servicios en un período determinado, el PIB aprovecha oportunidades y recursos para un crecimiento económico el PIB nos informa sobre nuestras pérdidas y ganancias de la economía de las personas lo cual nos indica bienestar económico de un individuo en sociedad. De esta forma se concluye el crecimiento económico en un período determinado, se debe a una ampliación muy baja de la inversión privada neta el gobierno estableció políticas que no favorecieron las actividades productivas pero, favorecían las actividades financieras. Estos dos sectores aportan al PIB algo significativo a la económia del país.