Evaluación EU1U2

Importar datos

setwd("~/Estadistica")
library(readr)
PIB <- read_csv("PIB.csv")
## 
## -- Column specification --------------------------------------------------------
## cols(
##   primarias = col_double(),
##   manufactura = col_double(),
##   inmobiliarias = col_double()
## )
head(PIB)
## # A tibble: 6 x 3
##   primarias manufactura inmobiliarias
##       <dbl>       <dbl>         <dbl>
## 1   371390.    1698488.       998787.
## 2   369425.    1678576.      1010400.
## 3   377071.    1671630.      1017815.
## 4   362920.    1681706.      1027499.
## 5   363635.    1698171.      1040847.
## 6   393408.    1737834.      1052990.

Analisis economico de Mexico

A continuacion junto con la herramienta de el programa Rstudios se elaborara un analisis entre dos factores de la economia aqui en Mexico. Esta informacion se adquirio de sitio:https://www.inegi.org.mx/temas/pib/#Tabulados

Para este trabajo solo compararemos 2 de sectores :

Análisis y Comparacion de las Actividades primaria y la Manufactura aqui en nuestro pais

¿Que son las actividades primarias? Se denomina aquel sector de la economía que comprende las actividades productivas de la extracción y obtención de materias primas, como la agricultura, la ganadería, la apicultura, la acuicultura, la pesca, la minería, la silvicultura y la explotación forestal.

¿Que es la manofactura?

Manufactura o fabricación es una fase de la producción económica de los bienes. … También involucra procesos de elaboración de productos semi-manufacturados o productos semielaborados.

  • Primero Crearemos una variable que contenga los datos de las actividades primarias y manufactura
Pri <- PIB$primarias
Man <- PIB$manufactura

Estadística descriptiva

La estadística descriptiva es la técnica matemática que obtiene, organiza, presenta y describe un conjunto de datos con el propósito de facilitar el uso, generalmente con el apoyo de tablas, medidas numéricas o gráficas.

Medidas de tendencia central

Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un solo valor a un conjunto de valores. Representan un centro en torno al cual se encuentra ubicado el conjunto de los datos. Las medidas de tendencia central más utilizadas son: media, mediana y moda.

Con esta descripcion de lo que son las medida de tendencia central(Media , Mediana y Moda) pasaremos a elaborar prosedimientos para conocer estos datos por medio de codigo.

Media

#Primarias
mediaPri <- mean(Pri)
mediaPri
## [1] 471505.8
#Manofactura
mediaMan <- mean(Man)
mediaMan
## [1] 2370180

Mediana

#Primarias
medianaPri <- median(Pri)
medianaPri
## [1] 470182.3
#Manofactura
medianaMan <- median(Man)
medianaMan
## [1] 2372057

Moda

#Primarias
library(modeest)
mlv(Pri, method="mfv")
##   [1] 351036.5 358108.6 362920.4 363634.9 368845.8 369424.7 371390.2 371847.3
##   [9] 377070.8 377685.1 385071.9 386531.7 387759.8 387893.5 388504.7 390053.8
##  [17] 391824.9 392134.9 392264.4 393407.9 394887.2 396696.7 397191.0 398155.0
##  [25] 398629.1 402645.9 407587.3 409415.4 411035.7 415778.9 416318.7 421223.1
##  [33] 422867.3 425053.4 427278.5 429969.9 431401.3 435588.0 436274.2 437004.5
##  [41] 438472.6 438656.2 439030.0 441998.5 442317.4 442739.9 446117.2 446375.0
##  [49] 450220.8 456849.3 459959.5 460202.8 462744.9 462822.4 466886.5 467940.9
##  [57] 472423.6 472699.0 473111.7 474005.5 474238.0 476841.0 476917.1 477514.1
##  [65] 477587.1 478576.3 478896.8 484933.3 485481.7 486657.3 487170.5 489061.0
##  [73] 491190.6 493474.1 494162.2 495701.6 498927.5 500117.8 501393.4 502625.0
##  [81] 508378.5 510001.4 512843.2 518674.9 524088.8 528627.5 533250.8 538724.4
##  [89] 539983.4 540421.2 541769.2 544433.2 545250.2 557704.1 568053.2 568808.0
##  [97] 568853.0 575101.2 576255.0 581070.6 587197.5 587682.0 587878.1 590808.7
## [105] 592659.0 592912.4 593758.2 594163.6 596741.9 604903.4 616544.1 631653.3
#Manofactura
library(modeest)
mlv(Man, method="mfv")
##   [1] 1591590 1630377 1671630 1678576 1681706 1698171 1698331 1698488 1737834
##  [10] 1760069 1766085 1769214 1781156 1796901 1812049 1888922 1921331 1977080
##  [19] 2021828 2087948 2100335 2111285 2152457 2152752 2157564 2166767 2183179
##  [28] 2188641 2212026 2218840 2224143 2231770 2234171 2239728 2242791 2243939
##  [37] 2245005 2246333 2249843 2251276 2253833 2254089 2283201 2296002 2316299
##  [46] 2316839 2320765 2325533 2329709 2331730 2331854 2342612 2344402 2351759
##  [55] 2364911 2366278 2377837 2387464 2413172 2421035 2422352 2428010 2439170
##  [64] 2442793 2444821 2456107 2457225 2468088 2470754 2472527 2473144 2473742
##  [73] 2474986 2483717 2491708 2502094 2522297 2540534 2558515 2558725 2563296
##  [82] 2570231 2575538 2590132 2593854 2636394 2681868 2686401 2727775 2733965
##  [91] 2752923 2770210 2770819 2772088 2774488 2787010 2805940 2834238 2837244
## [100] 2865578 2879245 2880133 2892737 2894845 2895683 2929393 2932418 2939272
## [109] 2939943 2953599 2978552 2981584

Rango intercuartil (IQR)

Se le llama rango intercuartílico o rango intercuartil, a la diferencia entre el tercer y el primer cuartil de una distribución. Es una medida de la dispersión estadística. A diferencia del rango, se trata de un estadístico robusto.

#Primarias
summary(Pri)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  351037  410631  470182  471506  520028  631653
IQR(Pri)
## [1] 109397.8
#Manofactura
summary(Man)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## 1591590 2206180 2372058 2370180 2591063 2981584
IQR(Man)
## [1] 384883.3

Gráfico de caja y bigote

Un diagrama de cajas y bigotes es una manera conveniente de mostrar visualmente grupos de datos numéricos a través de sus cuartiles

#Primaria
boxplot(Pri)

#Manofactura
boxplot(Man)

histograma

#Primaria
hist(Pri)

#Manofactura
hist(Man)

Distribucion de frecuencias

Las distribuciones de frecuencias son tablas en que se dispone las modalidades de la variable por filas. En las columnas se dispone el número de ocurrencias por cada valor, porcentajes, etc. La finalidad de las agrupaciones en frecuencias es facilitar la obtención de la información que contienen los datos.

Tabla de frecuencia

A continuacion haremos una tabla de frecuencia tanto de las actividades primarias como de la manufactura continuando con el estudio en Mexico

#Primaria
library(fdth)
## 
## Attaching package: 'fdth'
## The following object is masked from 'package:modeest':
## 
##     mfv
## The following objects are masked from 'package:stats':
## 
##     sd, var
DPri <- fdt(Pri, breaks ="Sturges")
DPri
##             Class limits  f   rf rf(%)  cf  cf(%)
##  [347526.129,383831.592) 10 0.09  8.93  10   8.93
##  [383831.592,420137.055) 21 0.19 18.75  31  27.68
##  [420137.055,456442.518) 18 0.16 16.07  49  43.75
##  [456442.518,492747.981) 24 0.21 21.43  73  65.18
##  [492747.981,529053.444) 13 0.12 11.61  86  76.79
##  [529053.444,565358.907)  8 0.07  7.14  94  83.93
##   [565358.907,601664.37) 15 0.13 13.39 109  97.32
##   [601664.37,637969.833)  3 0.03  2.68 112 100.00
#Manofactura
library(fdth)
DMan <- fdt(Man, breaks ="Sturges")
DMan
##               Class limits  f   rf rf(%)  cf  cf(%)
##  [1575674.365,1755140.009)  9 0.08  8.04   9   8.04
##  [1755140.009,1934605.653)  8 0.07  7.14  17  15.18
##  [1934605.653,2114071.298)  5 0.04  4.46  22  19.64
##  [2114071.298,2293536.942) 21 0.19 18.75  43  38.39
##  [2293536.942,2473002.586) 27 0.24 24.11  70  62.50
##   [2473002.586,2652468.23) 16 0.14 14.29  86  76.79
##   [2652468.23,2831933.874) 11 0.10  9.82  97  86.61
##  [2831933.874,3011399.518) 15 0.13 13.39 112 100.00

Acontinuacion con el comando sort acomodaremos los datos de menor a mayor

Primarias

sort(Pri)
##   [1] 351036.5 358108.6 362920.4 363634.9 368845.8 369424.7 371390.2 371847.3
##   [9] 377070.8 377685.1 385071.9 386531.7 387759.8 387893.5 388504.7 390053.8
##  [17] 391824.9 392134.9 392264.4 393407.9 394887.2 396696.7 397191.0 398155.0
##  [25] 398629.1 402645.9 407587.3 409415.4 411035.7 415778.9 416318.7 421223.1
##  [33] 422867.3 425053.4 427278.5 429969.9 431401.3 435588.0 436274.2 437004.5
##  [41] 438472.6 438656.2 439030.0 441998.5 442317.4 442739.9 446117.2 446375.0
##  [49] 450220.8 456849.3 459959.5 460202.8 462744.9 462822.4 466886.5 467940.9
##  [57] 472423.6 472699.0 473111.7 474005.5 474238.0 476841.0 476917.1 477514.1
##  [65] 477587.1 478576.3 478896.8 484933.3 485481.7 486657.3 487170.5 489061.0
##  [73] 491190.6 493474.1 494162.2 495701.6 498927.5 500117.8 501393.4 502625.0
##  [81] 508378.5 510001.4 512843.2 518674.9 524088.8 528627.5 533250.8 538724.4
##  [89] 539983.4 540421.2 541769.2 544433.2 545250.2 557704.1 568053.2 568808.0
##  [97] 568853.0 575101.2 576255.0 581070.6 587197.5 587682.0 587878.1 590808.7
## [105] 592659.0 592912.4 593758.2 594163.6 596741.9 604903.4 616544.1 631653.3

Manofactura

sort(Man)
##   [1] 1591590 1630377 1671630 1678576 1681706 1698171 1698331 1698488 1737834
##  [10] 1760069 1766085 1769214 1781156 1796901 1812049 1888922 1921331 1977080
##  [19] 2021828 2087948 2100335 2111285 2152457 2152752 2157564 2166767 2183179
##  [28] 2188641 2212026 2218840 2224143 2231770 2234171 2239728 2242791 2243939
##  [37] 2245005 2246333 2249843 2251276 2253833 2254089 2283201 2296002 2316299
##  [46] 2316839 2320765 2325533 2329709 2331730 2331854 2342612 2344402 2351759
##  [55] 2364911 2366278 2377837 2387464 2413172 2421035 2422352 2428010 2439170
##  [64] 2442793 2444821 2456107 2457225 2468088 2470754 2472527 2473144 2473742
##  [73] 2474986 2483717 2491708 2502094 2522297 2540534 2558515 2558725 2563296
##  [82] 2570231 2575538 2590132 2593854 2636394 2681868 2686401 2727775 2733965
##  [91] 2752923 2770210 2770819 2772088 2774488 2787010 2805940 2834238 2837244
## [100] 2865578 2879245 2880133 2892737 2894845 2895683 2929393 2932418 2939272
## [109] 2939943 2953599 2978552 2981584

Histogramas y poligonos de frecuencia

*Los histogramas son gráficos que indican la frecuencia de un hecho mediante una distribución de los datos. En definitiva, un histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados.

Con este comando lo que haremos sera hacer que el mismo programas nos arroje una grafia para que podamos tener un mejor contexto y una mejor compresion acerca de los datos presentados anteriormente

Primarias

#Primaria
plot(DPri, type = "fh") #Hisograma de frecuencia absolutas

#Manofactura
plot(DMan, type = "fh") #Hisograma de frecuencia absolutas

#Primarias
plot(DPri, type = "rfh") #Hisograma de frecuencia Relativas

#Manofactura
plot(DMan, type = "rfh") #Hisograma de frecuencia Relativas

# Primarias
plot(DPri, type = "cfh") #Hisograma de frecuencia Acomulativas

plot (DMan, type = "cfh") #Hisograma de frecuencia Acomulativas

poligonos

plot(DPri, type = "fp") #Poligono de frecuencia absolutas

plot(DMan, type = "fp") #Poligono de frecuencia absolutas

plot(DPri, type = "rfp") #Poligono de frecuencia relativas

plot(DMan, type = "rfp") #Poligono de frecuencia relativas

plot(DPri, type = "cfp")#Poligono de frecuencia acomuladas

plot(DMan, type = "cfp")#Poligono de frecuencia acomuladas

En cada una de las tablas nos daremos cuenta de las fluctuaciones atravez del tiempo Algunas graficas se han venido manteniendo otras tiene pequeños aumentos y otras disminuyen.

Medidas de dispersion

  • Varianza, La varianza es una medida de dispersion que representa la variabolidad de una serie de datos respecto a su media.Formalmente se calcula como la suma de los residuos al cuadrado divididos entre el total de observaciones.

  • Grafico de dispersion (scatterplot)

Las medidas de dispersión tratan, a través del cálculo de diferentes fórmulas, de arrojar un valor numérico que ofrezca información sobre el grado de variabilidad de una variable. En otras palabras, las medidas de dispersión son números que indican si una variable se mueve mucho, poco, más o menos que otra.

plot(Pri)

plot(Man)

Estadistica Inferencial

La estadística inferencial es una parte de la estadística que comprende los métodos y procedimientos que por medio de la inducción determina propiedades de una población estadística, a partir de una parte de esta.

¿De que forma se relaciona el PIB de Actividades Primarias, Manofactura e Inmuebles? ### Matriz de diagramas de dispercion

De esta manera podremos analisar si hay alguna concordancia con estos sectores aqui en en nuestro pais de una manera mas grafica.

pairs(PIB)

Matriz de coeficienctes de correlacion

*En este apartado podemos entender si hay alguna relacion en base a los numeros: a continuacion de manera porcentual.

cor (PIB)
##               primarias manufactura inmobiliarias
## primarias     1.0000000   0.8979538     0.9614170
## manufactura   0.8979538   1.0000000     0.9115337
## inmobiliarias 0.9614170   0.9115337     1.0000000
regresion <-lm(Pri~ Man, data=PIB)
summary(regresion)
## 
## Call:
## lm(formula = Pri ~ Man, data = PIB)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -88736 -14901  -1134  15670 163738 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 4.949e+04  1.995e+04   2.481   0.0146 *  
## Man         1.781e-01  8.320e-03  21.400   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 31620 on 110 degrees of freedom
## Multiple R-squared:  0.8063, Adjusted R-squared:  0.8046 
## F-statistic:   458 on 1 and 110 DF,  p-value: < 2.2e-16

Conclusion

Como podemos darnos cuenta , estos dos sectores se puede decir que existe cierta relacion en cuestiones laborales sin enbargo sabemos que las actividades primarias tienen cierta prioridad en el pais ya que hay muchos recursos que necesitamos para poder mantener un buen estilo de vida en la actualidad , por eso mismo podemos comprender que tiene mas peso que en la manofactura , este ultimo como se refiere mas al recurso humano y el esfuerzo de trabajadores a raiz de algunos sucesos como la pandemia u otros factores puede que en su caso no haya mucho trabajo o recorte de personales por cuestiones de seguridad entre otras cosas.