setwd("~/Estadística 1")
library(readr)
PIB <- read_csv("PIB.CSV")
##
## -- Column specification --------------------------------------------------------
## cols(
## primarias = col_double(),
## manufactura = col_double(),
## inmobiliarias = col_double()
## )
View(PIB)
head(PIB)
## # A tibble: 6 x 3
## primarias manufactura inmobiliarias
## <dbl> <dbl> <dbl>
## 1 371390. 1698488. 998787.
## 2 369425. 1678576. 1010400.
## 3 377071. 1671630. 1017815.
## 4 362920. 1681706. 1027499.
## 5 363635. 1698171. 1040847.
## 6 393408. 1737834. 1052990.
inm <- PIB$inmobiliarias
man <- PIB$manufactura
La estadística descriptiva es la técnica matemática que obtiene, organiza, presenta y describe un conjunto de datos con el propósito de facilitar el uso, generalmente con el apoyo de tablas, medidas numéricas o gráficas.
La medida de tendencia central, parámetro de tendencia central o medida de centralización es un número situado hacia el centro de la distribución de los valores de una serie de observaciones, en la que se encuentra ubicado el conjunto de los datos.
La media es el valor promedio de un conjunto de datos numéricos, calculada como la suma del conjunto de valores dividida entre el número total de valores.
mean(PIB$manufactura)
## [1] 2370180
mean(PIB$inmobiliarias)
## [1] 1570802
La mediana es un estadístico de posición central que parte la distribución en dos, es decir, deja la misma cantidad de valores a un lado que a otro.
median(PIB$manufactura)
## [1] 2372057
median(PIB$inmobiliarias)
## [1] 1582417
La moda es el valor que más se repite en una muestra estadística o población. No tiene fórmula en sí mismo.
library(modeest)
mlv(PIB$manufactura, method = "mfv")
## [1] 1591590 1630377 1671630 1678576 1681706 1698171 1698331 1698488 1737834
## [10] 1760069 1766085 1769214 1781156 1796901 1812049 1888922 1921331 1977080
## [19] 2021828 2087948 2100335 2111285 2152457 2152752 2157564 2166767 2183179
## [28] 2188641 2212026 2218840 2224143 2231770 2234171 2239728 2242791 2243939
## [37] 2245005 2246333 2249843 2251276 2253833 2254089 2283201 2296002 2316299
## [46] 2316839 2320765 2325533 2329709 2331730 2331854 2342612 2344402 2351759
## [55] 2364911 2366278 2377837 2387464 2413172 2421035 2422352 2428010 2439170
## [64] 2442793 2444821 2456107 2457225 2468088 2470754 2472527 2473144 2473742
## [73] 2474986 2483717 2491708 2502094 2522297 2540534 2558515 2558725 2563296
## [82] 2570231 2575538 2590132 2593854 2636394 2681868 2686401 2727775 2733965
## [91] 2752923 2770210 2770819 2772088 2774488 2787010 2805940 2834238 2837244
## [100] 2865578 2879245 2880133 2892737 2894845 2895683 2929393 2932418 2939272
## [109] 2939943 2953599 2978552 2981584
library(modeest)
mlv(PIB$inmobiliarias, method = "mfv")
## [1] 998786.5 1010400.0 1017815.1 1027499.3 1040846.8 1052990.5 1061997.4
## [8] 1071085.9 1081899.1 1090147.5 1100050.2 1108722.8 1121553.8 1130838.5
## [15] 1140772.0 1148461.8 1152976.5 1162436.3 1169150.5 1176209.7 1180001.7
## [22] 1188178.1 1194145.0 1202344.2 1214119.5 1227782.5 1241755.1 1252100.9
## [29] 1265115.5 1277347.8 1289301.5 1300858.7 1315843.3 1328261.4 1336191.8
## [36] 1345491.7 1346509.0 1354713.5 1368670.8 1378940.5 1395531.7 1402297.5
## [43] 1420959.0 1435916.0 1449865.7 1466334.0 1471072.0 1471404.9 1484691.7
## [50] 1496019.1 1501011.5 1515406.3 1539661.1 1560846.7 1568628.7 1578234.6
## [57] 1586600.3 1608974.7 1626808.6 1637882.7 1645685.8 1665057.0 1672874.1
## [64] 1673078.5 1678430.7 1679159.3 1699994.1 1702526.6 1713141.9 1728565.7
## [71] 1752428.3 1762721.3 1777521.0 1779450.1 1792507.4 1813614.3 1822601.4
## [78] 1829997.1 1842771.2 1843496.9 1847655.2 1852728.3 1857708.6 1867323.0
## [85] 1880929.2 1886702.1 1901156.9 1912307.3 1918526.3 1942484.3 1946775.7
## [92] 1957807.3 1958684.1 1977714.4 1985272.8 1997899.6 1998123.1 1998584.3
## [99] 2006775.5 2018933.9 2029323.8 2029454.1 2038797.5 2043916.1 2045017.9
## [106] 2052070.5 2059907.9 2062074.7 2069001.6 2071895.5 2073988.6 2074242.0
En estadística descriptiva, se le llama rango intercuartílico o rango intercuartil, a la diferencia entre el tercer y el primer cuartil de una distribución. Es una medida de la dispersión estadística
# Manufactura
summary(man)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1591590 2206180 2372058 2370180 2591063 2981584
IQR(man)
## [1] 384883.3
# Inmobiliario
summary(inm)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 998787 1261862 1582417 1570802 1870725 2074242
IQR(inm)
## [1] 608862.7
Manufactura
maximo <- max(PIB$manufactura) #valor más grande
maximo
## [1] 2981584
minimo <- min(PIB$manufactura) #valor más chico
minimo
## [1] 1591590
rango <- (maximo-minimo) #amplitud
Inmobiliarias
maximo <- max(PIB$inmobiliarias) #valor más grande
maximo
## [1] 2074242
minimo <- min(PIB$inmobiliarias) #valor más chico
minimo
## [1] 998786.5
rango <- (maximo-minimo) #amplitud
rango
## [1] 1075455
boxplot(PIB$manufactura)
boxplot(PIB$manufactura)
### Distribución de frecuencias
Manufactura
library(fdth) #importar paquete
##
## Attaching package: 'fdth'
## The following object is masked from 'package:modeest':
##
## mfv
## The following objects are masked from 'package:stats':
##
## sd, var
dist <- fdt(PIB$manufactura, breaks="Sturges")
dist
## Class limits f rf rf(%) cf cf(%)
## [1575674.365,1755140.009) 9 0.08 8.04 9 8.04
## [1755140.009,1934605.653) 8 0.07 7.14 17 15.18
## [1934605.653,2114071.298) 5 0.04 4.46 22 19.64
## [2114071.298,2293536.942) 21 0.19 18.75 43 38.39
## [2293536.942,2473002.586) 27 0.24 24.11 70 62.50
## [2473002.586,2652468.23) 16 0.14 14.29 86 76.79
## [2652468.23,2831933.874) 11 0.10 9.82 97 86.61
## [2831933.874,3011399.518) 15 0.13 13.39 112 100.00
sort(man)
## [1] 1591590 1630377 1671630 1678576 1681706 1698171 1698331 1698488 1737834
## [10] 1760069 1766085 1769214 1781156 1796901 1812049 1888922 1921331 1977080
## [19] 2021828 2087948 2100335 2111285 2152457 2152752 2157564 2166767 2183179
## [28] 2188641 2212026 2218840 2224143 2231770 2234171 2239728 2242791 2243939
## [37] 2245005 2246333 2249843 2251276 2253833 2254089 2283201 2296002 2316299
## [46] 2316839 2320765 2325533 2329709 2331730 2331854 2342612 2344402 2351759
## [55] 2364911 2366278 2377837 2387464 2413172 2421035 2422352 2428010 2439170
## [64] 2442793 2444821 2456107 2457225 2468088 2470754 2472527 2473144 2473742
## [73] 2474986 2483717 2491708 2502094 2522297 2540534 2558515 2558725 2563296
## [82] 2570231 2575538 2590132 2593854 2636394 2681868 2686401 2727775 2733965
## [91] 2752923 2770210 2770819 2772088 2774488 2787010 2805940 2834238 2837244
## [100] 2865578 2879245 2880133 2892737 2894845 2895683 2929393 2932418 2939272
## [109] 2939943 2953599 2978552 2981584
#Histogramas
plot(dist, type = "fh") # Histograma de frecuencia absoluta
plot(dist, type = "rfh") #Histograma de frecuencia relativa
plot(dist, type = "cfh") #Histograma de frecuencia acumulada
#Polígonos
plot(dist, type = "fp") # Polígono de frecuencia absoluta
plot(dist, type = "rfp") # Polígono de frecuencia relativa
plot(dist, type = "cfp") # Polígono de frecuencia acumulada
En estadística, las medidas de dispersión es el grado en que una distribución se estira o exprime.
var(PIB$manufactura, na.rm = TRUE)
## [1] 130102816410
En estadística, la desviación típica es una medida que se utiliza para cuantificar la variación o la dispersión de un conjunto de datos numéricos.
sd(PIB$manufactura, na.rm = TRUE)
## [1] 360697.7
Manufactura
plot(man)
library(fdth) #importar paquetes
dist <- fdt(inm, breaks = "Sturges")
dist
## Class limits f rf rf(%) cf cf(%)
## [988798.6608,1127071.883) 13 0.12 11.61 13 11.61
## [1127071.883,1265345.105) 16 0.14 14.29 29 25.89
## [1265345.105,1403618.328) 13 0.12 11.61 42 37.50
## [1403618.328,1541891.55) 11 0.10 9.82 53 47.32
## [1541891.55,1680164.772) 13 0.12 11.61 66 58.93
## [1680164.772,1818437.995) 10 0.09 8.93 76 67.86
## [1818437.995,1956711.217) 15 0.13 13.39 91 81.25
## [1956711.217,2094984.439) 21 0.19 18.75 112 100.00
sort(inm)
## [1] 998786.5 1010400.0 1017815.1 1027499.3 1040846.8 1052990.5 1061997.4
## [8] 1071085.9 1081899.1 1090147.5 1100050.2 1108722.8 1121553.8 1130838.5
## [15] 1140772.0 1148461.8 1152976.5 1162436.3 1169150.5 1176209.7 1180001.7
## [22] 1188178.1 1194145.0 1202344.2 1214119.5 1227782.5 1241755.1 1252100.9
## [29] 1265115.5 1277347.8 1289301.5 1300858.7 1315843.3 1328261.4 1336191.8
## [36] 1345491.7 1346509.0 1354713.5 1368670.8 1378940.5 1395531.7 1402297.5
## [43] 1420959.0 1435916.0 1449865.7 1466334.0 1471072.0 1471404.9 1484691.7
## [50] 1496019.1 1501011.5 1515406.3 1539661.1 1560846.7 1568628.7 1578234.6
## [57] 1586600.3 1608974.7 1626808.6 1637882.7 1645685.8 1665057.0 1672874.1
## [64] 1673078.5 1678430.7 1679159.3 1699994.1 1702526.6 1713141.9 1728565.7
## [71] 1752428.3 1762721.3 1777521.0 1779450.1 1792507.4 1813614.3 1822601.4
## [78] 1829997.1 1842771.2 1843496.9 1847655.2 1852728.3 1857708.6 1867323.0
## [85] 1880929.2 1886702.1 1901156.9 1912307.3 1918526.3 1942484.3 1946775.7
## [92] 1957807.3 1958684.1 1977714.4 1985272.8 1997899.6 1998123.1 1998584.3
## [99] 2006775.5 2018933.9 2029323.8 2029454.1 2038797.5 2043916.1 2045017.9
## [106] 2052070.5 2059907.9 2062074.7 2069001.6 2071895.5 2073988.6 2074242.0
#Histogramas
plot(dist, type = "fh") # Histograma de frecuencia absoluta
plot(dist, type = "rfh") #Histograma de frecuencia relativa
plot(dist, type = "cfh") #Histograma de frecuencia acumulada
#Polígonos
plot(dist, type = "fp") # Polígono de frecuencia absoluta
plot(dist, type = "rfp") # Polígono de frecuencia relativa
plot(dist, type = "cfp") # Polígono de frecuencia acumulada
Varianza
Varianza es una medida de dispersión definida como la esperanza del cuadrado de la desviación de dicha variable respecto a su media.
var(PIB$inmobiliarias, na.rm = TRUE)
## [1] 1.15122e+11
Desviación estandar
sd(PIB$inmobiliarias, na.rm = TRUE)
## [1] 339296.4
plot(inm)
La Estadística inferencial o Inferencia estadística estudia cómo sacar conclusiones generales para toda la población a partir del estudio de una muestra, y el grado de fiabilidad o significación de los resultados obtenidos.
pairs(PIB)
Matriz de correlación se puede utilizar para estudiar series numéricas o de valores cuantitativos para un determinado número de variables cuantitativas mayor de dos.
cor(PIB)
## primarias manufactura inmobiliarias
## primarias 1.0000000 0.8979538 0.9614170
## manufactura 0.8979538 1.0000000 0.9115337
## inmobiliarias 0.9614170 0.9115337 1.0000000
regresion <-lm(manufactura~ inmobiliarias, data=PIB)
summary(regresion)
##
## Call:
## lm(formula = manufactura ~ inmobiliarias, data = PIB)
##
## Residuals:
## Min 1Q Median 3Q Max
## -714292 -87804 24752 100100 323637
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 8.480e+05 6.697e+04 12.66 <2e-16 ***
## inmobiliarias 9.690e-01 4.168e-02 23.25 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 149000 on 110 degrees of freedom
## Multiple R-squared: 0.8309, Adjusted R-squared: 0.8294
## F-statistic: 540.5 on 1 and 110 DF, p-value: < 2.2e-16
El PIB nos demuestra el nivel de crecimiento de una economía, es decir, cuando aumenta podemos decir que la gente se encuentra en una buena situación económica esto lo podemos utilizar como medida de bienestar económico, cuando una empresa vende un producto a cambio recibe un dinero y esto es un ingreso para la empresa. Este ingreso va a una parte a los trabajadores en forma de salario y una parte va al empresario en forma de beneficio una parte va al banco en forma de intereses.