#1. Análisis de la base de datos "benefits" (20 ptos).
library(wooldridge)
## Warning: package 'wooldridge' was built under R version 4.3.2
View(benefits)
head(benefits)
## distid schid lunch enroll staff exppp avgsal avgben math4 story4 bs
## 1 1010 4937 48.3 539 71.1 3586 39383 13656 68.0 70.7 0.3467486
## 2 2010 4959 51.5 59 127.1 4357 25622 10004 40.0 40.0 0.3904457
## 3 2020 4999 51.2 82 122.6 5667 31318 12645 57.1 57.1 0.4037614
## 4 2070 597 33.7 409 77.5 2752 27873 9657 63.2 73.5 0.3464643
## 5 3010 790 11.9 259 87.6 3253 31264 10017 56.4 64.1 0.3204004
## 6 3010 1403 22.8 337 105.3 3326 26385 8395 60.0 80.0 0.3181732
## lavgsal lenroll lstaff bsbar lunchbar lenrollbar lstaffbar
## 1 10.58109 6.289716 4.264087 0.3467486 48.30000 6.289716 4.264087
## 2 10.15121 4.077538 4.844974 0.3904457 51.50000 4.077538 4.844974
## 3 10.35195 4.406719 4.808927 0.4037614 51.20000 4.406719 4.808927
## 4 10.23541 6.013715 4.350278 0.3464643 33.70000 6.013715 4.350278
## 5 10.35022 5.556828 4.472781 0.3185335 20.93333 5.918446 4.391466
## 6 10.18055 5.820083 4.656814 0.3185335 20.93333 5.918446 4.391466
plot(benefits$enroll ~ benefits$exppp)

plot(benefits$exppp ~ benefits$enroll)

#No se observa una relación positiva, sino una negativa. Sin embargo, será necesario saber qué variable puede estar causando a la otra. En la primera gráfica se observa que a un mayor gasto educativo por alumno existe una menor tasa de matrícula, lo cual no tiene sentido económico. Entonces, ¿cuál es la correcta dirección de la correlación?
#Análisis de la Bolsa de Valores. Caso Bitcoin
library(readr)
## Warning: package 'readr' was built under R version 4.3.2
BTC_USD <- read_csv("C:/DATA/MI_DISCO/matriz_2023/1_UADEC/TERCER_SEMESTRE/CIENCIA_DATOS/BTC-USD.csv")
## Rows: 13 Columns: 7
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## dbl (6): Open, High, Low, Close, Adj Close, Volume
## date (1): Date
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
View(BTC_USD)
head(BTC_USD)
## # A tibble: 6 × 7
## Date Open High Low Close `Adj Close` Volume
## <date> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 2023-03-01 23151. 29160. 19628. 28478. 28478. 883299703608
## 2 2023-04-01 28473. 31006. 27071. 29269. 29269. 511540319004
## 3 2023-05-01 29227. 29820. 25878. 27220. 27220. 443473015479
## 4 2023-06-01 27218. 31390. 24797. 30477. 30477. 481734214225
## 5 2023-07-01 30472. 31815. 28934. 29230. 29230. 382224489090
## 6 2023-08-01 29231. 30177. 25409. 25931. 25931. 437724169499
#Analizando la volatilidad al OPen
boxplot(BTC_USD$Open)

# No se aprecia valores atípicos.
#Analizando la volatilidad al Close
boxplot(BTC_USD$Close)

# No se aprecia valores atípicos.
#Dado esto se procede a estimar los estadísticos descriptivos regulares
summary(BTC_USD$Open)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 23151 27218 29231 33048 37718 51731
summary(BTC_USD$Close)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 25931 28478 30477 35312 42265 53525
#Los promedios son muy similares, se podría usar la desviación estándar como un indicador de la volatilidad.
sd(BTC_USD$Open)
## [1] 8294.509
sd(BTC_USD$Close)
## [1] 9325.367
#Se concluye que al cierre hay mayor volatilidad
#Simulación de activos
"vector de tiempo"
## [1] "vector de tiempo"
Tiempo = c(1,2,3)
"Vector Activo 1"
## [1] "Vector Activo 1"
Activo_1 = c(1,1.02,1.5)
"Vector Activo 2"
## [1] "Vector Activo 2"
Activo_2 = c(1.03,1.58,1.34)
Frame_activos = data.frame(Tiempo, Activo_1, Activo_2)
#Graficando con ggplot2
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.3.2
Act1 <- ggplot (Frame_activos, aes (x = Tiempo, y = Activo_1)) + geom_line ( color = "red")
plot(Act1)

Act2 <- ggplot (Frame_activos, aes (x = Tiempo, y = Activo_2)) + geom_line ( color = "blue")
plot(Act2)

library(patchwork)
## Warning: package 'patchwork' was built under R version 4.3.2
Act1 / Act2

#Análisis de compras internacionales para Torreón desde la página web de Datos México: https://www.economia.gob.mx/datamexico/es/profile/geo/torreon
"Ojo que previamente se eliminaron las filas de ventas en el xls"
## [1] "Ojo que previamente se eliminaron las filas de ventas en el xls"
library(readxl)
## Warning: package 'readxl' was built under R version 4.3.2
Comercio_internacional_neto_de_Torreon <- read_excel("C:/DATA/MI_DISCO/matriz_2023/1_UADEC/TERCER_SEMESTRE/CIENCIA_DATOS/r_markdown/Comercio-internacional-neto-de-Torreon.xlsx")
View(Comercio_internacional_neto_de_Torreon)
#Vamos a eliminar las columnas que no sirven
View(Comercio_internacional_neto_de_Torreon)
Comercio = Comercio_internacional_neto_de_Torreon[ , -c(3,4,6)]
library(dygraphs)
## Warning: package 'dygraphs' was built under R version 4.3.2
dygraph(Comercio)
#Saludos