#1. Análisis de la base de datos "benefits" (20 ptos).

library(wooldridge)
## Warning: package 'wooldridge' was built under R version 4.3.2
View(benefits)
head(benefits)
##   distid schid lunch enroll staff exppp avgsal avgben math4 story4        bs
## 1   1010  4937  48.3    539  71.1  3586  39383  13656  68.0   70.7 0.3467486
## 2   2010  4959  51.5     59 127.1  4357  25622  10004  40.0   40.0 0.3904457
## 3   2020  4999  51.2     82 122.6  5667  31318  12645  57.1   57.1 0.4037614
## 4   2070   597  33.7    409  77.5  2752  27873   9657  63.2   73.5 0.3464643
## 5   3010   790  11.9    259  87.6  3253  31264  10017  56.4   64.1 0.3204004
## 6   3010  1403  22.8    337 105.3  3326  26385   8395  60.0   80.0 0.3181732
##    lavgsal  lenroll   lstaff     bsbar lunchbar lenrollbar lstaffbar
## 1 10.58109 6.289716 4.264087 0.3467486 48.30000   6.289716  4.264087
## 2 10.15121 4.077538 4.844974 0.3904457 51.50000   4.077538  4.844974
## 3 10.35195 4.406719 4.808927 0.4037614 51.20000   4.406719  4.808927
## 4 10.23541 6.013715 4.350278 0.3464643 33.70000   6.013715  4.350278
## 5 10.35022 5.556828 4.472781 0.3185335 20.93333   5.918446  4.391466
## 6 10.18055 5.820083 4.656814 0.3185335 20.93333   5.918446  4.391466
plot(benefits$enroll ~ benefits$exppp)

plot(benefits$exppp ~ benefits$enroll)

#No se observa una relación positiva, sino una negativa. Sin embargo, será necesario saber qué variable puede estar causando a la otra. En la primera gráfica se observa que a un mayor gasto educativo por alumno existe una menor tasa de matrícula, lo cual no tiene sentido económico. Entonces, ¿cuál es la correcta dirección de la correlación?
#Análisis de la Bolsa de Valores. Caso Bitcoin

library(readr)
## Warning: package 'readr' was built under R version 4.3.2
BTC_USD <- read_csv("C:/DATA/MI_DISCO/matriz_2023/1_UADEC/TERCER_SEMESTRE/CIENCIA_DATOS/BTC-USD.csv")
## Rows: 13 Columns: 7
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## dbl  (6): Open, High, Low, Close, Adj Close, Volume
## date (1): Date
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
View(BTC_USD)
head(BTC_USD)
## # A tibble: 6 × 7
##   Date         Open   High    Low  Close `Adj Close`       Volume
##   <date>      <dbl>  <dbl>  <dbl>  <dbl>       <dbl>        <dbl>
## 1 2023-03-01 23151. 29160. 19628. 28478.      28478. 883299703608
## 2 2023-04-01 28473. 31006. 27071. 29269.      29269. 511540319004
## 3 2023-05-01 29227. 29820. 25878. 27220.      27220. 443473015479
## 4 2023-06-01 27218. 31390. 24797. 30477.      30477. 481734214225
## 5 2023-07-01 30472. 31815. 28934. 29230.      29230. 382224489090
## 6 2023-08-01 29231. 30177. 25409. 25931.      25931. 437724169499
#Analizando la volatilidad al OPen
boxplot(BTC_USD$Open)

# No se aprecia valores atípicos.

#Analizando la volatilidad al Close
boxplot(BTC_USD$Close)

# No se aprecia valores atípicos.

#Dado esto se procede a estimar los estadísticos descriptivos regulares

summary(BTC_USD$Open)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   23151   27218   29231   33048   37718   51731
summary(BTC_USD$Close)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   25931   28478   30477   35312   42265   53525
#Los promedios son muy similares, se podría usar la desviación estándar como un indicador de la volatilidad.
sd(BTC_USD$Open)
## [1] 8294.509
sd(BTC_USD$Close)
## [1] 9325.367
#Se concluye que al cierre hay mayor volatilidad
#Simulación de activos
"vector de tiempo"
## [1] "vector de tiempo"
Tiempo = c(1,2,3)
"Vector Activo 1"
## [1] "Vector Activo 1"
Activo_1 = c(1,1.02,1.5)
"Vector Activo 2"
## [1] "Vector Activo 2"
Activo_2 = c(1.03,1.58,1.34)
Frame_activos = data.frame(Tiempo, Activo_1, Activo_2)
#Graficando con ggplot2
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.3.2
Act1 <- ggplot (Frame_activos, aes (x = Tiempo, y = Activo_1)) + geom_line ( color = "red")
plot(Act1)

Act2 <- ggplot (Frame_activos, aes (x = Tiempo, y = Activo_2)) + geom_line ( color = "blue")
plot(Act2)

library(patchwork)
## Warning: package 'patchwork' was built under R version 4.3.2
Act1 / Act2

#Análisis de compras internacionales para Torreón desde la página web de Datos México: https://www.economia.gob.mx/datamexico/es/profile/geo/torreon

"Ojo que previamente se eliminaron las filas de ventas en el xls"
## [1] "Ojo que previamente se eliminaron las filas de ventas en el xls"
library(readxl)
## Warning: package 'readxl' was built under R version 4.3.2
Comercio_internacional_neto_de_Torreon <- read_excel("C:/DATA/MI_DISCO/matriz_2023/1_UADEC/TERCER_SEMESTRE/CIENCIA_DATOS/r_markdown/Comercio-internacional-neto-de-Torreon.xlsx")

View(Comercio_internacional_neto_de_Torreon)

#Vamos a eliminar las columnas que no sirven

View(Comercio_internacional_neto_de_Torreon)

Comercio = Comercio_internacional_neto_de_Torreon[ , -c(3,4,6)]
library(dygraphs)
## Warning: package 'dygraphs' was built under R version 4.3.2
dygraph(Comercio)
#Saludos