Actividad 4.2

Enrique Monsivais
2023-10-04

Shiny App ß Análisis de Sentimientos (Himno y El Triste)

Redes Neuronales

Introducción a las Redes Neuronales

Una Red Neural Artificial (ANN) modela la relación entre un conjunto de entradas y una salida, resolviendo un problema de aprendizaje.

Un ejemplo de aplicación de Redes Neuronales es 1. La recomendación de contenido de Netflix. 2. El feed de Tiktok, o instagram.

1. Instalar paquetes y llamar librerías

library(neuralnet)

2. Alimentar con ejemplos

examen <- c(20,10,30,20,80,30)
proyecto <- c(90,20,40,50,50,80)
estatus <- c(1,0,0,0,1,1)
df <- data.frame(examen, proyecto, estatus)

3. Generar Red Neuronal

red_neuronal <- neuralnet(estatus ~ examen + proyecto, data=df)
plot(red_neuronal, rep = 'best')

4. Predecir con la red neuronal

prueba_examen <- c(30,40,85)
prueba_proyecto <- c(85,50,40)
prueba <- data.frame(prueba_examen, prueba_proyecto)

prediccion <- compute(red_neuronal, prueba)
prediccion$net.result 
##           [,1]
## [1,] 0.4999788
## [2,] 0.4999789
## [3,] 0.4999789
probabilidad <- prediccion$net.result
resultado <- ifelse(probabilidad>0.5,1,0)
resultado
##      [,1]
## [1,]    0
## [2,]    0
## [3,]    0

Ejercicio Red Neuronal

1. Instalar paquetes y llamar librerías

library(neuralnet)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following object is masked from 'package:neuralnet':
## 
##     compute
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

2. Alimentar con base de datos

data <-  read.csv("C:\\Users\\enriq\\OneDrive\\Documentos\\Datos a Desiciones\\Modulo4\\cancer_de_mama.csv")
data <- na.omit(data)

3. Asignar valores númericos a la variable dependiente

data <- data %>%
  mutate(diagnosis = ifelse(diagnosis == "M", 1, ifelse(diagnosis == "V", 0, diagnosis)))

4. Dividimos los datos en entrenamiento y prueba

inp <- sample(2, nrow(data), replace = TRUE, prob = c(0.7, 0.3))
training_data <- data[inp==1, ]
test_data <- data[inp==2, ]

5. Generar Red Neuronal

set.seed(222)
attach(data)
n <- neuralnet(diagnosis~.,
               data = training_data,
               hidden = 5,
               err.fct = "sse",
               linear.output = FALSE,
               lifesign = 'full',
               rep = 1,
               algorithm = "rprop+",
               stepmax = 500000)
## hidden: 5    thresh: 0.01    rep: 1/1    steps:    1000  min thresh: 0.224288958813999
##                                                    2000  min thresh: 0.224288958813999
##                                                    3000  min thresh: 0.224288958813999
##                                                    4000  min thresh: 0.224288958813999
##                                                    5000  min thresh: 0.224288958813999
##                                                    6000  min thresh: 0.224288958813999
##                                                    7000  min thresh: 0.224288958813999
##                                                    8000  min thresh: 0.101646496234301
##                                                    9000  min thresh: 0.0965388464781778
##                                                   10000  min thresh: 0.0965388464781778
##                                                   11000  min thresh: 0.0965388464781778
##                                                   12000  min thresh: 0.0965388464781778
##                                                   13000  min thresh: 0.0965388464781778
##                                                   14000  min thresh: 0.0965388464781778
##                                                   15000  min thresh: 0.0965388464781778
##                                                   16000  min thresh: 0.0965388464781778
##                                                   17000  min thresh: 0.0965388464781778
##                                                   18000  min thresh: 0.0965388464781778
##                                                   19000  min thresh: 0.0965388464781778
##                                                   20000  min thresh: 0.0880770494011347
##                                                   21000  min thresh: 0.0630496046396311
##                                                   22000  min thresh: 0.0117993088136834
##                                                   23000  min thresh: 0.0117993088136834
##                                                   24000  min thresh: 0.0117993088136834
##                                                   25000  min thresh: 0.0117993088136834
##                                                   25836  error: 2.33795  time: 7.3 secs
plot(n, rep = 'best')

6. Cambiar las predicciones de 0 y 1 a M, V

# Obtener las predicciones como 0 o 1
output <- neuralnet::compute(n, rep = 1, test_data[, -1])
p <- output$net.result
pred <- ifelse(p >= 0.5, "M", "V")

7. Matriz de Confusión

# Asegurarse de que ambos vectores tengan la misma longitud
n <- min(length(pred), length(test_data$diagnosis))
pred <- pred[1:n]
actual <- test_data$diagnosis[1:n]

# Crear la matriz de confusión
tab <- table(pred, actual)
tab
##     actual
## pred   1   B
##    M  74   4
##    V   2 100

8. Porcentaje de error total

#Con esta operación obtenemos el porcentaje de error total (usando datos de la matrix de confusión)
1 - sum(diag(tab)) / sum(tab)
## [1] 0.03333333

Series de Tiempo

Introducción

Una Serie de Tiempo es una colecció de observaciones sobre un feterminado fenómeno efectuadas en momentos de tiempo sucesivos, usualmente equiespaciados.

Ejemplos de Series de Tiempo son:
1. Precio de acciones.
2. Niveles de inventario.
3. Rotación de persona.
4. Ventas.

1. Instalar paquetes y llamar librerías

library(forecast)
## Registered S3 method overwritten by 'quantmod':
##   method            from
##   as.zoo.data.frame zoo

2. Crear la Serie de Tiempo

# Paso 1. Obtener los valores dependeintes
produccion <- c(50,53,55,57,55,60)

#Paso 2. Agregar a los valores anteriores su tiempo correspondiente
serie_de_tiempo <-  ts(data = produccion, start = 2020, frequency = 4) #aquí lo hizo por trimestre 
serie_de_tiempo
##      Qtr1 Qtr2 Qtr3 Qtr4
## 2020   50   53   55   57
## 2021   55   60

3. Crear modelo ARIMA

# ARIMA: AutoRegressive Integrated Moving Average o Modelo Autorregresivo Integrado de Media Móvil. 
#ARIMA (p, d, q)
# p = orden de auto-regresión
# d = orden de integración (o diferenciación)
# q = orden del promedio móvil

# ¿Cuándo se usa? Cuando las estimaciones futuras se explican por los datos del pasado y no por variables independientes.

#Ejemplo: Tipo de cambio
modelo <- auto.arima(serie_de_tiempo, D=1) #agg D porque la gráfica iba para arriba y el pronóstico no 
modelo
## Series: serie_de_tiempo 
## ARIMA(0,0,0)(0,1,0)[4] with drift 
## 
## Coefficients:
##        drift
##       1.5000
## s.e.  0.1768
## 
## sigma^2 = 2.01:  log likelihood = -2.84
## AIC=9.68   AICc=-2.32   BIC=7.06
summary(modelo)
## Series: serie_de_tiempo 
## ARIMA(0,0,0)(0,1,0)[4] with drift 
## 
## Coefficients:
##        drift
##       1.5000
## s.e.  0.1768
## 
## sigma^2 = 2.01:  log likelihood = -2.84
## AIC=9.68   AICc=-2.32   BIC=7.06
## 
## Training set error measures:
##                      ME      RMSE       MAE        MPE      MAPE       MASE
## Training set 0.03333332 0.5787923 0.3666667 0.03685269 0.6429133 0.06111111
##                    ACF1
## Training set -0.5073047

4. Realizar pronóstico

pronostico <- forecast(modelo, level = c(95), h=5)
pronostico
##         Point Forecast    Lo 95    Hi 95
## 2021 Q3             61 58.22127 63.77873
## 2021 Q4             63 60.22127 65.77873
## 2022 Q1             61 58.22127 63.77873
## 2022 Q2             66 63.22127 68.77873
## 2022 Q3             67 63.07028 70.92972
plot(pronostico)

Banco mundial

El Banco mundial (WB) es un organismo multinacional especializado en finanzas. En R se puede acceder a sus indicadores a través de la librería WDI.

1. Instalar paquetes y llamar librerías

library(WDI)
library(wbstats)
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ forcats   1.0.0     ✔ readr     2.1.4
## ✔ ggplot2   3.4.2     ✔ stringr   1.5.0
## ✔ lubridate 1.9.2     ✔ tibble    3.2.1
## ✔ purrr     1.0.1     ✔ tidyr     1.3.0
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::compute() masks neuralnet::compute()
## ✖ dplyr::filter()  masks stats::filter()
## ✖ dplyr::lag()     masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors

2. Crear la serie de tiempo

# Paso 1. Obtener los valores dependientes
gdp_data <- wb_data(country = "MX", indicator = "NY.GDP.MKTP.CD",start_date = 1973, end_date = 2022)

# Paso 2. Agregar a los valores anteriores su tiempo correspondiente
serie_de_tiempo1 <- ts(data=gdp_data$NY.GDP.MKTP.CD, start = c(1973,1), frequency=1, end=c(2022,1))
serie_de_tiempo1
## Time Series:
## Start = 1973 
## End = 2022 
## Frequency = 1 
##  [1] 5.528021e+10 7.200018e+10 8.800000e+10 8.887679e+10 8.191250e+10
##  [6] 1.026473e+11 1.345296e+11 2.055770e+11 2.638021e+11 1.846036e+11
## [11] 1.561675e+11 1.842312e+11 1.952414e+11 1.345561e+11 1.475426e+11
## [16] 1.816112e+11 2.214031e+11 2.612537e+11 3.131397e+11 3.631578e+11
## [21] 5.007334e+11 5.278106e+11 3.600725e+11 4.109730e+11 5.004160e+11
## [26] 5.264997e+11 6.002330e+11 7.079099e+11 7.567029e+11 7.721097e+11
## [31] 7.293350e+11 7.822429e+11 8.774769e+11 9.753834e+11 1.052697e+12
## [36] 1.109987e+12 9.000470e+11 1.057801e+12 1.180487e+12 1.201094e+12
## [41] 1.274444e+12 1.315356e+12 1.171870e+12 1.078493e+12 1.158912e+12
## [46] 1.222406e+12 1.269010e+12 1.090515e+12 1.272839e+12 1.414187e+12
## attr(,"label")
## [1] GDP (current US$)

3. Crear modelo ARIMA

modelo1 <- auto.arima(serie_de_tiempo1)
modelo1
## Series: serie_de_tiempo1 
## ARIMA(0,1,0) 
## 
## sigma^2 = 7.381e+21:  log likelihood = -1303.18
## AIC=2608.36   AICc=2608.44   BIC=2610.25
summary(modelo1)
## Series: serie_de_tiempo1 
## ARIMA(0,1,0) 
## 
## sigma^2 = 7.381e+21:  log likelihood = -1303.18
## AIC=2608.36   AICc=2608.44   BIC=2610.25
## 
## Training set error measures:
##                       ME        RMSE         MAE      MPE     MAPE     MASE
## Training set 27179245230 85046847387 67623045592 4.943879 14.05421 0.980016
##                     ACF1
## Training set -0.01519178

4. Realizar pronóstico

pronostico1 <- forecast(modelo1, level = c(95), h=5)
pronostico1
##      Point Forecast        Lo 95        Hi 95
## 2023   1.414187e+12 1.245806e+12 1.582568e+12
## 2024   1.414187e+12 1.176060e+12 1.652314e+12
## 2025   1.414187e+12 1.122543e+12 1.705832e+12
## 2026   1.414187e+12 1.077425e+12 1.750949e+12
## 2027   1.414187e+12 1.037676e+12 1.790699e+12
plot(pronostico1)

