Actividad
4.2
Enrique
Monsivais
2023-10-04
Shiny App ß Análisis de Sentimientos
(Himno y El Triste)

Redes Neuronales
Introducción a las Redes
Neuronales

Una Red Neural Artificial (ANN) modela la relación entre un conjunto
de entradas y una salida, resolviendo un problema de aprendizaje.
Un ejemplo de aplicación de Redes Neuronales es 1. La recomendación
de contenido de Netflix. 2. El feed de Tiktok, o instagram.
1. Instalar paquetes y
llamar librerías
2. Alimentar con
ejemplos
examen <- c(20,10,30,20,80,30)
proyecto <- c(90,20,40,50,50,80)
estatus <- c(1,0,0,0,1,1)
df <- data.frame(examen, proyecto, estatus)
3. Generar Red
Neuronal
red_neuronal <- neuralnet(estatus ~ examen + proyecto, data=df)
plot(red_neuronal, rep = 'best')

4. Predecir con la red
neuronal
prueba_examen <- c(30,40,85)
prueba_proyecto <- c(85,50,40)
prueba <- data.frame(prueba_examen, prueba_proyecto)
prediccion <- compute(red_neuronal, prueba)
prediccion$net.result
## [,1]
## [1,] 0.4999788
## [2,] 0.4999789
## [3,] 0.4999789
probabilidad <- prediccion$net.result
resultado <- ifelse(probabilidad>0.5,1,0)
resultado
## [,1]
## [1,] 0
## [2,] 0
## [3,] 0
Ejercicio Red
Neuronal
1. Instalar paquetes y
llamar librerías
library(neuralnet)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following object is masked from 'package:neuralnet':
##
## compute
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
2. Alimentar con base de
datos
data <- read.csv("C:\\Users\\enriq\\OneDrive\\Documentos\\Datos a Desiciones\\Modulo4\\cancer_de_mama.csv")
data <- na.omit(data)
3. Asignar valores númericos
a la variable dependiente
data <- data %>%
mutate(diagnosis = ifelse(diagnosis == "M", 1, ifelse(diagnosis == "V", 0, diagnosis)))
4. Dividimos los datos en
entrenamiento y prueba
inp <- sample(2, nrow(data), replace = TRUE, prob = c(0.7, 0.3))
training_data <- data[inp==1, ]
test_data <- data[inp==2, ]
5. Generar Red
Neuronal
set.seed(222)
attach(data)
n <- neuralnet(diagnosis~.,
data = training_data,
hidden = 5,
err.fct = "sse",
linear.output = FALSE,
lifesign = 'full',
rep = 1,
algorithm = "rprop+",
stepmax = 500000)
## hidden: 5 thresh: 0.01 rep: 1/1 steps: 1000 min thresh: 0.224288958813999
## 2000 min thresh: 0.224288958813999
## 3000 min thresh: 0.224288958813999
## 4000 min thresh: 0.224288958813999
## 5000 min thresh: 0.224288958813999
## 6000 min thresh: 0.224288958813999
## 7000 min thresh: 0.224288958813999
## 8000 min thresh: 0.101646496234301
## 9000 min thresh: 0.0965388464781778
## 10000 min thresh: 0.0965388464781778
## 11000 min thresh: 0.0965388464781778
## 12000 min thresh: 0.0965388464781778
## 13000 min thresh: 0.0965388464781778
## 14000 min thresh: 0.0965388464781778
## 15000 min thresh: 0.0965388464781778
## 16000 min thresh: 0.0965388464781778
## 17000 min thresh: 0.0965388464781778
## 18000 min thresh: 0.0965388464781778
## 19000 min thresh: 0.0965388464781778
## 20000 min thresh: 0.0880770494011347
## 21000 min thresh: 0.0630496046396311
## 22000 min thresh: 0.0117993088136834
## 23000 min thresh: 0.0117993088136834
## 24000 min thresh: 0.0117993088136834
## 25000 min thresh: 0.0117993088136834
## 25836 error: 2.33795 time: 7.3 secs

6. Cambiar las predicciones
de 0 y 1 a M, V
# Obtener las predicciones como 0 o 1
output <- neuralnet::compute(n, rep = 1, test_data[, -1])
p <- output$net.result
pred <- ifelse(p >= 0.5, "M", "V")
7. Matriz de
Confusión
# Asegurarse de que ambos vectores tengan la misma longitud
n <- min(length(pred), length(test_data$diagnosis))
pred <- pred[1:n]
actual <- test_data$diagnosis[1:n]
# Crear la matriz de confusión
tab <- table(pred, actual)
tab
## actual
## pred 1 B
## M 74 4
## V 2 100
8. Porcentaje de error
total
#Con esta operación obtenemos el porcentaje de error total (usando datos de la matrix de confusión)
1 - sum(diag(tab)) / sum(tab)
## [1] 0.03333333
Series de Tiempo

Introducción
Una Serie de Tiempo es una colecció de observaciones sobre
un feterminado fenómeno efectuadas en momentos de tiempo sucesivos,
usualmente equiespaciados.
Ejemplos de Series de Tiempo son:
1. Precio de acciones.
2. Niveles de inventario.
3. Rotación de persona.
4. Ventas.
1. Instalar paquetes y llamar
librerías
## Registered S3 method overwritten by 'quantmod':
## method from
## as.zoo.data.frame zoo
2. Crear la Serie de
Tiempo
# Paso 1. Obtener los valores dependeintes
produccion <- c(50,53,55,57,55,60)
#Paso 2. Agregar a los valores anteriores su tiempo correspondiente
serie_de_tiempo <- ts(data = produccion, start = 2020, frequency = 4) #aquí lo hizo por trimestre
serie_de_tiempo
## Qtr1 Qtr2 Qtr3 Qtr4
## 2020 50 53 55 57
## 2021 55 60
3. Crear modelo
ARIMA
# ARIMA: AutoRegressive Integrated Moving Average o Modelo Autorregresivo Integrado de Media Móvil.
#ARIMA (p, d, q)
# p = orden de auto-regresión
# d = orden de integración (o diferenciación)
# q = orden del promedio móvil
# ¿Cuándo se usa? Cuando las estimaciones futuras se explican por los datos del pasado y no por variables independientes.
#Ejemplo: Tipo de cambio
modelo <- auto.arima(serie_de_tiempo, D=1) #agg D porque la gráfica iba para arriba y el pronóstico no
modelo
## Series: serie_de_tiempo
## ARIMA(0,0,0)(0,1,0)[4] with drift
##
## Coefficients:
## drift
## 1.5000
## s.e. 0.1768
##
## sigma^2 = 2.01: log likelihood = -2.84
## AIC=9.68 AICc=-2.32 BIC=7.06
## Series: serie_de_tiempo
## ARIMA(0,0,0)(0,1,0)[4] with drift
##
## Coefficients:
## drift
## 1.5000
## s.e. 0.1768
##
## sigma^2 = 2.01: log likelihood = -2.84
## AIC=9.68 AICc=-2.32 BIC=7.06
##
## Training set error measures:
## ME RMSE MAE MPE MAPE MASE
## Training set 0.03333332 0.5787923 0.3666667 0.03685269 0.6429133 0.06111111
## ACF1
## Training set -0.5073047
4. Realizar
pronóstico
pronostico <- forecast(modelo, level = c(95), h=5)
pronostico
## Point Forecast Lo 95 Hi 95
## 2021 Q3 61 58.22127 63.77873
## 2021 Q4 63 60.22127 65.77873
## 2022 Q1 61 58.22127 63.77873
## 2022 Q2 66 63.22127 68.77873
## 2022 Q3 67 63.07028 70.92972

Banco mundial
El Banco mundial (WB) es un organismo multinacional
especializado en finanzas. En R se puede acceder a sus indicadores a
través de la librería WDI.
1. Instalar paquetes y llamar
librerías
library(WDI)
library(wbstats)
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ forcats 1.0.0 ✔ readr 2.1.4
## ✔ ggplot2 3.4.2 ✔ stringr 1.5.0
## ✔ lubridate 1.9.2 ✔ tibble 3.2.1
## ✔ purrr 1.0.1 ✔ tidyr 1.3.0
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::compute() masks neuralnet::compute()
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
2. Crear la serie de
tiempo
# Paso 1. Obtener los valores dependientes
gdp_data <- wb_data(country = "MX", indicator = "NY.GDP.MKTP.CD",start_date = 1973, end_date = 2022)
# Paso 2. Agregar a los valores anteriores su tiempo correspondiente
serie_de_tiempo1 <- ts(data=gdp_data$NY.GDP.MKTP.CD, start = c(1973,1), frequency=1, end=c(2022,1))
serie_de_tiempo1
## Time Series:
## Start = 1973
## End = 2022
## Frequency = 1
## [1] 5.528021e+10 7.200018e+10 8.800000e+10 8.887679e+10 8.191250e+10
## [6] 1.026473e+11 1.345296e+11 2.055770e+11 2.638021e+11 1.846036e+11
## [11] 1.561675e+11 1.842312e+11 1.952414e+11 1.345561e+11 1.475426e+11
## [16] 1.816112e+11 2.214031e+11 2.612537e+11 3.131397e+11 3.631578e+11
## [21] 5.007334e+11 5.278106e+11 3.600725e+11 4.109730e+11 5.004160e+11
## [26] 5.264997e+11 6.002330e+11 7.079099e+11 7.567029e+11 7.721097e+11
## [31] 7.293350e+11 7.822429e+11 8.774769e+11 9.753834e+11 1.052697e+12
## [36] 1.109987e+12 9.000470e+11 1.057801e+12 1.180487e+12 1.201094e+12
## [41] 1.274444e+12 1.315356e+12 1.171870e+12 1.078493e+12 1.158912e+12
## [46] 1.222406e+12 1.269010e+12 1.090515e+12 1.272839e+12 1.414187e+12
## attr(,"label")
## [1] GDP (current US$)
3. Crear modelo
ARIMA
modelo1 <- auto.arima(serie_de_tiempo1)
modelo1
## Series: serie_de_tiempo1
## ARIMA(0,1,0)
##
## sigma^2 = 7.381e+21: log likelihood = -1303.18
## AIC=2608.36 AICc=2608.44 BIC=2610.25
## Series: serie_de_tiempo1
## ARIMA(0,1,0)
##
## sigma^2 = 7.381e+21: log likelihood = -1303.18
## AIC=2608.36 AICc=2608.44 BIC=2610.25
##
## Training set error measures:
## ME RMSE MAE MPE MAPE MASE
## Training set 27179245230 85046847387 67623045592 4.943879 14.05421 0.980016
## ACF1
## Training set -0.01519178
4. Realizar
pronóstico
pronostico1 <- forecast(modelo1, level = c(95), h=5)
pronostico1
## Point Forecast Lo 95 Hi 95
## 2023 1.414187e+12 1.245806e+12 1.582568e+12
## 2024 1.414187e+12 1.176060e+12 1.652314e+12
## 2025 1.414187e+12 1.122543e+12 1.705832e+12
## 2026 1.414187e+12 1.077425e+12 1.750949e+12
## 2027 1.414187e+12 1.037676e+12 1.790699e+12

