1. Contexto

En este documento se realizaran 3 métodos de cómo se pueden manejar los datos no estructurados. Entre los cuales se abordaran temas como un sistema de recomendación, un chat bot y un análisis de audio.

2. Instalación de librerías.

library(tidyverse)   
library(recommenderlab)
#install.packages("signal")
library(signal)
#install.packages("audio")
library(audio)
#install.packages("tuneR")
library(tuneR)

3. Tarea 1. Sistema de recomendación

3.1 Descripción

Se utilizo las calificación de peliculas de 3 compañeros comparandolos con algunas de mis calificaciones, dejando NA’s con la finalidad de poder predecir si me recomendaba o no dichas peliculas.

3.2 Crear la matriz

movie_ratings_tarea <- data.frame(
  KP1 = c(5, 4, 5, 4), 
  ENREDADOS = c(4, 5, 4, NA),
  UP = c(5, 4, 5, 2),
  CARS1 = c(4, 5, 3, NA),
  TS3  = c(3, 5, 3, 2),
  SHREK2 = c(3, 5, 4, 3),
  MONJA = c(3, NA, 3, NA)
)
rownames(movie_ratings_tarea) <- c('Diego','Lalo',  'Ale', 'You' )
movie_ratings_tarea
##       KP1 ENREDADOS UP CARS1 TS3 SHREK2 MONJA
## Diego   5         4  5     4   3      3     3
## Lalo    4         5  4     5   5      5    NA
## Ale     5         4  5     3   3      4     3
## You     4        NA  2    NA   2      3    NA

3.3 Proceso de matrices:

cosine_similarity <- function(vec_1, vec_2) {
  vec_len <- length(vec_1)
  
  # NA values are replaced with 0
  vec_1[is.na(vec_1)] <- 0
  vec_2[is.na(vec_2)] <- 0
  
  # Computing the denominator
  vec_1_denom <- sqrt(sum(vec_1^2))
  vec_2_denom <- sqrt(sum(vec_2^2))
  denominator <- vec_1_denom * vec_2_denom
  
  # Computing the numerator
  tib = tibble(vec_1 = vec_1, vec_2 = vec_2)
  tib <- tib %>% mutate(products = vec_1 * vec_2)
  numerator <- sum(tib$products)
  
  # Return the cosine similarity
  return (numerator / denominator)
}

3.4 Vectorizamos las puntuaciones:

# Obtenemos los vectores de cada persona
You <- as.numeric(as.vector(movie_ratings_tarea['You',]))
Diego <- as.numeric(as.vector(movie_ratings_tarea['Diego',]))
Lalo <- as.numeric(as.vector(movie_ratings_tarea['Lalo',]))
Ale <- as.numeric(as.vector(movie_ratings_tarea['Ale',]))


# Obtenemos "distancia" usando similitud por conseno
similarities_tarea <- data.frame(
  cosine_similarity = c(cosine_similarity(You, Diego), cosine_similarity(You, Lalo), cosine_similarity(You, Ale))
)
rownames(similarities_tarea) <- c('Diego', 'Lalo', 'Ale')
similarities_tarea
##       cosine_similarity
## Diego         0.7503127
## Lalo          0.7424242
## Ale           0.8003335

3.5 Promedio ponderado:

Una vez obtenidas las similaridades, realizamos un promedio ponderado para poder recomendar “La monja”

# Creamos una función para obtener un promedio ponderado en base a los amigos
movie_rating_weighted_average <- function(movie, friends) {
  denominator <- 0
  numerator <- 0
  for (friend in friends) {
    friend_similarity <- similarities_tarea[friend,][1]
    friend_rating <- movie_ratings_tarea[friend, movie][1]
    
    # Tomaremos el promedio ponderado en cuenta solo para películas con calificación
    if (is.na(friend_rating)) next
    
    denominator <- denominator + friend_similarity
    numerator <- numerator + (friend_similarity * friend_rating)
  }
  
  return (numerator / denominator)
}

3.6 Predicción

Usamos la función creada con anterioridad para predecir “La monja”

friend_names <- c('Diego', 'Lalo', 'Ale')
new_movies <- c('ENREDADOS', 'CARS1', 'MONJA')
new_movie_predicted_ratings <- tibble()
for (n in new_movies) {
  predicted_rating <- movie_rating_weighted_average(n, friend_names)
  prediction_tibble <- tibble(movie = n, predicted_rating = predicted_rating)
  new_movie_predicted_ratings <- bind_rows(new_movie_predicted_ratings, prediction_tibble)
}
new_movie_predicted_ratings
## # A tibble: 3 × 2
##   movie     predicted_rating
##   <chr>                <dbl>
## 1 ENREDADOS             4.32
## 2 CARS1                 3.97
## 3 MONJA                 3

Como podemos ver, la película con mayor rating predicho es ENREDADOS por lo que será la película recomendada en primer lugar

4. Tarea 2. Chatbot

4.1 Descripción

El chatbot realizado es con la finalidad de mostrar los temas vistos dentro del modulo 4 de la consentración de Inteligencia Artificial. Al ingresar solicita al usuario que se identifique; después se mostraran los dos temas principales: Datos Estructurados y Datos No Estructurados. Al dar click en alguno de ellos se mostraran los temas vistos así como un rpub del tema.

4.2 Creación del CHATBOT

Se creó un CHATBOT por medio de la aplicación Telegram. Con la ayuda del @BotFather Donde se configuraron los siguientes puntos de visualización.

Una vez creado el bot, así como su configuración se utilizo la herramienta SENDPULSE, en la cual se creo una cuenta con la finalidad de configurar el funcionamiento del chat.

Visita SENDPULSE

Dentro de esta plataforma se vinculo el chatbot por medio del token proporcionado en telegram. Además de un mensaje de bienvenida al iniciar el chat.

De igual manera se estructuraron los mensajes para la interacción con el usuario.

En este proceso se solicita el Nombre y Correo electronico, cuyos se guardaan en variables para ser mostrados en el siguiente mensaje.

4.4 Interacción con el Chatbot

4.3 Chatbot

Link del chatbot:

Visita CHAT

5. Tarea 3. Análisis de Audio

5.1 Descripción

En esta actividad se creó un audio en Python con la función text to speech además de la API “Text-to-speech” de OpenAI. Utilizando R se genera el ECO.

5.2 Creación de audio

Se establece la conexión de la API con Python. Utilizando la función Text-to-speech.

Descargamo el audio y continuamos en R.

5.3 Creación de eco

5.3.1 Importar audio

Se importa el audio generado por python

file_path <- "Diego_tarea.mp3"
audio_data <- readMP3(file_path)
y <- audio_data@left
Fs <- audio_data@samp.rate

5.3.2 Parámetros de ECO

alpha <- 0.9
D <- 0.25 * Fs  
echo <- numeric(length(y) + D)
echo[1:length(y)] <- y
echo[(D+1):(D+length(y))] <- alpha * y

5.3.3 Unir audios

x <- y + echo[1:length(y)]
new_audio <- Wave(x, samp.rate = Fs)
output_file <- "Diego_5561_echo.wav"
writeWave(new_audio, filename = output_file)

---
title: "Tarea 2, 3 y 4"
author: "Diego Alejandro Pérez Cisneros - A01275561"
date: "2024-04-21"
output: 
  html_document:
    toc: TRUE
    toc_float: TRUE
    code_download: TRUE
    theme: simplex 
---
 
 ![](C:\\Users\\Diego Pérez\\Downloads\\datos-estructurados-00.jpg)
 
 
# 1. Contexto
En este documento se realizaran 3 métodos de cómo se pueden manejar los datos no estructurados. Entre los cuales se abordaran temas como un sistema de recomendación, un chat bot y un análisis de audio.

# 2. Instalación de librerías.
```{r message=FALSE, warning=FALSE}
library(tidyverse)   
library(recommenderlab)
#install.packages("signal")
library(signal)
#install.packages("audio")
library(audio)
#install.packages("tuneR")
library(tuneR)
```


# 3. Tarea 1. Sistema de recomendación
![](C:\\Users\\Diego Pérez\\Downloads\\WhatsApp Image 2024-04-21 at 11.01.22 AM.jpeg)

## 3.1 Descripción
Se utilizo las calificación de peliculas de 3 compañeros comparandolos con algunas de mis calificaciones, dejando NA's con la finalidad de poder predecir si me recomendaba o no dichas peliculas. 

## 3.2 Crear la matriz
```{r warning=FALSE}
movie_ratings_tarea <- data.frame(
  KP1 = c(5, 4, 5, 4), 
  ENREDADOS = c(4, 5, 4, NA),
  UP = c(5, 4, 5, 2),
  CARS1 = c(4, 5, 3, NA),
  TS3  = c(3, 5, 3, 2),
  SHREK2 = c(3, 5, 4, 3),
  MONJA = c(3, NA, 3, NA)
)
rownames(movie_ratings_tarea) <- c('Diego','Lalo',  'Ale', 'You' )
movie_ratings_tarea
```

## 3.3 Proceso de matrices:
```{r warning=FALSE}
cosine_similarity <- function(vec_1, vec_2) {
  vec_len <- length(vec_1)
  
  # NA values are replaced with 0
  vec_1[is.na(vec_1)] <- 0
  vec_2[is.na(vec_2)] <- 0
  
  # Computing the denominator
  vec_1_denom <- sqrt(sum(vec_1^2))
  vec_2_denom <- sqrt(sum(vec_2^2))
  denominator <- vec_1_denom * vec_2_denom
  
  # Computing the numerator
  tib = tibble(vec_1 = vec_1, vec_2 = vec_2)
  tib <- tib %>% mutate(products = vec_1 * vec_2)
  numerator <- sum(tib$products)
  
  # Return the cosine similarity
  return (numerator / denominator)
}
```
 
## 3.4 Vectorizamos las puntuaciones:
```{r warning=FALSE}
# Obtenemos los vectores de cada persona
You <- as.numeric(as.vector(movie_ratings_tarea['You',]))
Diego <- as.numeric(as.vector(movie_ratings_tarea['Diego',]))
Lalo <- as.numeric(as.vector(movie_ratings_tarea['Lalo',]))
Ale <- as.numeric(as.vector(movie_ratings_tarea['Ale',]))


# Obtenemos "distancia" usando similitud por conseno
similarities_tarea <- data.frame(
  cosine_similarity = c(cosine_similarity(You, Diego), cosine_similarity(You, Lalo), cosine_similarity(You, Ale))
)
rownames(similarities_tarea) <- c('Diego', 'Lalo', 'Ale')
similarities_tarea
```

## 3.5 Promedio ponderado:
Una vez obtenidas las similaridades, realizamos un promedio ponderado para poder recomendar "La monja"
```{r warning=FALSE}
# Creamos una función para obtener un promedio ponderado en base a los amigos
movie_rating_weighted_average <- function(movie, friends) {
  denominator <- 0
  numerator <- 0
  for (friend in friends) {
    friend_similarity <- similarities_tarea[friend,][1]
    friend_rating <- movie_ratings_tarea[friend, movie][1]
    
    # Tomaremos el promedio ponderado en cuenta solo para películas con calificación
    if (is.na(friend_rating)) next
    
    denominator <- denominator + friend_similarity
    numerator <- numerator + (friend_similarity * friend_rating)
  }
  
  return (numerator / denominator)
}
```

## 3.6 Predicción
Usamos la función creada con anterioridad para predecir "La monja" 
```{r warning=FALSE}
friend_names <- c('Diego', 'Lalo', 'Ale')
new_movies <- c('ENREDADOS', 'CARS1', 'MONJA')
new_movie_predicted_ratings <- tibble()
for (n in new_movies) {
  predicted_rating <- movie_rating_weighted_average(n, friend_names)
  prediction_tibble <- tibble(movie = n, predicted_rating = predicted_rating)
  new_movie_predicted_ratings <- bind_rows(new_movie_predicted_ratings, prediction_tibble)
}
new_movie_predicted_ratings
```
Como podemos ver, la película con mayor rating predicho es ENREDADOS por lo que será la película recomendada en primer lugar


# 4. Tarea 2. Chatbot
![](C:\\Users\\Diego Pérez\\Downloads\\13317063_5208996.jpg)

## 4.1 Descripción
El chatbot realizado es con la finalidad de mostrar los temas vistos dentro del modulo 4 de la consentración de Inteligencia Artificial. Al ingresar solicita al usuario que se identifique; después se mostraran los dos temas principales: *Datos Estructurados* y *Datos No Estructurados*. Al dar click en alguno de ellos se mostraran los temas vistos así como un rpub del tema.

## 4.2 Creación del CHATBOT
Se creó un **CHATBOT** por medio de la aplicación *Telegram*. Con la ayuda del **@BotFather** Donde se configuraron los siguientes puntos de visualización.

![](C:\\Users\\Diego Pérez\\Downloads\\WhatsApp Image 2024-04-21 at 1.05.37 PM.jpeg)

Una vez creado el bot, así como su configuración se utilizo la herramienta **SENDPULSE**, en la cual se creo una cuenta con la finalidad de configurar el funcionamiento del chat. 

[Visita SENDPULSE](https://sendpulse.com/latam/features/email?{lpurl}?alt_source=google&alt_medium=cpc&alt_campaign=16153312977&alt_term=sendpulse&alt_content=crt_621863434983|ch_google|kwmt_b|ps_|srct_g|trgt_|src_|groupID_131566688045|campaignID_16153312977|keywordID_kwd-361307565517|exp=ade.0?&alt_source=google&alt_medium=cpc&alt_campaign=16153312977&alt_term=sendpulse&alt_content=crt_621863434983|ch_google|kwmt_b|ps_|srct_g|trgt_|src_|groupID_131566688045|campaignID_16153312977|keywordID_kwd-361307565517&gad_source=1&gclid=Cj0KCQjw8pKxBhD_ARIsAPrG45nHIqlftoYizmy9n-1e6GC5bWM1FL1XmN4V_oLEgJSEM-g0SLlAEN4aAlDBEALw_wcB)

Dentro de esta plataforma se vinculo el chatbot por medio del *token* proporcionado en telegram. Además de un mensaje de bienvenida al iniciar el chat.

![](C:\\Users\\Diego Pérez\\Downloads\\WhatsApp Image 2024-04-21 at 1.17.40 PM.jpeg)

De igual manera se estructuraron los mensajes para la interacción con el usuario.

![](C:\\Users\\Diego Pérez\\Downloads\\WhatsApp Image 2024-04-21 at 1.21.10 PM.jpeg)
En este proceso se solicita el *Nombre* y *Correo electronico*, cuyos se guardaan en variables para ser mostrados en el siguiente mensaje. 

## 4.4 Interacción con el Chatbot

![](C:\\Users\\Diego Pérez\\Downloads\\WhatsApp Image 2024-04-21 at 1.46.55 PM.jpeg)

![](C:\\Users\\Diego Pérez\\Downloads\\WhatsApp Image 2024-04-21 at 1.46.56 PM.jpeg)

## 4.3 Chatbot
Link del chatbot:

[Visita CHAT](https://diego5561-bot.tg.pulse.is/)

# 5. Tarea 3. Análisis de Audio
![](C:\\Users\\Diego Pérez\\Downloads\\Audio-waves-min-1.gif)

## 5.1 Descripción
En esta actividad se creó un audio en **Python** con la función *text to speech* además de la **API** *"Text-to-speech"* de **OpenAI**. Utilizando **R** se genera el *ECO*.

## 5.2 Creación de audio
Se establece la conexión de la **API** con **Python**. Utilizando la función *Text-to-speech*.

![](C:\\Users\\Diego Pérez\\Downloads\\WhatsApp Image 2024-04-21 at 3.51.52 PM.jpeg) 

Descargamo el audio y continuamos en **R**.

## 5.3 Creación de eco
### 5.3.1 Importar audio
Se importa el audio generado por python
```{r message=FALSE, warning=FALSE}
file_path <- "Diego_tarea.mp3"
audio_data <- readMP3(file_path)
y <- audio_data@left
Fs <- audio_data@samp.rate
```
![](C:\\Users\\Diego Pérez\\Downloads\\t2,3,4\\Diego_tarea.mp3)

### 5.3.2 Parámetros de ECO
```{r}
alpha <- 0.9
D <- 0.25 * Fs  
echo <- numeric(length(y) + D)
echo[1:length(y)] <- y
echo[(D+1):(D+length(y))] <- alpha * y
```

### 5.3.3 Unir audios 
```{r warning=FALSE}
x <- y + echo[1:length(y)]
new_audio <- Wave(x, samp.rate = Fs)
output_file <- "Diego_5561_echo.wav"
writeWave(new_audio, filename = output_file)
```
![](C:\\Users\\Diego Pérez\\Downloads\\Diego_5561_echo.wav)
