1. Contexto

En este documento se realizaran 3 métodos de cómo se pueden manejar los datos no estructurados. Entre los cuales se abordaran temas como un sistema de recomendación, un chat bot y un análisis de audio.

2. Instalación de librerías.

library(tidyverse)   
library(recommenderlab)
#install.packages("signal")
library(signal)
#install.packages("audio")
library(audio)
#install.packages("tuneR")
library(tuneR)

3. Tarea 1. Sistema de recomendación

3.1 Descripción

Se utilizo las calificación de peliculas de 3 compañeros comparandolos con algunas de mis calificaciones, dejando NA’s con la finalidad de poder predecir si me recomendaba o no dichas peliculas.

3.2 Crear la matriz

movie_ratings_tarea <- data.frame(
  KP1 = c(5, 4, 5, 4), 
  ENREDADOS = c(4, 5, 4, NA),
  UP = c(5, 4, 5, 2),
  CARS1 = c(4, 5, 3, NA),
  TS3  = c(3, 5, 3, 2),
  SHREK2 = c(3, 5, 4, 3),
  MONJA = c(3, NA, 3, NA)
)
rownames(movie_ratings_tarea) <- c('Diego','Lalo',  'Ale', 'You' )
movie_ratings_tarea
##       KP1 ENREDADOS UP CARS1 TS3 SHREK2 MONJA
## Diego   5         4  5     4   3      3     3
## Lalo    4         5  4     5   5      5    NA
## Ale     5         4  5     3   3      4     3
## You     4        NA  2    NA   2      3    NA

3.3 Proceso de matrices:

cosine_similarity <- function(vec_1, vec_2) {
  vec_len <- length(vec_1)
  
  # NA values are replaced with 0
  vec_1[is.na(vec_1)] <- 0
  vec_2[is.na(vec_2)] <- 0
  
  # Computing the denominator
  vec_1_denom <- sqrt(sum(vec_1^2))
  vec_2_denom <- sqrt(sum(vec_2^2))
  denominator <- vec_1_denom * vec_2_denom
  
  # Computing the numerator
  tib = tibble(vec_1 = vec_1, vec_2 = vec_2)
  tib <- tib %>% mutate(products = vec_1 * vec_2)
  numerator <- sum(tib$products)
  
  # Return the cosine similarity
  return (numerator / denominator)
}

3.4 Vectorizamos las puntuaciones:

# Obtenemos los vectores de cada persona
You <- as.numeric(as.vector(movie_ratings_tarea['You',]))
Diego <- as.numeric(as.vector(movie_ratings_tarea['Diego',]))
Lalo <- as.numeric(as.vector(movie_ratings_tarea['Lalo',]))
Ale <- as.numeric(as.vector(movie_ratings_tarea['Ale',]))


# Obtenemos "distancia" usando similitud por conseno
similarities_tarea <- data.frame(
  cosine_similarity = c(cosine_similarity(You, Diego), cosine_similarity(You, Lalo), cosine_similarity(You, Ale))
)
rownames(similarities_tarea) <- c('Diego', 'Lalo', 'Ale')
similarities_tarea
##       cosine_similarity
## Diego         0.7503127
## Lalo          0.7424242
## Ale           0.8003335

3.5 Promedio ponderado:

Una vez obtenidas las similaridades, realizamos un promedio ponderado para poder recomendar “La monja”

# Creamos una función para obtener un promedio ponderado en base a los amigos
movie_rating_weighted_average <- function(movie, friends) {
  denominator <- 0
  numerator <- 0
  for (friend in friends) {
    friend_similarity <- similarities_tarea[friend,][1]
    friend_rating <- movie_ratings_tarea[friend, movie][1]
    
    # Tomaremos el promedio ponderado en cuenta solo para películas con calificación
    if (is.na(friend_rating)) next
    
    denominator <- denominator + friend_similarity
    numerator <- numerator + (friend_similarity * friend_rating)
  }
  
  return (numerator / denominator)
}

3.6 Predicción

Usamos la función creada con anterioridad para predecir “La monja”

friend_names <- c('Diego', 'Lalo', 'Ale')
new_movies <- c('ENREDADOS', 'CARS1', 'MONJA')
new_movie_predicted_ratings <- tibble()
for (n in new_movies) {
  predicted_rating <- movie_rating_weighted_average(n, friend_names)
  prediction_tibble <- tibble(movie = n, predicted_rating = predicted_rating)
  new_movie_predicted_ratings <- bind_rows(new_movie_predicted_ratings, prediction_tibble)
}
new_movie_predicted_ratings
## # A tibble: 3 × 2
##   movie     predicted_rating
##   <chr>                <dbl>
## 1 ENREDADOS             4.32
## 2 CARS1                 3.97
## 3 MONJA                 3

Como podemos ver, la película con mayor rating predicho es ENREDADOS por lo que será la película recomendada en primer lugar

4. Tarea 2. Chatbot

4.1 Descripción

El chatbot realizado es con la finalidad de mostrar los temas vistos dentro del modulo 4 de la consentración de Inteligencia Artificial. Al ingresar solicita al usuario que se identifique; después se mostraran los dos temas principales: Datos Estructurados y Datos No Estructurados. Al dar click en alguno de ellos se mostraran los temas vistos así como un rpub del tema.

4.2 Creación del CHATBOT

Se creó un CHATBOT por medio de la aplicación Telegram. Con la ayuda del @BotFather Donde se configuraron los siguientes puntos de visualización.

Una vez creado el bot, así como su configuración se utilizo la herramienta SENDPULSE, en la cual se creo una cuenta con la finalidad de configurar el funcionamiento del chat.

Visita SENDPULSE

Dentro de esta plataforma se vinculo el chatbot por medio del token proporcionado en telegram. Además de un mensaje de bienvenida al iniciar el chat.

De igual manera se estructuraron los mensajes para la interacción con el usuario.

En este proceso se solicita el Nombre y Correo electronico, cuyos se guardaan en variables para ser mostrados en el siguiente mensaje.

4.4 Interacción con el Chatbot

4.3 Chatbot

Link del chatbot:

Visita CHAT

5. Tarea 3. Análisis de Audio

5.1 Descripción

En esta actividad se creó un audio en Python con la función text to speech además de la API “Text-to-speech” de OpenAI. Utilizando R se genera el ECO.

5.2 Creación de audio

Se establece la conexión de la API con Python. Utilizando la función Text-to-speech.

Descargamo el audio y continuamos en R.

5.3 Creación de eco

5.3.1 Importar audio

Se importa el audio generado por python

file_path <- "Diego_tarea.mp3"
audio_data <- readMP3(file_path)
y <- audio_data@left
Fs <- audio_data@samp.rate

5.3.2 Parámetros de ECO

alpha <- 0.9
D <- 0.25 * Fs  
echo <- numeric(length(y) + D)
echo[1:length(y)] <- y
echo[(D+1):(D+length(y))] <- alpha * y

5.3.3 Unir audios

x <- y + echo[1:length(y)]
new_audio <- Wave(x, samp.rate = Fs)
output_file <- "Diego_5561_echo.wav"
writeWave(new_audio, filename = output_file)

