1. Contexto
En este documento se realizaran 3 métodos de cómo se pueden manejar
los datos no estructurados. Entre los cuales se abordaran temas como un
sistema de recomendación, un chat bot y un análisis de audio.
3. Tarea 1. Sistema de recomendación

3.1 Descripción
Se utilizo las calificación de peliculas de 3 compañeros
comparandolos con algunas de mis calificaciones, dejando NA’s con la
finalidad de poder predecir si me recomendaba o no dichas peliculas.
3.2 Crear la matriz
movie_ratings_tarea <- data.frame(
KP1 = c(5, 4, 5, 4),
ENREDADOS = c(4, 5, 4, NA),
UP = c(5, 4, 5, 2),
CARS1 = c(4, 5, 3, NA),
TS3 = c(3, 5, 3, 2),
SHREK2 = c(3, 5, 4, 3),
MONJA = c(3, NA, 3, NA)
)
rownames(movie_ratings_tarea) <- c('Diego','Lalo', 'Ale', 'You' )
movie_ratings_tarea
## KP1 ENREDADOS UP CARS1 TS3 SHREK2 MONJA
## Diego 5 4 5 4 3 3 3
## Lalo 4 5 4 5 5 5 NA
## Ale 5 4 5 3 3 4 3
## You 4 NA 2 NA 2 3 NA
3.3 Proceso de matrices:
cosine_similarity <- function(vec_1, vec_2) {
vec_len <- length(vec_1)
# NA values are replaced with 0
vec_1[is.na(vec_1)] <- 0
vec_2[is.na(vec_2)] <- 0
# Computing the denominator
vec_1_denom <- sqrt(sum(vec_1^2))
vec_2_denom <- sqrt(sum(vec_2^2))
denominator <- vec_1_denom * vec_2_denom
# Computing the numerator
tib = tibble(vec_1 = vec_1, vec_2 = vec_2)
tib <- tib %>% mutate(products = vec_1 * vec_2)
numerator <- sum(tib$products)
# Return the cosine similarity
return (numerator / denominator)
}
3.4 Vectorizamos las puntuaciones:
# Obtenemos los vectores de cada persona
You <- as.numeric(as.vector(movie_ratings_tarea['You',]))
Diego <- as.numeric(as.vector(movie_ratings_tarea['Diego',]))
Lalo <- as.numeric(as.vector(movie_ratings_tarea['Lalo',]))
Ale <- as.numeric(as.vector(movie_ratings_tarea['Ale',]))
# Obtenemos "distancia" usando similitud por conseno
similarities_tarea <- data.frame(
cosine_similarity = c(cosine_similarity(You, Diego), cosine_similarity(You, Lalo), cosine_similarity(You, Ale))
)
rownames(similarities_tarea) <- c('Diego', 'Lalo', 'Ale')
similarities_tarea
## cosine_similarity
## Diego 0.7503127
## Lalo 0.7424242
## Ale 0.8003335
3.5 Promedio ponderado:
Una vez obtenidas las similaridades, realizamos un promedio ponderado
para poder recomendar “La monja”
# Creamos una función para obtener un promedio ponderado en base a los amigos
movie_rating_weighted_average <- function(movie, friends) {
denominator <- 0
numerator <- 0
for (friend in friends) {
friend_similarity <- similarities_tarea[friend,][1]
friend_rating <- movie_ratings_tarea[friend, movie][1]
# Tomaremos el promedio ponderado en cuenta solo para películas con calificación
if (is.na(friend_rating)) next
denominator <- denominator + friend_similarity
numerator <- numerator + (friend_similarity * friend_rating)
}
return (numerator / denominator)
}
3.6 Predicción
Usamos la función creada con anterioridad para predecir “La
monja”
friend_names <- c('Diego', 'Lalo', 'Ale')
new_movies <- c('ENREDADOS', 'CARS1', 'MONJA')
new_movie_predicted_ratings <- tibble()
for (n in new_movies) {
predicted_rating <- movie_rating_weighted_average(n, friend_names)
prediction_tibble <- tibble(movie = n, predicted_rating = predicted_rating)
new_movie_predicted_ratings <- bind_rows(new_movie_predicted_ratings, prediction_tibble)
}
new_movie_predicted_ratings
## # A tibble: 3 × 2
## movie predicted_rating
## <chr> <dbl>
## 1 ENREDADOS 4.32
## 2 CARS1 3.97
## 3 MONJA 3
Como podemos ver, la película con mayor rating predicho es ENREDADOS
por lo que será la película recomendada en primer lugar
4. Tarea 2. Chatbot

4.1 Descripción
El chatbot realizado es con la finalidad de mostrar los temas vistos
dentro del modulo 4 de la consentración de Inteligencia Artificial. Al
ingresar solicita al usuario que se identifique; después se mostraran
los dos temas principales: Datos Estructurados y Datos No
Estructurados. Al dar click en alguno de ellos se mostraran los
temas vistos así como un rpub del tema.
4.2 Creación del CHATBOT
Se creó un CHATBOT por medio de la aplicación
Telegram. Con la ayuda del @BotFather Donde se configuraron los
siguientes puntos de visualización.

Una vez creado el bot, así como su configuración se utilizo la
herramienta SENDPULSE, en la cual se creo una cuenta
con la finalidad de configurar el funcionamiento del chat.
Visita
SENDPULSE
Dentro de esta plataforma se vinculo el chatbot por medio del
token proporcionado en telegram. Además de un mensaje de
bienvenida al iniciar el chat.

De igual manera se estructuraron los mensajes para la interacción con
el usuario.
En este proceso se solicita el Nombre y Correo
electronico, cuyos se guardaan en variables para ser mostrados en
el siguiente mensaje.
4.4 Interacción con el Chatbot


