Gestión de Sistema de Información
Nombre y Apellido: Cueva Rico, Abraham Elias
Curso: Estadistica Aplicada a la Computación
Docente: Victor Manuel Guevara Ponce
Ciclo: IV
Año: 2023
Datos extraidos de https://www.kaggle.com/datasets/thedevastator/youtube-trending-videos-dataset
El devastador.
Además, también revela varias métricas de participación, como la cantidad de vistas que ha recibido el video, los gustos y disgustos que ha obtenido de la audiencia. Además, la información relacionada con el recuento de comentarios en videos particulares permite analizar la interacción y la respuesta del espectador. Además, este conjunto de datos describe si los comentarios o las calificaciones están deshabilitados para un video en particular, lo que permite examinar cómo estos factores afectan la participación.
Al explorar este conjunto de datos en profundidad, los especialistas en marketing pueden obtener información valiosa para identificar tendencias en la popularidad del contenido en diferentes países, al tiempo que tienen en cuenta las consideraciones de tiempo basadas en el día de la semana publicado. También abre vías para analizar el sentimiento del público hacia videos específicos en función de la proporción de me gusta y no me gusta y el recuento de comentarios, lo que ayuda aún más a diseñar estrategias de marketing adecuadas.
En general, este conjunto de datos informativos sirve como un activo invaluable para investigadores, analistas de datos y especialistas en marketing que se esfuerzan por obtener una comprensión más profunda sobre los patrones de video de tendencias, las métricas relevantes que influyen en la viralidad del contenido, los factores que dictan los sentimientos de los espectadores y la exploración de nuevas posibilidades dentro del espacio de marketing digital aprovechando el amplio alcance de YouTube.
Ofrecen una plataforma de análisis de YouTube que revela métricas clave de participación, como vistas, likes, dislikes y comentarios. Este conjunto de datos detallado permite a los especialistas en marketing comprender tendencias globales y locales, analizar la interacción del espectador y evaluar el sentimiento del público. Además, proporciona información sobre la habilitación de comentarios y calificaciones, permitiendo ajustar estrategias de marketing para maximizar la efectividad. Con nuestra herramienta, los profesionales pueden optimizar estrategias, descubrir oportunidades y obtener una comprensión profunda de los patrones de tendencias en el espacio digital de YouTube.
La investigación se centra en la falta de herramientas eficaces para analizar a fondo el rendimiento y la interacción del público en plataformas de video, como YouTube. La ausencia de datos detallados sobre métricas de participación, comentarios y configuraciones específicas, dificulta a los profesionales del marketing la toma de decisiones informadas. Esta carencia impide identificar oportunidades clave, comprender los patrones de tendencias a nivel mundial y local, y ajustar estrategias de manera efectiva. La problemática se centra en la necesidad de una herramienta integral que proporcione una visión completa y precisa del comportamiento del público en el espacio digital de videos en línea.
rm(list = ls()): Elimina todos los objetos existentes en el entorno de trabajo. setwd(dirname(rstudioapi::getActiveDocumentContext()$path)): Establece el directorio de trabajo al directorio del archivo actual. getwd(): Imprime el directorio de trabajo actual.
read.csv(“youtube.csv”, sep = “,”): Lee el archivo “youtube.csv” como un conjunto de datos. head(youtube): Muestra las primeras filas del conjunto de datos.
Se utiliza ggplot2 para crear un histograma de las vistas con ciertos parámetros estéticos.
quantile(youtube$views): Calcula los cuartiles del conjunto de datos de vistas. Además, se proporcionan interpretaciones para los cuartiles.
skewness(youtube$views): Calcula el coeficiente de asimetría de los datos de vistas.
kurtosis(youtube$views): Calcula el coeficiente de curtosis de los datos de vistas.
rm(list = ls())
setwd(dirname(rstudioapi::getActiveDocumentContext()$path))
getwd()
## [1] "C:/Users/ricoa/Documents/cuarto ciclo/Estadística Aplicada a la Computación/tarea tema8.2"
youtube <- read.csv("youtube.csv", sep = ",")
head(youtube)
library(ggplot2)
ggplot(youtube, aes(x = views)) +
geom_histogram(binwidth = 500000, fill = "blue", color = "black", alpha = 0.7) +
labs(x = "Número de Vistas", y = "Frecuencia", title = "Distribución de Vistas en YouTube") +
theme_minimal() +
theme(panel.spacing = unit(1, "lines"))
quantile(youtube$views)
## 0% 25% 50% 75% 100%
## 223.0 101538.2 384739.5 1339528.0 424538912.0
Interpretación es 101538.2; El 25% de de visualizaciones es 101538.2
Interpretación es 384739.5; El 50% de de visualizaciones es 384739.5
Interpretación es 1339528.0; El 75% de de visualizaciones es 1339528.0
Interpretación es 424538912.0 ; El 100% de de visualizaciones es 424538912.0
quantile(youtube$views, probs = seq(0, 1, 0.1))
## 0% 10% 20% 30% 40% 50%
## 223.0 23818.9 70755.6 139625.7 239780.2 384739.5
## 60% 70% 80% 90% 100%
## 617371.2 1018146.5 1818481.4 4173844.8 424538912.0
library(fBasics)
skewness(youtube$views)
## [1] 15.21021
## attr(,"method")
## [1] "moment"
Resultado: [1] 15.21021, como el valor es positivo, entonces el valor de los datos es ascimetrica positiva, esto quiere de decir que los valores estan concentrados en los puntos minimos(la mayoria de clientes compra montos pequeños)
hist(youtube$views)
kurtosis(youtube$views)
## [1] 344.5051
## attr(,"method")
## [1] "excess"
Resultado: [1] 344.5051, el valor mayor que 3, por lo tanto, la distribucion de los datos es leptocurtica, quiere decir que los datos estan muy concentrados alrededor de las medidas de endencia central (el apuntamiento es alto)