Se pide desarrollar los siguientes puntos:
1.Cree un conjunto de datos que contenga los nombres de los
productos y los precios
2.Elabore la un Boxplot de los precios y un Wordcloud de los nombre
de productos
3.Adjunte el archivo de salida en (Quarto, Markdown o
flexdasboard)
Carga de datos
url = "https://almacenesmarriott.com/cat/lamparas-decorativas/"
datos.m <- read_html(url)
1.Cree un conjunto de datos que contenga los nombres de los
productos y los precios
datos.m <- read_html(url) %>%
html_nodes('h2')%>%html_nodes('a')
nom.prod<- read_html(url)%>%
html_nodes('div')%>%
html_nodes('.mf-product-details-hover')%>%
html_nodes('h2')%>%
html_nodes('a')%>%
html_text2()
valor <- read_html(url)%>%
html_nodes('div')%>%
html_nodes('.mf-product-details-hover')%>%
html_nodes('span')%>%
html_nodes('bdi')%>%
html_text2()
valor<-valor[-1]
valor<-str_replace(valor,"\\$","")
Datos = data.frame(
articulo=nom.prod,
precio= as.numeric(valor))
2.Elabore la un Boxplot de los precios y un Wordcloud de los nombre
de productos
BLOXPLOT

Los precios se encuentran aproximadamente entre $20 y $220 USD.
La mediana está alrededor de los $50 USD, lo que indica que la mitad
de los productos cuestan menos de $50 y la otra mitad más.
La caja está asimétrica, con la mediana más cerca del primer cuartil
(Q1), lo que sugiere una asimetría positiva (cola hacia la
derecha).
WORDCLOUD
Las palabras que más se repiten son “lmpara” con 11 veces y
“colgant” con 5, el resto tiene menos de 5 repeticiones.