{r} prabowo tweets <- prabowo$full_text %>% as.character() head(tweets)
number of tweet rows after duplicated text removed
{r} nrow(tweets)
hapus url
{r} tweets <- tweets %>% replace_html() %>% replace_url() tweets
print original tweet with converted emoji in index
{r} replace_emoji(tweets) print tweet with converted
html in index
{r} replace_html(replace_emoji(tweets))
perform the replacement task to whole text variable
{r} tweets <- tweets %>% replace_emoji(.) %>% replace_html(.)
print replaced text data on index [4:5]
{r} replace_tag(tweets) remove mentions ```{r} tweets <-
tweets %>% replace_tag(tweets, pattern =
“@([A-Za-z0-9_]+)”,replacement=““) %>% # remove mentions
replace_hash(tweets, pattern =”#([A-Za-z0-9_]+)“,replacement=”“) #
remove hashtags
strip simbol
```{r}
tweets <- strip(tweets)
menghapus kata penghubung
```{r} tweets<-removeWords(tweets, c(“di”,“dan”,“yang”,“akan”,“agar”,“seperti”,“yaitu”,“kami”,“kami”, “mari”,“pada”,“jelang”,“dimana”,“dengan”,“sudah”,“ini”,“seluruh”, “diminta”,“tak”,“itu”,“hai”,“bisa”,“wib”,“oleh”,“mai”,“jam”, “masa”,“berikut”,“kalau”,“klik”,“ibodwq”,“terd”,“httpstconvv”, “httpstcoxu”,“yzmrlyx”,“tahapan”,“refaabdi”,“kota”,“kpu”,“kpuid”,“rt”,“hingga”,“saat”, “belum”,“apa”,“sih”,“suara”,“pesta”,“dindap”,“http”,“httpstco”,“asn”,“bakal”))
lower case = mengubah huruf kapital menjadi huruf kecil
```{r}
tweets <- tolower(tweets)
Mengembalikan Kata yang disingkat Menjadi Kata Aslinya
{r} tweets <- replace_contraction(tweets)
Mengembalikan Kata yang Mengalami Perpanjangan Menjadi Kata Aslinya
```{r} tweets <- replace_word_elongation(tweets)
tweets
Membuat Word Cloud
Mengubah Data Frame Menjadi Data Faktor
```{r}
tdm <- TermDocumentMatrix(tweets)
m <- as.matrix(tdm)
v <- sort(rowSums(m),decreasing = TRUE)
Mengubah Data Faktor Menjadi Data Frame
```{r} d <- data.frame(word = names(v), freq = v)
wordcloud(d\(word, d\)freq, random.order = FALSE, max.words = 500, colors = brewer.pal(name = “Dark2”,8 )) ```
interpretasi berdasarkan hasil output diatas maka dapat kita simpulkan bahwa frekuensi kata paling sering muncul adalah kata “prabowo”dengan jumlah 111, dan kata yang kedua yaitu “pak”.