{r} prabowo tweets <- prabowo$full_text %>% as.character() head(tweets)

number of tweet rows after duplicated text removed

{r} nrow(tweets)

hapus url

{r} tweets <- tweets %>% replace_html() %>% replace_url() tweets print original tweet with converted emoji in index

{r} replace_emoji(tweets) print tweet with converted html in index

{r} replace_html(replace_emoji(tweets))

perform the replacement task to whole text variable {r} tweets <- tweets %>% replace_emoji(.) %>% replace_html(.)

print replaced text data on index [4:5] {r} replace_tag(tweets) remove mentions ```{r} tweets <- tweets %>% replace_tag(tweets, pattern = “@([A-Za-z0-9_]+)”,replacement=““) %>% # remove mentions replace_hash(tweets, pattern =”#([A-Za-z0-9_]+)“,replacement=”“) # remove hashtags


strip simbol
```{r}
tweets <- strip(tweets)

menghapus kata penghubung

```{r} tweets<-removeWords(tweets, c(“di”,“dan”,“yang”,“akan”,“agar”,“seperti”,“yaitu”,“kami”,“kami”, “mari”,“pada”,“jelang”,“dimana”,“dengan”,“sudah”,“ini”,“seluruh”, “diminta”,“tak”,“itu”,“hai”,“bisa”,“wib”,“oleh”,“mai”,“jam”, “masa”,“berikut”,“kalau”,“klik”,“ibodwq”,“terd”,“httpstconvv”, “httpstcoxu”,“yzmrlyx”,“tahapan”,“refaabdi”,“kota”,“kpu”,“kpuid”,“rt”,“hingga”,“saat”, “belum”,“apa”,“sih”,“suara”,“pesta”,“dindap”,“http”,“httpstco”,“asn”,“bakal”))


lower case = mengubah huruf kapital menjadi huruf kecil

```{r}
tweets <- tolower(tweets)

Mengembalikan Kata yang disingkat Menjadi Kata Aslinya

{r} tweets <- replace_contraction(tweets) Mengembalikan Kata yang Mengalami Perpanjangan Menjadi Kata Aslinya

```{r} tweets <- replace_word_elongation(tweets)

tweets

Membuat Word Cloud
Mengubah Data Frame Menjadi Data Faktor
```{r}
tdm <- TermDocumentMatrix(tweets)
m <- as.matrix(tdm)
v <- sort(rowSums(m),decreasing = TRUE)

Mengubah Data Faktor Menjadi Data Frame

```{r} d <- data.frame(word = names(v), freq = v)

wordcloud(d\(word, d\)freq, random.order = FALSE, max.words = 500, colors = brewer.pal(name = “Dark2”,8 )) ```

interpretasi berdasarkan hasil output diatas maka dapat kita simpulkan bahwa frekuensi kata paling sering muncul adalah kata “prabowo”dengan jumlah 111, dan kata yang kedua yaitu “pak”.