Clustering Analysis, atau Analisis Pengelompokan, adalah teknik dalam bidang statistika dan mesin pembelajaran yang bertujuan untuk mengelompokkan atau mengidentifikasi pola dalam data. Tujuan utamanya adalah mengumpulkan objek-objek serupa ke dalam kelompok atau klaster, sehingga objek dalam satu klaster memiliki kesamaan yang tinggi antara satu sama lain
Sedangkan Clustering data tweet dapat membantu mengidentifikasi topik atau tren tertentu dalam percakapan online, mengelompokkan tweet berdasarkan sentimen, atau bahkan menemukan kelompok-kelompok yang mungkin tidak terduga dalam data tweet.
Langkah pertama yang dilakukan adalah menginstal dan memuat beberapa Packages atau Library yang diperlukan. Data yang digunakan adalah data tweet tentang kasus pembunuhan.
wordcloud:Untuk membuat visualisasi word cloud yang menampilkan kata-kata dengan ukuran proporsional terhadap frekuensinya dalam teks. Berguna dalam memberikan gambaran umum tentang kata-kata yang paling sering muncul.
tm : Digunakan untuk membuat Term-Document Matrix (TDM) yang dapat digunakan sebagai input untuk analisis clustering. Paket ini menyediakan fungsi-fungsi untuk pra-pemrosesan teks.
textclean : Memberikan fungsi-fungsi untuk membersihkan dan memproses teks dengan efektif. Langkah pra-pemrosesan teks seperti mengubah huruf menjadi huruf kecil, mengembalikan kata singkatan, dan lainnya dapat membantu dalam meningkatkan kualitas analisis clustering.
tidytext : analisis teks yang bersih dan terstruktur menggunakan konsep rapi data. Berguna untuk mengorganisir teks data dalam format yang mudah digunakan untuk analisis clustering.
dplyr : untuk melakukan manipulasi dan transformasi data dengan sintaks yang mudah dipahami.
tidyverse : Dirancang untuk membuat analisis data menggunakan R menjadi lebih mudah, konsisten, dan efisien. Ini mencakup berbagai paket seperti ggplot2 untuk visualisasi, dplyr untuk manipulasi data, rapir untuk keperluan kebersihan data, dan banyak lagi.
stringr : untuk memanipulasi teks, mencocokkan pola string, dan mengelola teks dalam konteks pengolahan data.
# Install dan load paket-paket yang diperlukan
library(dplyr)
library(stringr)
library(tm)
library(textclean)
library(tidyverse)
library(wordcloud)
library(tidytext)
library(readr)
Pembunuhan <- read_csv("C:/Users/LENOVO/Downloads/Pembunuhan.csv")
tweet <- Pembunuhan$full_text
# Menghapus URL dan bentuk symbol Emotion
tweet_text <- str_replace_all(tweet, "http\\S+|www\\S+|https\\S+ [^[:graph:][:space:]]", "")
# Contoh menghapus karakter yang tidak dikenali
data_clean <- gsub("[^A-Z a-z]", "", tweet_text)
# lower case = mengubah huruf kapital menjadi huruf kecil
rev <- tolower(data_clean)
#Mengembalikan Kata yang disingkat Menjadi Kata Aslinya
rev <- replace_contraction(rev)
#Mengembalikan Kata yang Mengalami Perpanjangan Menjadi Kata Aslinya
rev <- replace_word_elongation(rev)
#Menghapus simbol
rev <- strip(rev)
#tokenisasi = metode untuk melakukan pemisahan kata dalam suatu kalimat.
rev <- rev %>%
rev()
head(rev)
## [1] "mpraldo pelaku provokasi secara umum menyerukan pembunuhan terhadap warga negara indonesia termasuk yang berada di jakarta ini mengindikasikan kebencian terhadap indonesia yang sangat mendalam patut diduga pelaku bukan saja simpatisan namun juga orang yang terafiliasi oleh kelompok"
## [2] "pembunuhan"
## [3] "kasus salah tangkap lain menimpa seorang buruh pabrik ia dituduh bersekongkol melakukan pembunuhan amp disiksa utk menandatangani bap ats kasus yg tak dilakukan saat bebas pun ia tdk mendpt ganti rugi yg sebanding dgn kerugian yg telah dialaminya nantikan kisah selengkapnya"
## [4] "cipikacipiki dubes uni emirat arab uea dan dubes rezim israel pembunuh anakanak palestina di pbb sangat memalukan dimana saudara arabmu dibantai kau malah bermesraan dengan pembunuhan saudara arabmu"
## [5] "ini bukan kes bunuh diri ini kes pembunuhan kogoro mouris voice adambukanadam"
## [6] "soal matmin ini latihan apa pembunuhan pak"
#menghapus kata beberapa kata yang tidak penting
rev <-removeWords(rev, c( "kontenberfaedah", "melihat","gencatan","sendangguwo"
,"genosida", "tidak","x","aljazeera","ke","p","l","stin"
,"atas","kami","spmr","netanyahu","syuhada","tapi","gz",
"bagi", "hati", "israel", "kemana", "massal","almh",
"orang", "saudi", "wahai","zionis", "dari", "fitnah",
"kejam", "lebih", "aja", "berencana", "ga", "kerja",
"kuat","poin", "nya", "pemimpin", "yg", "mah", "ada",
"banget", "kredivo", "rame", "rumah","sampe", "udah",
"viral", "video", "dah", "gue", "namanya", "dalam",
"awam","beramairamai", "bom", "dan","i", "mw", "dia",
"seorang", "mereka", "wowo", "jatanras", "sumsel",
"almabhouh", "mahmoud","sprm","islam", "mossad","arah",
"rakaman","melakukan","roket","full","rndlstvns",
"posisicerdas","pembunuhanknp","ga","kaharman",
"howtodresvvell","klo","amp","gaza","palestina",
"httpstco","ini","ketika","kalau","juga","yang",
"zpuzvzgt","ato","listyosigitp","sih","tuhnov","nov",
"tuh","tau","akan","pak","bone","tetty","sseorang",
"hannibal","batuaji","via","rumondang","ganjarpranowo",
"kalo","lain","gitu","palestin","sama","baru","di","oleh"
,"bisa","jadi","tak","yang","itu","adalah","untuk"
,"karena","siri","jika","telah","dilakukan","pada","saat"
,"para","apa","kayak","pers","dengan","terhadap","hamas"
,"hal","dgn","sirul","bahwa","kes","mpraldo "
,"cipikacipiki dubes uni emirat arab uea dubes rezim
pembunuh anakanak","mendpt","kogoro mouris
voice adambukanadam","utk","matmin"))
head(rev)
## [1] "pelaku provokasi secara umum menyerukan pembunuhan warga negara indonesia termasuk berada jakarta mengindikasikan kebencian indonesia sangat mendalam patut diduga pelaku bukan saja simpatisan namun terafiliasi kelompok"
## [2] "pembunuhan"
## [3] "kasus salah tangkap menimpa buruh pabrik ia dituduh bersekongkol pembunuhan disiksa menandatangani bap ats kasus bebas pun ia tdk ganti rugi sebanding kerugian dialaminya nantikan kisah selengkapnya"
## [4] "cipikacipiki dubes uni emirat arab uea dubes rezim pembunuh anakanak pbb sangat memalukan dimana saudara arabmu dibantai kau malah bermesraan pembunuhan saudara arabmu"
## [5] " bukan bunuh diri pembunuhan kogoro mouris voice adambukanadam"
## [6] "soal latihan pembunuhan "
##Membuat Word Cloud
#Mengubah Data Frame Menjadi Data Faktor
tdm <- TermDocumentMatrix(rev)
m <- as.matrix(tdm)
v <- sort(rowSums(m),decreasing = TRUE)
d <- data.frame(word = names(v), freq = v)
wordcloud(d$word, d$freq,
random.order = FALSE,
max.words = 25,
colors = brewer.pal(name = "Dark2",8 ))
# inspect frequent words
freq.terms <- findFreqTerms(tdm, lowfreq = 1)
term.freq <- rowSums(as.matrix(tdm))
term.freq <- subset(term.freq, term.freq >10 )
df <- data.frame(term = names(term.freq), freq = term.freq)
ggplot(df, aes(x = term, y = freq)) + geom_bar(stat = "identity") +
xlab("Terms") + ylab("Count") + coord_flip()
Dapat dilihat bahwa frekuensi kata terbanyak adalah kata “pembunuhan” lebih dari 100 kali muncul dalam variabel full_text, kemudian kata “warga” muncul sebanyak kurang lebih 10 kali, dan kata “anak” muncul lebih sedikit dibandingkan kata “warga” dan “pembunuhan”.
# which words are associated with 'r'?
findAssocs(tdm, "Pembunuhan", 0.2)
## $Pembunuhan
## numeric(0)
Karena asosiasi kata pembunuhan adalah 0, maka kita dapat menyimpulkan bahwa kemunculan atau keberadaan kata pembunuhan tidak memberikan indikasi atau prediksi apapun tentang kemungkinan munculnya kata lainnya
# remove sparse terms
tdm2 <- removeSparseTerms(tdm, sparse = 0.95)
m2 <- as.matrix(tdm2)
# cluster terms (Analisis cluster pada kata)
distMatrix <- dist(scale(m2))
fit <- hclust(distMatrix, method = "ward.D")
plot(fit)
rect.hclust(fit, k=2) # cut tree into 2 clusters
m3 <- t(m2) # transpose the matrix to cluster documents (tweets)
set.seed(122) # set a fixed random seed
k <- 2 # number of clusters
kmeansResult <- kmeans(m3, k)
round(kmeansResult$centers, digits = 3) # cluster centers
## pembunuhan warga rakyat sipil anak perang senjata
## 1 1.000 0.000 0.000 0.000 3.000 0.000 0.500
## 2 1.031 0.122 0.092 0.082 0.051 0.071 0.051
for (i in 1:k) {
cat(paste("cluster ", i, ": ", sep = ""))
s <- sort(kmeansResult$centers[i, ], decreasing = TRUE)
cat(names(s)[1:5], "\n")
# print the tweets of every cluster
# print(tweets[which(kmeansResult£cluster==i)])
}
## cluster 1: anak pembunuhan senjata warga rakyat
## cluster 2: pembunuhan warga rakyat sipil perang
Dari hasi Clustering, kelompok kata untuk kelas pertama yaitu “anak”, “pembunuhan”, “senjata”, “warga”, “rakyat”. Sedangkan kelompok kata yang masuk kedalam kelas kedua yaitu “pembunuhan”, “warga”, “rakyat”, “sipil”, “perang”. Yang Dimana kata “Pembunuhan”, “anak,”rakyat” masing-masing masuk ke dalam kelas pertama dan kedua.
#Menyimpan file baru data tweets yang telah dibersihkan.
write.csv(rev, file = "C:/Users/LENOVO/Downloads/Dtb.csv", row.names = FALSE)
##Analisis Sentiment
setwd("C:/Users/LENOVO/Downloads")
# import data dari excel (.csv)
datasentiment <- read_delim("C:/Users/LENOVO/Downloads/UAS Kompstat.csv",
delim = ";", escape_double = FALSE, trim_ws = TRUE)
# Buat DataFrame untuk komentar positif
komentar_positif <- datasentiment %>%
filter(Sentiment == "POSITIVE")
komentar_positif <-komentar_positif$full_text
head(komentar_positif)
## [1] "pelaku provokasi secara umum menyerukan pembunuhan warga negara indonesia termasuk berada jakarta mengindikasikan kebencian indonesia sangat mendalam patut diduga pelaku bukan saja simpatisan namun terafiliasi kelompok"
## [2] "pengakuan tahan perlakuan tentara tahanan pemukulan pemerkosaan pelecehan seksual bahkan pembunuhan sebuah kesaksian tahanan dibebaskan dari penjara"
## [3] "elon jangan bodoh solusinya bukanlah membunuh pembunuhan berujung pembunuhan berikutnya begitu seterusnya looping solusinya seperti disebut survivor holokaus kembalikan tanah hiduplah berdampingan damai"
## [4] "tragedi pembunuhan polisi bertindak jangan sampai umat marah"
## [5] "membunuh rakyat sipil pembunuhan rakyat sipil memang dibenarkan namun tentara banyak membunuh sipil bersenjata banyak kejahatan perang"
## [6] "alhamdulillah relawan kemanusiaan asal indonesia selamat dari pembunuhan tentara israel"
head()#Mengubah Data Frame Menjadi Data Faktor
tdm_pos <- TermDocumentMatrix(komentar_positif)
m_pos <- as.matrix(tdm_pos)
v_pos <- sort(rowSums(m_pos),decreasing = TRUE)
head(v_pos)
## pembunuhan membunuh sipil berhasil turki anak
## 17 4 4 4 4 4
#Mengubah Data Faktor Menjadi Data Frame
d_pos <- data.frame(word = names(v_pos), freq = v_pos)
head(d_pos)
## word freq
## pembunuhan pembunuhan 17
## membunuh membunuh 4
## sipil sipil 4
## berhasil berhasil 4
## turki turki 4
## anak anak 4
wordcloud(d_pos$word, d_pos$freq,
random.order = FALSE,
max.words = 500,
colors = brewer.pal(name = "Dark2",8 ))
Dari hasil wordcloud untuk kata yang termasuk dalam komentar positif terkait dengan kata pembunuhan yaitu, pembunuhan, tentara, membunuh, anak, secara, sipil, indonesia, turki, agen, negara, namun, berhasil, namun, secara dan lain-lain dapat dilihat jelas dari tampilan wordcloud.
# Buat DataFrame hanya untuk komentar negatif
komentar_negatif <- datasentiment %>%
filter(Sentiment == "NEGATIVE")
komentar_negatif<-komentar_negatif$full_text
head(komentar_negatif)
## [1] "cipikacipiki dubes uni emirat arab rezim pembunuh anak anak pbb sangat memalukan dimana saudara arabmu dibantai kau malah bermesraan pembunuhan saudara arabmu"
## [2] "saya bukan christian mau apapun agama gak beradab kaya gini tempat ibadah tolol mau izin atau belum tetep bikin respect mana banyak adegan pembunuhan jadi terkesan membunuh boleh segampang"
## [3] "gak mungkin ormas berani pembunuhan secara terang terangan tanpa beking keparat dibelakangnya"
## [4] "liat trailer ikatan sinting ya allah elsa nasib lo nikah sama devan eh pas duduk pelaminan diputer pas reka adegan pas pembunuhan roy nino alhasil eyang lebas marah besar sama devan kmu nikahi pembunuh astaga"
## [5] "adegan pembunuhan anak anak pelajar melanggar semua norma konvensi rezim terlaknat"
## [6] "pembunuhan rakyat berbagai senjata digunakan membunuh rakyat ledakan besar sampai menggunakan bahan kimia perbuatan sangat terkutuk free palestine"
#Mengubah Data Frame Menjadi Data Faktor
tdm_neg <- TermDocumentMatrix(komentar_negatif)
m_neg <- as.matrix(tdm_neg)
v_neg <- sort(rowSums(m_neg),decreasing = TRUE)
head(v_neg)
## pembunuhan anak senjata adegan pas mati
## 10 4 4 3 3 3
#Mengubah Data Faktor Menjadi Data Frame
d_neg <- data.frame(word = names(v_neg), freq = v_neg)
head(d_neg)
## word freq
## pembunuhan pembunuhan 10
## anak anak 4
## senjata senjata 4
## adegan adegan 3
## pas pas 3
## mati mati 3
wordcloud(d_neg$word, d_neg$freq,
random.order = FALSE,
max.words = 500,
colors = brewer.pal(name = "Dark2",8 ))
Dari hasil wordcloud negative, kata paling banyak berkaitan dengan pembunuhan pada data tweet “pembunuhan” yaitu, pembunuhan, anak, mati, senjata, pas, adegan.
# Buat DataFrame hanya untuk komentar Neutral
komentar_neutral <- datasentiment %>%
filter(Sentiment == "NEUTRAL")
komentar_neutral<-komentar_neutral$full_text
head(komentar_neutral)
## [1] "pembunuhan"
## [2] "kasus salah tangkap menimpa buruh pabrik ia dituduh bersekongkol pembunuhan disiksa menandatangani bap ats kasus bebas pun ia tidak ganti rugi sebanding kerugian dialaminya nantikan kisah selengkapnya"
## [3] "bukan bunuh diri pembunuhan kogoro mouris voice adam"
## [4] "tersangka perlawanan petugas pengembangan lokasi tasikmalaya pembunuhan perempuan"
## [5] "nanyain kenapa sekarang inget novel terancam pembunuhan disiram air keras gaes"
## [6] "aktifis ham papua pura buta pentanderaan pilot susi air pembunuhan pekerja puskesmas kstp heran kenapa bungkam pelakunya tp aparat pelakunya sonrak bilang pelanggaran ham hellawemang boleh kstp sekjm warga sipil"
#Mengubah Data Frame Menjadi Data Faktor
tdm_neutral <- TermDocumentMatrix(komentar_neutral)
tdm_neutral
## <<TermDocumentMatrix (terms: 220, documents: 18)>>
## Non-/sparse entries: 260/3700
## Sparsity : 93%
## Maximal term length: 15
## Weighting : term frequency (tf)
m_neutral <- as.matrix(tdm_neutral)
v_neutral <- sort(rowSums(m_neutral),decreasing = TRUE)
head(v_neutral)
## pembunuhan warga kasus ham pekerja kkb
## 20 6 3 3 3 3
#Mengubah Data Faktor Menjadi Data Frame
d_neutral <- data.frame(word = names(v_neutral), freq = v_neutral)
head(d_neutral)
## word freq
## pembunuhan pembunuhan 20
## warga warga 6
## kasus kasus 3
## ham ham 3
## pekerja pekerja 3
## kkb kkb 3
wordcloud(d_neutral$word, d_neutral$freq,
random.order = FALSE,
max.words = 500,
colors = brewer.pal(name = "Dark2",8 ))
Untuk komentar netral pada data tweet “pembunuhan”, yaitu Pembunuhan, kkb, warga, kasus, kstp, ham dan pekerja.
#Menginstall Paket "Caret" dan "Matrix"
# set nilai random generator
set.seed(1234)
library(caret)
library(Matrix)
# membagi data 80% training, 20% testing
bg <- createDataPartition(datasentiment$Sentiment, p = 0.8, list=FALSE)
training<- datasentiment[bg,]
testing<- datasentiment[-bg,]
# cross-validasi 5 lipat
ctrl <- trainControl(method = "cv", number = 5, classProbs = TRUE)
head(ctrl)
## $method
## [1] "cv"
##
## $number
## [1] 5
##
## $repeats
## [1] NA
##
## $search
## [1] "grid"
##
## $p
## [1] 0.75
##
## $initialWindow
## NULL
# Menginstall paket "e1071"
library(e1071)
#KLASIFIKASI NAIVE BAYES
naive<-naiveBayes(Sentiment~.,data = training)
head(naive)
## $apriori
## Y
## NEGATIVE NEUTRAL POSITIVE
## 8 15 12
##
## $tables
## $tables$full_text
## full_text
## Y adegan pembunuhan anak anak pelajar melanggar semua norma konvensi rezim terlaknat
## NEGATIVE 0.12500000
## NEUTRAL 0.00000000
## POSITIVE 0.00000000
## full_text
## Y adegan penyelamatan anak perempuan setelah dibom api sebelum senjata berlaku pembunuhan dengan cara dibakar metode nazi biadab anak angkat bicara
## NEGATIVE 0.00000000
## NEUTRAL 0.00000000
## POSITIVE 0.08333333
## full_text
## Y aktifis ham papua pura buta pentanderaan pilot susi air pembunuhan pekerja puskesmas kstp heran kenapa bungkam pelakunya tp aparat pelakunya sonrak bilang pelanggaran ham hellawemang boleh kstp sekjm warga sipil
## NEGATIVE 0.00000000
## NEUTRAL 0.06666667
## POSITIVE 0.00000000
## full_text
## Y alhamdulillah relawan kemanusiaan asal indonesia selamat dari pembunuhan tentara israel
## NEGATIVE 0.00000000
## NEUTRAL 0.00000000
## POSITIVE 0.08333333
## full_text
## Y ancaman pembunuhan terhadap aiman witjaksono makin serius tidak main kasus dialami banyak pendukung timses ganjar mahfud lawan neoorba lawan
## NEGATIVE 0.00000000
## NEUTRAL 0.06666667
## POSITIVE 0.00000000
## full_text
## Y asalamuaalaikum salam jumaat ternyata negara negara arab seharusnya bertanggung jawab keatas kemusnahan palastine hanya kekejaman kemusnahan pembunuhan umat disana cukup sekadar berbuat wasalam irwan fahmi ideris pm dec
## NEGATIVE 0.00000000
## NEUTRAL 0.00000000
## POSITIVE 0.08333333
## full_text
## Y babinsa serda tri setyo melaksanakan pendampingan rekontruksi kdrt sertai pembunuhan
## NEGATIVE 0.00000000
## NEUTRAL 0.06666667
## POSITIVE 0.00000000
## full_text
## Y badan intelijen nasional turki berhasil menyelamatkan hacker upaya pembunuhan agen dinas rahasia turki malaysia pemuda cerdas berhasil membobol sistem iron dome milik
## NEGATIVE 0.00000000
## NEUTRAL 0.00000000
## POSITIVE 0.08333333
## full_text
## Y banyak bukti terbantahkan covid bencana pembunuhan demi keuntungan perang senjata biologis kimia mengurangi populasi umat manusia pencurian dna penipuan finansial global demi menciptakan tatanan dunia nwo
## NEGATIVE 0.12500000
## NEUTRAL 0.00000000
## POSITIVE 0.00000000
## full_text
## Y benar benar menentang dunia menyaksikan pembunuhan warga politisi nigeria najia najaatu bala mohammad menekankan warga pemilik tanah harus bebas
## NEGATIVE 0.00000000
## NEUTRAL 0.06666667
## POSITIVE 0.00000000
## full_text
## Y bukan bunuh diri pembunuhan kogoro mouris voice adam
## NEGATIVE 0.00000000
## NEUTRAL 0.06666667
## POSITIVE 0.00000000
## full_text
## Y cipikacipiki dubes uni emirat arab rezim pembunuh anak anak pbb sangat memalukan dimana saudara arabmu dibantai kau malah bermesraan pembunuhan saudara arabmu
## NEGATIVE 0.12500000
## NEUTRAL 0.00000000
## POSITIVE 0.00000000
## full_text
## Y elon kegembiraan teroris membunuh warga sipil berdosa sangat meresahkan protes besaran hampir setiap kota mendukung kita harus menghentikan propaganda meyakinkan pembunuhan
## NEGATIVE 0.00000000
## NEUTRAL 0.00000000
## POSITIVE 0.08333333
## full_text
## Y elon jangan bodoh solusinya bukanlah membunuh pembunuhan berujung pembunuhan berikutnya begitu seterusnya looping solusinya seperti disebut survivor holokaus kembalikan tanah hiduplah berdampingan damai
## NEGATIVE 0.00000000
## NEUTRAL 0.00000000
## POSITIVE 0.08333333
## full_text
## Y innalillahi pembunuhan rip qullbet all prayers goes out for him and his family
## NEGATIVE 0.00000000
## NEUTRAL 0.00000000
## POSITIVE 0.08333333
## full_text
## Y kasus kasus pembunuhan pejuang lingkungan harapannya penegakan keadilan seadil adilnya salah satunya investigasi mendalam mengejar intelectual dadercriminal mind dalang tindak pidana pembunuhan tersebut
## NEGATIVE 0.00000000
## NEUTRAL 0.00000000
## POSITIVE 0.08333333
## full_text
## Y kasus salah tangkap menimpa buruh pabrik ia dituduh bersekongkol pembunuhan disiksa menandatangani bap ats kasus bebas pun ia tidak ganti rugi sebanding kerugian dialaminya nantikan kisah selengkapnya
## NEGATIVE 0.00000000
## NEUTRAL 0.06666667
## POSITIVE 0.00000000
## full_text
## Y khutbah jumaat akhir zaman banyak berlakunya pembunuhan
## NEGATIVE 0.00000000
## NEUTRAL 0.06666667
## POSITIVE 0.00000000
## full_text
## Y liat trailer ikatan sinting ya allah elsa nasib lo nikah sama devan eh pas duduk pelaminan diputer pas reka adegan pas pembunuhan roy nino alhasil eyang lebas marah besar sama devan kmu nikahi pembunuh astaga
## NEGATIVE 0.12500000
## NEUTRAL 0.00000000
## POSITIVE 0.00000000
## full_text
## Y membunuh rakyat sipil pembunuhan rakyat sipil memang dibenarkan namun tentara banyak membunuh sipil bersenjata banyak kejahatan perang
## NEGATIVE 0.00000000
## NEUTRAL 0.00000000
## POSITIVE 0.08333333
## full_text
## Y menyetrum memukuli meludahi mengancam saya pemerkosaan pembunuhan hanadi alhalawani murabithah masjidil aqsha menceritakan kpd alqudsalbawsala rincian penganiayaan terhadap dirinya dan tahanan wanita lainnya
## NEGATIVE 0.00000000
## NEUTRAL 0.06666667
## POSITIVE 0.00000000
## full_text
## Y nanyain kenapa sekarang inget novel terancam pembunuhan disiram air keras gaes
## NEGATIVE 0.00000000
## NEUTRAL 0.06666667
## POSITIVE 0.00000000
## full_text
## Y pelaku provokasi secara umum menyerukan pembunuhan warga negara indonesia termasuk berada jakarta mengindikasikan kebencian indonesia sangat mendalam patut diduga pelaku bukan saja simpatisan namun terafiliasi kelompok
## NEGATIVE 0.00000000
## NEUTRAL 0.00000000
## POSITIVE 0.08333333
## full_text
## Y pembunuhan rakyat berbagai senjata digunakan membunuh rakyat ledakan besar sampai menggunakan bahan kimia perbuatan sangat terkutuk free palestine
## NEGATIVE 0.12500000
## NEUTRAL 0.00000000
## POSITIVE 0.00000000
## full_text
## Y pembunuhan extrim pencabulan penganiayaan pembunuhan anak bawah umur pelaku pembunuhan ferry ardiansyah atin nuraeni elmiah basar ayitarodin muawanah amsori jamal anggota kepolisiaan wawanajuninilah pelaku kejahatan di jabodetabek
## NEGATIVE 0.00000000
## NEUTRAL 0.06666667
## POSITIVE 0.00000000
## full_text
## Y pembunuhan remaja mati ditembak sniper idf tempoh senjata laknat allah israhell
## NEGATIVE 0.12500000
## NEUTRAL 0.00000000
## POSITIVE 0.00000000
## full_text
## Y pengakuan tahan perlakuan tentara tahanan pemukulan pemerkosaan pelecehan seksual bahkan pembunuhan sebuah kesaksian tahanan dibebaskan dari penjara
## NEGATIVE 0.00000000
## NEUTRAL 0.00000000
## POSITIVE 0.08333333
## full_text
## Y pernyataan resmi memanggil jurnalis lembaga media mengunjungi jalur secara intensif menelaah tingkat kehancuran ciri ciri perang penjajah tentara nzi warga pembantaian pembunuhan
## NEGATIVE 0.00000000
## NEUTRAL 0.06666667
## POSITIVE 0.00000000
## full_text
## Y saya bukan christian mau apapun agama gak beradab kaya gini tempat ibadah tolol mau izin atau belum tetep bikin respect mana banyak adegan pembunuhan jadi terkesan membunuh boleh segampang
## NEGATIVE 0.12500000
## NEUTRAL 0.00000000
## POSITIVE 0.00000000
## full_text
## Y terjadi seseorang tentara memutuskan pembunuhan anak tersebut bukanlah sebuah masalah besar sehingga tersebut wajar
## NEGATIVE 0.00000000
## NEUTRAL 0.06666667
## POSITIVE 0.00000000
## full_text
## Y terjadi pembunuhan
## NEGATIVE 0.00000000
## NEUTRAL 0.06666667
## POSITIVE 0.00000000
## full_text
## Y tersangka perlawanan petugas pengembangan lokasi tasikmalaya pembunuhan perempuan
## NEGATIVE 0.00000000
## NEUTRAL 0.06666667
## POSITIVE 0.00000000
## full_text
## Y tiga org pekerja bangunan puskesmas tewas diserang kkb distrik beoga barat kab puncak motif pembunuhan diduga krn pekerja menolak memberi uang kepada kkb bukti pelanggaran ham kkb papua
## NEGATIVE 0.00000000
## NEUTRAL 0.06666667
## POSITIVE 0.00000000
## full_text
## Y tragedi pembunuhan polisi bertindak jangan sampai umat marah
## NEGATIVE 0.00000000
## NEUTRAL 0.00000000
## POSITIVE 0.08333333
## full_text
## Y tuntutan hukuman mati berhentikan keanggotaan tni pelaku penculikan pembunuhan pemuda aceh imam mansykur km harusnya hukum mati semua pelakunya
## NEGATIVE 0.12500000
## NEUTRAL 0.00000000
## POSITIVE 0.00000000
##
##
## $levels
## [1] "NEGATIVE" "NEUTRAL" "POSITIVE"
##
## $isnumeric
## full_text
## FALSE
##
## $call
## naiveBayes.default(x = X, y = Y, laplace = laplace)
#Melakukan Prediksi Menggunakan Data Testing
prediksi<-predict(naive,testing)
hasil_pred<-confusionMatrix(table(prediksi,testing$Sentiment))
hasil_pred
## Confusion Matrix and Statistics
##
##
## prediksi NEGATIVE NEUTRAL POSITIVE
## NEGATIVE 0 0 0
## NEUTRAL 2 3 3
## POSITIVE 0 0 0
##
## Overall Statistics
##
## Accuracy : 0.375
## 95% CI : (0.0852, 0.7551)
## No Information Rate : 0.375
## P-Value [Acc > NIR] : 0.6303
##
## Kappa : 0
##
## Mcnemar's Test P-Value : NA
##
## Statistics by Class:
##
## Class: NEGATIVE Class: NEUTRAL Class: POSITIVE
## Sensitivity 0.00 1.000 0.000
## Specificity 1.00 0.000 1.000
## Pos Pred Value NaN 0.375 NaN
## Neg Pred Value 0.75 NaN 0.625
## Prevalence 0.25 0.375 0.375
## Detection Rate 0.00 0.375 0.000
## Detection Prevalence 0.00 1.000 0.000
## Balanced Accuracy 0.50 0.500 0.500