didapatkan bahwa skor korelasi mendekati +1, yang mana kita dapat menyimpulkan bahwa pendidikan dan pengalaman memiliki hubungan yang sangat kuat satu sama lain. Adapun kesimpulan seseorang yang pendidikan yang lebiih tinggi maka pengalaman akan cendrung tinggi.
# Load library yang diperlukanlibrary(ggplot2)library(reshape2)# Load library yang diperlukanset.seed(345)# Membuat dataset dengan 100 observasisosial_data <-data.frame(pendidikan =sample(8:20, 100, replace =TRUE),pengalaman =sample(1:30, 100, replace =TRUE),jam_kerja_per_minggu =sample(30:60, 100, replace =TRUE),jumlah_anak =sample(0:5, 100, replace =TRUE),usia =sample(22:60, 100, replace =TRUE),status_pernikahan =sample(0:1, 100, replace =TRUE),lokasi_kota =sample(0:1, 100, replace =TRUE),industri =sample(0:1, 100, replace =TRUE),pelatihan_profesional =sample(0:1, 100, replace =TRUE),keterampilan_teknis =sample(0:1, 100, replace =TRUE))# Menghitung matriks korelasicor_matrix <-cor(sosial_data)# Mengubah matriks korelasi menjadi format yang dapat digunakan di ggplot2cor_melted <-melt(cor_matrix)# Membuat heatmap dengan angka korelasiggplot(data = cor_melted, aes(Var1, Var2, fill = value)) +geom_tile() +geom_text(aes(label =round(value, 2)), color ="black", size =5) +# Menampilkan angka korelasiscale_fill_gradient2(low ="blue", high ="red", mid ="white",midpoint =0, limit =c(-1, 1), space ="Lab",name="Korelasi") +theme_minimal() +theme(axis.text.x =element_text(angle =45, vjust =1,size =12, hjust =1)) +labs(title ="Heatmap Korelasi Sosial", x ="", y ="")
Call:
lm(formula = pendidikan ~ pengalaman, data = sosial_data)
Residuals:
Min 1Q Median 3Q Max
-7.2988 -3.4807 -0.0291 3.6308 7.1498
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 15.57081 0.86952 17.907 <2e-16 ***
pengalaman -0.09069 0.04594 -1.974 0.0512 .
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 3.935 on 98 degrees of freedom
Multiple R-squared: 0.03825, Adjusted R-squared: 0.02844
F-statistic: 3.898 on 1 and 98 DF, p-value: 0.05117
Persamaan Regresi
y = 15.57081-0.09069x
Dalam hasil regresi linier sederhana antara tingkat pendidikan dan pengalaman ada beberapa hal yang perlu diperhatikan. Pertama, koefisien regresi menunjukkan bahwa setiap peningkatan satu tahun pendidikan menurunkan pengalaman rata-rata sebesar -0,09069 tahun. Namun, p-value dari variabel pengalaman adalah 0.05117 hampir sama dari 0.05 ini berarti dapat disimpulkan pendidikan secara signifikan mempengaruhi pengalaman dalam model ini. Selain itu, nilai R-squared sebesar 0.03825 menunjukkan bahwa hanya 3,4% variasi dalam pengalaman yang dapat dijelaskan oleh pendidikan. Signifikan code menunjukan hasil model yang signifikan antar pendidikan dan pengalaman 0,1 %, signifikan, 0,01% signifikan, 5% signifikan. Model ini menjelaskan dengan baik hubungan antara pendidikan dan pengalaman.
Degree of Freedom atau df dalam regresi dihitung berdasarkan rumus:
df=n−k−1
dimana n adalah jumlah observasidan k adalah jumlah variabel independen.
Berdasarkan grafik regresi linier sederhana ini, terdapat hubungan negatif antara tingkat pengalaman (sumbu X) dan pendidikan (sumbu Y). Garis regresi berwarna biru menunjukkan tren yang menunjukkan bahwa semakin rendah pengalaman seseorang, semakin tinggi pendidikan. Namun, dari penyebaran titik data (scatter plot), terlihat bahwa hubungan ini cukup lemah karena titik-titik tidak terlalu dekat dengan garis regresi.
Analisis Regresi Linier Berganda
model2 <-lm(pendidikan~usia+pengalaman, data = sosial_data)summary(model2)
Call:
lm(formula = pendidikan ~ usia + pengalaman, data = sosial_data)
Residuals:
Min 1Q Median 3Q Max
-7.3235 -3.4167 -0.0873 3.6697 7.1686
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 15.391382 1.739995 8.846 4.16e-14 ***
usia 0.004237 0.035531 0.119 0.9053
pengalaman -0.090418 0.046223 -1.956 0.0533 .
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 3.955 on 97 degrees of freedom
Multiple R-squared: 0.03839, Adjusted R-squared: 0.01857
F-statistic: 1.936 on 2 and 97 DF, p-value: 0.1498
Berdasarkan hasil regresi linier berganda antara pendidikan, usia dan pengalaman, terdapat beberapa hal yang perlu diperhatikan:
Koefisien regresi:
Intercept = 15.391382, yang berarti jika seseorang dengan atau tidak memiliki usia dan pengalaman kerja (nilai 0), maka pendapatan awal yang diprediksi adalah sekitar 15.391382 USD.
Usia memiliki koefisien 0.004327, artinya setiap tambahan 1 tahun usia, pendapatan bertambah sekitar 0.00437 USD, tetapi signifikan (p-value = 0.9053).
Pengalaman kerja memiliki koefisien -0.090418, yang berarti setiap tambahan 1 tahun pengalaman kerja, pendidikan bertambah sekitar –0.090418 tahun, tetapi juga tidak signifikan (p-value = 0.533).
Signifikansi statistik:
p-value untuk usia (0.9053) dan pengalaman (0.533) lebih besar dari 0.05, yang berarti tidak ada bukti cukup kuat bahwa kedua variabel ini berpengaruh secara signifikan terhadap pendidikan dalam model ini.
F-statistic p-value (0.1498) juga menunjukkan bahwa secara keseluruhan model ini tidak signifikan.
Goodness-of-Fit (R-squared):
Multiple R-squared = 0.03839, artinya hanya sekitar 3,83% variabilitas pendidikan yang dapat dijelaskan oleh usia dan pengalaman kerja.
Adjusted R-squared = 0.01857, yang positif, menunjukkan bahwa model ini lebih baik dibandingkan model tanpa prediktor.
Kesimpulan:
Model ini memiliki hubungan cukup kuat antara pendidikan, usia dan pengalaman.
Faktor-faktor lain kemungkinan memiliki pengaruh yang lebih kuat terhadap pendidikan, seperti jam kerja per minggu, jumlah anak, status pernikahan, lokasi kota, industri, pelatihan profesional atau keterampilan teknis.
Sebaiknya dilakukan eksplorasi lebih lanjut dengan menambahkan variabel lain dalam regresi untuk meningkatkan akurasi model.