Πληροφορίες για το επιλεγμένο dataset:
Το επιλεγμένο dataset περιέχει τα αποτελέσματα μίας έρευνας με σύνολο 16 ερωτήσεις, οι οποία διεξήχθη σε προπτυχιακούς φοιτητές 2ου & 3ου έτους, στη Σχολή Κυβερνητικής, Στατιστικής και Οικονομικής Πληροφορικής. Το dataset παρουσιάζει τις αντιλήψεις των φοιτητών σχετικά με το ρόλο της τεχνητής νοημοσύνης στην εκπαίδευση.
Η επιχειρηματική αναλυτική χρησιμοποιείται για να συνδυάσει και να οπτικοποιήσει δεδομένα, προερχόμενα από διάφορες πηγές, με σκοπό την απάντηση σε ερωτήματα και την επίλυση προβλημάτων. Καθώς βρισκόμαστε σε μία “τεχνολογικά εξελισσόμενη” περίοδο, η τεχνητή νοημοσύνη επηρεάζει ποια τους ανθρώπους σε πολλές φάσεις της ζωής τους. Μία από αυτές είναι και η εκπαίδευση και μέσω της χρήσης της επιχειρηματικής αναλυτικής μπορούμε επιτέλους να διακρίνουμε τα αποτελέσματα που αναζητούμε.
Κάποια από τα εωτήματα που μπορούν να απαντηθούν με την επιλογή αυτού του dataset και σύμφωνα με τις γνώσεις, την κατεύθυνση αλλά και τα χαρακτηριστικά των φοιτητών που πήραν μέρος στην αξιολόγηση, είναι:
α) Αν υπάρχουν ενδείξεις ανησυχίας από τους φοιτητές για την μελλοντική αντικατάστασή τους σε θέσεις εργασίας από την τεχνητή νοημοσύνη.
β) Την γενικότερη άποψη που επικρατεί στα περιβάλλοντα εκπαίδευσης για την τεχνητή νοημοσύνη, τουλάχιστον από την πλευρά των φοιτητών.
γ)Αν η τεχνητή νοημοσύνη επηρεάζει θετικά ή αρνητικά την γενικότερη γνώση των φοιτητών, με βάση τους μέσους όρους των βαθμών τους αλλά και την προσωπική άποψή τους
και άλλα ερωτήματα που μπορεί να παρουσιαστούν.
Οι μεταβλητές από τις οποίες αποτελείται το dataset, είναι στην ουσία οι ερωτήσεις από τις οποίες αποτελείται αυτή η αξιόλογηση και οι οποίες παροισιάστηκαν και στους φοιτητές.
Αναλυτικότερα είναι:
| Μεταβλητή | Τύπος | Εύρος Τιμών | Μονάδες Μέτρησης |
|---|---|---|---|
| Q1.AI_knowledge | Αριθμητική (Likert) | 1–10 | Επίπεδο γνώσης AI (1=χαμηλό, 10=υψηλό) |
| Q2.#1.Internet | Δυαδική | 0-1 | Πηγή ενημέρωσης (1=Ναι, 0=Όχι) |
| Q2#2.Books/Papers | Δυαδική | 0-1 | Πηγή ενημέρωσης (1=Ναι, 0=Όχι) |
| Q2#3.Social_media | Δυαδική | 0-1 | Πηγή ενημέρωσης (1=Ναι, 0=Όχι) |
| Q2#4.Discussions | Δυαδική | 0-1 | Πηγή ενημέρωσης (1=Ναι, 0=Όχι) |
| Q2#5.NotInformed | Δυαδική | 0-1 | Πηγή ενημέρωσης (1=Ναι, 0=Όχι) |
| Q3#1.Loss_of_control | Αριθμητική (Likert) | 1–5 | Συμφωνία (1=καθόλου, 5=πολύ) |
| Q3#2.Job_replacement | Αριθμητική (Likert) | 1–5 | Συμφωνία (1=καθόλου, 5=πολύ) |
| Q3#3.Privacy | Αριθμητική (Likert) | 1–5 | Συμφωνία (1=καθόλου, 5=πολύ) |
| Q3#4.AI_rulling_society | Αριθμητική (Likert) | 1–5 | Συμφωνία (1=καθόλου, 5=πολύ) |
| Q4#1.AI_costly | Αριθμητική (Likert) | 1–5 | Συμφωνία (1=καθόλου, 5=πολύ) |
| Q4#2.Economic_crisis | Αριθμητική (Likert) | 1–5 | Συμφωνία (1=καθόλου, 5=πολύ) |
| Q4#3.Economic_growth | Αριθμητική (Likert) | 1–5 | Συμφωνία (1=καθόλου, 5=πολύ) |
| Q4#4.Job_loss | Αριθμητική (Likert) | 1–5 | Συμφωνία (1=καθόλου, 5=πολύ) |
| Q5.Feelings | Αριθμητική (Likert) | 1–4 | Συναισθήματα (1=Curiosity, 2=Fear, 3=Indifference, 4=Trust) |
| Q6#1.Education | Δυαδική | 0-1 | Επηρέαση τομέα από AI (1=Ναι, 0=Όχι) |
| Q6#2.Medicine | Δυαδική | 0-1 | Επηρέαση τομέα από AI (1=Ναι, 0=Όχι) |
| Q6#3.Agriculture | Δυαδική | 0-1 | Επηρέαση τομέα από AI (1=Ναι, 0=Όχι) |
| Q6#4.Constructions | Δυαδική | 0-1 | Επηρέαση τομέα από AI (1=Ναι, 0=Όχι) |
| Q6#5.Marketing | Δυαδική | 0-1 | Επηρέαση τομέα από AI (1=Ναι, 0=Όχι) |
| Q6#6.Administration | Δυαδική | 0-1 | Επηρέαση τομέα από AI (1=Ναι, 0=Όχι) |
| Q6#7.Art | Δυαδική | 0-1 | Επηρέαση τομέα από AI (1=Ναι, 0=Όχι) |
| Q7.Utility_grade | Αριθμητική (Likert) | 1–10 | Χρησιμότητα AI (1=χαμηλό, 10=υψηλό) |
| Q8.Advantage_teaching | Αριθμητική (Likert) | 1–5 | Επιλογή πλεονεκτήματος |
| Q9.Advantage_learning | Αριθμητική (Likert) | 1–5 | Επιλογή πλεονεκτήματος |
| Q10.Advantage_evaluation | Αριθμητική (Likert) | 1–5 | Επιλογή πλεονεκτήματος |
| Q11.Disadvantage_educational_process | Αριθμητική (Likert) | 1–5 | Επιλογή μειονεκτήματος |
| Q12.Gender | Κατηγορική - Δυαδική | 1-2 | Επιλογή φύλου (1=κορίτσι, 2=αγόρι) |
| Q13.Year_of_study | Κατηγορική | 1-2 | Χρόνος σπουδών (1=2, 2=3) |
| Q14.Major | Κατηγορική | 1–5 | Κατεύθυνση (1=Economic Cybernetics, 2=Statistics and Economic Forecasting, 3=Economic Informatics) |
| Q15.Passed_exams | Δυαδική | 0-1 | Περασμένα μαθήματα (1=Ναι, 2=Όχι) |
| Q16.GPA | Αριθμητική (Likert) | 1-10 | Bαθμός GPA |
Περιγραφικά στατιστικά του dataset:
Για όλο το dataset μπορούμε να χρησιμοποιήσουμε την εντολή:
Survey_AI <- read.csv("C:/Users/Dimitris/Documents/ea_erg1/Survey_AI.csv")
summary(Survey_AI)
## ID Q1.AI_knowledge Q2.AI_sources Q2.1.Internet
## Min. : 1.0 Min. : 1.000 Length:91 Min. :0.0000
## 1st Qu.:23.5 1st Qu.: 5.000 Class :character 1st Qu.:1.0000
## Median :46.0 Median : 6.000 Mode :character Median :1.0000
## Mean :46.0 Mean : 5.912 Mean :0.8132
## 3rd Qu.:68.5 3rd Qu.: 7.000 3rd Qu.:1.0000
## Max. :91.0 Max. :10.000 Max. :1.0000
## Q2.2.Books.Papers Q2.3.Social_media Q2.4.Discussions Q2.5.NotInformed
## Min. :0.0000 Min. :0.0000 Min. :0.0000 Min. :0.00000
## 1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.00000
## Median :0.0000 Median :0.0000 Median :0.0000 Median :0.00000
## Mean :0.3516 Mean :0.4396 Mean :0.1978 Mean :0.06593
## 3rd Qu.:1.0000 3rd Qu.:1.0000 3rd Qu.:0.0000 3rd Qu.:0.00000
## Max. :1.0000 Max. :1.0000 Max. :1.0000 Max. :1.00000
## Q3.1.AI_dehumanization Q3.2.Job_replacement Q3.3.Problem_solving
## Min. :1.000 Min. :1.000 Min. :1.000
## 1st Qu.:2.000 1st Qu.:2.000 1st Qu.:4.000
## Median :2.000 Median :3.000 Median :4.000
## Mean :2.516 Mean :3.198 Mean :4.198
## 3rd Qu.:3.000 3rd Qu.:4.000 3rd Qu.:5.000
## Max. :5.000 Max. :5.000 Max. :5.000
## Q3.4.AI_rulling_society Q4.1.AI_costly Q4.2.Economic_crisis
## Min. :1.000 Min. :1.000 Min. :1.00
## 1st Qu.:1.000 1st Qu.:3.000 1st Qu.:2.00
## Median :3.000 Median :4.000 Median :3.00
## Mean :2.429 Mean :3.571 Mean :2.56
## 3rd Qu.:3.000 3rd Qu.:4.000 3rd Qu.:3.00
## Max. :5.000 Max. :5.000 Max. :5.00
## Q4.3.Economic_growth Q4.4.Job_loss Q5.Feelings Q6.Domains
## Min. :2.000 Min. :1.000 Min. :1.000 Length:91
## 1st Qu.:3.000 1st Qu.:3.000 1st Qu.:1.000 Class :character
## Median :4.000 Median :4.000 Median :1.000 Mode :character
## Mean :3.659 Mean :3.396 Mean :1.582
## 3rd Qu.:4.000 3rd Qu.:4.000 3rd Qu.:2.000
## Max. :5.000 Max. :5.000 Max. :4.000
## Q6.1.Education Q6.2.Medicine Q6.3.Agriculture Q6.4.Constructions
## Min. :0.0000 Min. :0.0000 Min. :0.0000 Min. :0.0000
## 1st Qu.:0.0000 1st Qu.:1.0000 1st Qu.:0.0000 1st Qu.:0.0000
## Median :1.0000 Median :1.0000 Median :1.0000 Median :1.0000
## Mean :0.6703 Mean :0.8022 Mean :0.5055 Mean :0.5495
## 3rd Qu.:1.0000 3rd Qu.:1.0000 3rd Qu.:1.0000 3rd Qu.:1.0000
## Max. :1.0000 Max. :1.0000 Max. :1.0000 Max. :1.0000
## Q6.5.Marketing Q6.6.Administration Q6.7.Art Q7.Utility_grade
## Min. :0.0000 Min. :0.0000 Min. :0.0000 Min. : 2.00
## 1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.: 6.00
## Median :0.0000 Median :0.0000 Median :0.0000 Median : 8.00
## Mean :0.3626 Mean :0.3846 Mean :0.1319 Mean : 7.44
## 3rd Qu.:1.0000 3rd Qu.:1.0000 3rd Qu.:0.0000 3rd Qu.: 9.00
## Max. :1.0000 Max. :1.0000 Max. :1.0000 Max. :10.00
## Q8.Advantage_teaching Q9.Advantage_learning Q10.Advantage_evaluation
## Min. :1.000 Min. :1.000 Min. :1.000
## 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:2.000
## Median :2.000 Median :2.000 Median :2.000
## Mean :1.923 Mean :1.879 Mean :2.253
## 3rd Qu.:3.000 3rd Qu.:2.000 3rd Qu.:3.000
## Max. :3.000 Max. :3.000 Max. :3.000
## Q11.Disadvantage_educational_process Q12.Gender Q13.Year_of_study
## Min. :1.000 Min. :1.000 Min. :1.000
## 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.000
## Median :2.000 Median :1.000 Median :2.000
## Mean :2.099 Mean :1.352 Mean :1.626
## 3rd Qu.:3.000 3rd Qu.:2.000 3rd Qu.:2.000
## Max. :4.000 Max. :2.000 Max. :2.000
## Q14.Major Q15.Passed_exams Q16.GPA
## Min. :1.000 Min. :0.0000 Min. :5.200
## 1st Qu.:1.000 1st Qu.:0.5000 1st Qu.:7.200
## Median :2.000 Median :1.0000 Median :7.700
## Mean :1.923 Mean :0.7473 Mean :7.799
## 3rd Qu.:2.500 3rd Qu.:1.0000 3rd Qu.:8.700
## Max. :3.000 Max. :1.0000 Max. :9.700
Αν θέλουμε να επιλέξουμε κάποιες βασικές αριθμητικές στήλες, μπορούμε να εμφανίσουμε επιπλέον την επικρατούσα τιμή, τη διακύμανση και την τυπική απόκλιση για πιο επιμελή διερεύνυση:
summary(Survey_AI [, c(
"Q1.AI_knowledge",
"Q5.Feelings",
"Q13.Year_of_study",
"Q16.GPA"
)])
## Q1.AI_knowledge Q5.Feelings Q13.Year_of_study Q16.GPA
## Min. : 1.000 Min. :1.000 Min. :1.000 Min. :5.200
## 1st Qu.: 5.000 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:7.200
## Median : 6.000 Median :1.000 Median :2.000 Median :7.700
## Mean : 5.912 Mean :1.582 Mean :1.626 Mean :7.799
## 3rd Qu.: 7.000 3rd Qu.:2.000 3rd Qu.:2.000 3rd Qu.:8.700
## Max. :10.000 Max. :4.000 Max. :2.000 Max. :9.700
sd(Survey_AI$Q1.AI_knowledge, na.rm=TRUE)
## [1] 1.970044
var(Survey_AI$Q1.AI_knowledge)
## [1] 3.881074
sd(Survey_AI$Q5.Feelings, na.rm=TRUE)
## [1] 0.9668498
var(Survey_AI$Q5.Feelings)
## [1] 0.9347985
sd(Survey_AI$Q13.Year_of_study, na.rm=TRUE)
## [1] 0.4864463
var(Survey_AI$Q13.Year_of_study)
## [1] 0.23663
sd(Survey_AI$Q16.GPA, na.rm=TRUE)
## [1] 0.9753056
var(Survey_AI$Q16.GPA)
## [1] 0.951221
Διερεύνηση συσχετίσεων:
#Middle to high correlation
cor(Survey_AI$Q1.AI_knowledge, Survey_AI$Q7.Utility_grade)
## [1] 0.3588534
cor(Survey_AI$Q1.AI_knowledge, Survey_AI$Q16.GPA)
## [1] 0.2734772
cor(Survey_AI$Q7.Utility_grade, Survey_AI$Q16.GPA)
## [1] 0.2769621
cor(Survey_AI$Q1.AI_knowledge, Survey_AI$Q5.Feelings)
## [1] 0.03884666
cor(Survey_AI$Q12.Gender, Survey_AI$Q5.Feelings)
## [1] 0.2240978
cor(Survey_AI$Q12.Gender, Survey_AI$Q7.Utility_grade)
## [1] -0.08636424
cor(Survey_AI$Q12.Gender, Survey_AI$Q16.GPA)
## [1] -0.2174615
#Negative correlation
cor(Survey_AI$Q5.Feelings, Survey_AI$Q7.Utility_grade)
## [1] -0.06006632
cor(Survey_AI$Q3.2.Job_replacement, Survey_AI$Q1.AI_knowledge)
## [1] -0.06703264
Ως προς την ερώτηση 1 και την ερώτηση 7, μπορεί να σχηματιστεί μία σχέση αναγνώρισης και χρήσης της τεχνητής νοημοσύνης από τους φοιτητές, σε τί βαθμό και πιθανόν να μπορεί να εξαχθεί και μία σχέση σχετικά με τα αποτελέσματα των βαθμών των φοιτητών και αν βοηθήθηκαν μέσω της τεχνητής νοημοσύνης - ερωτήσεις 1 και 16 και 7 και 16.
Μπορούμε να έχουμε και μία γενικότερη σχέση ως προς τα συναισθήματα των φοιτητών για την τεχνητή νοημοσύνη και αν τελικά επηρεάζονται από την αντίστοιχη γνώση που κατέχουν ως προς τον τομέα αυτόν.
Τέλος, μπορούμε να δημιουργήσουμε μία συσχέτιση για την άποψη που έχουν τα δύο διαφορετικά φύλα ως προς τη χρήση της τεχνητής νοημοσύνης, και παρόλο που οι συσχετίσεις μεταξύ των φύλων και κάποιων μεταβλητών όπως ο GPA, utility grade κ.α. βγαίνουν αρνητικές, να δημιουργήσουμε ίσως μία σχέση για το πως η πλειοψηφία του κάθε φύλου αντιμετωπίζει τους κινδύνους για τους οποίους ανηχυσούν, μέσω της ερώτησης 5.
Δημιουργία διαγραμμάτων:
library(ggplot2)
#scatterplot
ggplot(data = Survey_AI, aes(x = `Q1.AI_knowledge`, y = `Q7.Utility_grade`, color = factor(`Q14.Major`))) +
geom_point(size = 4, alpha = 0.7) +
geom_jitter(width = 0.4, height = 0.4, alpha = 0.6, size = 3)
labs(
title = "Knowledge of AI = Fear of replacement?",
color = "Area of Major"
) +
theme_classic()
## NULL
Το γράφημα διασποράς απεικονίζει τη συχέτιση που υπάρχει μεταξύ της γνώσης των φοιτητών για την τεχνητή νοημοσύνη και τη γνώμη τους για το πόσο χρήσιμη θα μπορούσε να είναι η τεχνητή νοημοσύνη στις εκπαιδευτικές διαδικασίες. Οι φοιτητές έχουν κατηγοριοποιηθεί με βάση την κατεύθυνση του πτυχίου τους, σε αντιστοίχιση με το γράφημα:
Μέσα από αυτή τη συσχέτιση είναι πολύ πιθανό ότι μπορούμε να εντωπίσουμε τους φοιτητές οι οποίοι χρησιμοποιούν την τεχνητή νοημοσύνη στο διάβασμά τους, σε τι βαθμό και αν γίνεται ωφέλιμη αξιοποίηση ή απλώς πρόχειρη χρήση.
#boxplot
#κανονικά έχω το Survey_AI$Q3#2.Job_replacement αλλά δεν το διαβάζει εξαιτίας του "#". Το κανονικό σχήμα είναι στην φωτογραφία.
ggplot(data = Survey_AI, aes(x = factor(`Q12.Gender`), y = Survey_AI$Q3.2.Job_replacemen, fill = factor(`Q12.Gender`))) +
geom_boxplot(alpha = 0.7) +
labs(
title = "Fear of replacement by Genders",
x = "Genders",
y = "job replacement",
fill = "Genders"
) +
theme_bw()
## Warning: Use of `Survey_AI$Q3.2.Job_replacemen` is discouraged.
## ℹ Use `Q3.2.Job_replacemen` instead.
Το γράφημα απεικονίζει τους φοιτητές ανάλογα με το φύλο που επέλεξαν και κατά πόσο φοβούνται ότι η τεχνητή νοημοσύνη θα απειλήσει τις θέσεις δουλειάς τους στο μέλλον. Οι δύο κατηγορίες επιλογής είναι:
Μπορούμε να συμπεράνουμε ότι οι φοιτητές και των δύο φύλων έχουν μέτριο έως υψηλό επίπεδο ανησυχίας με κάποιους να μην φοβούνται καθόλου, λίγο ή πολύ (τιμές 1 - 5). Τα αγόρια παρουσιάζουν ένα μεγαλύτερο ποσοστό ανησυχίας (κεντρική τάση → 4) και με μεγαλύτερη διακύμανση (2-5) χωρίς να υπάρχει όμως μεγάλη διαφορά και στις απόψεις των κοριτσιών (κεντρική τάση → 3) και διακύμανση (2-4).
ggplot(data = Survey_AI, aes(x = Q5.Feelings)) +
geom_histogram(aes(y = ..density..), binwidth = 0.9, fill = "purple", color = "yellow") +
geom_density(color = "yellow", linewidth = 1) +
labs(title = "Ιστόγραμμα + Καμπύλη Πυκνότητας")
## Warning: The dot-dot notation (`..density..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(density)` instead.
## This warning is displayed once per session.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
Το ιστόγραμμα απεικονίζει το πώς νιώθουν οι φοιτητές ερωτώμενοι για την τεχνητή νοημοσύνη σε γενικό επίπεδο και σε τί βαθμό. Οι περισσότεροι φοιτητές απάντησαν ότι αντιμετωπίζουν την τεχνητή νοημοσύνη με ένα μεγάλο ποσοστό περιέργειας, όπως εξάγουμε από το dataset:
Curiosity
Fear
Indifference
Trust
ggplot(data = Survey_AI, aes(x = factor(Q16.GPA))) +
geom_bar(fill = "darkgreen", color = "magenta") +
labs(
title = "Κατανομή GPA μαθητών",
x = "GPA",
y = "Συχνότητα"
)
Το γράφημα απεικονίζει τους μέσους όρους βαθμολογίας των φοιτητών (1-10) το τελευταίο έτος. Από μόνο του ένα τέτοιο διάγραμμα είναι πολύ γενικό αλλά σε συνδυασμό με άλλα στοιχεία μπορεί να μας βοηθήσει στο να βρούμε ποιοι φοιτητές χρησιμοποιούν την τεχνητή νοημοσύνη και σε τί βαθμό και περαιτέρω, να αιτιολογήσουμε την απόρροια των απαντήσεων και γνώμεων των φοιτητών.
Fin