Dataset: 🤖 Students’ Perceptions of AI in Education

Exploring the Attitudes and Perspectives of Cybernetics Students on AI

by Gianina-Maria Petrașcu · Updated 3 years ago

Πληροφορίες για το επιλεγμένο dataset:

  • Το επιλεγμένο dataset περιέχει τα αποτελέσματα μίας έρευνας με σύνολο 16 ερωτήσεις, οι οποία διεξήχθη σε προπτυχιακούς φοιτητές 2ου & 3ου έτους, στη Σχολή Κυβερνητικής, Στατιστικής και Οικονομικής Πληροφορικής. Το dataset παρουσιάζει τις αντιλήψεις των φοιτητών σχετικά με το ρόλο της τεχνητής νοημοσύνης στην εκπαίδευση.

  • Η επιχειρηματική αναλυτική χρησιμοποιείται για να συνδυάσει και να οπτικοποιήσει δεδομένα, προερχόμενα από διάφορες πηγές, με σκοπό την απάντηση σε ερωτήματα και την επίλυση προβλημάτων. Καθώς βρισκόμαστε σε μία “τεχνολογικά εξελισσόμενη” περίοδο, η τεχνητή νοημοσύνη επηρεάζει ποια τους ανθρώπους σε πολλές φάσεις της ζωής τους. Μία από αυτές είναι και η εκπαίδευση και μέσω της χρήσης της επιχειρηματικής αναλυτικής μπορούμε επιτέλους να διακρίνουμε τα αποτελέσματα που αναζητούμε.

  • Κάποια από τα εωτήματα που μπορούν να απαντηθούν με την επιλογή αυτού του dataset και σύμφωνα με τις γνώσεις, την κατεύθυνση αλλά και τα χαρακτηριστικά των φοιτητών που πήραν μέρος στην αξιολόγηση, είναι:

    α) Αν υπάρχουν ενδείξεις ανησυχίας από τους φοιτητές για την μελλοντική αντικατάστασή τους σε θέσεις εργασίας από την τεχνητή νοημοσύνη.

    β) Την γενικότερη άποψη που επικρατεί στα περιβάλλοντα εκπαίδευσης για την τεχνητή νοημοσύνη, τουλάχιστον από την πλευρά των φοιτητών.

    γ)Αν η τεχνητή νοημοσύνη επηρεάζει θετικά ή αρνητικά την γενικότερη γνώση των φοιτητών, με βάση τους μέσους όρους των βαθμών τους αλλά και την προσωπική άποψή τους

    και άλλα ερωτήματα που μπορεί να παρουσιαστούν.

  • Οι μεταβλητές από τις οποίες αποτελείται το dataset, είναι στην ουσία οι ερωτήσεις από τις οποίες αποτελείται αυτή η αξιόλογηση και οι οποίες παροισιάστηκαν και στους φοιτητές.

    Αναλυτικότερα είναι:

    Μεταβλητή Τύπος Εύρος Τιμών Μονάδες Μέτρησης
    Q1.AI_knowledge Αριθμητική (Likert) 1–10 Επίπεδο γνώσης AI (1=χαμηλό, 10=υψηλό)
    Q2.#1.Internet Δυαδική 0-1 Πηγή ενημέρωσης (1=Ναι, 0=Όχι)
    Q2#2.Books/Papers Δυαδική 0-1 Πηγή ενημέρωσης (1=Ναι, 0=Όχι)
    Q2#3.Social_media Δυαδική 0-1 Πηγή ενημέρωσης (1=Ναι, 0=Όχι)
    Q2#4.Discussions Δυαδική 0-1 Πηγή ενημέρωσης (1=Ναι, 0=Όχι)
    Q2#5.NotInformed Δυαδική 0-1 Πηγή ενημέρωσης (1=Ναι, 0=Όχι)
    Q3#1.Loss_of_control Αριθμητική (Likert) 1–5 Συμφωνία (1=καθόλου, 5=πολύ)
    Q3#2.Job_replacement Αριθμητική (Likert) 1–5 Συμφωνία (1=καθόλου, 5=πολύ)
    Q3#3.Privacy Αριθμητική (Likert) 1–5 Συμφωνία (1=καθόλου, 5=πολύ)
    Q3#4.AI_rulling_society Αριθμητική (Likert) 1–5 Συμφωνία (1=καθόλου, 5=πολύ)
    Q4#1.AI_costly Αριθμητική (Likert) 1–5 Συμφωνία (1=καθόλου, 5=πολύ)
    Q4#2.Economic_crisis Αριθμητική (Likert) 1–5 Συμφωνία (1=καθόλου, 5=πολύ)
    Q4#3.Economic_growth Αριθμητική (Likert) 1–5 Συμφωνία (1=καθόλου, 5=πολύ)
    Q4#4.Job_loss Αριθμητική (Likert) 1–5 Συμφωνία (1=καθόλου, 5=πολύ)
    Q5.Feelings Αριθμητική (Likert) 1–4 Συναισθήματα (1=Curiosity, 2=Fear, 3=Indifference, 4=Trust)
    Q6#1.Education Δυαδική 0-1 Επηρέαση τομέα από AI (1=Ναι, 0=Όχι)
    Q6#2.Medicine Δυαδική 0-1 Επηρέαση τομέα από AI (1=Ναι, 0=Όχι)
    Q6#3.Agriculture Δυαδική 0-1 Επηρέαση τομέα από AI (1=Ναι, 0=Όχι)
    Q6#4.Constructions Δυαδική 0-1 Επηρέαση τομέα από AI (1=Ναι, 0=Όχι)
    Q6#5.Marketing Δυαδική 0-1 Επηρέαση τομέα από AI (1=Ναι, 0=Όχι)
    Q6#6.Administration Δυαδική 0-1 Επηρέαση τομέα από AI (1=Ναι, 0=Όχι)
    Q6#7.Art Δυαδική 0-1 Επηρέαση τομέα από AI (1=Ναι, 0=Όχι)
    Q7.Utility_grade Αριθμητική (Likert) 1–10 Χρησιμότητα AI (1=χαμηλό, 10=υψηλό)
    Q8.Advantage_teaching Αριθμητική (Likert) 1–5 Επιλογή πλεονεκτήματος
    Q9.Advantage_learning Αριθμητική (Likert) 1–5 Επιλογή πλεονεκτήματος
    Q10.Advantage_evaluation Αριθμητική (Likert) 1–5 Επιλογή πλεονεκτήματος
    Q11.Disadvantage_educational_process Αριθμητική (Likert) 1–5 Επιλογή μειονεκτήματος
    Q12.Gender Κατηγορική - Δυαδική 1-2 Επιλογή φύλου (1=κορίτσι, 2=αγόρι)
    Q13.Year_of_study Κατηγορική 1-2 Χρόνος σπουδών (1=2, 2=3)
    Q14.Major Κατηγορική 1–5 Κατεύθυνση (1=Economic Cybernetics, 2=Statistics and Economic Forecasting, 3=Economic Informatics)
    Q15.Passed_exams Δυαδική 0-1 Περασμένα μαθήματα (1=Ναι, 2=Όχι)
    Q16.GPA Αριθμητική (Likert) 1-10 Bαθμός GPA

Περιγραφικά στατιστικά του dataset:

Για όλο το dataset μπορούμε να χρησιμοποιήσουμε την εντολή:

Survey_AI <- read.csv("C:/Users/Dimitris/Documents/ea_erg1/Survey_AI.csv")
summary(Survey_AI)
##        ID       Q1.AI_knowledge  Q2.AI_sources      Q2.1.Internet   
##  Min.   : 1.0   Min.   : 1.000   Length:91          Min.   :0.0000  
##  1st Qu.:23.5   1st Qu.: 5.000   Class :character   1st Qu.:1.0000  
##  Median :46.0   Median : 6.000   Mode  :character   Median :1.0000  
##  Mean   :46.0   Mean   : 5.912                      Mean   :0.8132  
##  3rd Qu.:68.5   3rd Qu.: 7.000                      3rd Qu.:1.0000  
##  Max.   :91.0   Max.   :10.000                      Max.   :1.0000  
##  Q2.2.Books.Papers Q2.3.Social_media Q2.4.Discussions Q2.5.NotInformed 
##  Min.   :0.0000    Min.   :0.0000    Min.   :0.0000   Min.   :0.00000  
##  1st Qu.:0.0000    1st Qu.:0.0000    1st Qu.:0.0000   1st Qu.:0.00000  
##  Median :0.0000    Median :0.0000    Median :0.0000   Median :0.00000  
##  Mean   :0.3516    Mean   :0.4396    Mean   :0.1978   Mean   :0.06593  
##  3rd Qu.:1.0000    3rd Qu.:1.0000    3rd Qu.:0.0000   3rd Qu.:0.00000  
##  Max.   :1.0000    Max.   :1.0000    Max.   :1.0000   Max.   :1.00000  
##  Q3.1.AI_dehumanization Q3.2.Job_replacement Q3.3.Problem_solving
##  Min.   :1.000          Min.   :1.000        Min.   :1.000       
##  1st Qu.:2.000          1st Qu.:2.000        1st Qu.:4.000       
##  Median :2.000          Median :3.000        Median :4.000       
##  Mean   :2.516          Mean   :3.198        Mean   :4.198       
##  3rd Qu.:3.000          3rd Qu.:4.000        3rd Qu.:5.000       
##  Max.   :5.000          Max.   :5.000        Max.   :5.000       
##  Q3.4.AI_rulling_society Q4.1.AI_costly  Q4.2.Economic_crisis
##  Min.   :1.000           Min.   :1.000   Min.   :1.00        
##  1st Qu.:1.000           1st Qu.:3.000   1st Qu.:2.00        
##  Median :3.000           Median :4.000   Median :3.00        
##  Mean   :2.429           Mean   :3.571   Mean   :2.56        
##  3rd Qu.:3.000           3rd Qu.:4.000   3rd Qu.:3.00        
##  Max.   :5.000           Max.   :5.000   Max.   :5.00        
##  Q4.3.Economic_growth Q4.4.Job_loss    Q5.Feelings     Q6.Domains       
##  Min.   :2.000        Min.   :1.000   Min.   :1.000   Length:91         
##  1st Qu.:3.000        1st Qu.:3.000   1st Qu.:1.000   Class :character  
##  Median :4.000        Median :4.000   Median :1.000   Mode  :character  
##  Mean   :3.659        Mean   :3.396   Mean   :1.582                     
##  3rd Qu.:4.000        3rd Qu.:4.000   3rd Qu.:2.000                     
##  Max.   :5.000        Max.   :5.000   Max.   :4.000                     
##  Q6.1.Education   Q6.2.Medicine    Q6.3.Agriculture Q6.4.Constructions
##  Min.   :0.0000   Min.   :0.0000   Min.   :0.0000   Min.   :0.0000    
##  1st Qu.:0.0000   1st Qu.:1.0000   1st Qu.:0.0000   1st Qu.:0.0000    
##  Median :1.0000   Median :1.0000   Median :1.0000   Median :1.0000    
##  Mean   :0.6703   Mean   :0.8022   Mean   :0.5055   Mean   :0.5495    
##  3rd Qu.:1.0000   3rd Qu.:1.0000   3rd Qu.:1.0000   3rd Qu.:1.0000    
##  Max.   :1.0000   Max.   :1.0000   Max.   :1.0000   Max.   :1.0000    
##  Q6.5.Marketing   Q6.6.Administration    Q6.7.Art      Q7.Utility_grade
##  Min.   :0.0000   Min.   :0.0000      Min.   :0.0000   Min.   : 2.00   
##  1st Qu.:0.0000   1st Qu.:0.0000      1st Qu.:0.0000   1st Qu.: 6.00   
##  Median :0.0000   Median :0.0000      Median :0.0000   Median : 8.00   
##  Mean   :0.3626   Mean   :0.3846      Mean   :0.1319   Mean   : 7.44   
##  3rd Qu.:1.0000   3rd Qu.:1.0000      3rd Qu.:0.0000   3rd Qu.: 9.00   
##  Max.   :1.0000   Max.   :1.0000      Max.   :1.0000   Max.   :10.00   
##  Q8.Advantage_teaching Q9.Advantage_learning Q10.Advantage_evaluation
##  Min.   :1.000         Min.   :1.000         Min.   :1.000           
##  1st Qu.:1.000         1st Qu.:1.000         1st Qu.:2.000           
##  Median :2.000         Median :2.000         Median :2.000           
##  Mean   :1.923         Mean   :1.879         Mean   :2.253           
##  3rd Qu.:3.000         3rd Qu.:2.000         3rd Qu.:3.000           
##  Max.   :3.000         Max.   :3.000         Max.   :3.000           
##  Q11.Disadvantage_educational_process   Q12.Gender    Q13.Year_of_study
##  Min.   :1.000                        Min.   :1.000   Min.   :1.000    
##  1st Qu.:1.000                        1st Qu.:1.000   1st Qu.:1.000    
##  Median :2.000                        Median :1.000   Median :2.000    
##  Mean   :2.099                        Mean   :1.352   Mean   :1.626    
##  3rd Qu.:3.000                        3rd Qu.:2.000   3rd Qu.:2.000    
##  Max.   :4.000                        Max.   :2.000   Max.   :2.000    
##    Q14.Major     Q15.Passed_exams    Q16.GPA     
##  Min.   :1.000   Min.   :0.0000   Min.   :5.200  
##  1st Qu.:1.000   1st Qu.:0.5000   1st Qu.:7.200  
##  Median :2.000   Median :1.0000   Median :7.700  
##  Mean   :1.923   Mean   :0.7473   Mean   :7.799  
##  3rd Qu.:2.500   3rd Qu.:1.0000   3rd Qu.:8.700  
##  Max.   :3.000   Max.   :1.0000   Max.   :9.700

Αν θέλουμε να επιλέξουμε κάποιες βασικές αριθμητικές στήλες, μπορούμε να εμφανίσουμε επιπλέον την επικρατούσα τιμή, τη διακύμανση και την τυπική απόκλιση για πιο επιμελή διερεύνυση:

summary(Survey_AI [, c(
  "Q1.AI_knowledge",
  "Q5.Feelings",
  "Q13.Year_of_study",
  "Q16.GPA"
)])
##  Q1.AI_knowledge   Q5.Feelings    Q13.Year_of_study    Q16.GPA     
##  Min.   : 1.000   Min.   :1.000   Min.   :1.000     Min.   :5.200  
##  1st Qu.: 5.000   1st Qu.:1.000   1st Qu.:1.000     1st Qu.:7.200  
##  Median : 6.000   Median :1.000   Median :2.000     Median :7.700  
##  Mean   : 5.912   Mean   :1.582   Mean   :1.626     Mean   :7.799  
##  3rd Qu.: 7.000   3rd Qu.:2.000   3rd Qu.:2.000     3rd Qu.:8.700  
##  Max.   :10.000   Max.   :4.000   Max.   :2.000     Max.   :9.700
sd(Survey_AI$Q1.AI_knowledge, na.rm=TRUE)
## [1] 1.970044
var(Survey_AI$Q1.AI_knowledge)
## [1] 3.881074
sd(Survey_AI$Q5.Feelings, na.rm=TRUE)
## [1] 0.9668498
var(Survey_AI$Q5.Feelings)
## [1] 0.9347985
sd(Survey_AI$Q13.Year_of_study, na.rm=TRUE)
## [1] 0.4864463
var(Survey_AI$Q13.Year_of_study)
## [1] 0.23663
sd(Survey_AI$Q16.GPA, na.rm=TRUE)
## [1] 0.9753056
var(Survey_AI$Q16.GPA)
## [1] 0.951221

Διερεύνηση συσχετίσεων:

#Middle to high correlation
cor(Survey_AI$Q1.AI_knowledge, Survey_AI$Q7.Utility_grade)
## [1] 0.3588534
cor(Survey_AI$Q1.AI_knowledge, Survey_AI$Q16.GPA)
## [1] 0.2734772
cor(Survey_AI$Q7.Utility_grade, Survey_AI$Q16.GPA)
## [1] 0.2769621
cor(Survey_AI$Q1.AI_knowledge, Survey_AI$Q5.Feelings)
## [1] 0.03884666
cor(Survey_AI$Q12.Gender, Survey_AI$Q5.Feelings)
## [1] 0.2240978
cor(Survey_AI$Q12.Gender, Survey_AI$Q7.Utility_grade)
## [1] -0.08636424
cor(Survey_AI$Q12.Gender, Survey_AI$Q16.GPA)
## [1] -0.2174615
#Negative correlation
cor(Survey_AI$Q5.Feelings, Survey_AI$Q7.Utility_grade)
## [1] -0.06006632
cor(Survey_AI$Q3.2.Job_replacement, Survey_AI$Q1.AI_knowledge)
## [1] -0.06703264
  • Ως προς την ερώτηση 1 και την ερώτηση 7, μπορεί να σχηματιστεί μία σχέση αναγνώρισης και χρήσης της τεχνητής νοημοσύνης από τους φοιτητές, σε τί βαθμό και πιθανόν να μπορεί να εξαχθεί και μία σχέση σχετικά με τα αποτελέσματα των βαθμών των φοιτητών και αν βοηθήθηκαν μέσω της τεχνητής νοημοσύνης - ερωτήσεις 1 και 16 και 7 και 16.

  • Μπορούμε να έχουμε και μία γενικότερη σχέση ως προς τα συναισθήματα των φοιτητών για την τεχνητή νοημοσύνη και αν τελικά επηρεάζονται από την αντίστοιχη γνώση που κατέχουν ως προς τον τομέα αυτόν.

  • Τέλος, μπορούμε να δημιουργήσουμε μία συσχέτιση για την άποψη που έχουν τα δύο διαφορετικά φύλα ως προς τη χρήση της τεχνητής νοημοσύνης, και παρόλο που οι συσχετίσεις μεταξύ των φύλων και κάποιων μεταβλητών όπως ο GPA, utility grade κ.α. βγαίνουν αρνητικές, να δημιουργήσουμε ίσως μία σχέση για το πως η πλειοψηφία του κάθε φύλου αντιμετωπίζει τους κινδύνους για τους οποίους ανηχυσούν, μέσω της ερώτησης 5.

Δημιουργία διαγραμμάτων:

library(ggplot2)
#scatterplot
ggplot(data = Survey_AI, aes(x = `Q1.AI_knowledge`, y = `Q7.Utility_grade`, color = factor(`Q14.Major`))) +
  geom_point(size = 4, alpha = 0.7) +
  geom_jitter(width = 0.4, height = 0.4, alpha = 0.6, size = 3)

  labs(
    title = "Knowledge of AI = Fear of replacement?",
    color = "Area of Major"
  ) +
  theme_classic()
## NULL

Το γράφημα διασποράς απεικονίζει τη συχέτιση που υπάρχει μεταξύ της γνώσης των φοιτητών για την τεχνητή νοημοσύνη και τη γνώμη τους για το πόσο χρήσιμη θα μπορούσε να είναι η τεχνητή νοημοσύνη στις εκπαιδευτικές διαδικασίες. Οι φοιτητές έχουν κατηγοριοποιηθεί με βάση την κατεύθυνση του πτυχίου τους, σε αντιστοίχιση με το γράφημα:

  • Economic Cybernetics
  • Statistics and Economic Forecasting
  • Economic Informatics

Μέσα από αυτή τη συσχέτιση είναι πολύ πιθανό ότι μπορούμε να εντωπίσουμε τους φοιτητές οι οποίοι χρησιμοποιούν την τεχνητή νοημοσύνη στο διάβασμά τους, σε τι βαθμό και αν γίνεται ωφέλιμη αξιοποίηση ή απλώς πρόχειρη χρήση.

#boxplot
#κανονικά έχω το Survey_AI$Q3#2.Job_replacement αλλά δεν το διαβάζει εξαιτίας του "#". Το κανονικό σχήμα είναι στην φωτογραφία.
ggplot(data = Survey_AI, aes(x = factor(`Q12.Gender`), y = Survey_AI$Q3.2.Job_replacemen, fill = factor(`Q12.Gender`))) +
  geom_boxplot(alpha = 0.7) +
  labs(
    title = "Fear of replacement by Genders",
    x = "Genders",
    y = "job replacement",
    fill = "Genders"
  ) +
  theme_bw()
## Warning: Use of `Survey_AI$Q3.2.Job_replacemen` is discouraged.
## ℹ Use `Q3.2.Job_replacemen` instead.

Το γράφημα απεικονίζει τους φοιτητές ανάλογα με το φύλο που επέλεξαν και κατά πόσο φοβούνται ότι η τεχνητή νοημοσύνη θα απειλήσει τις θέσεις δουλειάς τους στο μέλλον. Οι δύο κατηγορίες επιλογής είναι:

  • Κορίτσια = 59
  • Αγόρια = 32

Μπορούμε να συμπεράνουμε ότι οι φοιτητές και των δύο φύλων έχουν μέτριο έως υψηλό επίπεδο ανησυχίας με κάποιους να μην φοβούνται καθόλου, λίγο ή πολύ (τιμές 1 - 5). Τα αγόρια παρουσιάζουν ένα μεγαλύτερο ποσοστό ανησυχίας (κεντρική τάση → 4) και με μεγαλύτερη διακύμανση (2-5) χωρίς να υπάρχει όμως μεγάλη διαφορά και στις απόψεις των κοριτσιών (κεντρική τάση → 3) και διακύμανση (2-4).

ggplot(data = Survey_AI, aes(x = Q5.Feelings)) +
geom_histogram(aes(y = ..density..), binwidth = 0.9, fill = "purple", color = "yellow") +
geom_density(color = "yellow", linewidth = 1) +
labs(title = "Ιστόγραμμα + Καμπύλη Πυκνότητας")
## Warning: The dot-dot notation (`..density..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(density)` instead.
## This warning is displayed once per session.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

Το ιστόγραμμα απεικονίζει το πώς νιώθουν οι φοιτητές ερωτώμενοι για την τεχνητή νοημοσύνη σε γενικό επίπεδο και σε τί βαθμό. Οι περισσότεροι φοιτητές απάντησαν ότι αντιμετωπίζουν την τεχνητή νοημοσύνη με ένα μεγάλο ποσοστό περιέργειας, όπως εξάγουμε από το dataset:

  1. Curiosity

  2. Fear

  3. Indifference

  4. Trust

ggplot(data = Survey_AI, aes(x = factor(Q16.GPA))) +
geom_bar(fill = "darkgreen", color = "magenta") +
labs(
title = "Κατανομή GPA μαθητών",
x = "GPA",
y = "Συχνότητα"
)

Το γράφημα απεικονίζει τους μέσους όρους βαθμολογίας των φοιτητών (1-10) το τελευταίο έτος. Από μόνο του ένα τέτοιο διάγραμμα είναι πολύ γενικό αλλά σε συνδυασμό με άλλα στοιχεία μπορεί να μας βοηθήσει στο να βρούμε ποιοι φοιτητές χρησιμοποιούν την τεχνητή νοημοσύνη και σε τί βαθμό και περαιτέρω, να αιτιολογήσουμε την απόρροια των απαντήσεων και γνώμεων των φοιτητών.

Fin