Dataset: 🤖 Students’ Perceptions of AI in Education

Exploring the Attitudes and Perspectives of Cybernetics Students on AI

by Gianina-Maria Petrașcu · Updated 3 years ago

Πληροφορίες για το επιλεγμένο dataset:

  • Το επιλεγμένο dataset περιέχει τα αποτελέσματα μίας έρευνας με σύνολο 16 ερωτήσεις, οι οποία διεξήχθη σε προπτυχιακούς φοιτητές 2ου & 3ου έτους, στη Σχολή Κυβερνητικής, Στατιστικής και Οικονομικής Πληροφορικής. Το dataset παρουσιάζει τις αντιλήψεις των φοιτητών σχετικά με το ρόλο της τεχνητής νοημοσύνης στην εκπαίδευση.

  • Η επιχειρηματική αναλυτική χρησιμοποιείται για να συνδυάσει και να οπτικοποιήσει δεδομένα, προερχόμενα από διάφορες πηγές, με σκοπό την απάντηση σε ερωτήματα και την επίλυση προβλημάτων. Καθώς βρισκόμαστε σε μία “τεχνολογικά εξελισσόμενη” περίοδο, η τεχνητή νοημοσύνη επηρεάζει ποια τους ανθρώπους σε πολλές φάσεις της ζωής τους. Μία από αυτές είναι και η εκπαίδευση και μέσω της χρήσης της επιχειρηματικής αναλυτικής μπορούμε επιτέλους να διακρίνουμε τα αποτελέσματα που αναζητούμε.

  • Κάποια από τα εωτήματα που μπορούν να απαντηθούν με την επιλογή αυτού του dataset και σύμφωνα με τις γνώσεις, την κατεύθυνση αλλά και τα χαρακτηριστικά των φοιτητών που πήραν μέρος στην αξιολόγηση, είναι:

    α) Αν υπάρχουν ενδείξεις ανησυχίας από τους φοιτητές για την μελλοντική αντικατάστασή τους σε θέσεις εργασίας από την τεχνητή νοημοσύνη.

    β) Την γενικότερη άποψη που επικρατεί στα περιβάλλοντα εκπαίδευσης για την τεχνητή νοημοσύνη, τουλάχιστον από την πλευρά των φοιτητών.

    γ)Αν η τεχνητή νοημοσύνη επηρεάζει θετικά ή αρνητικά την γενικότερη γνώση των φοιτητών, με βάση τους μέσους όρους των βαθμών τους αλλά και την προσωπική άποψή τους

    και άλλα ερωτήματα που μπορεί να παρουσιαστούν.

  • Οι μεταβλητές από τις οποίες αποτελείται το dataset, είναι στην ουσία οι ερωτήσεις από τις οποίες αποτελείται αυτή η αξιόλογηση και οι οποίες παροισιάστηκαν και στους φοιτητές.

Συσταδοποίηση

Survey_AI <- read.csv("C:/Users/Dimitris/Documents/ea_erg1/Survey_AI.csv")
Survey_AI = unique(Survey_AI)
num_data <- Survey_AI[, sapply(Survey_AI, is.numeric)]
num_data <- na.omit(num_data)

distances <- dist(num_data, method = "euclidean")
clusterSurvey <- hclust(distances, method = "ward.D2")

plot(clusterSurvey)

clusterGroups = cutree(clusterSurvey, k = 6)

tapply(Survey_AI$Q7.Utility_grade, clusterGroups, mean)
##        1        2        3        4        5        6 
## 7.909091 6.583333 6.636364 8.052632 8.450000 6.444444
tapply(Survey_AI$Q1.AI_knowledge, clusterGroups, mean)
##        1        2        3        4        5        6 
## 5.545455 6.583333 5.272727 6.578947 6.000000 5.277778
tapply(Survey_AI$Q5.Feelings, clusterGroups, mean)
##        1        2        3        4        5        6 
## 1.090909 2.000000 1.000000 1.473684 1.700000 1.944444
colMeans(num_data[clusterGroups == 1, ])
##                                   ID                      Q1.AI_knowledge 
##                            6.0000000                            5.5454545 
##                        Q2.1.Internet                    Q2.2.Books.Papers 
##                            0.9090909                            0.3636364 
##                    Q2.3.Social_media                     Q2.4.Discussions 
##                            0.2727273                            0.3636364 
##                     Q2.5.NotInformed               Q3.1.AI_dehumanization 
##                            0.0000000                            2.1818182 
##                 Q3.2.Job_replacement                 Q3.3.Problem_solving 
##                            2.7272727                            4.5454545 
##              Q3.4.AI_rulling_society                       Q4.1.AI_costly 
##                            1.7272727                            3.8181818 
##                 Q4.2.Economic_crisis                 Q4.3.Economic_growth 
##                            2.2727273                            3.2727273 
##                        Q4.4.Job_loss                          Q5.Feelings 
##                            3.0909091                            1.0909091 
##                       Q6.1.Education                        Q6.2.Medicine 
##                            0.8181818                            0.7272727 
##                     Q6.3.Agriculture                   Q6.4.Constructions 
##                            0.5454545                            0.4545455 
##                       Q6.5.Marketing                  Q6.6.Administration 
##                            0.3636364                            0.3636364 
##                             Q6.7.Art                     Q7.Utility_grade 
##                            0.0000000                            7.9090909 
##                Q8.Advantage_teaching                Q9.Advantage_learning 
##                            2.0909091                            2.0000000 
##             Q10.Advantage_evaluation Q11.Disadvantage_educational_process 
##                            2.3636364                            2.5454545 
##                           Q12.Gender                    Q13.Year_of_study 
##                            1.2727273                            2.0000000 
##                            Q14.Major                     Q15.Passed_exams 
##                            2.1818182                            0.5454545 
##                              Q16.GPA 
##                            7.7454545
colMeans(num_data[clusterGroups == 4, ])
##                                   ID                      Q1.AI_knowledge 
##                           44.0000000                            6.5789474 
##                        Q2.1.Internet                    Q2.2.Books.Papers 
##                            0.8947368                            0.4210526 
##                    Q2.3.Social_media                     Q2.4.Discussions 
##                            0.5789474                            0.2105263 
##                     Q2.5.NotInformed               Q3.1.AI_dehumanization 
##                            0.0000000                            2.7368421 
##                 Q3.2.Job_replacement                 Q3.3.Problem_solving 
##                            3.0526316                            4.0000000 
##              Q3.4.AI_rulling_society                       Q4.1.AI_costly 
##                            2.5263158                            3.5263158 
##                 Q4.2.Economic_crisis                 Q4.3.Economic_growth 
##                            3.0000000                            3.7894737 
##                        Q4.4.Job_loss                          Q5.Feelings 
##                            3.6315789                            1.4736842 
##                       Q6.1.Education                        Q6.2.Medicine 
##                            0.7368421                            0.7894737 
##                     Q6.3.Agriculture                   Q6.4.Constructions 
##                            0.4736842                            0.4736842 
##                       Q6.5.Marketing                  Q6.6.Administration 
##                            0.2631579                            0.4210526 
##                             Q6.7.Art                     Q7.Utility_grade 
##                            0.1578947                            8.0526316 
##                Q8.Advantage_teaching                Q9.Advantage_learning 
##                            1.6842105                            1.7368421 
##             Q10.Advantage_evaluation Q11.Disadvantage_educational_process 
##                            2.0526316                            2.0000000 
##                           Q12.Gender                    Q13.Year_of_study 
##                            1.3157895                            2.0000000 
##                            Q14.Major                     Q15.Passed_exams 
##                            2.2631579                            0.6842105 
##                              Q16.GPA 
##                            7.4368421
colMeans(num_data[clusterGroups == 5, ])
##                                   ID                      Q1.AI_knowledge 
##                                63.50                                 6.00 
##                        Q2.1.Internet                    Q2.2.Books.Papers 
##                                 0.95                                 0.35 
##                    Q2.3.Social_media                     Q2.4.Discussions 
##                                 0.55                                 0.15 
##                     Q2.5.NotInformed               Q3.1.AI_dehumanization 
##                                 0.05                                 2.15 
##                 Q3.2.Job_replacement                 Q3.3.Problem_solving 
##                                 3.35                                 4.35 
##              Q3.4.AI_rulling_society                       Q4.1.AI_costly 
##                                 2.80                                 3.35 
##                 Q4.2.Economic_crisis                 Q4.3.Economic_growth 
##                                 2.45                                 4.05 
##                        Q4.4.Job_loss                          Q5.Feelings 
##                                 3.15                                 1.70 
##                       Q6.1.Education                        Q6.2.Medicine 
##                                 0.80                                 0.95 
##                     Q6.3.Agriculture                   Q6.4.Constructions 
##                                 0.70                                 0.70 
##                       Q6.5.Marketing                  Q6.6.Administration 
##                                 0.50                                 0.40 
##                             Q6.7.Art                     Q7.Utility_grade 
##                                 0.15                                 8.45 
##                Q8.Advantage_teaching                Q9.Advantage_learning 
##                                 1.75                                 1.95 
##             Q10.Advantage_evaluation Q11.Disadvantage_educational_process 
##                                 2.30                                 2.10 
##                           Q12.Gender                    Q13.Year_of_study 
##                                 1.40                                 1.40 
##                            Q14.Major                     Q15.Passed_exams 
##                                 1.40                                 0.80 
##                              Q16.GPA 
##                                 8.20

Από την ολοκλήρωση της συσταδοποίησης παρατηρούμε ότι επιλέγοντας 3 τυχαία cluster από τα 6 συνολικά, μπορούμε να δούμε τον μέσο όρο της κάθε μεταβλητής για κάθε cluster και αντίστοιχα σε κάθε κατηγορία (από τις 3 Q7: χρήση ΑΙ, Q1: γνώση ΑΙ, Q5: στάση απέναντι στο ΑΙ).

Έπειτα, χρησιμοποιώντας την “colMeans” μπορούμε να αναλύσουμε όποιο cluster επιλέξουμε από τα διαθέσιμα και να δούμε τους μέσους όρους των απαντήσεων των φοιτητών ως προς κάθε ερώτηση / μεταβλητή.

Έχουμε έτσι την ευκαιρία όχι μόνο να συγκρίνουμε μία ερώτηση μεταξύ πολλών ομάδων αλλά να δούμε και σε κάθε ομάδα ποιες ερωτήσεις επηρεάζουν άλλες απαντήσεις για να εξάγουμε συμπεράσματα ως προς τη συνολική άποψη κάθε cluster φοιτητών για το ΑΙ.

Απομόνωση groups φοιτητών με ID

subset(Survey_AI, ID=="39")
##    ID Q1.AI_knowledge                                    Q2.AI_sources
## 39 39               7 Books/Scientific papers (physical/online format)
##    Q2.1.Internet Q2.2.Books.Papers Q2.3.Social_media Q2.4.Discussions
## 39             0                 1                 0                0
##    Q2.5.NotInformed Q3.1.AI_dehumanization Q3.2.Job_replacement
## 39                0                      2                    3
##    Q3.3.Problem_solving Q3.4.AI_rulling_society Q4.1.AI_costly
## 39                    4                       3              2
##    Q4.2.Economic_crisis Q4.3.Economic_growth Q4.4.Job_loss Q5.Feelings
## 39                    3                    4             3           2
##    Q6.Domains Q6.1.Education Q6.2.Medicine Q6.3.Agriculture Q6.4.Constructions
## 39  Education              1             0                0                  0
##    Q6.5.Marketing Q6.6.Administration Q6.7.Art Q7.Utility_grade
## 39              0                   0        0                7
##    Q8.Advantage_teaching Q9.Advantage_learning Q10.Advantage_evaluation
## 39                     1                     2                        1
##    Q11.Disadvantage_educational_process Q12.Gender Q13.Year_of_study Q14.Major
## 39                                    2          1                 2         2
##    Q15.Passed_exams Q16.GPA
## 39                1     7.7
clusterGroups[39]
## 39 
##  4
cluster2 = subset(Survey_AI, clusterGroups==4)
cluster2$ID[1:10]       
##  [1] 35 36 37 38 39 40 41 42 43 44
View(cluster2)

subset(Survey_AI, ID=="14")
##    ID Q1.AI_knowledge                                    Q2.AI_sources
## 14 14               9 Books/Scientific papers (physical/online format)
##    Q2.1.Internet Q2.2.Books.Papers Q2.3.Social_media Q2.4.Discussions
## 14             0                 1                 0                0
##    Q2.5.NotInformed Q3.1.AI_dehumanization Q3.2.Job_replacement
## 14                0                      2                    4
##    Q3.3.Problem_solving Q3.4.AI_rulling_society Q4.1.AI_costly
## 14                    5                       4              3
##    Q4.2.Economic_crisis Q4.3.Economic_growth Q4.4.Job_loss Q5.Feelings
## 14                    2                    5             5           1
##                                                                      Q6.Domains
## 14 Education;Medicine;Agriculture;Constructions;Marketing;Public Administration
##    Q6.1.Education Q6.2.Medicine Q6.3.Agriculture Q6.4.Constructions
## 14              1             1                1                  1
##    Q6.5.Marketing Q6.6.Administration Q6.7.Art Q7.Utility_grade
## 14              1                   1        0                9
##    Q8.Advantage_teaching Q9.Advantage_learning Q10.Advantage_evaluation
## 14                     1                     1                        3
##    Q11.Disadvantage_educational_process Q12.Gender Q13.Year_of_study Q14.Major
## 14                                    2          2                 1         3
##    Q15.Passed_exams Q16.GPA
## 14                1     9.2
clusterGroups[14]
## 14 
##  2
cluster3 = subset(Survey_AI, clusterGroups==2)
cluster3$ID[1:10]       
##  [1] 12 13 14 15 16 17 18 19 20 21
View(cluster3)

Σε αυτό το βήμα απομονώσαμε τους φοιτητές με ID = 39 και 14 με αποτέλεσμα να μπορούμε να δούμε ύστερα τα στοιχεία τους και σε ποιο cluster ανήκουν, αντίστοιχα.

Έπειτα, παίρνοντας το cluster στο οποίο ανήκει ο κάθε ένας από τους φοιτητές, μπορούμε να εμφανήσουμε και τα υπόλοιπα άτομα που ανήκουν στο cluster το οποίο μας ενδιαφέρει να ερευνήσουμε.

Παράδειγμα σε πανεπιστήμιο

Μπορούμε να δημιουργήσουμε ένα case study αντικαθιστώντας τα ID με ονόματα φοιτητών, σε περίπτωση μη ανώνυμης έρευνας, και να εντοπίσουμε από το κάθε τμήμα, Εφαρμοσμένης Πληροφορικής, Διεθνών και Ευρωπαϊκών Σπουδών κ.α., χωρίζοντάς τα σε clusters, την γνώση, χρήση και άποψη που έχουν για το ΑΙ ανάλογα με την εμπειρία τους και τον κλάδο σπουδών τους.

Survey_AI$ID[1:16] = c("iii29184", "iii29467", "iii29859", "iii29907", "iii29036", "iii29000", "iii29473", "iii29281", "iii29509", "iii29123", "iii29290", "iii29456", "iii29478", "iii29179", "iii29010", "iii29333")

# clustering
distances2 <- dist(num_data, method = "euclidean")
clusterSurvey2 <- hclust(distances2, method = "ward.D2")

clusterGroups2 = cutree(clusterSurvey2, k = 4)

# summaries
tapply(num_data$Q7.Utility_grade, clusterGroups2, mean)
##        1        2        3        4 
## 7.029412 8.052632 8.450000 6.444444
tapply(num_data$Q1.AI_knowledge, clusterGroups2, mean)
##        1        2        3        4 
## 5.823529 6.578947 6.000000 5.277778
tapply(num_data$Q5.Feelings, clusterGroups2, mean)
##        1        2        3        4 
## 1.382353 1.473684 1.700000 1.944444
colMeans(num_data[clusterGroups2 == 3, ])
##                                   ID                      Q1.AI_knowledge 
##                                63.50                                 6.00 
##                        Q2.1.Internet                    Q2.2.Books.Papers 
##                                 0.95                                 0.35 
##                    Q2.3.Social_media                     Q2.4.Discussions 
##                                 0.55                                 0.15 
##                     Q2.5.NotInformed               Q3.1.AI_dehumanization 
##                                 0.05                                 2.15 
##                 Q3.2.Job_replacement                 Q3.3.Problem_solving 
##                                 3.35                                 4.35 
##              Q3.4.AI_rulling_society                       Q4.1.AI_costly 
##                                 2.80                                 3.35 
##                 Q4.2.Economic_crisis                 Q4.3.Economic_growth 
##                                 2.45                                 4.05 
##                        Q4.4.Job_loss                          Q5.Feelings 
##                                 3.15                                 1.70 
##                       Q6.1.Education                        Q6.2.Medicine 
##                                 0.80                                 0.95 
##                     Q6.3.Agriculture                   Q6.4.Constructions 
##                                 0.70                                 0.70 
##                       Q6.5.Marketing                  Q6.6.Administration 
##                                 0.50                                 0.40 
##                             Q6.7.Art                     Q7.Utility_grade 
##                                 0.15                                 8.45 
##                Q8.Advantage_teaching                Q9.Advantage_learning 
##                                 1.75                                 1.95 
##             Q10.Advantage_evaluation Q11.Disadvantage_educational_process 
##                                 2.30                                 2.10 
##                           Q12.Gender                    Q13.Year_of_study 
##                                 1.40                                 1.40 
##                            Q14.Major                     Q15.Passed_exams 
##                                 1.40                                 0.80 
##                              Q16.GPA 
##                                 8.20
# check individual
subset(Survey_AI, ID=="iii29333")
##          ID Q1.AI_knowledge
## 16 iii29333               6
##                                                Q2.AI_sources Q2.1.Internet
## 16 Internet;Books/Scientific papers (physical/online format)             1
##    Q2.2.Books.Papers Q2.3.Social_media Q2.4.Discussions Q2.5.NotInformed
## 16                 1                 0                0                0
##    Q3.1.AI_dehumanization Q3.2.Job_replacement Q3.3.Problem_solving
## 16                      2                    2                    4
##    Q3.4.AI_rulling_society Q4.1.AI_costly Q4.2.Economic_crisis
## 16                       2              4                    2
##    Q4.3.Economic_growth Q4.4.Job_loss Q5.Feelings
## 16                    4             2           3
##                             Q6.Domains Q6.1.Education Q6.2.Medicine
## 16 Constructions;Public Administration              0             0
##    Q6.3.Agriculture Q6.4.Constructions Q6.5.Marketing Q6.6.Administration
## 16                0                  1              0                   1
##    Q6.7.Art Q7.Utility_grade Q8.Advantage_teaching Q9.Advantage_learning
## 16        0                4                     2                     2
##    Q10.Advantage_evaluation Q11.Disadvantage_educational_process Q12.Gender
## 16                        1                                    1          1
##    Q13.Year_of_study Q14.Major Q15.Passed_exams Q16.GPA
## 16                 2         3                1     8.2
clusterGroups2[Survey_AI$ID == "iii29333"]
## 16 
##  1
# cluster subset
cluster4 = subset(Survey_AI, clusterGroups2==1)
cluster4$ID[1:3]
## [1] "iii29184" "iii29467" "iii29859"
View(cluster4)

Εδώ το clustering έγινε πάλι με βάση τα IDs αλλά μπορούμε και πάλι μέσω του εμφανήσιμου πίνακα να παρατηρήσουμε τον μέσο όρο απαντήσεων από κάθε τμήμα καθώς και το τμήμα κάθε φοιτητή ξεχωριστά ή σε μέσω όρο.

Q14.Major           2.0000000

Όπου 2 = Statistics and Economic Forecasting.

Fin