Anzeige
Anzeige
Anzeige
Lesedauer 3 Min.

KI löst spielend fast alle Prüfungsaufgaben

Generative künstliche Intelligenz (GenKI) wie ChatGPT könnte so manche Prüfung an Hochschulen bestehen, so Antoine Bosselut von der Eidgenössischen Technischen Hochschule Lausanne (EPFL).
© (Quelle: ETHZ)

Sein Team hat den GenKI-Varianten GPT 3.5 und GPT 4 Prüfungsfragen aus 50 Kursen vorgelegt, die ein breites Spektrum an MINT-Disziplinen abdecken, darunter Informatik, Mathematik, Biologie, Chemie, Physik und Materialwissenschaften.

Trefferquote bei 65,8 Prozent

Die Forscher haben festgestellt, dass GPT 4 im Schnitt 65,8 Prozent der Fragen richtig beantwortete, wenn sie jemand stellt, der von der Technik nichts versteht, die hinter der KI steckt. Die besser Informierten kamen auf eine Erfolgsquote von bis zu 85,1 Prozent.

"Wir waren von den Ergebnissen überrascht. Niemand hatte erwartet, dass die KI-Assistenten in so vielen Kursen einen so hohen Prozentsatz an richtigen Antworten erzielen würden", sagt Anna Sotnikova, Postdoc im Natural Language Processing Laboratory der EPFL.

Studenten vertrauen auf GenKI

Im Hochschulbereich setzen Studenten zunehmend KI-Assistenten ein, um Aufgaben zu lösen und zu lernen. Diese Tools bieten zwar Möglichkeiten für eine verbesserte Lehre und Ausbildung, stellen aber auch eine grosse Herausforderung für die Bewertung und die Lernergebnisse dar.

Bislang gibt es kaum Studien über potenzielle Folgen auf Bewertungsmethoden, die Hochschulen anwenden. Gute Arbeiten können durchaus von Studenten abgeliefert werden, die gar nichts verstehen. Es ist nicht ausgeschlossen, dass die Sprachmodelle Bachelor- oder noch anspruchsvollere Prüfungen bestehen.

"Wir hatten das Glück, dass uns ein grosses Konsortium von EPFL-Professoren, Lehrern und Lehrassistenten dabei half, den bisher grössten Datensatz an Kursmaterialien, Bewertungen und Prüfungen zu sammeln, um eine Vielzahl von Materialien für unsere Studiengänge zu erhalten", so Bosselut.

Und weiter: "Diese Daten brachten wir in ein Format, von dem wir annehmen, dass es der Art und Weise am ehesten ähnelt, wie Studenten diese Informationen tatsächlich an grosse Sprachmodelle weitergeben. Anschliessend generierten wir Antworten von den Modellen und sahen, wie gut sie antworteten."

Strengere Bewertungen in Anflug

Kurzfristig spricht sich Bosselut für strengere Bewertungen aus - nicht im Sinne der Schwierigkeit der Fragen, sondern im Sinne der Komplexität der Bewertung selbst, bei der mehrere Fähigkeiten aus verschiedenen Konzepten, die im Laufe des Semesters erlernt werden und in einer ganzheitlichen Bewertung zusammengeführt werden, berücksichtigt werden müssen.

"Die Modelle sind noch nicht wirklich darauf ausgelegt, auf diese Art und Weise zu planen und zu arbeiten, und letztendlich sind wir der Meinung, dass dieses projektbasierte Lernen für die Studierenden ohnehin besser ist", unterstreicht Bosselut abschliessend. (pressetext.com)

Kommentare

Künstliche Intelligenz KI & Trends
Anzeige
Anzeige

Neueste Beiträge

Vernehmlassung
Angepasste Unternehmensabgabe für Radio und TV
Der Bundesrat will das Tarifmodell der Unternehmensabgabe für Radio und Fernsehen anpassen und damit einen Entscheid des Bundesgerichts umsetzen. Die Vernehmlassung zur Teilrevision der Radio- und Fernsehverordnung wird am 23. Juni 2026 eröffnet.
2 Minuten
19. Jun 2026
AI Frontier Hackathon
Neurodiverse IT-Lernende entwickeln bei Microsoft eigene KI-Agenten
Über 40 neurodiverse IT-Lernende und Ausbildner, darunter Lernende im Autismus-Spektrum und mit ADHS, entwickelten beim AI Frontier Hackathon von Kauz Informatik Medien AG und Microsoft Schweiz eigene KI-Agenten.
3 Minuten
21. Jun 2026
Die besten PCtipp-Artikel aus der Kalenderwoche 24
In der Kalenderwoche 24 vom 08. bis zum 14. Juni 2026 standen die Artikel «Ubuntu 26.04 LTS ist da!» und «Mini-Cup-Game in der Google-Suche spielen» ganz oben in der Gunst unserer Leserschaft.  
2 Minuten
19. Jun 2026

Das könnte Sie auch interessieren

NFC-Angriffe auf Android verdreifacht
Cyberkriminelle nutzen zunehmend NFC-Technologie, um Bankdaten von Android-Nutzern zu stehlen. Die Angriffszahlen sind in wenigen Monaten dramatisch gestiegen.
2 Minuten
28. Mai 2026
Radios können Gesuche einreichen
BAKOM publiziert UKW-Frequenzen
Das Bundesamt für Kommunikation BAKOM hat am 28. Mai 2026 die Frequenzpakete für die Verbreitung von UKW publiziert.
2 Minuten
29. Mai 2026
Viele Mobilfunk-Anbieter senken Roaming-Preise
Die Sommerferien stehen vor der Tür. Daher hat der Online-Vergleichsdienst moneyland.ch die Kosten für die Nutzung des Smartphones im Ausland analysiert.
6 Minuten
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige

Kommentare