Matura 2025: AI siada do egzaminu z języka polskiego. Kto zasłużył na brawa, a kto do poprawki?
INFORMACJA06-05-2025
Matura 2025: AI siada do egzaminu z języka polskiego. Kto zasłużył na brawa, a kto do poprawki?
Czy sztuczna inteligencja byłaby w stanie zdać maturę? To pytanie, które kiedyś brzmiałoby jak żart z lekcji informatyki, dziś stało się tematem poważnego eksperymentu dziennikarskiego. Redakcja Interii postanowiła sprawdzić, jak trzy popularne modele AI poradzą sobie z wypracowaniem maturalnym z języka polskiego. Temat? Wcale nie banalny: „Jak błędna ocena sytuacji wpływa na życie człowieka?” I choć nie było sali gimnastycznej, stresu ani zakreślaczy, to emocji nie brakowało. Na cyfrowej tablicy wyników pojawiły się liczby, które mogą zaskoczyć niejednego ucznia – i niejednego nauczyciela.

Model od OpenAI poradził sobie celująco, uzyskując 94% możliwych punktów. Jak podkreśliła egzaminatorka:

"Praca była spójna, logiczna i wykraczała poza standard uczniowski. Gdybym nie wiedziała, że to AI, uznałabym, że to bardzo dobrze przygotowany maturzysta." -

Claude (Anthropic): 32/35 – Solidna robota

Drugi na podium Claude zdobył 91%, co również zasługuje na wysoką ocenę. Była to praca "bardzo dobra", choć – jak zauważono – momentami brakowało oryginalności lub głębi w interpretacji. Mimo to, wynik imponujący jak na cyfrowego ucznia.

DeepSeek (Chiński model AI): 7/35 – Niestety, niezaliczone

Na trzecim biegunie – model DeepSeek, który zdobył jedynie 20% punktów. Praca została oceniona jako niepoprawna zarówno pod względem językowym, jak i merytorycznym. Zdaniem ekspertów, tekst „nie spełniał podstawowych kryteriów maturalnych”.

Sztuczna inteligencja na maturze?

Jak komentuje nauczycielka polskiego:

Dwie z trzech prac przewyższają poziomem to, z czym najczęściej mamy do czynienia przy ocenie prac maturalnych. AI nie tylko rozumie polecenie, ale także potrafi je zrealizować w logiczny i dojrzały sposób.

To oznacza jedno: AI nie tylko rozumie „Pana Tadeusza”, ale też wie, jak go umiejętnie przytoczyć. Przynajmniej niektóre modele.

Co różniło zwycięzców od przegranego?

Klucz leży w danych treningowych i architekturze modelu. Zarówno ChatGPT, jak i Claude, były szkolone na ogromnych zbiorach tekstów literackich i akademickich, co pozwoliło im operować językiem na wysokim poziomie. DeepSeek – choć szybko zdobywa popularność w Azji – nie został jeszcze dostrojony do specyfiki zadań maturalnych czy polskiej literatury.

Wnioski na przyszłość

Ten eksperyment to nie tylko ciekawostka, ale też początek ważnej rozmowy o roli AI w edukacji. Czy uczniowie będą korzystać z takich narzędzi? Tak. Czy szkoły powinny uczyć, jak to robić mądrze i etycznie? Zdecydowanie tak.

Bo choć sztuczna inteligencja może pomóc napisać wypracowanie, to jeszcze nie zastąpi refleksji, jaką daje prawdziwe zrozumienie tekstu – i życia.

Udostępnij ten artykuł: