Η συζήτηση για τα μεγάλα γλωσσικά μοντέλα (Large Language Models – LLMs) και το τι μπορούν να κάνουν, ήρθε στην επικαιρότητα πριν μερικά χρόνια. Από τη πρώτη στιγμή, το δίλημμα ήταν κατά πόσο πραγματικά «παράγουν» σκέψη ή απλά μιμούνται τη δυνατότητα των ανθρώπων να συντονίζουμε σκέψεις και πράξεις ώστε να χτίζουμε σύνθετα δημιουργήματα. Με άλλα λόγια, μπορούν να παράξουν σοφία ή είναι απλά σοφιστές;
Μια μεγάλη μερίδα ανθρώπων εμμέσως πλην σαφώς τάχθηκε στο ευρύτερο φάσμα του μιμιτισμού. Ναι, λέει, ένα LLM μπορεί να μιμηθεί εξαιρετικά πειστικά τους ανθρώπους αλλά «κάνει παιδαριώδη λάθη, όταν του ζήτησα αυτό το απλό πράγμα». Έχει πολλές «παραισθήσεις» – όπως ονομάστηκε η παραγωγή ψευδών ή ανακριβών πληροφοριών – ειδικά όταν το μοντέλο αναζητά επιστημονικές πηγές ή πράγματα που «αν απλά γκουγκλάρουμε τα βρίσκουμε πιο γρήγορα». Αυτό οδήγησε αρκετούς να παραμείνουν μεταξύ ενός χαλαρού σκεπτικισμού ή βαθύτητης απόρριψης των LLMs, υποστηρίζοντας πως στο τέλος της ημέρας «δεν είναι όσο χρήσιμα μας λένε» ή πως είναι μια «μηχανή αντιγραφής».
Στον αντίποδα, αρκετοί από όσους χρησιμοποιούν LLMs, ή μάλλον το γνωστότερο τους υποπροϊόν – δηλαδή το περιβάλλον διαδικτυακής συζήτησης, κοινώς το chatbox – φαίνεται πως έχουν υπερεπενδύσει στην ικανότητα των μοντέλων να παράγουν μιας συγκεκριμένης μορφής σκέψη, την ψυχολογική/αυτοεπιβεβαιωτική. Σύμφωνα με τις εταιρείες-κολοσσούς πίσω από τα πιο δημοφιλή μοντέλα, η βασική χρήση των LLMs για την πλειοψηφία των χρηστών είναι ως ένα φθηνότερο ψυχολόγο ή ιδιόμορφο φίλο ή ακόμα και, προφανώς σπανιότερα, ως εικονικού συντρόφου. Για αυτούς τους χρήστες είναι σαφές πως το ζητούμενο δεν είναι αν τα μοντέλα έχουν τη δυνατότητα ή ικανότητα σκέψης με την «φιλοσοφική» έννοια, τους αρκεί πως μπορούν να παράξουν σκέψη που αυτοί θα καταναλώσουν, με στόχο την αντιμετώπιση ή – δυστυχώς συχνότερα – τη διαιώνιση ενός προβλήματος.
Κοιτώντας πέρα από το εάν όσα παράγει ένα LLM είναι πραγματικές σκέψεις ή όχι, ένας αυξανόμενος αριθμός ανθρώπων τα αντιμετωπίζει σαν ένα νέο τύπο μηχανής ή ένα νέο εργαλείο. Η ουσιαστική διαφορά που έχει με προηγούμενα εργαλεία που μετέβαλλαν τον τρόπο που δημιουργούμε κάτι, είναι πως για πρώτη φορά τα εργαλεία προσπαθούν να αντικαταστήσουν κάθε μορφή δημιουργίας – αυτό είναι άλλωστε το μεγάλο στοίχημα πίσω από το κυνήγι μιας «Γενικής Τεχνητής Νοημοσύνης» (AGI). Άσχετα με το πόσο κοντά είμαστε σε αυτό, οι νεότερες εκδόσεις των υπάρχοντων LLMs μπορούν να πραγματοποιούν πράγματα που μέχρι πρότινος απαιτούσαν συντονισμένη και σύνθετη δουλειά μηνών, μέσα σε λίγες ώρες.
Για παράδειγμα, οι επιστημονικές εργασίες απαιτούν ενα μεταβαλλόμενο σύνολο διάφορων ενεργειών: εύρεση ερωτήματος, συλλογή και περιγραφή βιβλιογραφίας, πρόσβαση και ανάλυση δεδομένων, περιγραφή των αποτελεσμάτων, δόμηση ενός θεωρητικού μοντέλου και συγγραφή όλων αυτών σε κάτι που μπορεί να διαβαστεί από άλλους επιστήμονες. Όσοι γνωρίζουν πως να χρησιμοποιούν τα LLMs σαν ένα σύνολο εργαλείων στα οποία τους δίνουμε συγκεκριμένες κατευθύνσεις και τα υποχρεώνουμε να επανεξετάζουν συνεχώς όσα σκέφτονται, μπορούν ΉΔΗ να φτιάξουν μια επιστημονική εργασία από το μηδέν μέσα σε λίγες ώρες ή μέρες.
Προφανώς, η εργαλειακή χρήση των LLM μπορεί να γίνει και με απλουστευτικό τρόπο. Όσοι βρίσκονται στα μαθητικά ή φοιτητικά τους χρόνια, είναι πλέον εμφανές πως είναι εξαιρετικά δύσκολο να μην μπουν στον πειρασμό της αντιγραφής και επιδερμικής χρήσης τους. Η πλειοψηφία, απλά θέλει κάποιος να τους λύσει το πρόβλημα που έχουν για την επόμενη μέρα, και ας τους κάνει να σκέφτονται λιγότερο. Αρκετοί μάλιστα πολλές φορές δηλώνουν ανοιχτά πως δεν ενδιαφέρονται για το ζήτημα της σκέψης, αφού «μπορεί να το κάνει αυτό για μένα».
Στο σχεδιασμό συστημάτων, θεμελιώδη βαρύτητα έχει η φράση “ο σκοπός ενός συστήματος είναι αυτό που κάνει” (POSIWID). Με λίγα λόγια λέει πως, η πραγματική λειτουργία ενός συστήματος καθορίζεται από τα παρατηρούμενα αποτελέσματά του, και όχι από τους δηλωμένους στόχους, τις προθέσεις ή τις προδιαγραφές του. Ουσιαστικά, είναι πλέον αδιάφορο για τους περισσότερους μας αν τα LLMs σκέφτονται ή όχι με βάση κάποια φιλοσοφικά κριτήρια – το ζήτημα είναι πως η χρήση τους οδηγεί νομοτελειακά σε κάτι που θα ρευστοποιήσει συθέμελα τις ζωές μας.
Στη Σκανδιναβική μυθολογία, το Ράγκναροκ έχει παραλληλιστεί με τη Χριστιανική Αποκάλυψη. Σε αυτό το πλαίσιο, η αδιάκοπη αναζήτηση της γνώσης από τον Όντιν, για την οποία θυσίασε πρόθυμα το ίδιο του το μάτι, δεν αποσκοπούσε στην αποτροπή του αναπόφευκτου Ράγκναροκ. Αντιθέτως, πλήρωσε αυτό το βαρύ τίμημα για να αποκτήσει την απόλυτη ενόραση που χρειαζόταν, ώστε να αντιμετωπίσει την καταστροφή της εποχής του με πλήρη ετοιμότητα.
Υπό αυτό το πρίσμα, ο δικός του «θαυμαστός νέος κόσμος» δεν είναι μια σκοτεινή δυστοπία, αλλά η εξαγνισμένη πραγματικότητα που αναδύεται μέσα από τις στάχτες. Μέσα από αυτόν τον μύθο κατανοούμε πως η αληθινή σοφία δεν έγκειται στο να πολεμάς το πεπρωμένο, αλλά στο να προετοιμάζεσαι για τη νέα αρχή που ακολουθεί. Και η εποχή που ήδη αρχίζει, θα μας υποχρεώσει να ανατρέψουμε το σύνολο των βεβαιοτήτων μας για το πώς λειτουργεί ο κόσμος – θέλοντας και μη.
Image credits: Αγγελική Ανάγνου (@lanworks)
Ο Αργύρης Σακαλής έχει σπουδάσει Οικονομικά
Και είναι ερευνητής στο Durham University
