Η σημασία του ορισμού της τεχνητής νοημοσύνης ανοιχτού κώδικα

Ένα έγγραφο 500 λέξεων κυκλοφόρησε πριν από αρκετές εβδομάδες που θα επηρεάσει σημαντικά το μέλλον του Διαδικτύου. To Open Source Initiative (OSI) δημοσίευσε έναν σχεδόν τελικό ορισμό της AI ανοιχτού κώδικα που θα απελευθερώσει την ευρεία κοινότητα των προγραμματιστών τεχνητής νοημοσύνης για να δημιουργήσει ένα ακμάζον κίνημα για την καινοτομία της τεχνητής νοημοσύνης, όπως και με τη δημιουργία του ίδιου του Διαδικτύου.

Το Λογισμικό ανοιχτού κώδικα υποστηρίζει την υποδομή του Διαδικτύου και τις περισσότερες εφαρμογές που χρησιμοποιούνται σήμερα. Αυτό συνέβη επειδή οι πρωτοπόροι ανοιχτού κώδικα το όρισαν ως λογισμικό που θα ήταν πάντα ελεύθερο να χρησιμοποιηθεί και να τροποποιηθεί. Αυτό επέτρεψε την ευρεία υιοθέτηση λογισμικού ανοιχτού κώδικα και την καινοτομία που τροφοδοτεί την ψηφιακή μας ζωή.

Δεν θα μπορούσε να έρθει σε καλύτερη στιγμή. Βλέπουμε ένα κύμα μοντέλων τεχνητής νοημοσύνης – πολλά από τις μεγαλύτερες εταιρείες τεχνολογίας – που διαφημίζονται από “ανοιχτού κώδικα” χωρίς όμως να αντανακλούν το πνεύμα του αρχικού ορισμού του λογισμικού ανοιχτού κώδικα. Αν και αυτό μπορεί να μοιάζει με σημασιολογία, αλλά οι λέξεις έχουν σημασία. Η ατημέλητη γλώσσα γύρω από την τεχνητή νοημοσύνη ανοιχτού κώδικα μπορεί να καταστρέψει τρισεκατομμύρια δολάρια στη μελλοντική καινοτομία και να αφήσει τους όρους της τεχνητής νοημοσύνης στα χέρια μερικών μεγάλων εταιρειών.

Υπάρχουν πολλά να χαθούν εάν δεν υπάρχει ένα πραγματικά ανοιχτό ήθος και κοινότητα ανάπτυξης AI. Μια πρόσφατη μελέτη από το Πανεπιστήμιο του Χάρβαρντ δείχνει ότι το λογισμικό ανοιχτού κώδικα έχει δημιουργήσει 8 τρισεκατομμύρια δολάρια σε οικονομική αξία. Όλη αυτή η καινοτομία βασίζεται στις διαβεβαιώσεις στον αρχικό ορισμό ανοιχτού κώδικα που γράφτηκε το 1998: ότι κάθε λογισμικό που αυτοαποκαλείται ανοιχτός κώδικας θα είναι πάντα ελεύθερο στη χρήση, τη μελέτη, την τροποποίηση και την κοινή χρήση. Αυτό σημαίνει ότι μπορείτε να δημιουργήσετε μια επιχείρηση, μια κρατική υπηρεσία — οτιδήποτε, πραγματικά — πάνω από λογισμικό ανοιχτού κώδικα χωρίς να φοβάστε ότι κάποιος μπορεί να σας χρεώσει ή να αλλάξει τους όρους χρήσης αυτού του λογισμικού στο μέλλον.

Θα δούμε αυτά τα ίδια οφέλη με το AI, αλλά μόνο εάν οι προγραμματιστές μπορούν ελεύθερα να χρησιμοποιούν, να μελετούν, να τροποποιούν και να μοιράζονται όλα τα στοιχεία ενός συστήματος AI. Η φράση “όλα τα στοιχεία ενός συστήματος AI” είναι κρίσιμη εδώ. Το AI και το λογισμικό έχουν κάποιες κρίσιμες διαφορές. Ένα σύστημα τεχνητής νοημοσύνης περιλαμβάνει κώδικα λογισμικού που δημιουργήθηκε από λειτουργικά μοντέλα τεχνητής νοημοσύνης και υποκείμενα δεδομένα εκπαίδευσης που χρησιμοποιούνται για τη δημιουργία του μοντέλου. Ο νέος ορισμός του OSI βεβαιώνει ότι ο κώδικας και τα μοντέλα πρέπει να είναι ανοιχτά και τα δεδομένα πρέπει να είναι διαφανή και αναπαραγώγιμα. Ας υποθέσουμε ότι θέλουμε να ξεκλειδώσουμε μια άλλη εποχή δημιουργικότητας και καινοτομίας. Σε αυτή την περίπτωση, χρειαζόμαστε τα εργαστήρια τεχνητής νοημοσύνης – συμπεριλαμβανομένων των μεγάλων εμπορικών παικτών – να ενστερνιστούν αυτόν τον ορισμό πριν ονομάσουν αυτό που κυκλοφορούν “ανοιχτού κώδικα”. Χωρίς αυτό, οι προγραμματιστές μπορεί να αποφεύγουν τα ανοιχτά μοντέλα και ολόκληρο το οικοσύστημα ανοιχτού κώδικα μπορεί να σταματήσει νωρίς.

Υπήρξε μια έκρηξη μεγάλων γλωσσικών μοντέλων (LLM) που προέρχονται από τις μεγαλύτερες εταιρείες τεχνολογίας – η Meta’s Llama είναι η πιο αξιοσημείωτη – που έχουν διαφημιστεί ως ανοιχτού κώδικα. Αυτά τα μοντέλα διευκολύνουν τη δημιουργία εφαρμογών AI χωρίς το υπερβολικό κόστος που απαιτείται για την κατασκευή τους από την αρχή. Έχουμε δει πολύτιμες εφαρμογές AI, από ανακάλυψη ναρκωτικών μέχρι την ιατρική εκπαίδευση, χτισμένες πάνω σε αυτά τα μοντέλα. Αυτό είναι ένα βήμα προς τη σωστή κατεύθυνση, αλλά υπάρχει μια προειδοποίηση: αυτά τα μοντέλα τεχνητής νοημοσύνης δεν είναι πραγματικά ανοιχτά.

Σε ένα άρθρο γνώμης του Economist νωρίτερα αυτή την εβδομάδα, ο Mark Zuckerberg και ο διευθύνων σύμβουλος του Spotify, Daniel Ek, ορίζουν την τεχνητή νοημοσύνη ανοιχτού κώδικα ως «μοντέλα των οποίων τα βάρη δημοσιεύονται δημόσια με μια επιτρεπτή άδεια» και αναφέρουν το Llama ως παράδειγμα. Αυτός ο στενός ορισμός αφήνει ανοιχτή την πόρτα σε εταιρείες όπως η Meta να αλλάξουν πορεία και να σταματήσουν να κυκλοφορούν τμήματα των μοντέλων τεχνητής νοημοσύνης τους εάν δεν εξυπηρετούν πλέον τα συμφέροντά τους. Εάν συνέβαινε αυτό, οι προγραμματιστές που έχουν χτίσει πάνω από αυτά τα μοντέλα μπορεί να βρουν τα προϊόντα τους μη λειτουργικά ή, τουλάχιστον, αυστηρά περιορισμένα — σκέφτονται ότι οι υπηρεσίες που έχουν διακοπεί και η καινοτομία έχει καθυστερήσει. Αυτό εγείρει πραγματικές ανησυχίες σχετικά με τη μακροπρόθεσμη βιωσιμότητα των εφαρμογών που βασίζονται σε αυτά τα μοντέλα — και, συνολικά, για τη βιωσιμότητα ενός ζωντανού οικοσυστήματος AI ανοιχτού κώδικα.

Τον Φεβρουάριο, ο Mozilla και το Columbia University συγκάλεσαν κορυφαίους ειδικούς να διερευνήσουν τι θα πρέπει να σημαίνει ανοιχτότητα στην εποχή της τεχνητής νοημοσύνης. Η δημοσίευση που προέκυψε επισήμανε τους κινδύνους από στενές και ακατάλληλες χρήσεις του όρου «ανοιχτού κώδικα» στην τεχνητή νοημοσύνη. Έθεσε επίσης μια κόκκινη σημαία γύρω από τις «ανοιχτές» άδειες, όπως η άδεια Llama, η οποία παρέχει δωρεάν χρήση μόνο για προϊόντα με λιγότερους από 700 εκατομμύρια μηνιαίους χρήστες. Μπορείτε να φανταστείτε να δημιουργήσετε την εκκίνηση σας σε ανοιχτό λογισμικό που θα κλειδωνόταν μόλις η επιχείρησή σας είναι επιτυχημένη; Αυτό το αποτέλεσμα θα είχαν οι άδειες όπως αυτή.

Το προσχέδιο του ορισμού στοχεύει στην αντιμετώπιση αυτών των κινδύνων — χαράσσοντας σαφή όρια γύρω από το τι θεωρείται τεχνητή νοημοσύνη ανοιχτού κώδικα, ώστε οι προγραμματιστές να γνωρίζουν σε τι μπορούν να βασιστούν. Αυτό θα βάλει τον άνεμο στα πανιά των εργαστηρίων AI που κατασκευάζουν μοντέλα τεχνητής νοημοσύνης ανοιχτού κώδικα που δεν θα εξαφανιστούν ή τελικά δεν θα κλείσουν.

Παραδείγματα περιλαμβάνουν το GPT-NeoX-20B της EleutherAI, που κυκλοφόρησε με την άδεια Apache 2.0, η οποία επιτρέπει σε οποιονδήποτε να χρησιμοποιήσει το μοντέλο. Ομοίως, το μοντέλο OLMo του Ινστιτούτου Allen παρέχει πλήρη πρόσβαση στον κώδικα, τα δεδομένα, τα βάρη και τη σουίτα αξιολόγησης που χρησιμοποιήθηκαν για την ανάπτυξή του, επιτρέποντας στους ερευνητές να τον μελετήσουν και να τον βελτιώσουν. Σε αντίθεση με το Llama του Meta, αυτά τα μοντέλα επιτρέπουν στους ερευνητές να μελετήσουν και να δοκιμάσουν πλήρως την εσωτερική λειτουργία των συστημάτων AI και να τα προσαρμόσουν στις δικές τους ανάγκες.

Αξίζει επίσης να σημειωθεί ότι εργαστήρια όπως το Eleuther και το AI2 είναι μη κερδοσκοπικοί οργανισμοί, δίνοντας στους προγραμματιστές τη σιγουριά ότι αυτοί οι πόροι θα παραμείνουν διαθέσιμοι και ενημερωμένοι, διασφαλίζοντας τη βιωσιμότητα των προϊόντων τους που βασίζονται σε αυτά τα μοντέλα. Αυτή η ίδια αρχή της διαρκούς υποστήριξης έχει κάνει έργα ανοιχτού κώδικα όπως το Linux και το Apache τόσο διαδεδομένα στους διακομιστές σε όλο τον κόσμο. Οι προγραμματιστές γνωρίζουν και εμπιστεύονται τα θεμέλια Linux και Apache θα συνεχίσουν να διατηρούν το λογισμικό τους που λειτουργεί προς το δημόσιο συμφέρον.

Το έργο αυτών των μη κερδοσκοπικών οργανισμών έχει τη δυνατότητα να δημιουργήσει ένα μέλλον τεχνητής νοημοσύνης που ταυτόχρονα συμβάλλει σε ένα ευρύτερο δημόσιο αγαθό και δημιουργεί μια πραγματικά ανοιχτή εργαλειοθήκη για την εποχή της τεχνητής νοημοσύνης. Οι υπεύθυνοι χάραξης πολιτικής, οι δωρητές και η ευρύτερη τεχνολογική κοινότητα θα πρέπει να εντείνουν και να υποστηρίξουν πρωτοβουλίες όπως αυτές. Οι πιο εξέχοντες εμπορικοί φορείς θα πρέπει να πάρουν αυτά τα έργα ως πρότυπο, αλλάζοντας την προσέγγισή τους σε μία ακόμη, σύμφωνα με τον νέο ορισμό του OSI. Εάν το κάνουμε σωστά, μπορούμε να δώσουμε τη δυνατότητα σε οποιονδήποτε — και σε οποιαδήποτε κοινότητα — να διαμορφώσει, να απολαύσει και να εμπιστευτεί την τεχνητή νοημοσύνη. Το μέλλον της ψηφιακής μας υποδομής και η ικανότητά μας να καινοτομούμε εξαρτάται από αυτό.

Πηγή άρθρου https://thenewstack.io/

Leave a Comment Cancel reply