ΕΛ/ΛΑΚ | creativecommons.gr | mycontent.ellak.gr |
freedom

Apertus: Ένα νέο κεφάλαιο στην ανοιχτή, διαφανή και πολυγλωσσική τεχνητή νοημοσύνη

Στις 2 Σεπτεμβρίου, το EPFL, το ETH Zurich και το Swiss National Supercomputing Centre (CSCS) παρουσίασαν το Apertus, το πρώτο μεγάλο, ανοιχτό και πολυγλωσσικό μοντέλο γλώσσας της Ελβετίας. Πρόκειται για ένα ορόσημο στην ιστορία της γενετικής τεχνητής νοημοσύνης, το οποίο συνδυάζει τη διαφάνεια, την ανοιχτή πρόσβαση και την πολυγλωσσία, ανοίγοντας νέους δρόμους για έρευνα, καινοτομία και κοινωνική πρόοδο.

Η ονομασία Apertus, που στα λατινικά σημαίνει «ανοιχτός», αντικατοπτρίζει πλήρως τον χαρακτήρα του έργου: όλα τα στάδια ανάπτυξης, από την αρχιτεκτονική και τα βάρη του μοντέλου μέχρι τα δεδομένα εκπαίδευσης και τις μεθόδους, είναι ελεύθερα διαθέσιμα και πλήρως τεκμηριωμένα. Αυτή η προσέγγιση διαφοροποιεί το Apertus από άλλα μοντέλα που συνήθως κρατούν σημαντικά μέρη της διαδικασίας κλειστά.

Ένα πλήρως ανοιχτό μοντέλο

Το Apertus διατίθεται σε δύο εκδόσεις: με 8 δισεκατομμύρια και με 70 δισεκατομμύρια παραμέτρους. Η μικρότερη έκδοση είναι πιο κατάλληλη για ατομική χρήση και πειραματισμό, ενώ η μεγαλύτερη απευθύνεται σε ερευνητικά κέντρα και βιομηχανικές εφαρμογές. Και οι δύο εκδόσεις κυκλοφορούν με μια άδεια ανοιχτού κώδικα, γεγονός που σημαίνει ότι μπορούν να χρησιμοποιηθούν όχι μόνο στην εκπαίδευση και την έρευνα, αλλά και σε εμπορικές εφαρμογές και κοινωνικές πρωτοβουλίες.

Οι ενδιαφερόμενοι μπορούν να κατεβάσουν το μοντέλο απευθείας από την πλατφόρμα Hugging Face ή να έχουν πρόσβαση μέσω της Swisscom, στρατηγικού εταίρου της Ελβετικής Πρωτοβουλίας για την ΤΝ. Έτσι, επιστήμονες, επαγγελματίες αλλά και έμπειροι ενθουσιώδεις χρήστες μπορούν να το αξιοποιήσουν, να το προσαρμόσουν στις ανάγκες τους ή να ελέγξουν λεπτομερώς τη διαδικασία εκπαίδευσης.

Ένα από τα πιο εντυπωσιακά χαρακτηριστικά του Apertus είναι η πολυγλωσσική του φύση. Το μοντέλο έχει εκπαιδευτεί σε 15 τρισεκατομμύρια tokens από περισσότερες από 1.000 γλώσσες, με το 40% των δεδομένων να μην είναι στα αγγλικά. Αυτό σημαίνει ότι δίνεται χώρος σε γλώσσες που μέχρι τώρα ήταν ουσιαστικά αόρατες στον χώρο των μεγάλων γλωσσικών μοντέλων, όπως τα ελβετικά γερμανικά και η ρομανσική γλώσσα.

Με αυτόν τον τρόπο, το Apertus δεν είναι απλώς ένα ακόμη εργαλείο ΤΝ. Αντιπροσωπεύει μια προσπάθεια για συμπερίληψη και ισότητα γλωσσών, φέρνοντας στο επίκεντρο φωνές που συχνά παραμελούνται από τις κυρίαρχες τεχνολογικές εταιρείες.

Καινοτομία με διαφάνεια

Η ανάπτυξη του Apertus δεν αποτελεί μια τυπική διαδικασία μεταφοράς τεχνολογίας από την έρευνα στην αγορά. Αντίθετα, οι δημιουργοί του το βλέπουν ως κινητήρια δύναμη καινοτομίας και ως μέσο ενίσχυσης της τεχνογνωσίας στην τεχνητή νοημοσύνη σε όλα τα επίπεδα – από την επιστημονική κοινότητα έως τη βιομηχανία και την κοινωνία.

Σύμφωνα με τον καθηγητή Martin Jaggi του EPFL, το Apertus προσφέρει ένα πρότυπο για το πώς μπορεί να αναπτυχθεί ένα αξιόπιστο, κυρίαρχο και συμπεριληπτικό μοντέλο ΤΝ. Η ομάδα ανάπτυξης, αποτελούμενη από μηχανικούς και ερευνητές των CSCS, ETH Zurich και EPFL, δεσμεύεται να ενημερώνει και να εξελίσσει τακτικά το μοντέλο.

Η διαφάνεια βρίσκεται στον πυρήνα του Apertus. Μαζί με τα μοντέλα δημοσιεύονται ο πλήρης κώδικας, η τεκμηρίωση, τα datasets, καθώς και όλα τα ενδιάμεσα checkpoints. Το εκπαιδευτικό σύνολο δεδομένων έχει δημιουργηθεί με σεβασμό σε νομικά και ηθικά πρότυπα:

  • Χρησιμοποιούνται μόνο δημόσια διαθέσιμα δεδομένα.
  • Έχουν αφαιρεθεί προσωπικά δεδομένα και ανεπιθύμητο περιεχόμενο.
  • Λαμβάνονται υπόψη αιτήματα ιστοτόπων για εξαίρεση από τη χρήση.
  • Υπάρχει συμμόρφωση με τον Ελβετικό νόμο περί προστασίας δεδομένων, τον νόμο περί πνευματικών δικαιωμάτων και τις υποχρεώσεις διαφάνειας του Ευρωπαϊκού AI Act.

Αυτή η προσέγγιση ενισχύει την εμπιστοσύνη και καθιστά το Apertus ένα υπόδειγμα υπεύθυνης τεχνολογικής ανάπτυξης.

Δημόσιο αγαθό και προσβασιμότητα

Το Apertus δεν προορίζεται μόνο για ειδικούς. Στόχος των δημιουργών του είναι να λειτουργήσει ως δημόσιο αγαθό, όπως το νερό, το ηλεκτρικό ρεύμα ή οι υποδομές μεταφορών. Μέσα από πρωτοβουλίες όπως οι Swiss {ai} Weeks, προγραμματιστές θα έχουν την ευκαιρία να πειραματιστούν με το μοντέλο, να αξιολογήσουν τις δυνατότητές του και να συνεισφέρουν με ανατροφοδότηση για μελλοντικές βελτιώσεις.

Η Swisscom έχει ήδη αναπτύξει ειδική διεπαφή ώστε να διευκολύνει την αλληλεπίδραση με το μοντέλο, ενώ για χρήστες εκτός Ελβετίας, το Public AI Inference Utility προσφέρει πρόσβαση στο Apertus, υποστηρίζοντας ένα παγκόσμιο κίνημα για ανοιχτή ΤΝ.

Το μέλλον του Apertus

Η κυκλοφορία του Apertus δεν αποτελεί το τέλος αλλά την αρχή ενός ταξιδιού. Οι επόμενες εκδόσεις αναμένεται να διευρύνουν την οικογένεια μοντέλων, να βελτιώσουν την αποδοτικότητα και να εξερευνήσουν εξειδικευμένες εφαρμογές σε τομείς όπως το δίκαιο, η κλιματική επιστήμη, η υγεία και η εκπαίδευση.

Όπως τονίζει ο Antoine Bosselut, επικεφαλής του Εργαστηρίου Επεξεργασίας Φυσικής Γλώσσας του EPFL, η πρόκληση δεν είναι μόνο να κατασκευαστεί ένα ισχυρό μοντέλο, αλλά να διατηρηθεί ανοιχτό, αξιόπιστο και προσβάσιμο για το κοινό συμφέρον.

Το Apertus αντιπροσωπεύει μια νέα εποχή στην τεχνητή νοημοσύνη. Ως το πρώτο μεγάλο πολυγλωσσικό μοντέλο που είναι πλήρως ανοιχτό και διαφανές, συνδυάζει την τεχνολογική καινοτομία με την κοινωνική ευθύνη. Προσφέρει τη δυνατότητα σε ερευνητές, εταιρείες αλλά και πολίτες να συμβάλουν στη διαμόρφωση ενός οικοσυστήματος ΤΝ που στηρίζεται στην εμπιστοσύνη, τη συνεργασία και την ισότιμη πρόσβαση.

Η επιτυχία του Apertus δείχνει ότι η τεχνητή νοημοσύνη δεν χρειάζεται να είναι ένα κλειστό και εμπορικό προνόμιο. Μπορεί να είναι δημόσια υποδομή, σχεδιασμένη για το συλλογικό καλό, χτίζοντας γέφυρες μεταξύ γλωσσών, κοινοτήτων και πολιτισμών.

Πηγή άρθρου: https://ethz.ch/

Leave a Comment

Social Media Auto Publish Powered By : XYZScripts.com