ΕΛ/ΛΑΚ | creativecommons.gr | mycontent.ellak.gr |
freedom

Μarin: Ένα Ανοικτό Εργαστήριο για την Ανάπτυξη Βασικών Μοντέλων Τεχνητής Νοημοσύνης

Η ανάπτυξη της τεχνητής νοημοσύνης (AI) και, ειδικότερα, των θεμελιωδών μοντέλων (foundation models) έχει αποτελέσει την αιχμή του δόρατος για την επιστημονική και τεχνολογική καινοτομία της τελευταίας δεκαετίας. Αν και το ανοιχτό λογισμικό έχει αποδείξει την αξία του ως ένα επιτυχημένο μοντέλο ανάπτυξης και συνεργασίας, το αντίστοιχο πλαίσιο στον τομέα της τεχνητής νοημοσύνης παραμένει ατελές. Το Marin συστήνεται ως απάντηση σε αυτό το έλλειμμα διαφάνειας: ένα πλήρως ανοικτό εργαστήριο όπου η ανάπτυξη μοντέλων είναι επαναλήψιμη, κοινοτική και επιστημονικά τεκμηριωμένη από την πρώτη ημέρα. Στόχος του είναι όχι μόνο να προάγει την επιστημονική έρευνα αλλά και να καταστήσει την κατασκευή μοντέλων AI μια συλλογική διαδικασία.

Το Κενό στην Ανοιχτή Τεχνητή Νοημοσύνη

Παρά την πρόοδο που έχει σημειωθεί με μοντέλα όπως τα Llama, DeepSeek, Gemma, τα οποία διατίθενται με ανοικτά βάρη (open weights), σπανίως συνοδεύονται από τον πλήρη κώδικα και τις συνταγές δεδομένων που χρησιμοποιήθηκαν για την εκπαίδευσή τους. Αυτό σημαίνει πως δεν πληρούν τις προδιαγραφές του πραγματικού ανοιχτού κώδικα. Ερευνητικές ομάδες όπως οι Eleuther AI, AI2, Hugging Face, BigScience, BigCode, Together AI έχουν κάνει βήματα προς αυτή την κατεύθυνση, δημοσιεύοντας τόσο τους κώδικες όσο και τα δεδομένα, επιτρέποντας την αναπαραγωγή και τη μετεξέλιξη των μοντέλων τους.

Το Marin προχωρά ένα βήμα παραπέρα, εισάγοντας μία υποδομή και μεθοδολογία που επιτρέπει την πλήρη διαφάνεια και τη συλλογική συμμετοχή στην έρευνα και ανάπτυξη των θεμελιωδών μοντέλων.

Marin: Μία Νέα Μορφή Ανοιχτού Εργαστηρίου

Το Marin λειτουργεί ως ένα “ανοικτό εργαστήριο” (open lab) όπου κάθε πτυχή της έρευνας και της ανάπτυξης είναι δημόσια και τεκμηριωμένη από την αρχή. Αξιοποιεί το GitHub όχι μόνο ως αποθετήριο κώδικα, αλλά ως το κεντρικό μέσο οργάνωσης και τεκμηρίωσης των πειραμάτων. Κάθε πείραμα ορίζεται και παρακολουθείται μέσω GitHub issues, τα οποία λειτουργούν ως προκαταρτικές δηλώσεις υποθέσεων και στόχων (mini-preregistration).

Η διαδικασία είναι η εξής:

  1. Υποβολή πειράματος: Ένας ερευνητής υποβάλλει pull request (PR) με τον απαραίτητο κώδικα.
  2. Αξιολόγηση: Ο PR αξιολογείται δημόσια, με δυνατότητα σχολιασμού και διαλόγου από την κοινότητα.
  3. Εκτέλεση: Εφόσον εγκριθεί, το πείραμα εκτελείται δημόσια και τα αποτελέσματα τεκμηριώνονται σε πραγματικό χρόνο.
  4. Αναλύσεις: Τα ευρήματα και η ανάλυση ενσωματώνονται στο αρχικό issue.

Με τον τρόπο αυτό, εξασφαλίζεται η αναπαραγωγιμότητα, η επιστημονική διαφάνεια και η αποδοχή της αποτυχίας ως φυσικό μέρος της ερευνητικής διαδικασίας.

Πειράματα και Μοντέλα

Η υποδομή του Marin αξιοποιείται σε δύο βασικούς άξονες πειραμάτων:

  1. Ελεγχόμενα Πειράματα Μικρής Κλίμακας: Αφορούν την απομόνωση και μελέτη μεμονωμένων παραμέτρων όπως οι αρχιτεκτονικές, οι βελτιστοποιητές, οι ταξινομητές ποιότητας και οι μέθοδοι κανονικοποίησης. Αυτού του τύπου τα πειράματα θυμίζουν την παιδαγωγική προσέγγιση του μαθήματος CS336 του Stanford, με στόχο την εις βάθος κατανόηση κάθε τμήματος της αλυσίδας της μοντελοποίησης. (Δείτε ένα ελεγχόμενο πείραμα εδώ: Controlled experiment example)
  2. YOLO Εκτελέσεις (You Only Launch Once): Μεγάλες εκπαιδεύσεις που οδηγούν στην κατασκευή ανταγωνιστικών μοντέλων. Κατά τη διάρκεια αυτών, καταγράφηκαν προβλήματα, ανακαλύφθηκαν νέα ευρήματα και έγιναν αναθεωρήσεις. Ένα τέτοιο παράδειγμα αποτελεί το Marin 8B Base, το οποίο εκπαιδεύτηκε με αρχιτεκτονική τύπου LLaMA και ξεπέρασε το LLaMA 3.1 8B Base σε 14 από τις 19 βασικές αξιολογήσεις.

Η έκδοση Marin 8B Instruct, που προήλθε από επιπλέον επιβλεπόμενη εκπαίδευση (~5B tokens), ξεπέρασε το OLMo 2 σε standard αξιολογήσεις για instruct models, παρότι υπολείπεται ακόμη του LLaMA 3.1 Tulu, κυρίως λόγω απουσίας RLHF.

Speedrun: Ο Αγώνας Ταχύτητας για Ερευνητές AI

Για να ενισχύσει τη συνεισφορά της κοινότητας, το Marin υιοθετεί τον μηχανισμό των speedruns, εμπνευσμένο από αντίστοιχα εγχειρήματα όπως το nanogpt speedrun. Οι συμμετέχοντες καλούνται να επιτύχουν προκαθορισμένα benchmarks με τον αποδοτικότερο τρόπο, ενθαρρύνοντας την καινοτομία σε επίπεδο αρχιτεκτονικής, εκπαίδευσης και επεξεργασίας δεδομένων.

Ιδιαίτερη έμφαση δίνεται στην κλιμακωτή αξιολόγηση: τα πειράματα εκτελούνται σε διαφορετικά επίπεδα υπολογιστικών πόρων, με σκοπό την εξαγωγή scaling laws. Έτσι, προκρίνεται η μεθοδολογική αξιολόγηση της απόδοσης και όχι η επίδοση σε απομονωμένη κλίμακα.

Datashop: Για τους Ειδικούς του Τομέα

Το Datashop αποτελεί μία καινοτόμο προσθήκη για την ενίσχυση των επιδόσεων των μοντέλων σε εξειδικευμένα πεδία. Ειδικοί από διάφορους επιστημονικούς χώρους μπορούν να συμβάλουν με την επιμέλεια δεδομένων που καλύπτουν συγκεκριμένες ανάγκες ή ελλείψεις των μοντέλων.

Η διαδικασία περιλαμβάνει:

  1. Ορισμό παραμέτρων (prompt) για την αναζήτηση κατάλληλων δεδομένων.
  2. Χρήση LLMs για την ταξινόμηση εγγράφων βάσει των κριτηρίων.
  3. Εκπαίδευση ενός απλού ταξινομητή (π.χ., γραμμικού ή BERT).
  4. Επιλογή δεδομένων για fine-tuning ή αξιολόγηση κατά το midtraining.

Με τον τρόπο αυτό, ειδικοί χωρίς βαθιές τεχνικές γνώσεις μπορούν να συνεισφέρουν ουσιαστικά στην προσαρμογή των μοντέλων σε επιμέρους επιστημονικούς ή τεχνικούς τομείς.

Συμπεράσματα και Προοπτικές

Το Marin δεν είναι απλώς μία νέα πλατφόρμα ανοιχτής έρευνας. Αντιπροσωπεύει μια βαθιά αλλαγή στην αντίληψη για το πώς πρέπει να υλοποιείται η έρευνα στην τεχνητή νοημοσύνη: με διαφάνεια, συλλογικότητα, επαναληψιμότητα και ανοικτό πειραματισμό.

Η πορεία δεν είναι εύκολη: η εκπαίδευση θεμελιωδών μοντέλων απαιτεί τεράστιους πόρους και η οικοδόμηση κοινότητας είναι απαιτητική. Όμως, η ιστορία του ανοιχτού διαδικτύου και του ανοιχτού λογισμικού αποδεικνύει πως τέτοιες προσπάθειες, όσο φιλόδοξες κι αν φαίνονται, μπορούν να αλλάξουν το τοπίο της τεχνολογίας και της γνώσης.

Το Marin ανοίγει νέους δρόμους για την επιστημονική έρευνα και την τεχνολογική εξέλιξη. Στοχεύει να επεκτείνει τη λειτουργικότητα του μοντέλου με υποστήριξη για πολυτροπικότητα, πολύγλωσση κατανόηση, μακροσκελείς συμφραζόμενες και προηγμένες τεχνικές ενίσχυσης με ανθρώπινη ανατροφοδότηση (RLHF).

Πηγή άρθρου: https://marin.community/

Leave a Comment

Social Media Auto Publish Powered By : XYZScripts.com