To Open Source Initiative (OSI) δημοσίευσε τον τελικό ορισμό της AI ανοιχτού κώδικα που θα απελευθερώσει την ευρεία κοινότητα των προγραμματιστών τεχνητής νοημοσύνης για να δημιουργήσει ένα ακμάζον κίνημα για την καινοτομία της τεχνητής νοημοσύνης, όπως έγινε και με τη δημιουργία του ίδιου του Διαδικτύου.
Το Λογισμικό ανοιχτού κώδικα υποστηρίζει την υποδομή του Διαδικτύου και τις περισσότερες εφαρμογές που χρησιμοποιούνται σήμερα. Αυτό συνέβη επειδή οι πρωτοπόροι ανοιχτού κώδικα το όρισαν ως λογισμικό που θα ήταν πάντα ελεύθερο να χρησιμοποιηθεί και να τροποποιηθεί. Αυτό επέτρεψε την ευρεία υιοθέτηση λογισμικού ανοιχτού κώδικα και την καινοτομία που τροφοδοτεί την ψηφιακή μας ζωή.
Δεν θα μπορούσε να έρθει σε καλύτερη στιγμή. Βλέπουμε ένα κύμα μοντέλων τεχνητής νοημοσύνης – πολλά από τις μεγαλύτερες εταιρείες τεχνολογίας – που διαφημίζονται από “ανοιχτού κώδικα” χωρίς όμως να αντανακλούν το πνεύμα του αρχικού ορισμού του λογισμικού ανοιχτού κώδικα. Αν και αυτό μπορεί να μοιάζει με σημασιολογία, αλλά οι λέξεις έχουν σημασία. Η ατημέλητη γλώσσα γύρω από την τεχνητή νοημοσύνη ανοιχτού κώδικα μπορεί να καταστρέψει τρισεκατομμύρια δολάρια στη μελλοντική καινοτομία και να αφήσει τους όρους της τεχνητής νοημοσύνης στα χέρια μερικών μεγάλων εταιρειών.
The Open Source AI Definition – 1.0
Προοίμιο
Γιατί χρειαζόμαστε τεχνητή νοημοσύνη ανοιχτού κώδικα (AI)
Ο Ανοιχτός Κώδικας έχει αποδείξει ότι τεράστια οφέλη προκύπτουν σε όλους μετά την άρση των φραγμών στη μάθηση, τη χρήση, την κοινή χρήση και τη βελτίωση των συστημάτων λογισμικού. Αυτά τα οφέλη είναι το αποτέλεσμα της χρήσης αδειών που συμμορφώνονται με τον ορισμό του ανοιχτού κώδικα. Για την τεχνητή νοημοσύνη, η κοινωνία χρειάζεται τουλάχιστον τις ίδιες βασικές ελευθερίες του Ανοιχτού Κώδικα για να επιτρέψει στους προγραμματιστές, τους προγραμματιστές και τους τελικούς χρήστες τεχνητής νοημοσύνης να απολαμβάνουν τα ίδια οφέλη: αυτονομία, διαφάνεια, επαναχρησιμοποίηση χωρίς τριβές και συλλογική βελτίωση.
Τι είναι η τεχνητή νοημοσύνη ανοιχτού κώδικα
Όταν αναφερόμαστε σε ένα «σύστημα», μιλάμε τόσο για μια πλήρως λειτουργική δομή όσο και για τα διακριτά δομικά στοιχεία της. Για να θεωρηθεί Ανοιχτός Κώδικας, οι απαιτήσεις είναι οι ίδιες, είτε ισχύουν για ένα σύστημα, ένα μοντέλο, βάρη και παραμέτρους, ή άλλα δομικά στοιχεία.
Ενα AI ανοιχτού κώδικα είναι ένα σύστημα τεχνητής νοημοσύνης που διατίθεται υπό όρους και με τρόπο που παρέχουν τις ελευθερίες 1 για :
- Χρήση το σύστημα για οποιοδήποτε σκοπό και χωρίς να χρειάζεται να ζητήσετε άδεια.
- Μελέτη πώς λειτουργεί το σύστημα και επιθεωρήστε τα στοιχεία του.
- Τροποποίηση του συστήματος για οποιονδήποτε σκοπό, συμπεριλαμβανομένης της αλλαγής της εξόδου του.
- Κοινή Χρήση του συστήματος για χρήση από άλλους με ή χωρίς τροποποιήσεις, για οποιονδήποτε σκοπό.
Αυτές οι ελευθερίες ισχύουν τόσο για ένα πλήρως λειτουργικό σύστημα όσο και για διακριτά στοιχεία ενός συστήματος. Προϋπόθεση για την άσκηση αυτών των ελευθεριών είναι να έχετε πρόσβαση στην προτιμώμενη μορφή για να κάνετε τροποποιήσεις στο σύστημα.
Προτιμώμενη μορφή για να κάνετε τροποποιήσεις στα συστήματα μηχανικής μάθησης
Η προτιμώμενη μορφή για την πραγματοποίηση τροποποιήσεων σε ένα σύστημα μηχανικής μάθησης πρέπει να περιλαμβάνει όλα τα παρακάτω στοιχεία:
- Πληροφορίες δεδομένων: Επαρκώς λεπτομερείς πληροφορίες σχετικά με τα δεδομένα που χρησιμοποιούνται για την εκπαίδευση του συστήματος, έτσι ώστε ένα εξειδικευμένο άτομο να μπορεί να δημιουργήσει ένα ουσιαστικά ισοδύναμο σύστημα. Οι πληροφορίες δεδομένων διατίθενται με όρους εγκεκριμένους από το OSI.
- Ειδικότερα, αυτό πρέπει να περιλαμβάνει: (1) την πλήρη περιγραφή όλων των δεδομένων που χρησιμοποιούνται για την εκπαίδευση, συμπεριλαμβανομένων (εάν χρησιμοποιούνται) μη κοινοποιήσιμων δεδομένων, αποκαλύπτοντας την προέλευση των δεδομένων, το εύρος και τα χαρακτηριστικά τους, τον τρόπο λήψης και επιλογής των δεδομένων, διαδικασίες επισήμανσης και μεθοδολογίες επεξεργασίας και φιλτραρίσματος δεδομένων· (2) κατάλογο όλων των διαθέσιμων στο κοινό δεδομένων εκπαίδευσης και πού να τα αποκτήσετε· και (3) μια λίστα με όλα τα δεδομένα εκπαίδευσης που λαμβάνονται από τρίτους και από πού να τα αποκτήσετε, συμπεριλαμβανομένης της αμοιβής.
- Κώδικας: Ο πλήρης πηγαίος κώδικας που χρησιμοποιείται για την εκπαίδευση και τη λειτουργία του συστήματος. Ο Κώδικας θα αντιπροσωπεύει την πλήρη προδιαγραφή του τρόπου επεξεργασίας και φιλτραρίσματος των δεδομένων και του τρόπου με τον οποίο έγινε η εκπαίδευση. Ο κώδικας διατίθεται με άδειες εγκεκριμένες από το OSI.
- Για παράδειγμα, εάν χρησιμοποιείται, αυτό πρέπει να περιλαμβάνει κώδικα που χρησιμοποιείται για επεξεργασία και φιλτράρισμα δεδομένων, κώδικα που χρησιμοποιείται για εκπαίδευση, συμπεριλαμβανομένων ορισμάτων και ρυθμίσεων που χρησιμοποιούνται, επικύρωση και δοκιμή, υποστήριξη βιβλιοθηκών όπως κώδικας αναζήτησης tokenizers και υπερπαραμέτρων, κώδικα συμπερασμάτων και αρχιτεκτονική μοντέλου.
- Παράμετροι: Οι παράμετροι του μοντέλου, όπως βάρη ή άλλες ρυθμίσεις διαμόρφωσης. Οι παράμετροι διατίθενται με όρους εγκεκριμένους από το OSI.
- Για παράδειγμα, αυτό μπορεί να περιλαμβάνει σημεία ελέγχου από βασικά ενδιάμεσα στάδια εκπαίδευσης καθώς και την τελική κατάσταση βελτιστοποίησης.
Η άδεια χρήσης ή άλλοι όροι που εφαρμόζονται σε αυτά τα στοιχεία και σε οποιονδήποτε συνδυασμό τους ενδέχεται να περιέχουν όρους που απαιτούν οποιαδήποτε τροποποιημένη έκδοση να κυκλοφορήσει με τους ίδιους όρους με την αρχική.
Μοντέλα ανοιχτού κώδικα και βάρη ανοιχτού κώδικα
Για συστήματα μηχανικής μάθησης,
- Ενα μοντέλο ΑΙ αποτελείται από την αρχιτεκτονική του μοντέλου, τις παραμέτρους του μοντέλου (συμπεριλαμβανομένων των βαρών) και τον κώδικα συμπερασμάτων για την εκτέλεση του μοντέλου.
- Βάρη AI είναι το σύνολο των μαθησιακών παραμέτρων που επικαλύπτουν την αρχιτεκτονική του μοντέλου για να παράγουν μια έξοδο από μια δεδομένη είσοδο.
Η προτιμώμενη μορφή για την πραγματοποίηση τροποποιήσεων στα συστήματα μηχανικής εκμάθησης ισχύει και για αυτά τα μεμονωμένα στοιχεία. Τα “Μοντέλα ανοιχτού κώδικα” και τα “Βάρη ανοιχτού κώδικα” πρέπει να περιλαμβάνουν τις πληροφορίες δεδομένων και τον κώδικα που χρησιμοποιούνται για την εξαγωγή αυτών των παραμέτρων.
Ο ορισμός τεχνητής νοημοσύνης ανοιχτού κώδικα δεν απαιτεί συγκεκριμένο νομικό μηχανισμό για τη διασφάλιση ότι οι παράμετροι του μοντέλου είναι ελεύθερα διαθέσιμες σε όλους. Μπορεί να είναι ελεύθεροι από τη φύση τους ή μπορεί να απαιτείται άδεια ή άλλο νομικό μέσο για τη διασφάλιση της ελευθερίας τους. Αναμένουμε ότι αυτό θα γίνει πιο ξεκάθαρο με την πάροδο του χρόνου, όταν το νομικό σύστημα είχε περισσότερες ευκαιρίες να αντιμετωπίσει τα συστήματα τεχνητής νοημοσύνης ανοιχτού κώδικα.
Ορισμοί
- Σύστημα AI 2: Ένα σύστημα τεχνητής νοημοσύνης είναι ένα σύστημα που βασίζεται σε μηχανήματα που, για ρητούς ή σιωπηρούς στόχους, συνάγει, από τα δεδομένα που λαμβάνει, τον τρόπο δημιουργίας αποτελεσμάτων όπως προβλέψεις, περιεχόμενο, προτάσεις ή αποφάσεις που μπορούν να επηρεάσουν φυσικά ή εικονικά περιβάλλοντα. Τα διαφορετικά συστήματα AI διαφέρουν ως προς τα επίπεδα αυτονομίας και προσαρμοστικότητας μετά την ανάπτυξη.
- Μηχανική μάθηση 3: είναι ένα σύνολο τεχνικών που επιτρέπει στις μηχανές να βελτιώνουν την απόδοσή τους και συνήθως δημιουργούν μοντέλα με αυτοματοποιημένο τρόπο μέσω της έκθεσης σε δεδομένα εκπαίδευσης, τα οποία μπορούν να βοηθήσουν στον εντοπισμό προτύπων και κανονικοτήτων και όχι μέσω ρητών οδηγιών από άνθρωπο. Η διαδικασία βελτίωσης της απόδοσης ενός συστήματος χρησιμοποιώντας τεχνικές μηχανικής μάθησης είναι γνωστή ως «εκπαίδευση».
- Αυτές οι ελευθερίες προέρχονται από τον Ορισμό του Ελεύθερου Λογισμικού. ↩︎
- Σύσταση του Συμβουλίου για την Τεχνητή Νοημοσύνη OECD/LEGAL/0449, Οργανισμός Οικονομικής και Συνεργατικής Ανάπτυξης (ΟΟΣΑ), 2024 ↩︎
- Επεξηγηματική έκθεση σχετικά με τον επικαιροποιημένο ορισμό του ΟΟΣΑ για ένα σύστημα AI, OECD Artificial Intelligence Papers, No. 8, OECD Publishing, Παρίσι ↩︎
Πηγή άρθρου: https://opensource.org/ai/open-source-ai-definition