O ανοιχτός κώδικας στην τεχνητή νοημοσύνη: Ένα αναδυόμενο κίνημα για φθηνές και προσβάσιμες τεχνολογίες AI

Οι πρώτες μέρες της έρευνας της τεχνητής νοημοσύνης είχαν μια αίσθηση της κοινότητας — να μοιράζονται ανοιχτά ιδέες και να συνεργάζονται για τη βελτίωση των τεχνολογιών. Αλλά πολλά άλλαξαν με το ChatGPT , το οποίο ταρακούνησε τον κόσμο πέρυσι.

Τεχνολογικά μεγαθήρια όπως η Google, η Microsoft και το Facebook προσπαθούν τώρα να επωφεληθούν από την τεχνητή νοημοσύνη, ενισχύοντας την πρόσβαση σε εργαλεία που καθορίζουν το τοπίο της τεχνητής νοημοσύνης. Περιορίζουν την πρόσβαση σε εργαλεία που μπορούν να απαντήσουν σε ερωτήσεις, να δημιουργήσουν εικόνες και να κατανοήσουν ομιλούμενες γλώσσες.

Αλλά για ορισμένους, ειδικά τους κατασκευαστές υλικού, η παράδοση του ελέγχου της τεχνητής νοημοσύνης σε μερικές πλούσιες εταιρείες τεχνολογίας είναι κακό για τις επιχειρήσεις. Αυτές οι εταιρείες υποστηρίζουν ένα αναδυόμενο κίνημα ανοιχτού κώδικα, ώστε οι τεχνολογίες AI είναι φθηνές και προσβάσιμες.

Οι αποστάτες

Η OpenAI , η οποία είναι μια κορυφαία εταιρεία τεχνητής νοημοσύνης, είναι ένας από τους αποστάτες. Η εταιρεία ξεκίνησε το 2015 ως μη κερδοσκοπικός οργανισμός με στόχο να προωθήσει και να μοιραστεί την έρευνα AI. Άνοιξε την πρόσβαση στα μεγάλα γλωσσικά της μοντέλα, συμπεριλαμβανομένου του GPT-3 , που είναι η δύναμη πίσω από το ChatGPT.

Ωστόσο, το OpenAI δεν άνοιξε το πιο πρόσφατο μοντέλο της σε μεγάλη γλώσσα, το GPT-4 , το οποίο κυκλοφόρησε τον περασμένο μήνα και χρησιμοποιείται από τη Microsoft στην αναζήτησή της στο Bing. Η Microsoft έχει επενδύσει δισεκατομμύρια στο OpenAI , το οποίο έγινε κερδοσκοπική οντότητα το 2019. Το OpenAI χρεώνει για την πρόσβαση στο GPT-4 .

Ο Έλον Μασκ , ο οποίος ήταν πρώτος δωρητής στο OpenAI, σε ένα tweet σημείωσε ότι το OpenAI προοριζόταν να είναι ανοιχτού κώδικα, αλλά «έχει γίνει μια εταιρεία κλειστού κώδικα, μέγιστου κέρδους που ελέγχεται ουσιαστικά από τη Microsoft». Σίγουρα, ο Μασκ δεσμεύτηκε να επενδύσει 1 δισεκατομμύριο δολάρια στο OpenAI, αλλά σταμάτησε μετά από έναν αγώνα εξουσίας και η Microsoft παρενέβη για να παράσχει μια πολύ αναγκαία ροή μετρητών.

Μια πτυχή του ανοιχτού οικοσυστήματος AI περιστρέφεται γύρω από το άνοιγμα των Large Language Models (LLMs) για ένα πιο προσεκτικό έλεγχο από την κοινότητα. Εκτός από το OpenAI, οι τεχνολογικοί γίγαντες Google, Facebook και Nvidia αναπτύσσουν τα δικά τους μοντέλα μεγάλων γλωσσών και τα αναπτύσσουν στο υλικό. Ωστόσο, η πρόσβαση στα πιο προηγμένα εργαλεία AI περιορίζεται είτε σε ερευνητές είτε σε λίγους προγραμματιστές.

Κλειστά LLM

Υπάρχουν ανησυχίες σχετικά με τα μοντέλα που διανέμονται ανοιχτά που χρησιμοποιούνται για κακόβουλους σκοπούς. Το OpenAI ανέφερε την ασφάλεια ως λόγο για να παραμείνει κλειστό το GPT-4. Το Bloomberg κρατά κλειστό το μοντέλο Bloomberg-GPT που κυκλοφόρησε πρόσφατα για λόγους ασφαλείας και επαγγελματικούς. Το μοντέλο εκπαιδεύτηκε σε δεδομένα δεκαετιών που αποτελούν τη βάση των χρηματοοικονομικών υπηρεσιών που παρέχει το Bloomberg σε πελάτες.

«Όπως είναι γνωστό, τα LLM είναι επιρρεπή σε επιθέσεις διαρροής δεδομένων και είναι δυνατή η εξαγωγή σημαντικών τμημάτων κειμένου με βάση το βάρος του μοντέλου. Επιπλέον, ακόμη και η παροχή επιλεκτικής πρόσβασης σε ερευνητές δεν αποτελεί εγγύηση ότι το μοντέλο δεν μπορεί να διαρρεύσει», ανέφεραν οι ερευνητές του Bloomberg σε έγγραφο που περιγράφει λεπτομερώς το μοντέλο.

Η περιορισμενη πρόσβαση σε κλειστά μοντέλα μεγάλων γλωσσών θα μπορούσε να παρέχεται μέσω API, αλλά «ακόμη και η επιλεκτική πρόσβαση σε ερευνητές δεν αποτελεί εγγύηση ότι το μοντέλο δεν μπορεί να διαρρεύσει», είπαν οι ερευνητές.

Τα εργαλεία ανάπτυξης όπως το TensorFlow και το PyTorch είναι ήδη ανοιχτού κώδικα, αλλά απαιτούν υλικό υψηλής απόδοσης όπως GPU για την εκτέλεση προγραμμάτων.

Ωστόσο, περισσότερες εταιρείες εντάσσονται σε ένα ανοιχτό κίνημα για να ανοίξουν τα Large Language Models, ώστε τα ιδιόκτητα μοντέλα να μην κυριαρχούν στην αγορά.

Οι κατασκευαστές υλικού πρωτοστατούν

Οι κατασκευαστές υλικού ηγούνται του κινήματος για την προώθηση της τεχνητής νοημοσύνης ανοιχτού κώδικα. Η Cerebras Systems , η οποία κατασκευάζει αυτό που θεωρείται το μεγαλύτερο τσιπ τεχνητής νοημοσύνης στον κόσμο κυκλοφόρησε τον περασμένο μήνα μοντέλα Cerebras-GPT με έως και 13 δισεκατομμύρια παραμέτρους.

«Έχουμε κάνει open source τα weights, έχουμε ανοιχτά τα checkpoints, δείχνουμε και παρέχουμε την πλήρη συνταγή ώστε να μπορείτε να την αντιγράψετε. Το κάνουμε αυτό με την πιο επιτρεπτή άδεια ανοιχτού κώδικα που είναι δυνατή», δήλωσε ο Andrew Feldman , Διευθύνων Σύμβουλος της Cerebras Systems, στο The New Stack.

Αυτά τα μοντέλα είναι forks του GPT-3 του OpenAI, το οποίο έχει 175 δισεκατομμύρια παραμέτρους. Ο Feldman είχε μια ζοφερή άποψη για μια ολοένα και πιο ιδιόκτητη προσέγγιση του OpenAI, της Google και του Facebook και είπε ότι στόχος της Cerebras είναι να παρέχει μια εναλλακτική λύση χαμηλού κόστους με τα μοντέλα τεχνητής νοημοσύνης ανοιχτού κώδικα.

«Οι τιμές των αποτελεσμάτων γίνονται μεγαλύτερες, επομένως οι OpenAI και Meta και άλλοι κλείνουν αυτά τα μοντέλα σε άλλες εταιρείες. Αυτό είναι κακό για το οικοσύστημα, τις μικρές εταιρείες και τις μεγάλες εταιρείες. Νομίζω ότι είναι μια προσπάθεια να προσπαθήσουμε να διατηρήσουμε αυτά τα μοντέλα σε μια χούφτα πολύ μεγάλες εταιρείες», είπε ο Feldman.

Τα επτά μοντέλα AI της Cerebras θα εκτελούνται σε οποιοδήποτε υλικό. Αλλά η εταιρεία θέλει επίσης να χρησιμοποιήσει το λογισμικό για να επιδείξει την απόδοση των τσιπ AI, τα οποία θεωρούνται από τα ταχύτερα στον κόσμο.

Εξέλιξη όπως το Linux

Οι αναλυτές είπαν ότι το κίνημα του ανοιχτού κώδικα εξελίσσεται όπως ακριβώς και η ανάπτυξη του Linux, που προέκυψε από την ανάγκη να αντιμετωπιστούν τα ιδιόκτητα λειτουργικά συστήματα. Το Linux είναι πλέον η ραχοκοκαλιά του Διαδικτύου και παρέχει τα δομικά στοιχεία για το cloud computing.

Η Intel, η οποία είναι ένας από τους μεγαλύτερους συνεισφέροντες στον πυρήνα του Linux, παρέχει επίσης υποδομές για την ανάπτυξη AI ανοιχτού κώδικα. Μερικά από τα εργαλεία του περιλαμβάνουν το OneAPI , το οποίο είναι ένα πλαίσιο ανοιχτού κώδικα για την ανάπτυξη και την ανάπτυξη εφαρμογών.

«Η Intel έχει δεσμευτεί… να προωθήσει ένα ανοιχτό οικοσύστημα λογισμικού τεχνητής νοημοσύνης, επιτρέποντας βελτιστοποιήσεις λογισμικού ανάντη και πλαισίων AI-ML για την προώθηση προγραμματισμού, φορητότητας και υιοθέτησης του οικοσυστήματος», δήλωσε ο Greg Lavender, επικεφαλής τεχνολογίας στην Intel, κατά τη διάρκεια παρουσίασης οδικού χάρτη τον περασμένο μήνα .

Ο κατασκευαστής τσιπ αναπτύσσει ένα ευρύ φάσμα τσιπ για την εκτέλεση εφαρμογών τεχνητής νοημοσύνης, συμπεριλαμβανομένων των GPU και των επιταχυντών όπως οι επιταχυντές του Gaudi. Μια προσέγγιση ανοιχτού κώδικα για την τεχνητή νοημοσύνη θα μπορούσε να κάνει τα τσιπ της πιο ελκυστικά για τους πελάτες. Η Intel ακολούθησε παρόμοια προσέγγιση με το Linux, όπου συνεισφέρει προγράμματα οδήγησης υλικού στον πυρήνα Linux για να βεβαιωθεί ότι τα τσιπ της είναι συμβατά με κάθε νέα έκδοση λειτουργικού συστήματος.

Αλλά η παρουσία της Intel σε τεχνητή νοημοσύνη δεν είναι τίποτα σε σύγκριση με τη Nvidia, η οποία κατέστησε δυνατή την υπολογιστική τεχνητή νοημοσύνη μέσω των GPU της. Σήμερα, οι GPU της Nvidia χρησιμοποιούνται για την εκτέλεση εφαρμογών AI που αναπτύσσονται από τη Microsoft και το Facebook. Η Google και η Amazon φιλοξενούν επίσης τις πιο πρόσφατες GPU Hopper της Nvidia για τους πελάτες να τρέξουν εφαρμογές εκπαίδευσης και εξαγωγής συμπερασμάτων AI.

Η Nvidia θέλει να κερδίσει χρήματα από την κυριαρχία της στην τεχνητή νοημοσύνη και πιστεύει ότι μια προσέγγιση κλειστού κώδικα είναι ο τρόπος για να φτάσετε εκεί. Η εταιρεία χρησιμοποιεί τα ιδιόκτητα εργαλεία υλικού και λογισμικού της για να κλειδώσει τους προγραμματιστές στο οικοσύστημά της.

Η στοίβα ανάπτυξης λογισμικού της Nvidia, η οποία ονομάζεται CUDA , είναι ήδη δημοφιλής μεταξύ των προγραμματιστών τεχνητής νοημοσύνης. Οι εφαρμογές γραμμένες σε CUDA λειτουργούν μόνο στις GPU της εταιρείας. Άλλα πλαίσια μηχανικής μάθησης όπως το OpenCL και το ROCm είναι διαθέσιμα, αλλά το output από το CUDA μπορεί να είναι μια δαπανηρή υπόθεση.

Ο κατασκευαστής τσιπ γραφικών λέει ότι διαθέτει βιβλιοθήκες ανοιχτού κώδικα για την ανάπτυξη κάθετων εφαρμογών AI, αλλά αυτές χρειάζονται τις GPU της εταιρείας για να τις εκτελέσουν. Η Intel προσπαθεί να διακόψει αυτήν την αποκλειστική προσέγγιση με το εργαλείο SYCL, το οποίο κόβει τον ειδικό κώδικα CUDA, ώστε οι εφαρμογές να μπορούν να εκτελούνται σε οποιαδήποτε CPU, GPU, FPGA ή άλλους επιταχυντές.

Η Nvidia έχει επίσης δημιουργήσει μια επιχείρηση υπηρεσιών γύρω από την τεχνητή νοημοσύνη. Οι εταιρείες μπορούν να υποβάλουν τις ανάγκες τους σε τεχνητή νοημοσύνη στη Nvidia, η οποία στη συνέχεια δημιουργεί και αναπτύσσει την εφαρμογή στις GPU της. Η Nvidia ελπίζει να γίνει γίγαντας λογισμικού τεχνητής νοημοσύνης και να αξιοποιήσει αυτό που η εταιρεία πιστεύει ότι θα μπορούσε να γίνει μια ευκαιρία αγοράς 1 τρισεκατομμυρίου δολαρίων.

Πηγή άρθρου: https://thenewstack.io/