ΕΛ/ΛΑΚ | creativecommons.gr | mycontent.ellak.gr |
freedom

Η σημασία του Ανοιχτού Κώδικα στην Τεχνητή Νοημοσύνη

Η κοινή χρήση γνώσεων και η κοινή χρήση κώδικα ήταν πάντα βασικός μοχλός για την καινοτομία στην Τεχνητή Νοημοσύνη. Οι ερευνητές συγκεντρώθηκαν από τότε που η τεχνητή νοημοσύνη καθιερώθηκε ως πεδίο για την ανάπτυξη και την προώθηση νέων τεχνικών, από την επεξεργασία φυσικής γλώσσας έως τα τεχνητά νευρωνικά δίκτυα, από τη μηχανική μάθηση έως τη βαθιά μάθηση.

Η κοινότητα Ανοιχτού Κώδικα έχει διαδραματίσει βασικό ρόλο στην προώθηση της τεχνητής νοημοσύνης και στην επίλυση προβλημάτων του πραγματικού κόσμου. Βιβλιοθήκες και πλαίσια όπως το TensorFlow,  το PyTorch, το Keras, και το Scikit-learn, , για παράδειγμα, επέτρεψαν σε ερευνητές και επιστήμονες δεδομένων να μελετήσουν και να κάνουν χρήση της τεχνητής νοημοσύνης.

Τα τελευταία χρόνια, έχουμε δει την εμφάνιση των LLMs (Large Language Models). Ενώ τα περισσότερα από τα πρώτα μοντέλα όπως το BERT  και το GPT-2  ήταν φιλικά προς το εμπόριο, ιδιόκτητα μοντέλα όπως το GPT-4 του OpenAI  έχουν κερδίσει μεγάλη δημοτικότητα. Μοντέλα όπως το LLaMA , το Alpaca , το Vicuna και το Koala  δεν έχουν ακόμη υιοθετήσει άδεια που να επιτρέπει την εμπορική χρήση.

Ευτυχώς τα τελευταία χρόνια, είδαμε την ερευνητική κοινότητα να δημιουργεί πολλά σημαντικά μοντέλα ανοιχτού κώδικα, όπως τα GPT-Neo, GPT-J, GPT-NeoX και Pythia της EleutherAI , καθώς και μοντέλα από το BLOOM  (BigScience Large Open -science Open-access Multilingual Language Model) και LAION  (Large-scale Artificial Intelligence Open Network).

Πιο πρόσφατα, είδαμε μοντέλα ανοιχτού κώδικα όπως DataBricks Dolly 2.0 , Stability Diffusion’s StableLM , Cerebras GPT , h2oGPT , RedPajama , UC Berkeley’s OpenLLaMA , MosaicML’s MPT , NVIDIA’s NeMo ,  το Tragging και το Hugging’s  Fall’sCoderce .

Επιπλέον, είναι σημαντικό να σημειωθεί ότι τα μικρότερα και πιο συγκεκριμένα μοντέλα υπερτερούν των μεγαλύτερων μοντέλων, επιτρέποντας σε μικρούς οργανισμούς και ακόμη και σε άτομα να καινοτομούν. Η τελειοποίηση αυτών των μοντέλων με τη χρήση τεχνικών όπως η LoRA  (Χαμηλή Προσαρμογή των Μεγάλων Γλωσσικών Μοντέλων) και η   QLoRA  επέτρεψαν ταχύτερες επαναλήψεις.

Πρόσφατα, οι χρήστες μπόρεσαν να τρέξουν και ακόμη και να ρυθμίσουν με ακρίβεια αυτά τα μικρότερα μοντέλα από τον υπολογιστή και το κινητό τους (π.χ. GPT4All  και PrivateGPT ) και το πρόγραμμα περιήγησής τους (π.χ. WebGPT ). Αυτό θα απελευθερώσει ένα νέο κύμα εφαρμογών, όπου θα σέβεται το απόρρητο των χρηστών, ενώ θα τους επιτρέπει να επωφελούνται από την τεχνητή νοημοσύνη. Οι επιχειρήσεις θα αποκτήσουν επίσης τον πλήρη έλεγχο αυτών των μοντέλων και θα μπορούν να τα εκτελούν σε δικές τους υποδομές ή στο δημόσιο cloud χρησιμοποιώντας τεχνολογίες που βελτιώνουν το απόρρητο. Επιπλέον, αυτά τα μοντέλα θα μπορούν επίσης να εκτελούνται από συσκευές IoT και στο edge.

Ο κόσμος της τεχνητής νοημοσύνης βρίσκεται σε ένα σημαντικό σταυροδρόμι. Υπάρχουν δύο δρόμοι προς τα εμπρός: ένας όπου θα επικρατήσει αυστηρά ρυθμιζόμενος ιδιόκτητος κώδικας με κλειστά μοντέλα και σύνολα δεδομένων, και ο άλλος όπου κυριαρχεί ο Ανοιχτός Κώδικας. Το ένα μονοπάτι θα οδηγήσει σε ένα προπύργιο της τεχνητής νοημοσύνης από μερικές μεγάλες εταιρείες όπου οι τελικοί χρήστες θα έχουν περιορισμένο απόρρητο και έλεγχο, ενώ το άλλο θα εκδημοκρατίσει την τεχνητή νοημοσύνη, επιτρέποντας σε οποιονδήποτε να μελετήσει, να το προσαρμόσει, να συνεισφέρει πίσω, να καινοτομήσει, καθώς και να δημιουργήσει επιχειρήσεις πάνω σε αυτά τα θεμέλια με πλήρη έλεγχο και σεβασμό στην ιδιωτικότητα.

Πηγή άρθρου: https://blog.opensource.org/

Leave a Comment

Social Media Auto Publish Powered By : XYZScripts.com