Η Meta ενισχύει τον αγώνα εξοπλισμών AI της Big Tech με νέο γλωσσικό μοντέλο
Η Meta Platforms Inc (NASDAQ:META) ανακοίνωσε την Παρασκευή ότι κυκλοφόρησε στους ερευνητές ένα νέο μοντέλο μεγάλης γλώσσας, το βασικό λογισμικό ενός νέου συστήματος τεχνητής νοημοσύνης, ενισχύοντας έναν αγώνα εξοπλισμών τεχνητής νοημοσύνης καθώς οι εταιρείες Big Tech σπεύδουν να ενσωματώσουν την τεχνολογία στα προϊόντα τους και εντυπωσιάζει τους επενδυτές.
Η δημόσια μάχη για κυριαρχία στον χώρο της τεχνολογίας AI ξεκίνησε στα τέλη του περασμένου έτους με την κυκλοφορία του ChatGPT του OpenAI που υποστηρίζεται από τη Microsoft και ώθησε τους βαρείς τεχνίτες από την Alphabet (NASDAQ:GOOGL) Inc έως την κινεζική Baidu Inc (NASDAQ:BIDU) να τρομοκρατήσουν τις δικές τους προσφορές.
Το LLaMA της Meta, συντομογραφία του Large Language Model Meta AI, θα είναι διαθέσιμο με μη εμπορική άδεια σε ερευνητές και οντότητες που συνδέονται με την κυβέρνηση, την κοινωνία των πολιτών και τον ακαδημαϊκό κόσμο, ανέφερε σε ιστολόγιο.
Μεγάλα γλωσσικά μοντέλα εξορύσσουν τεράστιες ποσότητες κειμένου για να συνοψίσουν πληροφορίες και να δημιουργήσουν περιεχόμενο. Μπορούν να απαντήσουν σε ερωτήσεις, για παράδειγμα, με προτάσεις που μπορούν να διαβαστούν σαν να γράφτηκαν από ανθρώπους.
Το μοντέλο, για το οποίο ο Μέτα είπε ότι απαιτεί «πολύ λιγότερη» υπολογιστική ισχύ από τις προηγούμενες προσφορές, εκπαιδεύεται σε 20 γλώσσες με έμφαση σε εκείνες με λατινικό και κυριλλικό αλφάβητο.
«Η σημερινή ανακοίνωση της Meta φαίνεται να είναι ένα βήμα στη δοκιμή των δυνατοτήτων παραγωγής τεχνητής νοημοσύνης, ώστε να μπορούν να τις εφαρμόσουν στα προϊόντα τους στο μέλλον», δήλωσε ο Gil Luria, ανώτερος αναλυτής λογισμικού στο D.A. Ντέιβιντσον.
«Το Generative AI είναι μια νέα εφαρμογή AI με την οποία η Meta έχει λιγότερη εμπειρία, αλλά είναι σαφώς σημαντική για το μέλλον της επιχείρησής της».
Η τεχνητή νοημοσύνη έχει αναδειχθεί ως φωτεινό σημείο για επενδύσεις στον κλάδο της τεχνολογίας, της οποίας η επιβράδυνση της ανάπτυξης έχει προκαλέσει εκτεταμένες απολύσεις και περικοπή των πειραματικών στοιχημάτων.
Η Meta είπε ότι το LLaMA θα μπορούσε να ξεπεράσει τους ανταγωνιστές που εξετάζουν περισσότερες παραμέτρους ή μεταβλητές που λαμβάνει υπόψη ο αλγόριθμος.
Συγκεκριμένα, είπε ότι μια έκδοση του LLaMA με 13 δισεκατομμύρια παραμέτρους μπορεί να ξεπεράσει το GPT-3, έναν πρόσφατο προκάτοχο του μοντέλου στο οποίο έχει κατασκευαστεί το ChatGPT.
Περιέγραψε το μοντέλο LLaMA των 65 δισεκατομμυρίων παραμέτρων ως «ανταγωνιστικό» με τα Chinchilla70B και PaLM-540B της Google, τα οποία είναι ακόμη μεγαλύτερα από το μοντέλο που χρησιμοποίησε η Google για να επιδείξει την αναζήτησή της που υποστηρίζεται από συνομιλία Bard.
Μια εκπρόσωπος της Meta απέδωσε την απόδοση σε μεγαλύτερη ποσότητα «καθαρότερων» δεδομένων και «αρχιτεκτονικές βελτιώσεις» στο μοντέλο που ενίσχυσαν τη σταθερότητα της προπόνησης.
Η Meta τον Μάιο του περασμένου έτους κυκλοφόρησε το μοντέλο OPT-175B σε μεγάλη γλώσσα, που απευθύνεται επίσης σε ερευνητές, το οποίο αποτέλεσε τη βάση μιας νέας επανάληψης του chatbot BlenderBot.
Αργότερα εισήγαγε ένα μοντέλο που ονομαζόταν Galactica, το οποίο μπορούσε να γράφει επιστημονικά άρθρα και να λύνει μαθηματικά προβλήματα, αλλά γρήγορα κατέρριψε το demo αφού δημιούργησε έγκυρες ψευδείς απαντήσεις.
