Nvidia αποκαλύφθηκε Το Nemotron 3 Nano Omni, ένα ανοιχτό πολυτροπικό μοντέλο AI που ενσωματώνει δυνατότητες όρασης, ήχου και γλώσσας σε μια ενιαία αρχιτεκτονική.
Το μοντέλο στοχεύει να αντιμετωπίσει τα ζητήματα των κατακερματισμένων αγωγών σε συστήματα εταιρικής τεχνητής νοημοσύνης επεξεργάζοντας πολλαπλούς τύπους εισόδου, συμπεριλαμβανομένων κειμένου, εικόνων, ήχου και βίντεο, και δημιουργώντας κείμενο ως έξοδο. Η Nvidia δήλωσε ότι συνδυάζει την ικανότητα γνώσης μεγαλύτερων μοντέλων, ενώ μειώνει το υπολογιστικό κόστος.
Κατασκευασμένο σε μια υβριδική αρχιτεκτονική μείγματος ειδικών 30 δισεκατομμυρίων παραμέτρων, το Nemotron 3 Nano Omni ενεργοποιεί περίπου 3 δισεκατομμύρια παραμέτρους ανά συμπέρασμα. Αυτή η αρχιτεκτονική ενοποιεί στοιχεία, συμπεριλαμβανομένου ενός κωδικοποιητή ομιλίας Parakeet για ήχο και ενός κωδικοποιητή όρασης C-RADIOv4-H, βελτιώνοντας την απόδοση του μοντέλου.
Η Nvidia ισχυρίζεται ότι το μοντέλο παρέχει έως και 9 φορές υψηλότερη απόδοση σε σύγκριση με παρόμοια ανοιχτά μοντέλα omni. Επιτυγχάνει περίπου 3 φορές μεγαλύτερη απόδοση με 2,75x χαμηλότερη υπολογιστική ισχύ για εργασίες συλλογιστικής βίντεο, υποστηρίζοντας ένα παράθυρο περιβάλλοντος 256K-token και κορυφαίους έξι πίνακες κατάταξης για πολύπλοκη ευφυΐα εγγράφων και κατανόηση πολυμέσων.
Η Foxconn, η Palantir και η H Company έχουν υιοθετήσει το μοντέλο. Ο Gautier Cloix, Διευθύνων Σύμβουλος της H Company, δήλωσε: «Η χρήση του Nemotron 3 Nano Omni επιτρέπει στους αντιπροσώπους μας να αναλύουν γρήγορα εγγραφές σε οθόνη Full HD, μια δυνατότητα που προηγουμένως δεν ήταν εφικτή».
Επιπλέον, εταιρείες όπως η Dell, η Oracle και η Infosys αξιολογούν αυτήν τη στιγμή το μοντέλο. Το μοντέλο είναι προσβάσιμο σε πλατφόρμες όπως το Hugging Face, το OpenRouter, το Amazon SageMaker JumpStart, το Vultr και περισσότερες από 25 πλατφόρμες συνεργατών.
Η Nvidia κυκλοφόρησε το Nemotron 3 Nano Omni με ανοιχτά βάρη, σύνολα δεδομένων και συνταγές εκπαίδευσης για προσαρμογή προγραμματιστών. Αυτό το μοντέλο αντιπροσωπεύει ένα βασικό στοιχείο στην ευρύτερη οικογένεια Nemotron 3 της Nvidia, η οποία περιλαμβάνει μοντέλα Super και Ultra σχεδιασμένα για μεγαλύτερο φόρτο εργασίας και έχει καταγράψει πάνω από 50 εκατομμύρια λήψεις το περασμένο έτος.
VIA: dataconomy.com


