Όλα τα νέα μοντέλα με άδεια ανοιχτής χρήσης — Phi 4 mini reasoning, Phi 4 reasoning και Phi 4 reasoning plus — είναι “συλλογιστικά” μοντέλα που σημαίνει ότι μπορούν να αφιερώνουν περισσότερο χρόνο στον έλεγχο λύσεων σε πολύπλοκα προβλήματα. Επεκτείνουν την οικογένεια “μικρών μοντέλων” Phi της Microsoft, την οποία η εταιρεία λάνσαρε πριν από ένα χρόνο για να προσφέρει μια βάση για προγραμματιστές τεχνητής νοημοσύνης που δημιουργούν εφαρμογές στο edge computing.
Το Phi 4 mini reasoning εκπαιδεύτηκε σε περίπου 1 εκατομμύριο συνθετικά μαθηματικά προβλήματα που δημιουργήθηκαν από το μοντέλο συλλογιστικής R1 της κινεζικής startup τεχνητής νοημοσύνης DeepSeek. Με μέγεθος περίπου 3,8 δισεκατομμύρια παραμέτρους, το Phi 4 mini reasoning είναι σχεδιασμένο για εκπαιδευτικές εφαρμογές, όπως αναφέρει η Microsoft, όπως η “ενσωματωμένη διδασκαλία” σε συσκευές μεσαίων δυνατοτήτων.
Οι παράμετροι αντιστοιχούν χονδρικά στις ικανότητες επίλυσης προβλημάτων ενός μοντέλου, και τα μοντέλα με περισσότερες παραμέτρους γενικά αποδίδουν καλύτερα από εκείνα με λιγότερες παραμέτρους.
Το Phi 4 reasoning, ένα μοντέλο 14 δισεκατομμυρίων παραμέτρων, εκπαιδεύτηκε χρησιμοποιώντας δεδομένα “υψηλής ποιότητας” από το διαδίκτυο καθώς και “επιμελημένα demo” από το προαναφερθέν o3-mini της OpenAI. Σύμφωνα με τη Microsoft, είναι καλύτερο για εφαρμογές μαθηματικών, επιστήμης και προγραμματισμού.
Όσον αφορά το Phi 4 reasoning plus, πρόκειται για το προηγουμένως κυκλοφορημένο μοντέλο Phi-4 της Microsoft που προσαρμόστηκε σε μοντέλο συλλογιστικής για την επίτευξη καλύτερης ακρίβειας σε συγκεκριμένες εργασίες. Η Microsoft ισχυρίζεται ότι το Phi 4 reasoning plus πλησιάζει τα επίπεδα απόδοσης του R1, ενός μοντέλου με σημαντικά περισσότερες παραμέτρους (671 δισεκατομμύρια). Η εσωτερική συγκριτική αξιολόγηση της εταιρείας δείχνει επίσης ότι το Phi 4 reasoning plus ισοφαρίζει το o3-mini στο OmniMath, ένα τεστ μαθηματικών ικανοτήτων.
Τα Phi 4 mini reasoning, Phi 4 reasoning και Phi 4 reasoning plus είναι διαθέσιμα στην πλατφόρμα ανάπτυξης τεχνητής νοημοσύνης Hugging Face, συνοδευόμενα από λεπτομερείς τεχνικές αναφορές.
“Χρησιμοποιώντας ενισχυτική μάθηση και δεδομένα υψηλής ποιότητας, τα νέα μοντέλα εξισορροπούν το μέγεθος και την απόδοση”, αναφέρει η Microsoft στην επίσημη ανακοίνωση. “Είναι αρκετά μικρά για περιβάλλοντα με χαμηλή απόκριση (latency), διατηρώντας παράλληλα ισχυρές δυνατότητες συλλογισμού που ανταγωνίζονται πολύ μεγαλύτερα μοντέλα. Αυτός ο συνδυασμός επιτρέπει ακόμη και σε συσκευές με περιορισμένους πόρους να εκτελούν αποτελεσματικά σύνθετες εργασίες συλλογισμού.”
VIA: Insomnia.gr