Microsoft a dévoilé le dernier ajout à sa famille Phi de modèles d’IA génératifs.
Baptisé Phi-4, le modèle présente plusieurs améliorations par rapport à ses prédécesseurs, affirme Microsoft, notamment en ce qui concerne la résolution de problèmes mathématiques. Cela est en partie dû à une meilleure qualité des données d’entraînement.
Phi-4 est disponible en accès très limité depuis jeudi soir uniquement sur la plateforme de développement Azure AI Foundry récemment lancée par Microsoft , et uniquement à des fins de recherche dans le cadre d’un accord de licence de recherche Microsoft.
Il s’agit du dernier modèle de langage de petite taille de Microsoft, avec une taille de 14 milliards de paramètres, et il concurrencera d’autres petits modèles tels que GPT-4o mini, Gemini 2.0 Flash et Claude 3.5 Haiku. Ces modèles d’IA plus petits sont souvent plus rapides et moins chers à exécuter, et leurs performances ont progressivement augmenté au cours des dernières années.
Dans ce cas, Microsoft attribue l’augmentation des performances de Phi-4 à l’utilisation d’« ensembles de données synthétiques de haute qualité » ainsi qu’à des ensembles de données de haute qualité de contenu généré par l’homme et à certaines améliorations post-formation non spécifiées.
De nombreux laboratoires d’IA étudient actuellement de près les innovations qu’ils peuvent apporter autour des données synthétiques et de la post-formation. Le PDG de Scale AI, Alexandr Wang, a déclaré dans un tweet jeudi que « nous avons atteint un mur de données de pré-formation », confirmant plusieurs rapports sur le sujet au cours des dernières semaines.
Phi-4 est notamment le premier modèle de la série Phi à être lancé après le départ de Sébastien Bubeck. Ancien vice-président de l’IA chez Microsoft et personnage clé du développement du modèle Phi de l’entreprise, Bubeck a quitté l’entreprise en octobre pour rejoindre OpenAI.