- Publié le
Ouah. Apple a publié aujourd'hui plusieurs modèles de langage étendus (LLM) open source conçus pour s'exécuter sur l'appareil plutôt que via des serveurs cloud.
- Auteurs
- Nom
- AbnAsia.org
- @steven_n_t
"Apple a publié aujourd'hui plusieurs modèles de langage étendus (LLM) open source conçus pour s'exécuter sur l'appareil plutôt que via des serveurs cloud. Appelés OpenELM (Open-source Efficient Language Models), les LLM sont disponibles sur le Hugging Face Hub, une communauté de partage de code d'IA.
Fonctionnalité optimisée Apple Silicon AI Siri Comme indiqué dans un livre blanc [PDF], il existe au total huit modèles OpenELM, dont quatre ont été pré-entraînés à l'aide de la bibliothèque CoreNet, et quatre modèles optimisés pour les instructions. Apple utilise une stratégie de mise à l'échelle par couche visant à améliorer la précision et l'efficacité.
Apple a fourni du code, des journaux de formation et plusieurs versions plutôt que le modèle final formé, et les chercheurs à l'origine du projet espèrent que cela conduira à des progrès plus rapides et à des « résultats plus fiables » dans le domaine de l'IA en langage naturel.
OpenELM, un modèle de langage ouvert de pointe. OpenELM utilise une stratégie de mise à l'échelle par couche pour allouer efficacement les paramètres au sein de chaque couche du modèle de transformateur, conduisant à une précision améliorée. Par exemple, avec un budget de paramètres d'environ un milliard de paramètres, OpenELM présente une amélioration de 2,36 % en termes de précision par rapport à OLMo tout en nécessitant 2 fois moins de jetons de pré-entraînement.
S'écartant des pratiques antérieures qui fournissent uniquement des poids de modèle et un code d'inférence, et pré-entraînent sur des ensembles de données privés, notre version inclut le cadre complet pour l'entraînement et l'évaluation du modèle de langage sur des ensembles de données accessibles au public, y compris les journaux d'entraînement, plusieurs points de contrôle et la pré-formation. configurations de formation.
Apple affirme qu'elle publie les modèles OpenELM pour « responsabiliser et enrichir la communauté de recherche ouverte » avec des modèles de langage de pointe. Le partage de modèles open source donne aux chercheurs un moyen d'étudier les risques et les biais des données et des modèles. Les développeurs et les entreprises peuvent utiliser les modèles tels quels ou apporter des modifications.
Le partage ouvert d'informations est devenu un outil important permettant à Apple de recruter des ingénieurs, des scientifiques et des experts de haut niveau, car il offre la possibilité de publier des articles de recherche qui n'auraient normalement pas pu être publiés dans le cadre des politiques secrètes d'Apple.
Apple n'a pas encore apporté ce type de fonctionnalités d'IA à ses appareils, mais iOS 18 devrait inclure un certain nombre de nouvelles fonctionnalités d'IA, et des rumeurs suggèrent qu'Apple envisage d'exécuter ses grands modèles de langage sur l'appareil à des fins de confidentialité."
Veuillez noter que la version française est assistée par Ai, des erreurs mineures peuvent donc exister.
Auteur
AiUTOMATING PEOPLE, ABN ASIA a été fondée par des personnes ayant des racines profondes dans le milieu académique, avec une expérience professionnelle aux États-Unis, aux Pays-Bas, en Hongrie, au Japon, en Corée du Sud, à Singapour et au Vietnam. ABN ASIA est l'endroit où l'académie et la technologie rencontrent l'opportunité. Avec nos solutions de pointe et nos services de développement logiciel compétents, nous aidons les entreprises à se développer et à s'imposer sur la scène mondiale. Notre engagement : Plus vite. Mieux. Plus fiable. Dans la plupart des cas : moins cher également.
N'hésitez pas à nous contacter chaque fois que vous avez besoin de services informatiques, de conseils en matière de numérique, de solutions logicielles prêtes à l'emploi, ou si vous souhaitez nous envoyer des demandes de propositions (RFP). Vous pouvez nous contacter à l'adresse [email protected]. Nous sommes prêts à vous aider avec tous vos besoins technologiques.
© ABN ASIA