Les humains sont le modèle le plus longtemps entraîné que la nature ait jamais formé

et la formation est toujours en cours

Les humains sont le modèle le plus longuement entraîné que la nature ait jamais formé — et l'entraînement est toujours en cours.

Un concept important dans l'IA est celui de « fonction de valeur », sur lequel les systèmes d'IA modernes s'appuient fortement — des mécanismes qui estiment si une action amène le système vers un résultat positif longtemps avant que le résultat final ne soit connu. Au lieu d'attendre une récompense lointaine, une fonction de valeur fournit un retour d'information dense, guidant le modèle étape par étape. Cela accélère considérablement l'apprentissage : le système ne erre pas aveuglément à travers de longues séquences ; il évalue constamment la direction de sa trajectoire. Chaque fois que le système trouve une fonction de valeur prometteuse, il l'enregistre en quelque sorte et la code en dur dans le cerveau de l'IA. Vous pouvez en savoir plus sur ces fonctions de valeur dans le podcast récent avec Ilya Sutskever, l'informaticien israélo-canadien et co-fondateur d'OpenAI qui a fait partie de la décision du conseil d'administration qui a temporairement retiré Sam Altman d'OpenAI.

Une question se pose : L'entraînement des modèles de pointe d'aujourd'hui nécessite des millions de GPU et d'énormes quantités de données. Alors pourquoi les humains sont-ils devenus le modèle pour l'IA — avec toutes les ambitions d'AGI — sans aucun de ces GPU ou jeux de données ?

Je suis arrivé à la conclusion que ce qui est fascinant, c'est à quel point cela reflète ce que l'évolution a fait pour les humains. La nature a passé des millions d'années à affiner nos fonctions de valeur internes — les instincts de survie, les récompenses sociales, les systèmes de peur, les boucles de curiosité, la satisfaction de la résolution de problèmes. Ce ne sont pas des abstractions ; ce sont des mécanismes de récompense génétiquement intégrés qui aident notre cerveau à décider si nous sommes sur un chemin prometteur. Chaque génération hérite d'un système de façonnage de récompense légèrement amélioré, basé sur les comportements qui ont historiquement augmenté les chances de survie et de reproduction. Ces fonctions de valeur éprouvées et fonctionnelles sont alors codées en dur dans notre ADN, nous sommes donc nés avec des fonctions de valeur prédéfinies et fonctionnelles, nous continuons donc l'« entraînement » à partir de là. C'est fascinant.

C'est pourquoi les humains n'ont pas besoin de GPU massifs ou de jeux de données à trillion de jetons pour devenir intelligents. Notre processus d'apprentissage est soutenu par des fonctions de valeur extrêmement puissantes, construites par l'évolution, qui compressent des millions d'années d'essais et d'erreurs en a priori biologiques. Nous sommes nés avec des gradients de récompense accordés — des incitations qui guident l'exploration, la coopération, la prudence, la créativité et la persévérance longtemps avant que nous ne comprenions pourquoi ils sont importants. L'évolution a effectué l'optimisation longue et coûteuse ; la culture et l'expérience individuelle ne font que raffiner le point de contrôle.

En ce sens, l'intelligence humaine n'est pas seulement un « matériel biologique ». C'est le produit de la boucle d'entraînement la plus longue de l'histoire — une boucle qui a façonné non seulement notre façon de penser, mais ce dont nous nous soucions. Nos fonctions de valeur sont notre boussole. Et c'est cette boussole qui permet à un modèle biologique lentement entraîné et à faible puissance de calcul de surpasser les machines qui consomment beaucoup plus de données et d'énergie brutes.

Les humains sont le modèle le plus longuement entraîné que la nature ait jamais formé — et l'entraînement est toujours en cours.

Écrit par Steven Nguyen

Veuillez noter que la version française est assistée par Ai, des erreurs mineures peuvent donc exister.

Auteur

Ai Base Network (ABN), ABN ASIA a été fondée par des personnes ayant des racines profondes dans le milieu académique, avec une expérience professionnelle aux États-Unis, aux Pays-Bas, en Hongrie, au Japon, en Corée du Sud, à Singapour et au Vietnam. ABN ASIA est l'endroit où l'académie et la technologie rencontrent l'opportunité. Avec nos solutions de pointe et nos services de développement logiciel compétents, nous aidons les entreprises à se développer et à s'imposer sur la scène mondiale. Notre engagement : Plus vite. Mieux. Plus fiable. Dans la plupart des cas : moins cher également.

N'hésitez pas à nous contacter chaque fois que vous avez besoin de services informatiques, de conseils en matière de numérique, de solutions logicielles prêtes à l'emploi, ou si vous souhaitez nous envoyer des demandes de propositions (RFP). Vous pouvez nous contacter à l'adresse [email protected]. Nous sommes prêts à vous aider avec tous vos besoins technologiques.