Avec LightOn Muse, la nouvelle vague d’Intelligence Artificielle ultra-puissante pour le langage est maintenant disponible en français

Les entreprises européennes peuvent interagir directement dans leur langue avec un puissant outil IA pour créer, analyser, ou résumer du texte avec une efficacité bluffante. Question de compétitivité, mais aussi de souveraineté. Une première !

En 2022, avec la croissance exponentielle de la quantité de données à traiter et l’exigence accrue d’efficacité, la tendance est plus que jamais au développement de l’IA, et tout particulièrement aux grands modèles de langage (source).

Pour faire simple, il s’agit d’algorithmes qui reconnaissent, prédisent et génèrent du texte en langage naturel celui que nous utilisons quotidiennement. Pour parvenir à un tel résultat, ils sont entraînés sur d’immenses bases de données de textes divers et variés, ce qui pourrait s’apparenter au processus d’apprentissage d’un humain par l’acquisition de connaissance ici à l’échelle de l’équivalent de millions de livres. Mais outre la quantité, la qualité des données est également essentielle à la performance de ces modèles.

Leur force ? La capacité de relever quelques-uns des grands défis de notre époque :

Traiter et surtout générer de grands volumes de texte en un clin d’œil ;
Offrir un contenu dont la qualité se rapproche de, voire dépasse, celle fournie par un humain ;
Permettre de construire des outils pour l’économie, les sciences, l’industrie de la culture ou du loisir dont on ne pouvait même pas rêver il y a encore quelques années.

Mieux : avec les modèles les plus performants, il n’y a même pas besoin d’écrire une ligne de code informatique ! Il suffit de décrire la tâche à exécuter, que le modèle saura interpréter sur la base des “connaissances” acquises lors de son entraînement (Machine Learning).

Pourtant, ces modèles ont été peu utilisés en Europe, car ils sont d’une part quasi-uniquement en anglais, et d’autre part extrêmement difficiles et coûteux à mettre en place. En effet, créer de grands modèles de langages suppose de:

Recruter les meilleurs ingénieurs en Machine Learning et NLP (Natural Language Processing) à la pointe de la recherche ;
Constituer une base de données de qualité, aussi grande et diversifiée que possible (œuvres littéraires, écrits techniques, articles scientifiques et économiques, sous-titres de films, etc.) ;
Prévoir, pour chaque modèle, plusieurs jours d’entraînement sur un superordinateur, ce qui suppose parfois une longue attente, et toujours des coûts prohibitifs ;
Faire les tests nécessaires pour s’assurer de la qualité du modèle ;
Effectuer éventuellement une personnalisation du modèle, pour le spécialiser dans l’exécution d’une tâche spécifique.

Ainsi, la complexité et le coût de ce type de projets font que, monopolisés par les Américains et les Asiatiques, ces modèles étaient disponibles uniquement en anglais (ex. : GPT-3, de OpenAI, en lien avec Microsoft) ou encore en chinois et en coréen. L’utilisation de ces grands modèles pour d’autres langues ne pouvait se faire qu’en passant par un outil de traduction, ce qui implique une baisse de qualité et une augmentation des coûts.

Une autre question, absolument essentielle, posée par le relativement faible développement de ces technologies en Europe est celle de la souveraineté. En effet, ces technologies sont indispensables à la transformation numérique des entreprises, qui est un avantage compétitif décisif dans le monde d’aujourd’hui. La dépendance des fournisseurs américains rend donc les entreprises européennes relativement impuissantes face à la récupération et l’utilisation gratuites de leurs données, qui servent ensuite à améliorer des produits et services non-européens. Ainsi, les entreprises et organisations européennes doivent subir cette dépendance sans l’avoir réellement choisie.

Mais ça… c’était avant ! Désormais, nous avons une pépite qui n’a pas à rougir face aux puissantes entreprises californiennes : la start-up française LightOn, qui révolutionne le marché en devenant la première entreprise au monde à avoir entraîné de grands modèles de langages directement en quatre langues européennes autres que l’anglais.

Pour les mettre à disposition de toutes les entreprises, des PME aux grands groupes, elle vient de créer l’API Muse, que chacun peut tester gratuitement.

“Nous pensons que l’API Muse est une avancée significative dans la technologie de l’IA. Nous avons conçu une API qui s’appuie sur des technologies de Machine Learning pour fournir un service de langage naturel à haute valeur ajoutée. Grâce au machine learning, [Muse] est capable de reconnaître les émotions dans des textes écrits, de générer des textes en langage naturel, d’écrire des messages personnalisés, de générer des résumés, d’analyser les sentiments et de comprendre l’intention d’une personne.” C’est un texte que nous aurions pu tout à fait écrire pour ce communiqué de presse, et cependant… il a été entièrement généré par l’API Muse elle-même!

**Démocratiser l’accès aux grands modèles de langages VLM-4 en 5 langues et à des fonctionnalités de customisation (*skills***)

Avec l’API Muse, LightOn ouvre ce domaine à la pointe de l’Intelligence Artificielle textuelle à tous les acteurs européens, quels que soient leur taille ou leur secteur d’activité (marketing, media, industrie du loisir, entreprises technologiques …. , voire même les administrations), qui ont besoin de s’adresser à leur public dans leur propre langue.

À travers l’API Muse, ils auront accès aux grands modèles de langages VLM-4 en cinq langues (Français, Anglais, Allemand, Espagnol, Italien), ainsi qu’à des fonctionnalités de customisation (skills) permettant de “spécialiser” le modèle pour des tâches particulières.

Le but est de permettre à tous ces acteurs de pouvoir bâtir facilement :

Des produits et services commerciaux autour de tâches liées au texte: une fleuriste sera aidée par l’IA pour créer quotidiennement du contenu pour le compte Instagram de sa boutique – un gain de temps non négligeable !- ; avec un outil spécialisé, un étudiant pourra mieux classifier et synthétiser les innombrables articles pour son travail de mémoire; les éditeurs de contenu peuvent s’appuyer sur les suggestions du modèle pour écrire plus rapidement;
Des produits et services pour leur usage interne: les managers pourront se faire aider par un assistant IA dans la gestion de projets; les emails ou documents internes pourront être résumés automatiquement pour que les employés n’aient à lire que l’essentiel, en détectant ceux qui appellent à une réponse immédiate, etc.

Les (grands) petits plus de cette technologie “zéro prise de tête”

Une API multilingue

Muse est la première API à ouvrir les modèles à grande échelle à un très large panel de langues : le français, l’anglais, l’italien, l’espagnol, l’allemand, avec beaucoup d’autres à venir (40 langues d’ici fin 2023).

Un must pour gagner de nouveaux marchés en parlant aux clients dans leur langue maternelle.

Facilité d’utilisation

L’API Muse est conçue pour être flexible, facile à intégrer dans tous les systèmes, et utilisable par tous, partout. Il suffit simplement de donner des instructions et des exemples en langage naturel, comme si on interagissait avec un humain.

Gain de temps et gain d’efficacité

Fini les longues heures passées à répondre aux e-mails et aux avis clients, à écrire des posts pour remonter dans les recherches en ligne… Avec l’API Muse, ces tâches chronophages, mais indispensables, peuvent faire un bond de productivité avec un niveau d’automatisation que vous contrôlez – de la simple suggestion de contenu à l’automatisation totale.

Des modèles de langages ultra-puissants

L’API Muse utilise VLM-4, des grands modèles de langages parmi les plus performants du marché. Les ingénieurs de LightOn innovent constamment pour augmenter la taille de leurs modèles et la qualité des données avec lesquelles ils sont entraînés (deux paramètres essentiels à un service d’excellence en matière de génération de texte). Les VLM-4 ont ainsi la capacité de répondre en contexte, d’apprendre à exécuter une tâche à partir de seulement quelques exemples (modèles few-shot) ou même sans le soutien d’aucun exemple (modèles zero-shot).

Des possibilités infinies de customisation

En rendant les modèles très performants pour exécuter des tâches spécifiques (skills), les ingénieurs de LightOn peuvent les adapter aux besoins et particularités de chaque entreprise.

Créer facilement des produits et des services performants

Via l’API Muse, il est possible de réinventer :

L’E-Marketing

Un SEO ultra-performant pour générer automatiquement du texte autour de mots-clés populaires, pour améliorer la visibilité de l’entreprise ;
Des campagnes d’emailing et des publicités qui font mouche puisqu’elles ciblent chaque client en particulier ;
La création de contenus beaucoup plus qualitatifs, avec beaucoup moins d’efforts.

La Relation clients

La satisfaction des clients augmente puisqu’ils bénéficient d’une assistance en temps réel via des Chatbots très efficaces. En parallèle, la mise en place de moteurs de recherche personnalisés facilite l’analyse des données de tous types.

L’Analyse commerciale

La fonctionnalité “Sentiment Analysis” livre une synthèse fiable des retours clients afin de simplifier la prise de décision. Les différents avis et évaluations sont analysés et classifiés. La base de données clients est structurée, ce qui permet une gestion plus efficace.

La Gestion de données

Muse peut résumer des documents et des e-mails pour extraire les informations essentielles afin de gagner du temps. De plus, en créant un outil de recherche ou de classification personnalisé, il est possible de traiter efficacement de grandes quantités de données de tous types.

Témoignages

BABBAR.TECH (produit SEO à partir de Muse) : “En combinant notre technologie unique de référencement prédictif avec la fonction de génération dirigée de texte de l’API Muse, Babbar est maintenant en mesure d’offrir un outil unique à nos clients, qui génère chaque mois des millions de mots, optimisé pour leurs usages spécifiques.” (Sylvain Peyronnet, CEO and Co-founder, Babbar.tech)

PIPPLET (évaluation linguistique à base d’un modèle de langage en anglais) : “Nous avons pu améliorer notre service d’évaluation linguistique et augmenter sa qualité et sa fiabilité pour nos clients grâce aux multiples langues de Muse et à la possibilité d’adapter le modèle VLM-4 à notre cas d’usage spécifique.” (Baptiste Derongs, co-fondateur et directeur Stratégie & Développement de Pipplet, une société ETS)

ITERATION X (construction de sites web avec des instructions en langage naturel) :“La capacité de VLM-4 à suivre les instructions données en langage naturel est vraiment étonnante.” (Mehdi Djabri, CEO et co-fondateur de Iteration-X)

(Crédits LightOn, Olivier Laly)

À propos de LightOn

La start-up LightOn a été fondée en 2016 par des chercheurs et des ingénieurs qui voulaient s’attaquer à un projet original et ambitieux : utiliser la lumière pour traiter efficacement de grandes quantités de données, en particulier dans le domaine de l’intelligence artificielle. Une initiative couronnée de succès : en 2020, LightOn a lancé son tout premier co-processeur photonique.

Entre-temps, l’équipe s’est agrandie, a levé des fonds, et s’est attaquée à un nouveau défi dans le domaine émergent de l’IA : créer les premiers grands modèles de langage pour les langues européennes, en particulier le français.

Aujourd’hui, l’équipe est composée de 20 personnes, parmi les meilleurs ingénieurs et chercheurs européens dans le domaine du Machine Learning.

La genèse du projet VLM-4 et de l’API Muse

Au départ, l’entraînement des grands modèles de langage faisait partie des applications possibles pour le processeur photonique de LightOn. Très vite, l’équipe se passionne pour cette nouvelle génération d’intelligence artificielle, encore méconnue en France, et elle élabore et entraîne ses propres modèles. En 2020, elle met en accès libre son premier modèle français à travers une interface simple de génération de texte : PAGnol. Enfin, après une année et demi de travail intensif, elle met au point VLM-4, une suite de grands modèles de langage en 5 langues européennes.

Et aujourd’hui, après avoir mis VLM-4 à la portée de tous à travers l’API Muse, LightOn travaille au développement de ce service, notamment en y ajoutant de nouvelles langues (40 d’ici 2023), en construisant une communauté autour de ce projet (échange d’expérience, de cas d’usage, etc.) et en mettant en place une offre de personnalisation.