Le boom de l'IA depuis deux ans : la technologie a-t-elle résolu les défis de la commercialisation ? -

Depuis l'apparition de ChatGPT, l'essor de l'IA dure depuis deux ans. Pendant ce temps, le grand public a été enthousiasmé par les capacités des grands modèles de langage, qui peuvent générer du texte fluide et naturel à partir de commandes simples, transformant ainsi les scénarios de science-fiction en réalité.

Le domaine des grands modèles entre également dans une phase critique, où les nouvelles technologies doivent se transformer en nouveaux produits répondant à des besoins réels et évoluer vers un nouvel écosystème commercial.

Tout comme les paiements mobiles, les smartphones et le LTE ont collectivement alimenté la prospérité de l’ère de l’Internet mobile, l’industrie de l’IA recherche également une telle adéquation produit-marché (PMF) en 2024.

L’ère de l’exploration des nouvelles technologies a commencé, et la découverte d’une nouvelle frontière déterminera si les grands modèles ne sont qu’un autre jeu de capital à brûler de l’argent, une répétition de la bulle Internet ou, comme l’a dit Jensen Huang, le début d’une nouvelle révolution industrielle. Cette réponse sera révélée plus rapidement que l’intelligence artificielle générale (AGI).

Les grands problèmes des grands modèles

Aujourd'hui, la concurrence dans les modèles fondamentaux s'est stabilisée. OpenAI, avec ChatGPT en tête du marché, détient le record, tandis que d'autres acteurs comme Anthropic, DeepMind, Llama et Grok ont chacun leurs points forts.

Ainsi, la chose la plus passionnante en 2024 n’est pas de savoir qui a étendu les paramètres ou amélioré la vitesse de réponse, mais comment la technologie des grands modèles peut devenir un produit utilisable.

Dès le début, l’application de la technologie des modèles de langage à grande échelle a été un défi. Harvard Business Review a mené une enquête et a découvert qu’il existe jusqu’à 100 types d’applications d’IA générative.

Tableau classant les applications d’IA en cinq types principaux.

Cependant, ils se répartissent en cinq grandes catégories : la résolution de problèmes techniques, la production et l’édition de contenu, le support client, l’apprentissage et l’éducation, ainsi que la création et la recherche artistiques.

La célèbre société d'investissement a16z a présenté les meilleurs produits d'IA générative de son équipe, notamment des noms familiers comme Perplexity, Claude et ChatGPT. Il existe également des produits plus spécialisés comme les applications de prise de notes Granola, Wispr Flow, Every Inc. et Cubby. Dans le secteur de l'éducation, le grand gagnant de 2024 a été NotebookLM, ainsi que des chatbots comme Character.ai et Replika.

Pour les utilisateurs ordinaires, la plupart de ces produits sont gratuits et les versions par abonnement ou professionnelles ne représentent pas des dépenses nécessaires. Même pour un acteur puissant comme ChatGPT, les revenus d'abonnement en 2024 étaient d'environ 283 millions de dollars par mois, soit le double de ceux de 2023. Mais face à des coûts énormes, ces revenus semblent insignifiants.

Les utilisateurs ordinaires peuvent profiter des avancées technologiques, mais pour les professionnels du secteur, aussi passionnantes soient-elles, ces avancées technologiques ne peuvent pas rester en laboratoire. Elles doivent entrer dans le monde commercial pour être testées. Le modèle d'abonnement n'a pas encore été largement accepté et le temps d'intégrer des publicités n'est pas encore venu. Le temps qui reste aux grands modèles pour dépenser de l'argent est compté.

En revanche, le développement axé sur les entreprises est plus prometteur.

Depuis 2018, la mention de l'IA dans les conférences téléphoniques sur les résultats financiers des entreprises du Fortune 500 a presque doublé. Dans toutes les conférences téléphoniques sur les résultats financiers, 19.7 % des enregistrements mentionnent l'IA générative comme le sujet le plus discuté.

C'est également le consensus de l'ensemble du secteur. Selon le livre bleu « Rapport sur le développement de l'intelligence artificielle (2024) » publié par l'Académie chinoise des technologies de l'information et de la communication, d'ici 2026, plus de 80 % des entreprises utiliseront des API d'IA génératives ou déploieront des applications génératives.

Les applications destinées aux entreprises et aux consommateurs présentent des tendances de développement différentes : les applications destinées aux consommateurs mettent l'accent sur les faibles barrières et la créativité, tandis que les applications destinées aux entreprises se concentrent davantage sur la personnalisation professionnelle et le retour d'information sur l'efficacité.

En d’autres termes, l’amélioration de l’efficacité est un objectif que toute entreprise souhaite atteindre, mais se contenter de ces quatre mots est trop vague. Les grands modèles doivent prouver qu’ils peuvent réellement résoudre des problèmes dans des cas d’utilisation et améliorer réellement l’efficacité.

Trouver précisément les points d’entrée pour mettre en œuvre la technologie

Qu'il s'agisse d'investissements dans les ressources ou d'efforts d'expansion du marché, la concurrence de la Chine dans les grands modèles a été intense tout au long de 2024.

Selon les données du ministère chinois de l'Industrie et des Technologies de l'information, le taux de croissance du marché chinois des grands modèles linguistiques en 2023 a dépassé 100 %, atteignant environ 2 milliards de dollars. Les entreprises expérimentent activement la commercialisation, en se lançant dans un premier temps dans une guerre des prix : réduction des coûts grâce à la facturation basée sur des jetons, aux appels API et à d'autres méthodes. De nombreux grands modèles courants sont désormais presque gratuits.

Il est relativement facile de réduire les prix et les coûts. Cependant, comprendre le monde des affaires et analyser les scénarios d’entrée sur le marché est un chemin plus difficile.

Toutes les entreprises ne participent pas à la guerre des prix, s’appuyant sur la concurrence à bas coûts.

« Dans ce contexte, il est plus important de trouver nos caractéristiques uniques et de tirer parti de nos atouts. Tencent dispose de nombreux scénarios internes qui nous fournissent davantage d'informations et améliorent encore nos capacités », a déclaré Zhao Xinyu, spécialiste des produits d'IA chez Tencent Cloud et responsable des produits ToB de Tencent Hunyuan. « En externe, nous nous concentrons sur un secteur, sur des scénarios spécifiques au sein de ce secteur, puis nous nous développons progressivement. »

Parmi les nombreux modèles fondateurs, le Hunyuan n’est peut-être pas le plus accrocheur, mais sa force technique est indéniable.

En septembre 2023, Hunyuan a publié le modèle général de texte à texte Hunyuan Turbo, adoptant une nouvelle structure de mélange d'experts (MoE). Il a obtenu de bons résultats dans la compréhension et la génération du langage, le raisonnement logique, la reconnaissance des intentions, ainsi que dans les tâches de codage, de contexte long et d'agrégation. Dans la version de mise à jour dynamique de novembre 2023, il a été mis à niveau vers le modèle le plus performant dans tous les domaines. Actuellement, les capacités de Tencent Hunyuan sont entièrement fournies par Tencent Cloud, offrant différentes tailles et types de modèles, combinés à d'autres produits et capacités d'IA de Tencent Cloud Intelligence, pour aider les applications de modélisation à se placer dans des scénarios.

Interface du modèle Hunyuan Turbo avec détails techniques et mesures de performances.

Actuellement, les formes d'application des modèles sont grossièrement divisées en deux types : les scénarios sérieux et les scénarios de divertissement. Ces derniers incluent les chatbots, les applications compagnons, etc.

Les « scénarios sérieux » font référence aux applications dans les opérations commerciales principales des entreprises, où la précision et la fiabilité sont très demandées. Dans ces scénarios, les grands modèles doivent gérer des informations structurées, généralement en suivant des processus commerciaux et des normes de qualité prédéfinis, et leurs effets d'application sont directement liés à l'efficacité opérationnelle et aux résultats commerciaux des entreprises.

Tencent Cloud a déjà aidé un fournisseur de services sortants à mettre en place un système de service client, ce qui est un scénario typiquement sérieux. Les appels sortants impliquent des capacités de dialogue en langage naturel, de compréhension du contenu et d'analyse, qui sont hautement compatibles avec les grands modèles linguistiques.

En fait, le défi réside dans les détails. À l'époque, l'équipe était confrontée à deux défis majeurs. Le premier était lié aux performances, car la taille des paramètres du modèle était énorme, atteignant 70 ou 300 B. Comment compléter la réponse en 500 millisecondes et la transmettre au système TTS en aval est devenu un défi technique important.

Le deuxième problème concernait la précision de la logique de dialogue. Le modèle produisait parfois des réponses illogiques dans certains dialogues, ce qui affectait l'effet global du dialogue. Pour surmonter ces difficultés, l'équipe de projet a adopté une stratégie d'itération intensive, en maintenant un rythme d'itération rapide d'une version par semaine dans un cycle de développement de 1 à 2 mois.

Les entreprises clientes manifestent un intérêt pour la technologie des modèles de langage à grande échelle et sont prêtes à essayer des innovations, mais il existe toujours un fossé cognitif dans l'intégration profonde de la technologie et des activités. Cela ne vient pas d'un manque de compréhension de leur propre activité par les entreprises, mais nécessite une équipe technique professionnelle pour comprendre en profondeur les points faibles du secteur et les scénarios commerciaux, trouver les scénarios les plus appropriés, adapter les solutions d'atterrissage de l'IA aux entreprises et obtenir la meilleure combinaison de technologie et d'activité.

« L’approche traditionnelle peut exiger des opérateurs qu’ils construisent des corpus un scénario à la fois », explique Xinyu, « mais avec de grands modèles, il suffit de donner une invite pour répondre à la demande. » Après avoir clarifié la demande, l’équipe Hunyuan a mis à jour une version presque chaque semaine, accélérant la vitesse d’itération, et en un ou deux mois, la précision a atteint 95 %.

Pour ce prestataire de services sortants, la technologie générative était une nouveauté. Hunyuan leur a directement montré les avantages apportés par les grands modèles, réduisant les dépenses de main-d'œuvre de trois quarts.

« La meilleure approche consiste à mettre en avant les effets », a déclaré Xinyu. Lorsque les clients ont une certaine compréhension de la technologie générative, mais pas beaucoup, la présentation des effets est la plus efficace. En trouvant des scénarios qui peuvent être saisis grâce à l'expérience commerciale du client, en effectuant directement des tests de vérification et en démontrant les améliorations qui peuvent être obtenues.

Une expérience similaire s’est produite dans le cadre d’une coopération avec Xiaomi, qui a été décrite comme un « voyage à double sens ».

L'autre partie souhaitait introduire de grands modèles dans les interactions de questions-réponses, en appliquant les capacités de recherche d'IA aux terminaux. Cela a touché deux des points forts de Hunyuan : le soutien fourni par l'écosystème de contenu riche de Tencent et les capacités de Hunyuan en matière de recherche d'IA. Pour les questions-réponses, la précision est très importante.

« Au début, il y avait encore beaucoup de difficultés », se souvient Xinyu. « De leur point de vue, le formulaire commercial couvrait de nombreux scénarios, notamment les conversations informelles, les questions-réponses sur les connaissances et d’autres types de scénarios, parmi lesquels le scénario des questions-réponses sur les connaissances avait des exigences de précision relativement élevées. »

Grâce à des tests préliminaires, l'équipe Hunyuan a clarifié ses avantages dans les scénarios de recherche et, en collaboration avec l'autre partie, a progressivement affiné l'interaction Q&R largement définie en fonction de différents niveaux de sujet. Ce type de segmentation permet au modèle de mieux comprendre les besoins spécifiques et les exigences d'effet de chaque scénario, ce qui permet une optimisation plus ciblée.

Le scénario de questions-réponses sur les connaissances est devenu le point d'atterrissage. Dans les implémentations ultérieures, Hunyuan a encore eu de nombreux défis à relever : les problèmes de latence n'ont pas besoin d'être mentionnés, le temps de réponse doit être rapide ; deuxièmement, l'intégration du contenu de recherche.

« Dans l’ensemble du lien, nous avons construit un moteur de recherche développé par nos soins et un modèle de classification des intentions pour déterminer s’il s’agit d’une question d’actualité. Par exemple, si elle est liée à l’actualité ou à des sujets d’actualité, puis nous décidons de la transmettre au modèle principal ou à la recherche par IA. »

Appeler uniquement les services les plus utiles améliore considérablement la vitesse de réponse. Une découverte importante est que 70 % des demandes mènent à une recherche par IA, ce qui signifie qu'il doit y avoir un contenu suffisamment riche pour le support d'appel le plus basique.

Derrière Hunyuan se cache l'ensemble de l'écosystème de contenu Tencent. De l'actualité à la musique, en passant par la finance et même la santé, l'écosystème de Tencent offre une multitude de contenus de haute qualité. Ce contenu est accessible et référencé par le modèle Hunyuan lors des recherches, offrant un avantage unique.

Après plus de deux mois d'itération intensive, la qualité des réponses, la vitesse de réponse et les performances ont pleinement répondu aux exigences et ont été mises en œuvre dans les opérations commerciales réelles de Xiaomi.

La clé du commerce B2B est de générer des revenus et de gagner la confiance, ce qui nécessite d'apporter une réelle valeur aux opérations des clients.

Généralisation « Roll » pour atteindre plus de scénarios

L’application de grands modèles à différents secteurs et produits favorise également la croissance de la technologie elle-même.

Pour certains produits de grande taille, le choix de la voie B2C implique une considération essentielle : utiliser les commentaires des consommateurs pour optimiser le modèle. Le besoin de réglage des modèles de grande taille est infini, et le nombre et l'activité des utilisateurs consommateurs fournissent le carburant pour l'itération du modèle, accélérant ainsi la vitesse d'itération.

En fait, cela se produit également dans le commerce B2B, avec des exigences encore plus élevées.

La fonction de notation des dissertations chinoises K12 de « Teenager Gains » utilise les capacités multimodales de Hunyuan. Associée à la technologie OCR intelligente de Tencent Cloud, elle reconnaît le contenu des dissertations des étudiants et utilise le grand modèle pour noter les dissertations en fonction de normes de notation prédéfinies.

En règle générale, si la différence de score entre le modèle à grande échelle et un enseignant humain est inférieure à cinq points, le résultat est considéré comme satisfaisant, mais ce n'est pas facile à atteindre. Au départ, seuls 80 % des scores de Hunyuan se situaient à cinq points près des scores des enseignants humains.

« Le modèle dispose de certaines méthodes et capacités pour résoudre les problèmes dans certains scénarios. Cependant, lorsqu'il s'agit de se concentrer sur l'activité d'un client spécifique, des performances plus élevées sont nécessaires », a déclaré Xinyu. « Bien qu'une précision de 90 % puisse répondre aux objectifs commerciaux, à 70 % ou 80 %, il existe toujours un écart. »

Cela implique des efforts continus. À mesure que la base de clients des entreprises s’élargit, de nouvelles exigences sont imposées à la technologie elle-même : tout d’abord, une augmentation significative de la vitesse d’itération – les itérations pour les utilisateurs grand public peuvent prendre un à deux mois, mais désormais une nouvelle version peut apparaître chaque semaine. Cette itération à haute fréquence favorise grandement la croissance et la progression du modèle.

Deuxièmement, le fait de proposer en permanence différents scénarios d'entreprise a considérablement amélioré la capacité de généralisation du modèle. Cela indique que répondre en profondeur aux divers besoins des entreprises accélère non seulement le rythme de développement et d'itération du modèle, mais améliore également sa praticabilité et son adaptabilité, lui permettant de passer de scénarios sérieux à des scénarios plus orientés vers le divertissement.

La plateforme de jeux de rôle « Dream Dimension », qui a récemment obtenu des dizaines de millions de dollars de financement de série A, a appliqué le modèle exclusif de jeu de rôle du grand modèle Hunyuan, Hunyuan-role, destiné aux jeunes utilisateurs. Il combine la technologie générative de l'IA pour offrir une expérience d'interaction de personnages virtuels interactive et axée sur l'histoire.

Hunyuan-role a été le pionnier d'une nouvelle forme d'interaction homme-machine. En créant diverses images de personnages virtuels et en s'appuyant sur des arrière-plans d'histoire et des paramètres de personnages prédéfinis, il engage les utilisateurs dans des dialogues interactifs naturels et fluides.

Sur le plan technique, ces applications de scénarios ont démontré les principaux avantages de Hunyuan-role dans la gestion des dialogues de texte longs et courts, la reconnaissance des intentions et la réponse. Il peut gérer divers scénarios d'application et présente d'excellentes capacités d'humanisation du contenu, non seulement en engageant des interactions de dialogue chaleureuses, mais aussi en faisant progresser les scénarios pour créer une expérience utilisateur immersive.

Ces fonctionnalités font de Hunyuan-role un outil puissant pour l'acquisition de clients et les opérations utilisateur, jouant un rôle crucial dans l'amélioration de la rétention et de l'engagement des utilisateurs. Cela reflète également le fait que Hunyuan, affiné et amélioré dans des scénarios sérieux, a développé des capacités de généralisation qui peuvent couvrir des scénarios plus larges, même dans des applications de bout en bout.

Passer de scénarios sérieux à des applications de divertissement, de créativité et bien plus encore est un voyage que les grandes applications de modèles doivent entreprendre.

À mesure que la technologie évolue et que les coûts diminuent, les grands modèles sont voués à s'étendre à des scénarios d'application plus vastes. Initialement axés sur des scénarios d'entreprise sérieux comme le travail de bureau en entreprise, l'analyse de données et la recherche scientifique, ces domaines ont des exigences claires et une volonté de payer plus élevée.

Une expansion plus poussée dans le domaine du divertissement, de la créativité et de la production de contenu nécessite un ancrage stratégique : se concentrer toujours sur la résolution de besoins de scénarios spécifiques comme objectif principal, en identifiant le point d'entrée pour l'intégration de capacités de grands modèles.

En plus de collaborer avec les logiciels d'application, des partenariats avec les fabricants de matériel sont également nécessaires pour permettre au modèle de fonctionner du côté du consommateur, en fournissant des services plus proches de la vie quotidienne des utilisateurs et en offrant des expériences de service plus pratiques et immédiates.

Dans ce processus, la notoriété et l'acceptation du marché de la technologie d'IA générative augmentent sans cesse, et la base d'utilisateurs s'élargit sans cesse. Face à cet environnement de marché en évolution rapide, la capacité d'itération du modèle devient particulièrement importante. Cela se reflète non seulement dans les performances techniques, mais aussi dans la compréhension des besoins des utilisateurs, l'adaptation à différents scénarios, etc. Seuls les modèles et les équipes capables d'apprendre rapidement, d'optimiser en permanence et de s'adapter constamment aux nouvelles demandes peuvent conserver un avantage concurrentiel.

À mesure que de nouveaux scénarios sont couverts, la portée vers davantage de consommateurs finaux s'élargit également. Avec l'acceptation globale de la technologie générative par le marché, la base d'utilisateurs potentiels continuera de croître. Un modèle capable d'itérer et de s'améliorer rapidement peut s'adapter rapidement aux changements, évoluant de manière plus régulière et plus loin.

Source à partir de si un

Avis de non-responsabilité : les informations présentées ci-dessus sont fournies par ifanr.com, indépendamment d'Chovm.com. Chovm.com ne fait aucune représentation ni garantie quant à la qualité et à la fiabilité du vendeur et des produits. Chovm.com décline expressément toute responsabilité en cas de violations des droits d'auteur du contenu.

Dernières infos

L’essor de l’IA depuis deux ans : la technologie a-t-elle résolu les défis de la commercialisation ?

Les grands problèmes des grands modèles

Trouver précisément les points d’entrée pour mettre en œuvre la technologie

Généralisation « Roll » pour atteindre plus de scénarios

A propos de l'auteur

si un

Laisser un commentaire

Les grands problèmes des grands modèles

Trouver précisément les points d’entrée pour mettre en œuvre la technologie

Généralisation « Roll » pour atteindre plus de scénarios

A propos de l'auteur

si un

Articles Similaires

Laisser un commentaire