ChatGPTの登場以来、AIブームは2年間続いています。この間、一般の人々は、単純なコマンドから滑らかで自然なテキストを生成し、SFのシナリオを現実に変えることができる大規模言語モデルの機能に興奮してきました。
大型モデルの分野もまた、新しい技術を実際のニーズを満たす新しい製品に変換し、新しい商業エコシステムに発展させる必要がある重要な段階に入っています。
モバイル決済、スマートフォン、LTE が相まってモバイル インターネット時代の繁栄を牽引したように、AI 業界も 2024 年にそのような製品市場適合 (PMF) を追求しています。
新しいテクノロジーを探求する時代が始まりました。新しいフロンティアを発見できるかどうかによって、大規模モデルが単なる資金を燃やす資本ゲームの 1 つに過ぎないのか、インターネット バブルの再現なのか、あるいはジェンセン フアンが言ったように、新しい産業革命の始まりなのかが決まります。この答えは、汎用人工知能 (AGI) よりも早く明らかになるでしょう。
大規模モデルの大きな問題
現在、基礎モデルにおける競争は基本的に安定しています。OpenAI がリードし、ChatGPT がしっかりと市場をリードしていますが、Anthropic、DeepMind、Llama、Grok などの他のプレーヤーもそれぞれ強みを持っています。
したがって、2024 年に最もエキサイティングなことは、誰がパラメータを拡張したか、または応答速度を改善したかではなく、大規模モデル技術がどのようにして実用的な製品になるかです。
当初から、大規模言語モデル技術の適用は課題となっていました。ハーバード・ビジネス・レビューが調査を実施したところ、生成 AI アプリケーションの種類は 100 種類にも上ることがわかりました。
ただし、それらは技術的な問題解決、コンテンツの制作と編集、顧客サポート、学習と教育、芸術的な創作と研究の 5 つの主なカテゴリに分類されます。
有名な投資会社 a16z は、Perplexity、Claude、ChatGPT などのおなじみの名前を含む、チームのトップ生成 AI 製品を公開しました。メモアプリの Granola、Wispr Flow、Every Inc.、Cubby など、よりニッチな製品もあります。教育分野では、2024 年の最大の勝者は NotebookLM で、Character.ai や Replika などのチャットボットもこれに並びました。
一般ユーザーにとって、これらの製品のほとんどは無料であり、サブスクリプションやプロフェッショナルバージョンは必要な費用ではありません。ChatGPTのような強力なプレーヤーであっても、2024年のサブスクリプション収益は月額約283億2023万ドルで、XNUMX年から倍増します。しかし、莫大なコストを考えると、この収入は取るに足らないものに思えます。
技術の進歩を享受することは一般ユーザーにとって喜びですが、業界の専門家にとっては、技術の進化がいかに刺激的であっても、研究室にとどまることはできません。商業の世界に参入してテストする必要があります。サブスクリプション モデルは広く受け入れられておらず、広告を埋め込む時期はまだ来ていません。大規模モデルが資金を浪費する時間は残り少なくなっています。
対照的に、ビジネス指向の開発はより有望です。
2018 年以降、フォーチュン 500 社の収益報告会での AI に関する言及はほぼ倍増しました。すべての収益報告会において、最も議論されたトピックとして生成 AI に言及した記録は 19.7% に上ります。
これは業界全体のコンセンサスでもあります。中国情報通信研究院が発表したブルーブック「人工知能発展報告(2024)」によると、2026年までに企業の80%以上が生成AI APIを使用するか、生成アプリケーションを導入することになります。
企業向けアプリケーションと消費者向けアプリケーションでは開発の傾向が異なります。消費者向けアプリケーションでは障壁の低さと創造性が重視されるのに対し、企業向けアプリケーションでは専門的なカスタマイズと効率性のフィードバックに重点が置かれています。
言い換えれば、効率性の向上はすべての企業が追求し、達成したいことですが、この 4 つの単語を言うだけでは漠然としすぎます。大規模なモデルでは、ユースケースの問題を真に解決し、効率性を真に高めることができることを証明する必要があります。
テクノロジーを導入するための入り口を正確に見つける
資源投資や市場拡大の取り組みの面でも、中国の大型モデルにおける競争は2024年を通じて熾烈だった。
中国工業情報化部のデータによると、2023年の中国の大規模言語モデル市場の成長率は100%を超え、約2億ドルに達しました。企業は積極的に商業化の実験を行っており、最初は価格競争に突入し、トークンベースの課金、API呼び出し、その他の方法を通じてコストを削減しています。主流の大規模モデルの多くは現在、ほぼ無料になっています。
価格とコストを下げることは比較的簡単に達成できます。しかし、ビジネスを理解し、参入シナリオを分析することはより困難な道のりです。
すべての企業が低コスト競争に依存して価格競争に参加しているわけではありません。
「このような状況では、当社独自の機能を見つけ、強みを活用することがより重要です。テンセントには、より多くの洞察を提供し、当社の能力をさらに強化する多くの社内シナリオがあります」と、テンセントクラウドのAI製品スペシャリストであり、テンセントフンユアンToB製品の責任者である趙新宇氏は述べています。「対外的には、1つの業界に焦点を当て、その業界内の特定のシナリオに集中し、徐々に拡大していきます。」
多くの基礎モデルの中で、Hunyuan は最も注目を集めるものではないかもしれませんが、その技術的な強さは否定できません。
2023年2023月、Hunyuanは新しいMixture of Experts(MoE)構造を採用した汎用テキストツーテキストモデルHunyuan Turboをリリースしました。言語理解と生成、論理的推論、意図認識、コーディング、ロングコンテキスト、集約タスクで優れたパフォーマンスを発揮しました。XNUMX年XNUMX月の動的更新バージョンでは、全面的に最高のパフォーマンスを発揮するモデルにアップグレードされました。現在、Tencent Hunyuanの機能はTencent Cloudを通じて完全に提供されており、さまざまなサイズとタイプのモデルを提供し、Tencent Cloud Intelligenceの他のAI製品と機能と組み合わせて、モデルアプリケーションをシナリオに実装するのに役立ちます。
現在、モデルの応用形態は、シリアスシナリオとエンタメシナリオの2つに大別されます。後者には、チャットボットやコンパニオンアプリなどが含まれます。
「深刻なシナリオ」とは、正確性と信頼性が強く求められる企業の中核業務への応用を指します。これらのシナリオでは、大規模なモデルで構造化された情報を処理する必要があり、通常は事前に設定されたビジネスプロセスと品質基準に従っており、その適用効果は企業の業務効率とビジネス成果に直接関係しています。
Tencent Cloud はかつて、アウトバウンド サービス プロバイダーが顧客サービス システムを構築するのを支援しました。これは典型的な深刻なシナリオです。アウトバウンド コールには、自然言語対話機能、コンテンツ理解、分析機能が含まれており、大規模な言語モデルとの互換性が非常に高くなっています。
実は、課題は細部にあります。当時、チームは 70 つの主要な課題に直面していました。300 つはパフォーマンスの問題です。モデルのパラメータ サイズが非常に大きく、500B または XNUMXB の規模に達したため、XNUMX ミリ秒以内に応答を完了し、下流の TTS システムに渡す方法が重要な技術的課題になりました。
1 つ目は、対話ロジックの正確さです。モデルは、一部の対話で非論理的な応答を生成することがあり、全体的な対話効果に影響を及ぼしていました。これらの課題を克服するために、プロジェクト チームは集中的な反復戦略を採用し、2 ~ XNUMX か月の開発サイクル内で XNUMX 週間に XNUMX バージョンという速い反復ペースを維持しました。
企業顧客は大規模言語モデル技術に興味を示し、革新を試みる意欲がありますが、技術とビジネスの深い融合には常に認識のギャップがあります。これは企業が自社のビジネスを理解していないことに起因するものではなく、業界の問題点とビジネスシナリオを深く理解し、最も適切なシナリオを見つけ、企業向けにAIランディングソリューションをカスタマイズし、技術とビジネスの最適な組み合わせを実現する専門技術チームが必要です。
「従来のアプローチでは、オペレーターが一度に 95 つのシナリオ (コーパス) を構築する必要がある可能性があります」と Xinyu 氏は説明します。「しかし、大規模なモデルでは、要求を満たすためにプロンプトを出すだけで済みます。」需要を明確にした後、Hunyuan チームはほぼ毎週バージョンを更新して反復速度を加速し、XNUMX ~ XNUMX か月以内に精度が XNUMX% に達しました。
このアウトバウンド サービス プロバイダーにとって、生成テクノロジーはまったく新しいものでした。Hunyuan は、大規模モデルがもたらすメリットを直接示し、人件費を 4 分の 3 削減しました。
「最善のアプローチは、効果を披露することです」とXinyu氏は言います。顧客がジェネレーティブテクノロジーについてある程度理解しているが、それほど詳しくない場合は、効果を披露することが最も効果的です。顧客のビジネス経験を通じて入力できるシナリオを見つけ、直接テスト検証を行い、達成できる改善を実証します。
同様の経験はXiaomiとの協力でも起こり、「双方向の旅」と表現されました。
相手側は、Q&Aインタラクションに大規模なモデルを導入し、AI検索機能を端末に適用したいと考えていました。これは、テンセントのリッチコンテンツエコシステムによるサポートとHunyuanのAI検索機能という、Hunyuanの2つの強みに合致しました。Q&Aでは、精度が非常に重要です。
「当初はまだ多くの困難がありました」と Xinyu 氏は振り返ります。「彼らの視点から見ると、ビジネス フォームには、カジュアル チャット、ナレッジ Q&A など、さまざまなシナリオが含まれており、その中でもナレッジ Q&A シナリオには比較的高い精度が求められていました。」
予備テストを通じて、Hunyuan チームは検索シナリオにおける自社の優位性を明らかにし、相手先と協力して、さまざまなトピック レベルに応じて、広義に定義された Q&A インタラクションを徐々に洗練させてきました。このようなセグメンテーションにより、モデルは各シナリオの具体的なニーズと効果要件をより明確に理解し、よりターゲットを絞った最適化を行うことができます。
知識に関する Q&A シナリオが着地点となりました。その後の実装では、Hunyuan が克服すべき課題がまだ多くありました。遅延の問題は言うまでもなく、応答時間は速くなければなりません。次に、検索コンテンツの統合です。
「リンク全体では、独自開発の検索エンジンと意図分類モデルを構築し、タイムリー度の高い質問かどうかを判断しています。例えば、ニュースや時事問題のトピックに関連しているかどうかなどを判断し、メインモデルに渡すかAI検索に渡すかを決定します。」
最も必要な部分のみを呼び出すことで、応答速度が大幅に向上します。重要な発見は、問い合わせの 70% が AI 検索につながることです。これは、最も基本的な通話サポートとして十分に豊富なコンテンツが必要であることを意味します。
Hunyuan の背後には、Tencent のコンテンツ エコシステム全体があります。ニュース、音楽、金融、ヘルスケアに至るまで、Tencent のエコシステムは、豊富な高品質コンテンツを提供しています。これらのコンテンツは、検索時に Hunyuan モデルからアクセスおよび参照できるため、独自の利点があります。
2 か月以上に及ぶ集中的な反復を経て、応答の品質、応答速度、パフォーマンスは要件を完全に満たし、Xiaomi の実際の業務に実装されました。
B2B ビジネスの鍵は収益を生み出し、信頼を獲得することであり、そのためにはクライアントの業務に真の価値を提供することが求められます。
より多くのシナリオに到達するための「ロール」一般化
さまざまな業界や製品にわたる大規模モデルの適用も、テクノロジー自体の成長を促進しています。
一部の大規模モデル製品の場合、B2C パスを選択する際には、消費者のフィードバックを使用してモデルを最適化するという重要な考慮事項が伴います。大規模モデルの調整の必要性は無限であり、消費者ユーザーの数とアクティビティがモデルの反復の原動力となり、反復速度が加速します。
実際、これは B2B ビジネスでも実現されており、要求はさらに高くなっています。
「Teenager Gains」のK12中国語エッセイ採点機能は、Hunyuanのマルチモーダル機能を活用しています。Tencent CloudのインテリジェントOCRテクノロジーと組み合わせることで、生徒のエッセイの内容を認識し、大規模なモデルを使用して、事前に設定された採点基準に基づいてエッセイを採点します。
通常、大規模モデルと人間の教師のスコアの差が 80 ポイント以内であれば良好とみなされますが、これを達成するのは簡単ではありません。当初、Hunyuan のスコアのうち、人間の教師のスコアと XNUMX ポイント以内だったのは XNUMX% だけでした。
「このモデルには、いくつかのシナリオで問題を解決するための特定の方法と機能があります。しかし、特定のクライアントのビジネスに焦点を当てる場合は、より高いパフォーマンスが必要です」とシンユー氏は言います。「90% の精度であればビジネス目標は達成できるかもしれませんが、70% や 80% では、まだギャップがあります。」
つまり、継続的な取り組みが必要です。エンタープライズ クライアント ベースが拡大するにつれて、テクノロジ自体に新たな要求が課せられます。まず、反復速度の大幅な向上です。消費者ユーザー向けの反復には 1 ~ 2 か月かかる場合がありますが、今では新しいバージョンを毎週公開できます。この高頻度の反復により、モデルの成長と進歩が大幅に促進されます。
第二に、さまざまな企業シナリオに継続的に対応することで、モデルの一般化能力が大幅に向上しました。これは、多様な企業ニーズに深く対応することで、モデルの開発と反復のペースが加速されるだけでなく、モデルの実用性と適応性が向上し、深刻なシナリオからエンターテイメント志向のシナリオまで拡張できることを示しています。
最近シリーズAで数千万の資金調達を行ったロールプレイングコンテンツプラットフォーム「Dream Dimension」は、若いユーザーをターゲットにしたHunyuan大型モデルのロールプレイング専用モデルHunyuan-roleを応用し、生成AI技術を組み合わせて、インタラクティブでストーリー主導の仮想キャラクターインタラクション体験を提供します。
Hunyuan-role は、人間とコンピューターのインタラクションの新しい形を切り開きました。多様な仮想キャラクター画像を作成し、事前に設定されたストーリーの背景とキャラクター設定に基づいて、ユーザーを自然でスムーズなインタラクティブな対話に引き込みます。
技術的なレベルでは、このようなシナリオ アプリケーションは、長文および短文の対話、意図の認識、および応答の処理における Hunyuan-role の優れた利点を実証しています。多様なアプリケーション シナリオを処理でき、優れたコンテンツ人間化機能を発揮します。温かみのある対話を行うだけでなく、ストーリー展開を進めて没入型のユーザー エクスペリエンスを生み出します。
これらの機能により、Hunyuan-role は製品の顧客獲得とユーザー操作のための強力なツールとなり、ユーザーの維持とエンゲージメントを高める上で重要な役割を果たします。また、深刻なシナリオで磨き上げられ改善された Hunyuan は、エンドサイド アプリケーションでもより広範なシナリオをカバーできる一般化機能を開発したことも反映しています。
シリアスなシナリオからエンターテイメント、創造性などへと拡張することは、大規模なモデル アプリケーションが実行しなければならない旅です。
技術が成熟し、コストが下がるにつれて、大規模モデルはより幅広いアプリケーション シナリオに拡大するはずです。当初は企業のオフィス業務、データ分析、科学研究などの本格的なビジネス シナリオに重点が置かれていましたが、これらの分野には明確な需要があり、支払い意欲も高くなっています。
エンターテインメント、創造性、コンテンツ制作へのさらなる拡大には、戦略的なアンカーが必要です。つまり、特定のシナリオのニーズを解決することを常に中核目標として重視し、大規模なモデル機能を統合するためのエントリ ポイントを正確に特定する必要があります。
アプリケーション ソフトウェアとの連携に加えて、モデルが消費者向けの側で実行および機能し、ユーザーの日常生活に近いサービスを提供し、より便利で即時のサービス エクスペリエンスを提供するには、ハードウェア メーカーとのパートナーシップも必要です。
この過程で、生成 AI 技術の市場認知度と受容度は継続的に高まり、ユーザー ベースは着実に拡大しています。急速に変化する市場環境に直面して、モデルの反復能力が特に重要になります。これは、技術的なパフォーマンスだけでなく、ユーザーのニーズを理解し、さまざまなシナリオに適応することにも反映されます。迅速に学習し、継続的に最適化し、常に新しい需要に適応できるモデルとチームだけが、競争で優位性を維持できます。
より多くのシナリオが継続的にカバーされるにつれて、より多くの最終消費者へのリーチも拡大します。市場全体で生成技術が受け入れられるにつれて、潜在的なユーザーベースは拡大し続けるでしょう。迅速に反復して自己改善できるモデルは、変化に敏感に適応し、より着実に前進することができます。
ソースから もし
免責事項: 上記の情報は、Chovm.com とは無関係に ifanr.com によって提供されています。Chovm.com は、販売者および製品の品質と信頼性について一切の表明および保証を行いません。Chovm.com は、コンテンツの著作権に関する違反に対する一切の責任を明示的に否認します。