منذ ظهور ChatGPT، استمر طفرة الذكاء الاصطناعي لمدة عامين. وخلال هذا الوقت، كان عامة الناس منبهرين بقدرات نماذج اللغة الكبيرة، التي يمكنها توليد نص سلس وطبيعي من أوامر بسيطة، وتحويل سيناريوهات الخيال العلمي إلى حقيقة.
ويدخل مجال النماذج الكبيرة أيضًا مرحلة حرجة، حيث يجب تحويل التقنيات الجديدة إلى منتجات جديدة تلبي الاحتياجات الحقيقية وتتطور إلى نظام بيئي تجاري جديد.
وكما ساهمت المدفوعات عبر الهاتف المحمول والهواتف الذكية وشبكات LTE مجتمعة في تغذية ازدهار عصر الإنترنت عبر الهاتف المحمول، فإن صناعة الذكاء الاصطناعي تسعى أيضًا إلى إيجاد مثل هذا التوافق بين المنتج والسوق (PMF) في عام 2024.
لقد بدأ عصر استكشاف التقنيات الجديدة، وما إذا كان من الممكن اكتشاف حدود جديدة سوف يحدد ما إذا كانت النماذج الضخمة مجرد لعبة أخرى لحرق الأموال، أو تكرار لفقاعة الإنترنت، أو كما قال جينسن هوانج، بداية ثورة صناعية جديدة. وسوف يتم الكشف عن هذه الإجابة بشكل أسرع من الذكاء الاصطناعي العام.
القضايا الكبرى مع النماذج الكبيرة
اليوم، استقرت المنافسة في النماذج الأساسية بشكل أساسي. بقيادة OpenAI، مع احتفاظ ChatGPT بزمام المبادرة في السوق، يتمتع كل من اللاعبين الآخرين مثل Anthropic وDeepMind وLlama وGrok بنقاط قوتهم.
وهكذا فإن الأمر الأكثر إثارة للاهتمام في عام 2024 ليس من الذي قام بتوسيع المعايير أو تحسين سرعة الاستجابة، بل كيف يمكن لتكنولوجيا النماذج الكبيرة أن تصبح منتجًا قابلاً للاستخدام.
منذ البداية، كان تطبيق تقنية نموذج اللغة الكبيرة يشكل تحديًا كبيرًا. أجرت مجلة هارفارد بيزنس ريفيو استطلاعًا ووجدت أن هناك ما يصل إلى 100 نوع من تطبيقات الذكاء الاصطناعي التوليدي.
ومع ذلك، فإنها تنقسم إلى خمس فئات رئيسية: حل المشكلات الفنية، وإنتاج المحتوى وتحريره، ودعم العملاء، والتعلم والتعليم، والإبداع الفني والبحث.
شاركت شركة الاستثمار الشهيرة a16z أفضل منتجات الذكاء الاصطناعي التوليدي التي أنتجتها فرقها، بما في ذلك أسماء مألوفة مثل Perplexity وClaude وChatGPT. وهناك أيضًا منتجات أكثر تخصصًا مثل تطبيقات تدوين الملاحظات Granola وWispr Flow وEvery Inc. وCubby. وفي قطاع التعليم، كان الفائز الأكبر في عام 2024 هو NotebookLM، إلى جانب برامج الدردشة الآلية مثل Character.ai وReplika.
بالنسبة للمستخدمين العاديين، فإن معظم هذه المنتجات مجانية، ولا تشكل الاشتراكات أو الإصدارات الاحترافية نفقات ضرورية. وحتى بالنسبة للاعب قوي مثل ChatGPT، بلغت إيرادات الاشتراك في عام 2024 حوالي 283 مليون دولار شهريًا، وهو ضعف ما كانت عليه في عام 2023. ولكن في مواجهة التكاليف الضخمة، يبدو هذا الدخل ضئيلاً.
إن الاستمتاع بالتقدم التكنولوجي يشكل متعة للمستخدمين العاديين، ولكن بالنسبة لمحترفي الصناعة، بغض النظر عن مدى إثارة التطور التكنولوجي، فإنه لا يمكن أن يظل في المختبر؛ بل يجب أن يدخل العالم التجاري للاختبار. لم يتم قبول نموذج الاشتراك على نطاق واسع، ولم يحن وقت تضمين الإعلانات بعد. إن الوقت المتبقي للنماذج الكبيرة لحرق الأموال ينفد.
وعلى النقيض من ذلك، فإن التنمية الموجهة نحو الأعمال التجارية هي أكثر إيجابية.
منذ عام 2018، تضاعف ذكر الذكاء الاصطناعي في مكالمات الأرباح لشركات Fortune 500 تقريبًا. وفي جميع مكالمات الأرباح، ذكر 19.7% من السجلات الذكاء الاصطناعي التوليدي باعتباره الموضوع الأكثر مناقشة.
وهذا هو أيضًا إجماع الصناعة بأكملها. وفقًا للكتاب الأزرق "تقرير تطوير الذكاء الاصطناعي (2024)" الصادر عن الأكاديمية الصينية لتكنولوجيا المعلومات والاتصالات، بحلول عام 2026، ستستخدم أكثر من 80٪ من الشركات واجهات برمجة تطبيقات الذكاء الاصطناعي التوليدية أو تنشر تطبيقات توليدية.
تظهر التطبيقات الموجهة للشركات والمستهلكين اتجاهات مختلفة في التطوير: حيث تؤكد التطبيقات الموجهة للمستهلكين على الحواجز المنخفضة والإبداع، بينما تركز التطبيقات الموجهة للمؤسسات بشكل أكبر على التخصيص المهني وردود الفعل المتعلقة بالكفاءة.
بعبارة أخرى، إن تحسين الكفاءة هو هدف تسعى إليه كل شركة وترغب في تحقيقه، ولكن مجرد ذكر هذه الكلمات الأربع أمر غامض للغاية. إذ يتعين على النماذج الكبيرة أن تثبت قدرتها الحقيقية على حل المشكلات في حالات الاستخدام وتعزيز الكفاءة حقًا.
العثور على نقاط الدخول لتطبيق التكنولوجيا بدقة
سواء من حيث استثمار الموارد أو جهود توسيع السوق، كانت المنافسة الصينية في النماذج الكبيرة شديدة طوال عام 2024.
وفقًا لبيانات وزارة الصناعة وتكنولوجيا المعلومات الصينية، تجاوز معدل نمو سوق نماذج اللغة الكبيرة في الصين 2023% في عام 100، ليصل إلى حوالي 2 مليار دولار. وتجري الشركات تجارب نشطة على التسويق، وتشارك في البداية في حروب الأسعار: خفض التكاليف من خلال الفوترة القائمة على الرمز، واستدعاءات واجهة برمجة التطبيقات، وغيرها من الأساليب. أصبحت العديد من النماذج الكبيرة السائدة الآن مجانية تقريبًا.
إن خفض الأسعار والتكاليف أمر سهل نسبيًا. ومع ذلك، فإن فهم الأعمال وتحليل سيناريوهات الدخول يمثلان مسارًا أكثر تحديًا.
لا تشارك جميع الشركات في حروب الأسعار، وتعتمد على المنافسة منخفضة التكلفة.
قال تشاو شينيو، أخصائي منتجات الذكاء الاصطناعي في Tencent Cloud ورئيس منتجات Tencent Hunyuan ToB، "في هذه الحالة، من المهم للغاية العثور على ميزاتنا الفريدة والاستفادة من نقاط قوتنا. تمتلك Tencent العديد من السيناريوهات الداخلية التي تزودنا بمزيد من الأفكار وتعزز قدراتنا بشكل أكبر". "خارجيًا، نركز على صناعة واحدة، ونركز على سيناريوهات محددة داخل تلك الصناعة، ثم نتوسع تدريجيًا".
من بين العديد من النماذج الأساسية، قد لا يكون Hunyuan هو الأكثر جذبًا للانتباه، ولكن قوته التقنية لا يمكن إنكارها.
في سبتمبر 2023، أصدرت Hunyuan نموذج النص إلى النص العام Hunyuan Turbo، والذي اعتمد على بنية جديدة لمزيج الخبراء (MoE). وقد حقق أداءً جيدًا في فهم اللغة وتوليدها، والاستدلال المنطقي، والتعرف على النية، بالإضافة إلى مهام الترميز والسياق الطويل والتجميع. وفي إصدار التحديث الديناميكي لشهر نوفمبر 2023، تمت ترقيته إلى أفضل نموذج أداءً على الإطلاق. حاليًا، يتم تقديم قدرات Tencent Hunyuan بالكامل من خلال Tencent Cloud، حيث تقدم أحجامًا وأنواعًا مختلفة من النماذج، جنبًا إلى جنب مع منتجات وقدرات الذكاء الاصطناعي الأخرى من Tencent Cloud Intelligence، للمساعدة في نمذجة التطبيقات في السيناريوهات.
حاليًا، تنقسم نماذج طلبات العارضات تقريبًا إلى نوعين: السيناريوهات الجادة والسيناريوهات الترفيهية. ويشمل النوع الأخير برامج الدردشة الآلية وتطبيقات المرافقة وما إلى ذلك.
تشير "السيناريوهات الجادة" إلى التطبيقات في العمليات التجارية الأساسية للمؤسسات، حيث تكون الدقة والموثوقية مطلوبة بشدة. في هذه السيناريوهات، تحتاج النماذج الكبيرة إلى التعامل مع المعلومات المنظمة، وعادةً ما تتبع عمليات تجارية محددة مسبقًا ومعايير جودة، وترتبط تأثيرات تطبيقها بشكل مباشر بالكفاءة التشغيلية ونتائج الأعمال للمؤسسات.
لقد ساعدت Tencent Cloud ذات مرة أحد مقدمي الخدمات الخارجية في بناء نظام خدمة العملاء، وهو سيناريو جدي نموذجي. تتضمن المكالمات الخارجية قدرات الحوار باللغة الطبيعية، وفهم المحتوى، وقدرات التحليل، وهي متوافقة للغاية مع نماذج اللغة الكبيرة.
في الواقع، يكمن التحدي في التفاصيل. في ذلك الوقت، واجه الفريق تحديين أساسيين. الأول كان مشكلات الأداء، حيث كان حجم معلمات النموذج ضخمًا، حيث وصل إلى مقياس 70 أو 300 مليار، وأصبحت كيفية إكمال الاستجابة في غضون 500 مللي ثانية وتمريرها إلى نظام TTS في المصب تحديًا فنيًا مهمًا.
كان التحدي الثاني هو دقة منطق الحوار. فقد كان النموذج ينتج أحيانًا استجابات غير منطقية في بعض الحوارات، مما يؤثر على تأثير الحوار بشكل عام. وللتغلب على هذه التحديات، تبنى فريق المشروع استراتيجية تكرار مكثفة، مع الحفاظ على وتيرة تكرار سريعة بمعدل إصدار واحد في الأسبوع خلال دورة تطوير مدتها شهر إلى شهرين.
يُظهر عملاء المؤسسات اهتمامًا بتكنولوجيا نموذج اللغة الكبيرة وهم على استعداد لتجربة الابتكارات، ولكن هناك دائمًا فجوة معرفية في التكامل العميق بين التكنولوجيا والأعمال. لا ينبع هذا من عدم فهم الشركات لأعمالها الخاصة، ولكنه يتطلب فريقًا فنيًا محترفًا لفهم نقاط الألم في الصناعة وسيناريوهات الأعمال بشكل عميق، والعثور على السيناريوهات الأكثر ملاءمة، وتصميم حلول هبوط الذكاء الاصطناعي للمؤسسات، وتحقيق أفضل مزيج من التكنولوجيا والأعمال.
وأوضح شينيو أن "النهج التقليدي قد يتطلب من المشغلين بناء سيناريو واحد في كل مرة، ولكن مع النماذج الكبيرة، ما عليك سوى إعطاء إشارة لتلبية الطلب". وبعد توضيح الطلب، قام فريق هونيوان بتحديث إصدار كل أسبوع تقريبًا، مما أدى إلى تسريع سرعة التكرار، وفي غضون شهر أو شهرين، وصلت الدقة إلى 95%.
بالنسبة لمزود الخدمة الخارجي هذا، كانت تقنية التوليد جديدة تمامًا. أظهرت لهم شركة Hunyuan بشكل مباشر الفوائد التي تجلبها النماذج الكبيرة، مما أدى إلى تقليل نفقات القوى العاملة بمقدار ثلاثة أرباع.
قال شينيو "إن أفضل نهج هو عرض التأثيرات". عندما يكون لدى العملاء بعض الفهم لتكنولوجيا التوليد ولكن ليس الكثير، فإن عرض التأثيرات هو الأكثر فعالية. من خلال العثور على السيناريوهات التي يمكن إدخالها من خلال تجربة عمل العميل، وإجراء التحقق من الاختبار بشكل مباشر، وإظهار التحسينات التي يمكن تحقيقها.
وقد حدثت تجربة مماثلة بالتعاون مع شركة شاومي، والتي وصفت بأنها "رحلة في اتجاهين".
أراد الطرف الآخر تقديم نماذج كبيرة في تفاعلات الأسئلة والأجوبة، وتطبيق قدرات البحث بالذكاء الاصطناعي على المحطات الطرفية. وقد ضرب هذا اثنتين من نقاط قوة Hunyuan: الدعم الذي توفره منظومة المحتوى الغنية من Tencent وقدرات Hunyuan في البحث بالذكاء الاصطناعي. بالنسبة للأسئلة والأجوبة، تعد الدقة بالغة الأهمية.
"كانت هناك صعوبات كثيرة في البداية"، كما تذكر شينيو. "من وجهة نظرهم، كان نموذج العمل يشمل سيناريوهات متعددة، بما في ذلك الدردشة غير الرسمية، والأسئلة والأجوبة المعرفية، وأنواع أخرى، ومن بينها سيناريو الأسئلة والأجوبة المعرفية الذي يتطلب دقة عالية نسبيًا."
من خلال الاختبار الأولي، أوضح فريق Hunyuan مزاياه في سيناريوهات البحث، وبالتعاون مع الطرف الآخر، قام تدريجيًا بتحسين تفاعل الأسئلة والأجوبة المحدد على نطاق واسع وفقًا لمستويات الموضوعات المختلفة. يتيح هذا النوع من التجزئة للنموذج فهم الاحتياجات المحددة ومتطلبات التأثير لكل سيناريو بشكل أكثر وضوحًا، وبالتالي إجراء تحسين أكثر استهدافًا.
لقد أصبح سيناريو الأسئلة والأجوبة المعرفية نقطة انطلاق. وفي التطبيقات اللاحقة، كان لا يزال أمام Hunyuan العديد من التحديات التي يتعين عليها التغلب عليها: لا داعي لذكر مشكلات زمن الوصول، بل يجب أن يكون وقت الاستجابة سريعًا؛ وثانيًا، دمج محتوى البحث.
"في الرابط بالكامل، قمنا ببناء محرك بحث تم تطويره ذاتيًا ونموذج تصنيف النوايا لتحديد ما إذا كان السؤال ذا أهمية كبيرة. على سبيل المثال، ما إذا كان مرتبطًا بأخبار أو مواضيع الشؤون الجارية، ثم قررنا ما إذا كنا سنمنحه للنموذج الرئيسي أو بحث الذكاء الاصطناعي."
إن استدعاء الأجزاء الأكثر احتياجًا فقط يحسن سرعة الاستجابة بشكل كبير. ومن بين الاكتشافات المهمة أن 70% من الاستفسارات تؤدي إلى البحث بالذكاء الاصطناعي، مما يعني أنه يجب أن يكون هناك محتوى غني بما يكفي لدعم الاتصال الأساسي.
يقع خلف هونيوان النظام البيئي الكامل لمحتوى تينسنت. من الأخبار والموسيقى والتمويل وحتى الرعاية الصحية، يقدم النظام البيئي لتينسنت ثروة من المحتوى عالي الجودة. يمكن الوصول إلى هذا المحتوى والرجوع إليه من خلال نموذج هونيوان أثناء عمليات البحث، مما يوفر ميزة فريدة.
بعد أكثر من شهرين من التكرار المكثف، أصبحت جودة الاستجابات وسرعة الاستجابة والأداء متوافقة تمامًا مع المتطلبات وتم تنفيذها في العمليات التجارية الفعلية لشركة Xiaomi.
إن مفتاح الأعمال التجارية بين الشركات هو توليد الإيرادات واكتساب الثقة، الأمر الذي يتطلب تقديم قيمة حقيقية لعمليات العملاء.
تعميم "التدحرج" للوصول إلى المزيد من السيناريوهات
إن تطبيق النماذج الكبيرة عبر مختلف الصناعات والمنتجات يعزز أيضًا نمو التكنولوجيا نفسها.
بالنسبة لبعض المنتجات ذات النماذج الكبيرة، فإن اختيار مسار B2C يتضمن اعتبارًا أساسيًا: استخدام ملاحظات المستهلكين لتحسين النموذج. إن الحاجة إلى ضبط النماذج الكبيرة لا حصر لها، كما أن عدد ونشاط مستخدمي المستهلكين يوفران الوقود لتكرار النموذج، وبالتالي تسريع سرعة التكرار.
وفي الواقع، يتم تحقيق ذلك أيضًا في أعمال B2B، مع وجود متطلبات أعلى.
تستخدم ميزة تصنيف المقالات الصينية K12 في تطبيق "Teenager Gains" قدرات Hunyuan المتعددة الوسائط. وبالاشتراك مع تقنية التعرف الضوئي على الحروف الذكية من Tencent Cloud، تتعرف Hunyuan على محتوى مقالات الطلاب وتستخدم النموذج الكبير لتصنيف المقالات بناءً على معايير التقييم المحددة مسبقًا.
في العادة، إذا كان الفارق في النتيجة بين النموذج الكبير والمعلم البشري في حدود خمس نقاط، فهذا يعتبر جيدًا، ولكن هذا ليس من السهل تحقيقه. في البداية، كانت 80% فقط من درجات هونيوان في حدود خمس نقاط من درجات المعلمين البشريين.
"يحتوي النموذج على طرق وقدرات معينة لحل المشكلات في بعض السيناريوهات. ومع ذلك، عند التركيز على أعمال عميل معين، يلزم تحقيق أداء أعلى"، كما قال شينيو. "في حين أن الدقة بنسبة 90% قد تلبي أهداف العمل، إلا أنه عند 70% أو 80%، لا تزال هناك فجوة".
وهذا يعني أن الجهود المتواصلة مطلوبة. ومع توسع قاعدة عملاء الشركات، تفرض متطلبات جديدة على التكنولوجيا نفسها: أولاً، زيادة كبيرة في سرعة التكرار ــ قد تستغرق التكرارات للمستخدمين المستهلكين شهراً إلى شهرين، ولكن الآن يمكن أن تظهر نسخة جديدة أسبوعياً. وهذا التكرار عالي التردد يعزز إلى حد كبير نمو النموذج وتقدمه.
ثانيًا، أدى تقديم خدمة مستمرة لسيناريوهات مختلفة للمؤسسات إلى تعزيز قدرة النموذج على التعميم بشكل كبير. وهذا يشير إلى أن تقديم خدمة عميقة لاحتياجات المؤسسات المتنوعة لا يؤدي فقط إلى تسريع وتيرة تطوير النموذج وتكراره، بل يحسن أيضًا من قابلية التطبيق العملي للنموذج وقدرته على التكيف، مما يسمح له بالتوسع من السيناريوهات الجادة إلى السيناريوهات الأكثر توجهاً نحو الترفيه.
وقد قامت منصة المحتوى للعب الأدوار "دريم ديمنشن"، والتي حصلت مؤخرًا على عشرات الملايين من التمويل من السلسلة A، بتطبيق نموذج لعب الأدوار الحصري لنموذج Hunyuan الكبير، Hunyuan-role، والذي يهدف إلى خدمة المستخدمين الشباب. فهو يجمع بين تقنية الذكاء الاصطناعي التوليدي لتوفير تجربة تفاعلية مع الشخصيات الافتراضية القائمة على القصة.
لقد كان Hunyuan-role رائدًا في شكل جديد من أشكال التفاعل بين الإنسان والحاسوب. فمن خلال إنشاء صور شخصيات افتراضية متنوعة واستنادًا إلى خلفيات قصصية محددة مسبقًا وإعدادات شخصية، فإنه يشرك المستخدمين في حوارات تفاعلية طبيعية وسلسة.
وعلى المستوى التقني، أثبتت تطبيقات السيناريو هذه المزايا الرائدة التي يتمتع بها Hunyuan-role في التعامل مع الحوارات النصية الطويلة والقصيرة، والتعرف على النوايا، والاستجابة. ويمكنه التعامل مع سيناريوهات تطبيق متنوعة، كما يتمتع بقدرات ممتازة على إضفاء الطابع الإنساني على المحتوى ــ ليس فقط من خلال المشاركة في تفاعلات حوارية دافئة، بل وأيضًا تطوير خطوط القصة لخلق تجربة مستخدم غامرة.
تجعل هذه الميزات من Hunyuan-role أداة قوية لاستقطاب عملاء المنتج وعمليات المستخدم، حيث تلعب دورًا حاسمًا في تعزيز الاحتفاظ بالمستخدمين وإشراكهم. كما تعكس أن Hunyuan، التي تم صقلها وتحسينها في السيناريوهات الجادة، طورت قدرات تعميم يمكنها تغطية السيناريوهات الأوسع، حتى في التطبيقات النهائية.
إن الانتقال من السيناريوهات الجادة إلى الترفيه والإبداع والمزيد هو رحلة يجب على تطبيقات النماذج الكبيرة القيام بها.
مع نضج التكنولوجيا وانخفاض التكاليف، من المؤكد أن النماذج الكبيرة ستتوسع في سيناريوهات تطبيقية أوسع. في البداية، كانت تركز على سيناريوهات الأعمال الجادة مثل العمل المكتبي للشركات وتحليل البيانات والبحث العلمي، لكن هذه المجالات لها متطلبات واضحة واستعداد أكبر للدفع.
يتطلب التوسع الإضافي في مجال الترفيه والإبداع وإنتاج المحتوى ركيزة استراتيجية: التركيز دائمًا على حل احتياجات السيناريوهات المحددة كهدف أساسي، وتحديد نقطة الدخول لدمج قدرات النموذج الكبيرة.
بالإضافة إلى التعاون مع برامج التطبيقات، هناك حاجة أيضًا إلى شراكات مع مصنعي الأجهزة للسماح للنموذج بالأداء والعمل على الجانب المواجه للمستهلك، وتوفير خدمات أقرب إلى الحياة اليومية للمستخدمين وتقديم تجارب خدمة أكثر ملاءمة وفورية.
في هذه العملية، يتزايد الوعي بالسوق وقبول تقنية الذكاء الاصطناعي التوليدي باستمرار، وتتوسع قاعدة المستخدمين بشكل مطرد. وفي مواجهة بيئة السوق المتغيرة بسرعة، تصبح قدرة النموذج على التكرار مهمة بشكل خاص. وهذا لا ينعكس فقط في الأداء الفني ولكن أيضًا في فهم احتياجات المستخدم والتكيف مع السيناريوهات المختلفة والمزيد. فقط النماذج والفرق التي يمكنها التعلم بسرعة والتحسين المستمر والتكيف باستمرار مع المتطلبات الجديدة يمكنها الحفاظ على ميزة في المنافسة.
ومع تغطية المزيد من السيناريوهات بشكل مستمر، يتوسع نطاق الوصول إلى المزيد من المستهلكين النهائيين. ومع القبول العام للسوق للتكنولوجيا التوليدية، ستستمر قاعدة المستخدمين المحتملين في النمو. والنموذج الذي يمكنه التكرار بسرعة وتحسين نفسه يمكنه التكيف بحماس مع التغييرات، والتحرك بشكل أكثر ثباتًا وأبعد.
مصدر من إيفان
إخلاء المسؤولية: يتم توفير المعلومات المذكورة أعلاه بواسطة ifanr.com، بشكل مستقل عن Chovm.com. لا تقدم Chovm.com أي تعهدات أو ضمانات فيما يتعلق بجودة وموثوقية البائع والمنتجات. ينكر موقع Chovm.com صراحةً أي مسؤولية عن الانتهاكات المتعلقة بحقوق الطبع والنشر للمحتوى.