قد يكون امتلاك سيارة ذات ميزات متقدمة لا تفهمها تمامًا تجربة مرهقة. هل يمكن لمساعد الذكاء الاصطناعي المساعدة؟
تقنية المساعد الصوتي ليست مفهومًا جديدًا للكثيرين. من SIRI إلى Alexa، كان معظمنا قد واجه التكنولوجيا القائمة على الذكاء الاصطناعي بهذا الشكل. ومع ذلك، فإن المساعدات الصوتية داخل السيارة هي تطبيق قد يكون جديدًا بالنسبة للبعض، مما يسمح بالمساعدة الصوتية داخل السيارة التي تؤدي إلى حل بدون استخدام اليدين لتقديم مجموعة متنوعة من المعلومات داخل مقصورة السيارة.
تقول شركة Soundhound للتعرف على الصوت والكلام إنها كانت أول من قدم مساعدًا صوتيًا داخل السيارة يجمع بين الذكاء الاصطناعي التوليدي ومساعد صوتي معروف. ومؤخرًا، أعلنت الشركة عن المزيد من التطورات في التكنولوجيا، مما يسمح للسائقين بالوصول إلى معلومات دليل السيارة بطريقة مبسطة وسهلة.
تحدثنا إلى مايكل زاجورسك، المدير التنفيذي للعمليات في SoundHound، لمناقشة الميزات الجديدة وما يمكن تحقيقه، وكذلك النظر في مستقبل هذه التكنولوجيا.
Just Auto (JA): من هو SoundHound وماذا تفعل الشركة؟
مايكل زاجورسك (MZ): نحن نعتبر أنفسنا مزودًا مستقلاً رائدًا لتقنية الذكاء الاصطناعي الصوتي للسيارات. في جوهر الأمر، ما نقوم به هو تزويد مصنعي المعدات الأصلية بمساعد صوتي ذو علامة بيضاء حتى يتمكن السائقون أو الركاب من التفاعل مع معلومات السيارة داخل السيارة وخارجها بصوتهم فقط.
لقد بدأنا في تطوير تقنيتنا في عام 2005. وأطلقناها في عام 2015 جنبًا إلى جنب مع الكثير مما كانت تفعله أمازون وجوجل. والفرق الرئيسي هو أن كبار مقدمي التكنولوجيا كانوا يقومون بتوسيع خدماتهم الصوتية إلى السيارة، في حين أن ما كنا نفعله هو زيادة السيارة وبالتالي قدرات ونقاط القوة الخاصة بالعلامات التجارية المصنعة للمعدات الأصلية.
يمكننا في نهاية المطاف إجراء الكثير من عمليات التصفية والمتابعة لتطبيقات السيارات، حتى بطرق لا يستطيع مقدمو التكنولوجيا الكبار القيام بها. والفرق الرئيسي هو أنه لا يقتصر فقط على وضع واجهة صوتية على شيء مثل ChatGPT؛ لدينا جميع مجالاتنا: الطقس، والملاحة، ونقاط الاهتمام - وهي في الوقت الفعلي، ويمكن ربطها بشيء مثل ChatGPT أو أي نماذج لغة كبيرة أخرى. نحن نؤمن بأن هذين الأمرين معًا (هندسة البرمجيات مع التعلم الآلي) يخلقان أقوى مساعد، وهذا شيء أطلقناه العام الماضي.
نحن نسيطر على علامات هيونداي التجارية وفي أسواق متعددة في أوروبا. لدينا شراكة استراتيجية عميقة مع Stellantis وعلاماتها التجارية العشرين، بالإضافة إلى شركة Togg، وهي شركة تصنيع سيارات تركية، ونتحدث مع العديد من مصنعي المعدات الأصلية الآخرين.
هل يمكنك مناقشة ميزة الذكاء الاصطناعي التوليدية الجديدة التي تم إطلاقها مؤخرًا؟
أحد العناصر الأساسية لما نقدمه هو فكرة أنه يمكنك الوصول إلى المعلومات خارج السيارة وداخلها. لقد كان دليل السيارة نفسه دائمًا يمثل تحديًا لشركات صناعة السيارات. من الواضح أنها سميكة وشاملة للغاية؛ من الواضح أن العثور على الأشياء يمثل تحديًا للجميع. هذه واحدة من "نقاط الألم" التي يعاني منها كل من يملك سيارة.
أحد العناصر الأساسية لما نقدمه هو فكرة أنه يمكنك الوصول إلى المعلومات خارج السيارة وداخلها.
ما يمكننا القيام به هو استيعاب ذلك ومن ثم استخدام مزيجنا من هندسة البرمجيات ونماذج اللغات الكبيرة، وجعل هذا الدليل متاحًا صوتيًا باستخدام مزيج خاص من الفهرسة والبحث. توفر مرونة نماذج اللغات الكبيرة مجالًا كبيرًا للترجمة الفورية. ليس من الضروري أن يعرف الأشخاص اسم الميزة. يقولون فقط، على سبيل المثال: "ما هذه الميزة إذا كنت على تلة حتى لا تنزلق؟" يحدد المساعد أنك تتحدث عن ميزة المساعدة في تثبيت التلال.
وهذا حقا يعزز عرض القيمة لدينا. في الأساس، نعتقد أن التجربة الصوتية يجب أن تكون امتدادًا للمركبة نفسها.
ثانيًا، نظرًا لأن السيارات أصبحت أكثر تركيزًا على البرمجيات، أصبحت فكرة الدليل المطبوع أكثر عفا عليها الزمن نظرًا لأنه يتم تحديث البرنامج عبر الأثير (OTA) ومن الواضح أنه لا توجد نسخة مطبوعة محدثة من ذلك. سيكون لدى المزيد من مصنعي المعدات الأصلية دليلهم متاحًا رقميًا داخل نظام المعلومات والترفيه نفسه، ولكن من الواضح أن هذا يمثل تحديات للوصول كما يمكنك أن تتخيل.
هل ستكون هذه التقنية متوافقة مع أي مركبة؟
تتمتع كل مركبة بقدرة صوتية إلى حد ما. أود أن أقول أن الجزء القديم منه هو القدرة المدمجة. ويتم ذلك قبل توصيل المركبات بالسحابة أو بأي خدمات. سيكون لديهم وظائف محدودة للغاية.
عندما دخلنا السوق، بدأنا في تقديم القدرة السحابية للسيارات المتصلة. ما سيحدث هو أننا سنقدم قدراتنا من خلال منصتنا على السيارة ومن ثم سنجعل ميزة استخبارات السيارة هذه متاحة.
نحن لسنا متشددين بشأن أي شركات سيارات ذات اتجاه واحد يجب أن تنفذ هذا. في بعض الحالات، إذا أرادوا الاستمرار في استخدام أمازون أو جوجل، فمن المؤكد أنهم يستطيعون ذلك. إن وجود مساعد صوتي مستقل يعيش جنبًا إلى جنب مع ذلك هو في الواقع امتداد لاستراتيجية علامتهم التجارية.
نشعر أن الحصول على مساعد أكثر شمولاً وذو علامة تجارية هو أفضل طريقة لاستخدام هذه التقنية، ولكن من الواضح أن هناك طرقًا متعددة يمكن أن يحدث ذلك.
ماذا تتوقع أن يحدث في هذا المجال خلال السنوات الثلاث المقبلة؟
أود أن أقول إن أحدث الابتكارات حول تقنيات الذكاء الاصطناعي التوليدية هذه قد أيقظت الناس حقًا على إمكانيات الذكاء الاصطناعي التحادثي حقًا.
وهذا ينطبق على السيارات بقدر ما ينطبق على مكبرات الصوت الذكية أو أي شيء يدعم الصوت. يفتح ChatGPT الباب أمام الكثير من حالات الاستخدام التي لم تكن موجودة من قبل. يمكن للأشخاص داخل السيارة أن يقولوا: "أنا مسافر إلى هذا الموقع؛ أنا مسافر إلى هذا الموقع". هل لديك نصيحة لي؟" بمجرد أن يبدأ الناس في إدراك أنه يمكن أن يبدأ التأثير بشكل هادف على حياتهم، سنرى الكثير من النشاط هناك.
أود أن أقول إن أحدث الابتكارات حول تقنيات الذكاء الاصطناعي التوليدية هذه قد أيقظت الناس حقًا على إمكانيات الذكاء الاصطناعي التحادثي حقًا.
الفئات الأخرى من الأشياء التي غازلها الناس، لكنها لم تظهر بعد، هي أقرب قليلاً إلى ما سنسميه "الذكاء العاطفي". إذا كنت أشعر بطريقة معينة، فيمكن للمساعد الصوتي التعرف والاستجابة وفقًا لذلك. إنها فكرة اكتشاف المشاعر. إذا كنت غاضبًا، فهل هناك فرصة للتحكم في هذه المشاعر من خلال الرد؟
على سبيل المثال، عندما تطلب الآن من الذكاء الاصطناعي مزحة، فإن تحويل النص إلى كلام هو نفس النغمة كما لو كنت تطلب منه الانتقال إلى أقرب محطة بنزين. أعتقد أنه سيكون هناك الكثير من الابتكار لتحويل النص الفعلي إلى كلام لتعديل استجابته بناءً على سياق ما يقوله. أعتقد أن هذا سيفتح المزيد من الإحساس بأنك تجري محادثة مع شيء يبدو أكثر ذكاءً من الروبوت الذي يتلقى الأوامر فقط.
وأيضًا، التعرف على الكلام والتعرف على الصوت – التكنولوجيا موجودة، لكنها لم تظهر في الشركات المصنعة للمعدات الأصلية. لذا، تخيل لو دخلت سيارتك وألقيت التحية. تتعرف سيارتك على صوتك وتقول "مرحبًا". وهذا بالتأكيد في متناول اليد، ويمكنني أن أرى ذلك يحدث في غضون السنوات القليلة المقبلة.
وأخيرًا وليس آخرًا، يعد تحقيق الدخل والتجارة من العناصر الأساسية في خارطة الطريق لدينا. جزء من عملنا هو أننا نرى الخدمات التي تدعم الصوت بالإضافة إلى المطاعم وطلب الطعام والطلبات من السيارة - الكثير من الإمكانات.
الفكرة هي أنه يمكنك طلب الطعام أو طرح أي أسئلة على الشركة من خلال الصوت الطبيعي. وكانت استراتيجيتنا دائمًا هي جلب هذه الخدمات إلى السيارة وجعل السيارة بوابة أقوى بكثير إلى العالم من حولنا. في غضون السنوات القليلة المقبلة، سنرى ذلك، وهو أمر مثير للاهتمام بالنسبة لمصنعي المعدات الأصلية لأن أسعار تحدي إيراداتهم أصبحت أكثر صرامة. إن السيارات الكهربائية التي نعرفها لا يتم بيعها بربح، لذلك تعد أشكال الإيرادات الإضافية أمرًا بالغ الأهمية، ونعتقد أن التفاعل الصوتي يمكن أن يفتح بعضًا من ذلك.
هل هناك أي شيء آخر تعتقد أن الناس يجب أن يعرفوه عن الذكاء الاصطناعي؟
عندما تصور الناس المساعد الصوتي لأول مرة، أود أن أقول في الأيام الأولى - ربما قبل سبع إلى عشر سنوات - رأوا التكنولوجيا وما يمكن أن تفعله في الممارسة العملية. لقد كانوا سعداء بذلك، لكن مخيلتهم كانت أيضًا أقوى كثيرًا. كانت أفلام الخيال العلمي تقدم مفاهيم مثل جارفيس للرجل الحديدي. كانت هناك دائمًا هذه الفجوة بين ما تمنى الناس أن تفعله وما فعلته.
أعتقد أن التطورات تأتي بسرعة كبيرة لدرجة أن فكرة وجود مساعد يمكنه التحدث معك ويكون موجودًا لك أصبحت في متناول اليد أكثر من أي وقت مضى.
نحن على أعتاب أناس يدركون أن بإمكانهم التحدث إلى مساعدهم الصوتي بدلاً من مجرد الأمر به. أعتقد أنه بمجرد أن يقتنع الناس بهذا السلوك، فلن يعودوا أبدًا. بمجرد أن تطلق العنان للقيمة باستخدام الذكاء الاصطناعي، فإنها تصبح جزءًا مما تفعله وكيفية تفاعلك. الفكرة هي أننا حقًا في وضع يسمح لنا باحتضان هذا المساعد الصوتي للمحادثة.
مصدر من سيارة فقط
إخلاء المسؤولية: المعلومات المذكورة أعلاه مقدمة من just-auto.com بشكل مستقل عن Chovm.com. لا تقدم Chovm.com أي تعهدات أو ضمانات فيما يتعلق بجودة وموثوقية البائع والمنتجات.