Двухлетний бум ИИ: решила ли технология проблемы коммерциализации? -

С момента появления ChatGPT бум ИИ продолжался два года. За это время широкая общественность была в восторге от возможностей больших языковых моделей, которые могут генерировать плавный и естественный текст из простых команд, превращая научно-фантастические сценарии в реальность.

Область больших моделей также вступает в критическую фазу, когда новые технологии должны трансформироваться в новые продукты, отвечающие реальным потребностям и развивающиеся в новую коммерческую экосистему.

Подобно тому, как мобильные платежи, смартфоны и LTE в совокупности способствовали процветанию эпохи мобильного интернета, индустрия ИИ также стремится к достижению соответствия продукта рынку (PMF) в 2024 году.

Началась эра исследования новых технологий, и то, будет ли открыт новый рубеж, определит, являются ли большие модели просто очередной игрой в сжигание капитала, повторением интернет-пузыря или, как сказал Дженсен Хуан, началом новой промышленной революции. Этот ответ будет получен быстрее, чем искусственный интеллект общего назначения (AGI).

Большие проблемы с большими моделями

Сегодня конкуренция в фундаментальных моделях в основном стабилизировалась. Во главе с OpenAI, где ChatGPT прочно удерживает лидерство на рынке, другие игроки, такие как Anthropic, DeepMind, Llama и Grok, имеют свои сильные стороны.

Таким образом, самым интересным в 2024 году будет не то, кто расширил параметры или улучшил скорость отклика, а то, насколько технология больших моделей может стать полезным продуктом.

С самого начала применение технологии большой языковой модели было сложной задачей. Harvard Business Review провел опрос и обнаружил, что существует около 100 типов приложений генеративного ИИ.

Диаграмма, разделяющая приложения ИИ на пять основных типов.

Однако они делятся на пять основных категорий: решение технических проблем, производство и редактирование контента, поддержка клиентов, обучение и образование, а также художественное творчество и исследования.

Известная инвестиционная фирма a16z поделилась лучшими продуктами своей команды в области генеративного ИИ, включая такие известные названия, как Perplexity, Claude и ChatGPT. Есть также более нишевые продукты, такие как приложения для создания заметок Granola, Wispr Flow, Every Inc. и Cubby. В секторе образования крупнейшим победителем 2024 года стал NotebookLM, а также чат-боты, такие как Character.ai и Replika.

Для обычных пользователей большинство этих продуктов бесплатны, а подписка или профессиональные версии не являются необходимыми расходами. Даже для такого сильного игрока, как ChatGPT, доход от подписки в 2024 году составил около 283 миллионов долларов в месяц, что вдвое больше, чем в 2023 году. Но на фоне огромных расходов этот доход кажется незначительным.

Наслаждение технологическими достижениями — это радость для обычных пользователей, но для профессионалов отрасли, какой бы захватывающей ни была технологическая эволюция, она не может оставаться в лаборатории; она должна выйти в коммерческий мир для тестирования. Модель подписки не получила широкого распространения, а время для встраивания рекламы еще не пришло. Время, отведенное для сжигания денег крупными моделями, заканчивается.

Напротив, развитие, ориентированное на бизнес, более перспективно.

С 2018 года упоминание ИИ в конференциях по доходам компаний из списка Fortune 500 почти удвоилось. Во всех конференциях по доходам 19.7% записей упоминают генеративный ИИ как наиболее обсуждаемую тему.

Это также консенсус всей отрасли. Согласно синей книге «Отчет о развитии искусственного интеллекта (2024)», выпущенной Китайской академией информационных и коммуникационных технологий, к 2026 году более 80% предприятий будут использовать API генеративного ИИ или развертывать генеративные приложения.

Приложения для предприятий и потребителей демонстрируют разные тенденции развития: потребительские приложения делают упор на низкие барьеры и креативность, в то время как корпоративные приложения больше ориентированы на профессиональную настройку и обратную связь по эффективности.

Другими словами, повышение эффективности — это то, к чему стремится и чего хочет достичь каждая компания, но просто произнести эти четыре слова — это слишком расплывчато. Большие модели должны доказать, что они действительно могут решать проблемы в вариантах использования и действительно повышать эффективность.

Точный поиск точек входа для внедрения технологий

Будь то с точки зрения инвестиций в ресурсы или усилий по расширению рынка, конкуренция со стороны Китая в крупных моделях была острой в течение 2024 года.

По данным Министерства промышленности и информационных технологий Китая, темпы роста рынка крупных языковых моделей Китая в 2023 году превысили 100%, достигнув примерно 2 млрд долларов. Компании активно экспериментируют с коммерциализацией, изначально участвуя в ценовых войнах: снижая издержки за счет выставления счетов на основе токенов, вызовов API и других методов. Многие основные крупные модели теперь практически бесплатны.

Снижение цен и затрат относительно легко достижимо. Однако понимание бизнеса и анализ сценариев входа — более сложный путь.

Не все компании участвуют в ценовых войнах, полагаясь на конкуренцию за счет низких издержек.

«В этой ситуации важнее найти наши уникальные особенности и использовать наши сильные стороны. У Tencent есть много внутренних сценариев, которые дают нам больше информации и еще больше расширяют наши возможности», — сказал Чжао Синьюй, специалист по продуктам ИИ в Tencent Cloud и руководитель Tencent Hunyuan ToB Products. «Внешне мы фокусируемся на одной отрасли, концентрируемся на конкретных сценариях внутри этой отрасли, а затем постепенно расширяемся».

Среди многих основополагающих моделей Хуньюань, возможно, не самая привлекающая внимание, но ее техническая сила неоспорима.

В сентябре 2023 года Hunyuan выпустила общую модель преобразования текста в текст Hunyuan Turbo, приняв новую структуру Mixture of Experts (MoE). Она хорошо показала себя в понимании и генерации языка, логическом обосновании, распознавании намерений, а также в задачах кодирования, длинного контекста и агрегации. В версии динамического обновления от ноября 2023 года она была обновлена до самой эффективной модели по всем направлениям. В настоящее время возможности Tencent Hunyuan полностью предоставляются через Tencent Cloud, предлагая различные размеры и типы моделей в сочетании с другими продуктами и возможностями ИИ от Tencent Cloud Intelligence, чтобы помочь приложениям моделей приземляться в сценариях.

Интерфейс модели Hunyuan Turbo с техническими подробностями и показателями производительности.

В настоящее время формы применения моделей условно делятся на два типа: серьезные сценарии и развлекательные сценарии. К последним относятся чат-боты, сопутствующие приложения и т. д.

«Серьезные сценарии» относятся к приложениям в основных бизнес-операциях предприятий, где точность и надежность крайне востребованы. В этих сценариях большие модели должны обрабатывать структурированную информацию, обычно следуя предопределенным бизнес-процессам и стандартам качества, а эффекты их приложений напрямую связаны с операционной эффективностью и бизнес-результатами предприятий.

Tencent Cloud однажды помог поставщику исходящих услуг построить систему обслуживания клиентов, что является типичным серьезным сценарием. Исходящие звонки включают возможности диалога на естественном языке, понимания контента и возможности анализа, которые в высокой степени совместимы с большими языковыми моделями.

На самом деле, проблема заключается в деталях. В то время команда столкнулась с двумя основными проблемами. Одна из них — проблемы с производительностью, поскольку размер параметров модели был огромным, достигая масштаба 70B или 300B, то, как завершить ответ в течение 500 миллисекунд и передать его в нижестоящую систему TTS, стало важной технической проблемой.

Вторым была точность логики диалога. Модель иногда выдавала нелогичные ответы в некоторых диалогах, влияя на общий эффект диалога. Чтобы преодолеть эти проблемы, команда проекта приняла интенсивную стратегию итераций, поддерживая быстрый темп итераций по одной версии в неделю в течение цикла разработки продолжительностью 1-2 месяца.

Корпоративные клиенты проявляют интерес к технологии большой языковой модели и готовы пробовать инновации, но всегда существует когнитивный разрыв в глубокой интеграции технологий и бизнеса. Это не связано с отсутствием понимания собственного бизнеса предприятиями, а требует профессиональной технической команды для глубокого понимания болевых точек отрасли и бизнес-сценариев, поиска наиболее подходящих сценариев, адаптации решений AI-приземления для предприятий и достижения наилучшего сочетания технологий и бизнеса.

«Традиционный подход может потребовать от операторов создания (корпораций) одного сценария за раз», — пояснил Синьюй, — «но с большими моделями вам нужно только дать подсказку, чтобы удовлетворить спрос». После выяснения спроса команда Hunyuan обновляла версию практически каждую неделю, ускоряя скорость итерации, и в течение одного или двух месяцев точность достигла 95%.

Для этого поставщика исходящих услуг генеративная технология была совершенно новой. Hunyuan напрямую продемонстрировала им преимущества, которые приносят большие модели, сократив расходы на рабочую силу на три четверти.

«Лучший подход — продемонстрировать эффекты», — сказал Синьюй. Когда у клиентов есть некоторое понимание генеративной технологии, но не слишком много, демонстрация эффектов является наиболее эффективной. Находя сценарии, которые можно ввести через бизнес-опыт клиента, напрямую проводя проверку тестов и демонстрируя улучшения, которых можно достичь.

Похожий опыт имел место в сотрудничестве с Xiaomi, которое было описано как «двустороннее путешествие».

Другая сторона хотела внедрить большие модели во взаимодействие вопросов и ответов, применяя возможности поиска ИИ к терминалам. Это ударило по двум сильным сторонам Hunyuan: поддержка, предоставляемая экосистемой богатого контента Tencent, и возможности Hunyuan в поиске ИИ. Для вопросов и ответов точность имеет решающее значение.

«Вначале все еще было много трудностей», — вспоминает Синьюй. «С их точки зрения, бизнес-форма охватывала несколько сценариев, включая неформальное общение, вопросы и ответы по знаниям и другие типы, среди которых сценарий вопросов и ответов по знаниям имел относительно высокие требования к точности».

В ходе предварительного тестирования команда Hunyuan прояснила свои преимущества в сценариях поиска и вместе с другой стороной постепенно усовершенствовала широко определенное взаимодействие вопросов и ответов в соответствии с различными уровнями тем. Этот вид сегментации позволяет модели более четко понимать конкретные потребности и требования к эффектам каждого сценария, тем самым проводя более целенаправленную оптимизацию.

Сценарий вопросов и ответов по знаниям стал точкой приземления. В последующих реализациях Hunyuan все еще предстояло преодолеть множество проблем: проблемы с задержкой не стоит упоминать, время отклика должно быть быстрым; во-вторых, интеграция поискового контента.

«Во всей ссылке мы построили самостоятельную поисковую систему и модель классификации намерений, чтобы определить, является ли вопрос актуальным. Например, связан ли он с новостями или текущими событиями, а затем решить, отдать ли его основной модели или поиску с помощью ИИ».

Только вызов самых необходимых частей значительно повышает скорость ответа. Важное открытие заключается в том, что 70% запросов ведут к поиску AI, что означает, что должно быть достаточно богатое содержание в качестве самой базовой поддержки звонков.

За Hunyuan стоит вся экосистема контента Tencent. От новостей, музыки, финансов и даже здравоохранения экосистема Tencent предлагает множество высококачественного контента. Этот контент доступен и ссылается на модель Hunyuan во время поиска, что обеспечивает уникальное преимущество.

После более чем двух месяцев интенсивной итерации качество ответов, скорость реагирования и производительность полностью соответствовали требованиям и были внедрены в реальные бизнес-операции Xiaomi.

Ключом к успеху в бизнесе B2B является получение дохода и завоевание доверия, что требует предоставления реальной ценности операциям клиентов.

«Катящаяся» генерализация для охвата большего количества сценариев

Применение крупных моделей в различных отраслях и продуктах также способствует развитию самой технологии.

Для некоторых крупных модельных продуктов выбор пути B2C подразумевает ключевое соображение: использование отзывов потребителей для оптимизации модели. Потребность в настройке крупных моделей бесконечна, а количество и активность потребителей-пользователей обеспечивают топливо для итерации модели, тем самым ускоряя скорость итерации.

На самом деле, то же самое происходит и в B2B-бизнесе, причём с ещё более высокими требованиями.

Функция оценки эссе K12 Chinese в «Teenager Gains» использует мультимодальные возможности Hunyuan. В сочетании с интеллектуальной технологией OCR Tencent Cloud она распознает содержание эссе учащихся и использует большую модель для оценки эссе на основе предустановленных стандартов оценки.

Обычно, если разница в оценках между большой моделью и учителем-человеком находится в пределах пяти баллов, это считается хорошим результатом, но этого нелегко достичь. Первоначально только 80% оценок Хуньюаня находились в пределах пяти баллов от оценок учителей-людей.

«Модель обладает определенными методами и возможностями для решения проблем в некоторых сценариях. Однако при фокусировке на бизнесе конкретного клиента требуется более высокая производительность», — сказал Синьюй. «Хотя точность в 90% может соответствовать бизнес-целям, при 70% или 80% все еще остается разрыв».

Это означает, что необходимы постоянные усилия. По мере расширения клиентской базы предприятий к самой технологии предъявляются новые требования: во-первых, значительное увеличение скорости итераций — итерации для потребителей могут занимать от одного до двух месяцев, но теперь новая версия может появляться еженедельно. Такая высокочастотная итерация значительно способствует росту и прогрессу модели.

Во-вторых, постоянное обслуживание различных корпоративных сценариев значительно повысило способность модели к обобщению. Это указывает на то, что глубокое обслуживание разнообразных корпоративных потребностей не только ускоряет темпы разработки и итерации модели, но и повышает практичность и адаптивность модели, позволяя ей расширяться от серьезных сценариев до более развлекательных.

Платформа ролевого контента «Dream Dimension», которая недавно получила десятки миллионов в рамках финансирования серии A, применила эксклюзивную модель ролевой игры Hunyuan, Hunyuan-role, нацеленную на обслуживание молодых пользователей. Она объединяет генеративную технологию ИИ для предоставления интерактивного, основанного на истории опыта взаимодействия с виртуальными персонажами.

Hunyuan-role стала пионером новой формы взаимодействия человека и компьютера. Создавая разнообразные образы виртуальных персонажей и основываясь на предустановленных фонах историй и настройках персонажей, она вовлекает пользователей в естественные и плавные интерактивные диалоги.

На техническом уровне такие приложения сценариев продемонстрировали ведущие преимущества Hunyuan-role в обработке длинных и коротких текстовых диалогов, распознавании намерений и реагировании. Он может обрабатывать разнообразные сценарии приложений и демонстрирует отличные возможности гуманизации контента — не только вовлекая в теплые диалоговые взаимодействия, но и продвигая сюжетные линии для создания иммерсивного пользовательского опыта.

Эти функции делают Hunyuan-role мощным инструментом для приобретения клиентов продукта и пользовательских операций, играя решающую роль в улучшении удержания и вовлеченности пользователей. Это также отражает то, что Hunyuan, отточенный и улучшенный в серьезных сценариях, разработал возможности обобщения, которые могут охватывать более широкие сценарии, даже в конечных приложениях.

Расширение от серьезных сценариев к развлечениям, творчеству и многому другому — это путь, который должны пройти приложения с большими моделями.

По мере развития технологий и снижения затрат крупные модели неизбежно расширятся в более широкие сценарии применения. Первоначально ориентированные на серьезные бизнес-сценарии, такие как корпоративная офисная работа, анализ данных и научные исследования, эти области имеют четкие требования и более высокую готовность платить.

Дальнейшее расширение сферы развлечений, творчества и производства контента требует стратегического якоря: постоянная концентрация на решении конкретных потребностей сценария как на основной цели, определение точки входа для интеграции возможностей большой модели.

Помимо сотрудничества с прикладным программным обеспечением, необходимо также наладить партнерские отношения с производителями оборудования, чтобы модель могла работать и функционировать на стороне потребителя, предоставляя услуги, которые ближе к повседневной жизни пользователей и предлагая более удобный и быстрый опыт обслуживания.

В этом процессе рыночная осведомленность и принятие технологии генеративного ИИ постоянно растут, а база пользователей неуклонно расширяется. Перед лицом этой быстро меняющейся рыночной среды итерационная способность модели становится особенно важной. Это отражается не только в технических характеристиках, но и в понимании потребностей пользователей, адаптации к различным сценариям и т. д. Только модели и команды, которые могут быстро учиться, непрерывно оптимизироваться и постоянно адаптироваться к новым требованиям, могут сохранить преимущество в конкурентной борьбе.

По мере того, как все больше сценариев непрерывно охватываются, также расширяется охват большего количества конечных потребителей. С общим принятием рынком генеративной технологии потенциальная пользовательская база будет продолжать расти. Модель, которая может быстро итерироваться и самосовершенствоваться, может быстро адаптироваться к изменениям, двигаясь более устойчиво и дальше.

Источник из ифанр

Отказ от ответственности: информация, изложенная выше, предоставлена ifanr.com независимо от Chovm.com. Chovm.com не делает никаких заявлений и не дает никаких гарантий относительно качества и надежности продавца и продукции. Chovm.com категорически отказывается от какой-либо ответственности за нарушения авторских прав на контент.

Новости

Двухлетний бум ИИ: решила ли технология проблемы коммерциализации?

Большие проблемы с большими моделями

Точный поиск точек входа для внедрения технологий

«Катящаяся» генерализация для охвата большего количества сценариев

Об авторе

ифанр

Оставьте комментарий

Большие проблемы с большими моделями

Точный поиск точек входа для внедрения технологий

«Катящаяся» генерализация для охвата большего количества сценариев

Об авторе

ифанр

Похожие сообщения

Оставьте комментарий