O boom de dois anos da IA: a tecnologia resolveu os desafios da comercialização? -

Desde o surgimento do ChatGPT, o boom da IA durou dois anos. Durante esse tempo, o público em geral ficou entusiasmado com as capacidades dos grandes modelos de linguagem, que podem gerar texto suave e natural a partir de comandos simples, transformando cenários de ficção científica em realidade.

O campo dos grandes modelos também está entrando em uma fase crítica, onde novas tecnologias devem ser transformadas em novos produtos que atendam às necessidades reais e se desenvolvam em um novo ecossistema comercial.

Assim como pagamentos móveis, smartphones e LTE impulsionaram coletivamente a prosperidade da era da internet móvel, o setor de IA também está buscando esse ajuste produto-mercado (PMF) em 2024.

A era de exploração de novas tecnologias começou, e se uma nova fronteira pode ser descoberta determinará se os grandes modelos são apenas mais um jogo de capital de queima de dinheiro, uma repetição da bolha da internet ou, como disse Jensen Huang, o início de uma nova revolução industrial. Esta resposta será revelada mais rápido do que a inteligência geral artificial (AGI).

Os grandes problemas com grandes modelos

Hoje, a competição em modelos fundamentais basicamente se estabilizou. Liderada pela OpenAI, com a ChatGPT mantendo firmemente a liderança de mercado, outros players como Anthropic, DeepMind, Llama e Grok têm seus pontos fortes.

Portanto, o mais emocionante em 2024 não é quem expandiu os parâmetros ou melhorou a velocidade de resposta, mas como a tecnologia de modelos grandes pode se tornar um produto utilizável.

Desde o início, aplicar a tecnologia de modelos de linguagem grande tem sido um desafio. A Harvard Business Review conduziu uma pesquisa e descobriu que há cerca de 100 tipos de aplicações de IA generativas.

Gráfico categorizando aplicações de IA em cinco tipos principais.

No entanto, eles se enquadram em cinco categorias principais: resolução de problemas técnicos, produção e edição de conteúdo, suporte ao cliente, aprendizado e educação, e criação e pesquisa artística.

A conhecida empresa de investimentos a16z compartilhou os principais produtos de IA generativa de sua equipe, incluindo nomes conhecidos como Perplexity, Claude e ChatGPT. Também há produtos de nicho, como aplicativos de anotações Granola, Wispr Flow, Every Inc. e Cubby. No setor de educação, o maior vencedor de 2024 foi o NotebookLM, junto com chatbots como Character.ai e Replika.

Para usuários comuns, a maioria desses produtos é gratuita, e as versões de assinatura ou profissionais não são despesas necessárias. Mesmo para um player forte como o ChatGPT, a receita de assinatura em 2024 foi de cerca de US$ 283 milhões por mês, dobrando em relação a 2023. Mas diante de custos enormes, essa renda parece insignificante.

Desfrutar de avanços tecnológicos é uma alegria para usuários comuns, mas para profissionais da indústria, não importa o quão emocionante seja a evolução tecnológica, ela não pode permanecer no laboratório; ela deve entrar no mundo comercial para testes. O modelo de assinatura não foi amplamente aceito, e o tempo para incorporar anúncios ainda não chegou. O tempo que resta para grandes modelos queimarem dinheiro está se esgotando.

Em contraste, o desenvolvimento orientado para os negócios é mais promissor.

Desde 2018, a menção de IA em chamadas de lucros da Fortune 500 quase dobrou. Em todas as chamadas de lucros, 19.7% dos registros mencionam IA generativa como o tópico mais discutido.

Este também é o consenso de toda a indústria. De acordo com o livro azul “Artificial Intelligence Development Report (2024)” lançado pela China Academy of Information and Communications Technology, até 2026, mais de 80% das empresas usarão APIs de IA generativas ou implantarão aplicativos generativos.

Os aplicativos para empresas e consumidores mostram diferentes tendências de desenvolvimento: os aplicativos voltados para o consumidor enfatizam barreiras baixas e criatividade, enquanto os aplicativos voltados para empresas se concentram mais na personalização profissional e no feedback de eficiência.

Em outras palavras, melhorar a eficiência é algo que toda empresa busca e quer alcançar, mas dizer apenas essas quatro palavras é muito vago. Grandes modelos precisam provar que podem realmente resolver problemas em casos de uso e realmente aumentar a eficiência.

Encontrando precisamente pontos de entrada para implementar tecnologia

Seja em termos de investimento em recursos ou esforços de expansão de mercado, a competição da China em grandes modelos foi intensa ao longo de 2024.

De acordo com dados do Ministério da Indústria e Tecnologia da Informação da China, a taxa de crescimento do mercado de modelos de linguagem grande da China em 2023 ultrapassou 100%, atingindo aproximadamente US$ 2 bilhões. As empresas estão experimentando ativamente a comercialização, inicialmente se envolvendo em guerras de preços: reduzindo custos por meio de cobrança baseada em token, chamadas de API e outros métodos. Muitos modelos grandes tradicionais agora são quase gratuitos.

Reduzir preços e custos é relativamente fácil de conseguir. No entanto, entender o negócio e analisar cenários de entrada é um caminho mais desafiador.

Nem todas as empresas participam de guerras de preços, confiando na concorrência de baixo custo.

“Nessa situação, é mais importante encontrar nossos recursos exclusivos e alavancar nossos pontos fortes. A Tencent tem muitos cenários internos que nos fornecem mais insights e aprimoram ainda mais nossas capacidades”, disse Zhao Xinyu, especialista em produtos de IA na Tencent Cloud e chefe da Tencent Hunyuan ToB Products. “Externamente, focamos em um setor, nos concentramos em cenários específicos dentro desse setor e, então, expandimos gradualmente.”

Entre muitos modelos fundamentais, Hunyuan pode não ser o que mais chama a atenção, mas sua força técnica é inegável.

Em setembro de 2023, a Hunyuan lançou o modelo geral de texto para texto Hunyuan Turbo, adotando uma nova estrutura Mixture of Experts (MoE). Ele teve um bom desempenho em compreensão e geração de linguagem, raciocínio lógico, reconhecimento de intenção, bem como tarefas de codificação, contexto longo e agregação. Na versão de atualização dinâmica de novembro de 2023, ele foi atualizado para o modelo de melhor desempenho em todos os aspectos. Atualmente, os recursos da Tencent Hunyuan estão sendo totalmente entregues por meio da Tencent Cloud, oferecendo vários tamanhos e tipos de modelos, combinados com outros produtos de IA e recursos da Tencent Cloud Intelligence, para ajudar os aplicativos de modelo a pousar em cenários.

Interface do modelo Hunyuan Turbo com detalhes técnicos e métricas de desempenho.

Atualmente, as formas de aplicação de modelos são divididas grosseiramente em dois tipos: cenários sérios e cenários de entretenimento. Este último inclui chatbots, aplicativos complementares, etc.

“Cenários sérios” referem-se a aplicações em operações comerciais centrais de empresas, onde precisão e confiabilidade são altamente exigidas. Nesses cenários, grandes modelos precisam lidar com informações estruturadas, geralmente seguindo processos comerciais e padrões de qualidade predefinidos, e seus efeitos de aplicação estão diretamente relacionados à eficiência operacional e aos resultados comerciais das empresas.

A Tencent Cloud certa vez ajudou um provedor de serviços outbound a construir um sistema de atendimento ao cliente, o que é um cenário sério típico. Chamadas outbound envolvem recursos de diálogo em linguagem natural, compreensão de conteúdo e recursos de análise, que são altamente compatíveis com grandes modelos de linguagem.

Na verdade, o desafio está nos detalhes. Naquela época, a equipe enfrentou dois desafios principais. Um era problemas de desempenho, já que o tamanho do parâmetro do modelo era enorme, atingindo a escala de 70B ou 300B, como completar a resposta em 500 milissegundos e passá-la para o sistema TTS downstream se tornou um desafio técnico importante.

O segundo foi a precisão da lógica do diálogo. O modelo às vezes produzia respostas ilógicas em alguns diálogos, afetando o efeito geral do diálogo. Para superar esses desafios, a equipe do projeto adotou uma estratégia de iteração intensiva, mantendo um ritmo rápido de iteração de uma versão por semana dentro de um ciclo de desenvolvimento de 1-2 meses.

Os clientes corporativos demonstram interesse em tecnologia de modelo de linguagem grande e estão dispostos a tentar inovações, mas sempre há uma lacuna cognitiva na integração profunda de tecnologia e negócios. Isso não decorre de uma falta de compreensão de seus próprios negócios pelas empresas, mas requer uma equipe técnica profissional para entender profundamente os pontos problemáticos da indústria e os cenários de negócios, encontrar os cenários mais adequados, personalizar soluções de pouso de IA para empresas e alcançar a melhor combinação de tecnologia e negócios.

“A abordagem tradicional pode exigir que os operadores criem (corpora) um cenário por vez”, explicou Xinyu, “mas com modelos grandes, você só precisa dar um prompt para atender à demanda”. Depois de esclarecer a demanda, a equipe de Hunyuan atualizou quase uma versão a cada semana, acelerando a velocidade da iteração e, em um ou dois meses, a precisão atingiu 95%.

Para esse provedor de serviços outbound, a tecnologia generativa era completamente nova. Hunyuan mostrou diretamente a eles os benefícios trazidos por grandes modelos, reduzindo as despesas com mão de obra em três quartos.

“A melhor abordagem é mostrar os efeitos”, disse Xinyu. Quando os clientes têm algum entendimento da tecnologia generativa, mas não muito, mostrar os efeitos é o mais eficaz. Ao encontrar cenários que podem ser inseridos por meio da experiência comercial do cliente, conduzindo diretamente a verificação de testes e demonstrando as melhorias que podem ser alcançadas.

Uma experiência semelhante ocorreu em cooperação com a Xiaomi, que foi descrita como uma “jornada de mão dupla”.

A outra parte queria introduzir grandes modelos em interações de perguntas e respostas, aplicando recursos de pesquisa de IA aos terminais. Isso atingiu dois pontos fortes da Hunyuan: suporte fornecido pelo rico ecossistema de conteúdo da Tencent e os recursos da Hunyuan em pesquisa de IA. Para perguntas e respostas, a precisão é muito crítica.

“Ainda havia muitas dificuldades no começo”, Xinyu lembrou. “Da perspectiva deles, o formulário de negócios cobria múltiplos cenários, incluindo bate-papo casual, perguntas e respostas de conhecimento e outros tipos, entre os quais o cenário de perguntas e respostas de conhecimento tinha requisitos de precisão relativamente altos.”

Por meio de testes preliminares, a equipe Hunyuan esclareceu suas vantagens em cenários de busca e, junto com a outra parte, gradualmente refinou a interação de perguntas e respostas amplamente definida de acordo com diferentes níveis de tópicos. Esse tipo de segmentação permite que o modelo entenda mais claramente as necessidades específicas e os requisitos de efeito de cada cenário, conduzindo assim uma otimização mais direcionada.

O cenário de perguntas e respostas de conhecimento se tornou o ponto de aterrissagem. Em implementações subsequentes, a Hunyuan ainda tinha muitos desafios a superar: problemas de latência não precisam ser mencionados, o tempo de resposta deve ser rápido; em segundo lugar, a integração do conteúdo de pesquisa.

“Em todo o link, construímos um mecanismo de busca autodesenvolvido e um modelo de classificação de intenção para determinar se é uma pergunta de alta atualidade. Por exemplo, se está relacionada a notícias ou tópicos de atualidades, e então decidir se deve entregá-la ao modelo principal ou à busca de IA.”

Ligar apenas para as partes mais necessárias melhora muito a velocidade de resposta. Uma descoberta importante é que 70% das consultas levam à busca de IA, o que significa que deve haver conteúdo suficientemente rico como o suporte de chamada mais básico.

Por trás do Hunyuan está todo o ecossistema de conteúdo da Tencent. De notícias, música, finanças, até mesmo saúde, o ecossistema da Tencent oferece uma riqueza de conteúdo de alta qualidade. Esse conteúdo é acessível e referenciável pelo modelo Hunyuan durante as pesquisas, fornecendo uma vantagem única.

Após mais de dois meses de iteração intensiva, a qualidade das respostas, a velocidade de resposta e o desempenho atenderam totalmente aos requisitos e foram implementados nas operações comerciais reais da Xiaomi.

A chave para os negócios B2B é gerar receita e ganhar confiança, o que exige entregar valor real às operações dos clientes.

“Roll” Generalização para Alcançar Mais Cenários

A aplicação de grandes modelos em vários setores e produtos também está promovendo o crescimento da tecnologia em si.

Para alguns produtos de modelo grande, escolher o caminho B2C envolve uma consideração essencial: usar o feedback do consumidor para otimizar o modelo. A necessidade de ajustar modelos grandes é infinita, e o número e a atividade dos usuários consumidores fornecem o combustível para a iteração do modelo, acelerando assim a velocidade da iteração.

Na verdade, isso também é alcançado em negócios B2B, com demandas ainda maiores.

O recurso de classificação de redações em chinês K12 do “Teenager Gains” utiliza os recursos multimodais da Hunyuan. Combinado com a tecnologia OCR inteligente da Tencent Cloud, ele reconhece o conteúdo das redações dos alunos e usa o modelo grande para classificar as redações com base em padrões de pontuação predefinidos.

Normalmente, se a diferença de pontuação entre o modelo grande e um professor humano estiver dentro de cinco pontos, é considerado bom — mas isso não é fácil de conseguir. Inicialmente, apenas 80% das pontuações de Hunyuan estavam dentro de cinco pontos das pontuações de professores humanos.

“O modelo tem certos métodos e capacidades para resolver problemas em alguns cenários. No entanto, ao focar no negócio de um cliente específico, é necessário um desempenho maior”, disse Xinyu. “Embora 90% de precisão possa atender às metas de negócios, em 70% ou 80%, ainda há uma lacuna.”

Isso significa que é necessário esforço contínuo. À medida que a base de clientes corporativos se expande, novas demandas são colocadas na tecnologia em si: primeiro, um aumento significativo na velocidade de iteração — iterações para usuários consumidores podem levar de um a dois meses, mas agora uma nova versão pode aparecer semanalmente. Essa iteração de alta frequência promove muito o crescimento e o progresso do modelo.

Em segundo lugar, servir continuamente a diferentes cenários empresariais melhorou significativamente a capacidade de generalização do modelo. Isso indica que servir profundamente às diversas necessidades empresariais não apenas acelera o ritmo do desenvolvimento e da iteração do modelo, mas também melhora a praticidade e a adaptabilidade do modelo, permitindo que ele se expanda de cenários sérios para cenários mais voltados para o entretenimento.

A plataforma de conteúdo de RPG “Dream Dimension”, que recentemente garantiu dezenas de milhões em financiamento da Série A, aplicou o modelo exclusivo de RPG do grande modelo Hunyuan, Hunyuan-role, voltado para atender usuários jovens. Ele combina tecnologia de IA generativa para fornecer uma experiência de interação de personagem virtual interativa e orientada por história.

Hunyuan-role foi pioneiro em uma nova forma de interação humano-computador. Ao criar diversas imagens de personagens virtuais e com base em cenários de história e cenários de personagens predefinidos, ele envolve os usuários em diálogos interativos naturais e suaves.

No nível técnico, tais aplicações de cenário demonstraram as principais vantagens do Hunyuan-role no tratamento de diálogos de texto longos e curtos, reconhecimento de intenção e resposta. Ele pode lidar com diversos cenários de aplicação e exibe excelentes capacidades de humanização de conteúdo — não apenas se envolvendo em interações de diálogo calorosas, mas também avançando histórias para criar uma experiência de usuário imersiva.

Esses recursos tornam o Hunyuan-role uma ferramenta poderosa para aquisição de clientes de produtos e operações de usuários, desempenhando um papel crucial no aprimoramento da retenção e do engajamento do usuário. Também reflete que o Hunyuan, aprimorado e aprimorado em cenários sérios, desenvolveu capacidades de generalização que podem cobrir cenários mais amplos, mesmo em aplicativos end-side.

Expandir de cenários sérios para entretenimento, criatividade e muito mais é uma jornada que grandes aplicativos de modelos devem empreender.

À medida que a tecnologia amadurece e os custos diminuem, grandes modelos estão fadados a se expandir para cenários de aplicação mais amplos. Inicialmente focadas em cenários de negócios sérios, como trabalho de escritório corporativo, análise de dados e pesquisa científica, essas áreas têm demandas claras e uma maior disposição para pagar.

Uma expansão maior em entretenimento, criatividade e produção de conteúdo requer uma âncora estratégica: sempre focar na solução de necessidades específicas de cenários como objetivo principal, identificando o ponto de entrada para integrar grandes capacidades de modelos.

Além de colaborar com software de aplicação, parcerias com fabricantes de hardware também são necessárias para permitir que o modelo tenha desempenho e funcione no lado voltado para o consumidor, fornecendo serviços mais próximos da vida diária dos usuários e oferecendo experiências de serviço mais convenientes e imediatas.

Nesse processo, a conscientização do mercado e a aceitação da tecnologia de IA generativa estão aumentando continuamente, e a base de usuários está se expandindo constantemente. Diante desse ambiente de mercado em rápida mudança, a capacidade de iteração do modelo se torna particularmente importante. Isso não se reflete apenas no desempenho técnico, mas também na compreensão das necessidades do usuário, na adaptação a diferentes cenários e muito mais. Somente modelos e equipes que podem aprender rapidamente, otimizar continuamente e se adaptar constantemente a novas demandas podem manter uma vantagem na competição.

À medida que mais cenários são continuamente cobertos, o alcance para mais consumidores finais também se expande. Com a aceitação geral do mercado da tecnologia generativa, a base de usuários em potencial continuará a crescer. Um modelo que pode iterar e se autoaprimorar rapidamente pode se adaptar intensamente às mudanças, movendo-se de forma mais constante e mais longe.

Retirado de se um

Isenção de responsabilidade: as informações estabelecidas acima são fornecidas por ifanr.com, independentemente do Chovm.com. Chovm.com não faz nenhuma representação e garantia quanto à qualidade e confiabilidade do vendedor e dos produtos. Chovm.com isenta-se expressamente de qualquer responsabilidade por violações relativas aos direitos autorais do conteúdo.

Últimas notícias

O boom de dois anos da IA: a tecnologia resolveu os desafios da comercialização?

Os grandes problemas com grandes modelos

Encontrando precisamente pontos de entrada para implementar tecnologia

“Roll” Generalização para Alcançar Mais Cenários

Sobre o autor

se um

Deixe um comentário

Os grandes problemas com grandes modelos

Encontrando precisamente pontos de entrada para implementar tecnologia

“Roll” Generalização para Alcançar Mais Cenários

Sobre o autor

se um

Artigos relacionados

Deixe um comentário