Participe de nossos boletins informativos diários e semanais para obter as atualizações mais recentes e conteúdo exclusivo sobre a cobertura de IA líder do setor. Saber mais
Toda semana – às vezes todos os dias – um novo modelo de IA de ponta nasce no mundo. À medida que avançamos para 2025, o ritmo de lançamento de novos modelos é vertiginoso. A curva da montanha-russa continua a crescer exponencialmente, e a exaustão e a surpresa tornaram-se companheiras constantes. Cada edição destaca por que Esse O modelo específico é superior a todos os outros, com infinitas coleções de benchmarks e gráficos de barras preenchendo nossos feeds enquanto continuamos lutando.
Há dezoito meses, a maioria dos desenvolvedores e empresas usavam um único modelo de IA. Hoje é o oposto. É raro encontrar um negócio de escala significativa que se limite às capacidades de um único modelo. As empresas estão cautelosas com o aprisionamento de fornecedores, especialmente no que diz respeito à tecnologia que rapidamente se tornou uma parte fundamental tanto da estratégia empresarial a longo prazo como das receitas finais a curto prazo. É cada vez mais perigoso para as equipes colocarem seus desafios em um modelo de linguagem grande (LLM).
Mas, apesar desta fragmentação, muitos fornecedores de modelos ainda apoiam a visão de que a IA será um mercado em que o vencedor leva tudo. Eles dizem que a experiência e a computação necessárias para treinar os melhores modelos são raras, defensivas e auto-reforçadoras. Do ponto de vista deles, a bolha do hype para a construção de modelos de IA acabará por entrar em colapso, deixando para trás um modelo gigante de Inteligência Geral Artificial (AGI) que pode ser usado para tudo e qualquer coisa. Possuir exclusivamente tal modelo seria a empresa mais poderosa do mundo. O tamanho deste prêmio deu início a uma corrida armamentista por mais e mais GPUs, com um novo zero adicionado ao número de parâmetros de treinamento a cada poucos meses.
Acreditamos que esta visão está errada. Não haverá um modelo único que governe o universo, nem no próximo ano ou na próxima década. Em vez disso, o futuro da IA será multimodal.
Modelos de linguagem são objetos difusos
O Dicionário Oxford de Economia Define mercadoria como “algo padronizado que se compra e vende em quantidade e cujas unidades são intercambiáveis”. Os modelos de linguagem são materiais em dois sentidos importantes:
- Os próprios modelos tornam-se intercambiáveis em uma ampla gama de tarefas;
- A experiência de investigação necessária para produzir estes modelos está a tornar-se mais distribuída e acessível, com os laboratórios de fronteira já não se superando uns aos outros e com investigadores independentes na comunidade de código aberto a seguirem-lhes os calcanhares.
Mas mesmo quando os modelos linguísticos são mercantilizados, eles o fazem de forma inconsistente. Há um grande núcleo de capacidades que são adequadas para lidar com qualquer modelo, desde o GPT-4 até o Mistral Small. Ao mesmo tempo, à medida que avançamos em direção a limites e estados marginais, vemos variações cada vez maiores, à medida que alguns provedores de modelos se especializam expressamente em geração de código, raciocínio, geração de aumento de recuperação (RAG) ou matemática. É uma tarefa interminável de caligrafia, pesquisa no reddit, avaliação e ajuste fino para encontrar o modelo perfeito para cada trabalho.
Quando os modelos de linguagem são mercadorias, eles são descritos com mais precisão Itens obscuros. Para muitos casos de uso, os modelos de IA são quase intercambiáveis, com métricas como custo e latência determinando qual modelo usar. Mas no limite das capacidades acontece o contrário: os modelos continuam a especializar-se e a divergir cada vez mais. Por exemplo, Deepseek-V2.5 é codificado em C# em vez de GPT-4o, mas tem uma fração do tamanho e é 50 vezes mais barato.
Estas duas dinâmicas – comoditização e especialização – desenraizam a tese de que um modelo é mais adequado para lidar com todos os casos de utilização possíveis. Em vez disso, apontam para um cenário progressivamente fragmentado para a IA.
Orquestração e roteamento multimodal
Existe uma analogia adequada para a dinâmica de mercado dos modelos de linguagem: o cérebro humano. A estrutura dos nossos cérebros permaneceu inalterada durante 100.000 anos, e os cérebros são mais semelhantes do que diferentes. Durante a maior parte do nosso tempo na Terra, a maioria das pessoas aprendeu as mesmas coisas e teve as mesmas habilidades.
Mas então algo mudou. Desenvolvemos a capacidade de nos comunicarmos por meio da linguagem – primeiro na fala, depois na escrita. Os protocolos de comunicação facilitam as redes e, à medida que os humanos começaram a se conectar uns com os outros, também começamos a nos especializar em graus cada vez maiores. Para sermos ilhas autossuficientes, estamos livres do fardo de sermos generalistas em todos os domínios. Paradoxalmente, a riqueza colectiva de conhecimentos significa que a pessoa média de hoje é um generalista muito mais forte do que qualquer um dos nossos antepassados.
Num espaço de entrada suficientemente amplo, o universo sempre tende à especialização. Isso é verdade em todos os sentidos, na química molecular, na biologia e na sociedade humana. Dada variedade suficiente, os sistemas distribuídos serão sempre mais eficientes computacionalmente do que os monólitos. Acreditamos que o mesmo se aplica à IA. Quanto mais pudermos aproveitar os pontos fortes de múltiplos modelos em vez de depender apenas de um, mais esses modelos poderão especializar-se e expandir os horizontes das capacidades.
Um método importante para melhorar a robustez dos modelos multivariados é o roteamento – encaminhando as consultas para o modelo mais apropriado e otimizando modelos mais baratos e mais rápidos sem comprometer a qualidade. O roteamento nos permite aproveitar todas as vantagens da especialização – maior precisão com menores custos e latência – sem abrir mão de qualquer robustez da generalização.
Uma demonstração simples do poder do roteamento pode ser vista no fato de que a maioria dos principais modelos do mundo são roteadores: eles são construídos usando Mistura Especializada Estruturas que levam cada geração de token subsequente a algumas dezenas de submodelos especializados. Se for verdade que os LLMs multiplicam exponencialmente objetos difusos, então o roteamento deve ser uma parte essencial de toda pilha de IA.
Há uma noção de que os LLMs atingirão um patamar quando atingirem a inteligência humana – quando saturarmos totalmente as habilidades, convergiremos em torno de um modelo comum, como convergimos em torno da AWS ou do iPhone. Nenhuma dessas plataformas (ou seus concorrentes) teve 10 vezes mais capacidades dos últimos dois anos – então podemos nos sentir confortáveis com seus ecossistemas. No entanto, acreditamos que a IA não se limita à inteligência a nível humano; Ele transcende todos os limites que possamos imaginar. Ao fazê-lo, tal como outros sistemas naturais, torna-se cada vez mais fragmentado e especializado.
Não podemos exagerar o quanto a fragmentação do modelo de IA é uma coisa boa. Os mercados fragmentados são mercados eficientes: capacitam os compradores, aumentam a inovação e reduzem custos. Estamos caminhando em direção a um futuro mais seguro, mais interpretável e mais sustentável para a IA, na medida em que podemos usar uma rede de modelos menores e mais especializados, em vez de enviar tudo pelas entranhas de um modelo gigante.
As maiores invenções não têm donos. Os herdeiros de Ben Franklin não possuíam eletricidade. O patrimônio de Turing não pertence a todos os computadores. A IA é sem dúvida uma das maiores invenções da humanidade; Acreditamos que o seu futuro será multimodal.
Zach Cos é o ex-presidente de Go-to-Market OpenAI.
Tomás Hernando Kofman é cofundador e CEO Não é um diamante.
Tomadores de decisões de dados
Bem-vindo à comunidade VentureBeat!
Os tomadores de decisão de dados são especialistas, incluindo técnicos que trabalham com dados, que podem compartilhar insights e inovações relacionadas a dados.
Se você quiser ler sobre ideias de ponta e informações atualizadas, melhores práticas e o futuro dos dados e da tecnologia de dados, junte-se a nós no DataDecisionMakers.
Você pode até considerar enviar seu próprio artigo!
Leia mais em DataDecisionMakers