Alibaba apresenta um rival “open source” ao modelo de IA da OpenAI

A group of people riding scooters in front of alibaba building

O que aconteceu: A equipe Qwen, da Alibaba, lançou o modelo de inteligência artificial QwQ-32B-Preview, um sistema projetado para raciocínio lógico que desafia os modelos o1 da OpenAI. O QwQ-32B é o primeiro modelo deste tipo a ser disponibilizado sob uma licença permissiva, permitindo uso comercial.


Por que importa:

O mercado de IA está em rápida expansão, e modelos que priorizam raciocínio lógico são raros. Com 32,5 bilhões de parâmetros, o QwQ-32B-Preview promete maior capacidade para resolver problemas lógicos e matemáticos do que seus concorrentes. Isso posiciona a Alibaba como um player relevante no desenvolvimento de IA de código aberto.


Detalhes técnicos:

  • Dimensões do modelo: O QwQ-32B-Preview possui 32,5 bilhões de parâmetros, enquanto a OpenAI não revela o tamanho exato de seus modelos o1.
  • Desempenho: Supera os modelos o1 da OpenAI nos benchmarks AIME e MATH, focados em resolver problemas matemáticos e de raciocínio.
  • Capacidade: Processa entradas com até 32.000 palavras, uma característica útil para análises extensas e tarefas complexas.

Contexto:

Este lançamento ocorre no momento em que a Alibaba intensifica seus investimentos em IA, incluindo a recente introdução de mais de 100 modelos de código aberto da família Qwen 2.5. Esses esforços mostram uma estratégia dupla: reforçar a pesquisa em IA e democratizar seu uso por meio de ferramentas acessíveis e licenciadas.


Desafios e limitações:

Apesar de seus avanços, o QwQ-32B-Preview apresenta limitações:

  • Mudanças inesperadas de idioma: O modelo pode trocar de língua sem aviso.
  • Loopings: Há casos onde ele não consegue concluir tarefas, especialmente quando exigem raciocínio de senso comum.
  • Restrições políticas: O modelo evita responder a questões sensíveis, como as relacionadas ao massacre da Praça Tiananmen.

O que estão dizendo:

“O QwQ-32B oferece uma abordagem diferenciada ao raciocínio em IA, mas sua abertura é parcial,” afirma um comunicado da equipe Qwen. A licença Apache 2.0 permite usos comerciais, mas a ausência de alguns componentes impede a reprodução completa do modelo.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima