DBRX: O Novo Padrão para Modelos Open Source Eficientes da Databricks

Imagem mostrando celular com a logo da Databricks

A Databricks, empresa de Dados e IA, anunciou hoje o lançamento do DBRX, um modelo de linguagem grande (LLM) de propósito geral que supera todos os modelos open source estabelecidos em benchmarks padrão. O DBRX democratiza o treinamento e ajuste de LLMs personalizados de alto desempenho para todas as empresas, para não precisarem mais depender de um pequeno punhado de modelos fechados.

O DBRX supera modelos open source existentes como o Llama 2 70B e o Mixtral-8x7B em benchmarks padrão da indústria, como compreensão de linguagem, programação, matemática e lógica. Ele também supera o GPT-3.5 na maioria dos benchmarks relevantes.

Infográfico Databricks
Comparativo com outros modelos Open Source em: entendimento de linguagem, programação e matemática.

Arquitetura Eficiente

Desenvolvido pela Mosaic AI e treinado na NVIDIA DGX Cloud, o DBRX foi otimizado para eficiência com uma arquitetura de mistura de especialistas (MoE), construída sobre o projeto open source MegaBlocks. O modelo resultante tem desempenho líder e é até duas vezes mais eficiente em termos de computação do que outros LLMs líderes disponíveis.

O DBRX estabelece um novo padrão para modelos open source, permitindo IA generativa personalizável e transparente para todas as empresas. Uma pesquisa recente da Andreessen Horowitz descobriu que quase 60% dos líderes de IA estão interessados em aumentar o uso de open source ou mudar quando modelos open source com ajuste fino correspondem aproximadamente ao desempenho de modelos de código fechado.

Benefícios na Plataforma Data Intelligence

Combinado com as ferramentas unificadas da Databricks Mosaic AI, o DBRX ajuda os clientes a construir e implantar rapidamente aplicativos de IA generativa de qualidade de produção seguros, precisos e governados, sem abdicar do controle de seus dados e propriedade intelectual. Os clientes se beneficiam de recursos integrados de gerenciamento de dados, governança, linhagem e monitoramento na Plataforma Databricks Data Intelligence.

O DBRX está disponível gratuitamente no GitHub e Hugging Face para uso comercial e de pesquisa. A partir de hoje na Plataforma Databricks, as empresas podem interagir com o DBRX, aproveitar seus recursos de contexto longo em sistemas de geração aumentada de recuperação (RAG) e construir modelos DBRX personalizados em seus próprios dados exclusivos.

Com o lançamento do DBRX, a Databricks está permitindo que mais empresas construam modelos de IA generativa seguros, portáteis e de alto desempenho, personalizados para seus próprios dados e casos de uso. Isso deve acelerar a tendência de mudança do uso de modelos fechados para open source no futuro.

Comparativo com outros modelos de llm fechados

ModelDBRX
Instruct
GPT-3.57GPT-48Claude 3 HaikuClaude 3 SonnetClaude 3 OpusGemini 1.0 ProGemini 1.5 ProMistral MediumMistral Large
MT Bench (Inflection corrected, n=5)8.39 ± 0.088.41 ± 0.04 8.54 ± 0.099.03 ± 0.068.23 ± 0.088.05 ± 0.128.90 ± 0.06
MMLU 5-shot73.7%70.0%86.4%75.2%79.0%86.8%71.8%81.9%75.3%81.2%
HellaSwag 10-shot89.0%85.5%95.3%85.9%89.0%95.4%84.7%92.5%88.0%89.2%
HumanEval 0-Shot
pass@1
(Programming)
70.1% temp=0, N=148.1%67.0%75.9%73.0%84.9%67.7%71.9%38.4%45.1%
GSM8k CoT maj@172.8% (5-shot)57.1% (5-shot)92.0% (5-shot)88.9%92.3%95.0%86.5%(maj1@32)91.7% (11-shot)66.7% (5-shot)81.0% (5-shot)
WinoGrande 5-shot81.8%81.6%87.5%88.0%86.7%
Tabela: Qualidade do DBRX Instruct e principais modelos fechados. Além do MTBench com correção de inflexão (que medimos nos endpoints do modelo), os números foram relatados pelos criadores desses modelos em seus respectivos white papers. Créditos: Databricks

Fonte: Databricks, Yahoo Finance

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima