GPT-4 retoma a primeira posição no ranking das LLM’s e aparição misteriosa do gpt-2-chatbot

Há aproximadamente um mês, tínhamos visto o modelo Claude 3 da Anthropic ultrapassar o GPT-4 turbo no ranking da Arena Chatbot, porém com o lançamento do GPT-4-Turbo-2024-04-09, a OpenAI voltou a ficar no topo (e com uma boa margem) do ranking.

Abaixo está disponível o ranking atualizado das LLM’s que estão no topo. Vale lembrar que hoje em dia existem centenas de modelos.

Rank* (UB)🤖 Model⭐ Arena Elo📊 95% CI🗳️ VotesOrganizationLicenseKnowledge Cutoff
1GPT-4-Turbo-2024-04-091257+4/-330562OpenAIProprietary2023/12
1GPT-4-1106-preview1253+3/-369871OpenAIProprietary2023/4
2Claude 3 Opus1251+3/-375684AnthropicProprietary2023/8
2Gemini 1.5 Pro API-0409-Preview1248+4/-333723GoogleProprietary2023/11
3GPT-4-0125-preview1247+2/-361924OpenAIProprietary2023/12
6Bard (Gemini Pro)1209+5/-512388GoogleProprietaryOnline
6Llama-3-70b-Instruct1207+4/-427298MetaLlama 3 Community2023/12
6Claude 3 Sonnet1202+3/-375418AnthropicProprietary2023/8
9Command R+1192+3/-341262CohereCC-BY-NC-4.02024/3
9GPT-4-03141189+4/-348390OpenAIProprietary2021/9
Créditos: LMSYS Chatbot Arena Leaderboard

Uma informação curiosa surgiu recentemente: uma nova LLM com o nome de GPT-2-chatbot, com capacidades impressionantes, superando até mesmo o GPT-4 e o Opus em algumas comparações. Desde então, começou a surgir especulação sobre se ela seria o GPT-4.5 ou até mesmo o GPT-5, mas, por enquanto, são apenas especulações. O próprio Sam Altman brincou no X dizendo que tem uma queda pelo gpt2.

“Eu realmente tenho uma queda pelo gpt2”

– Sam Altman

A postagem de Altman foi editada posteriormente para alinhar o nome do modelo com o nome do chatbot misterioso – uma versão anterior se referia ao modelo como “gpt-2”, de acordo com a nomenclatura da OpenAI. Isso, juntamente com o timing do tweet, sugere que ele está falando sobre esse novo sistema em vez de estar relembrando o passado com carinho.

O termo “GPT-2” está em tendência no X após o lançamento do chatbot misterioso, com muitos usuários especulando sobre a origem do bot e compartilhando pensamentos sobre suas capacidades. Resta aguardar para ver o que a OpenAI tem reservado e como esse mercado altamente competitivo de IA vai evoluir.

1 comentário em “GPT-4 retoma a primeira posição no ranking das LLM’s e aparição misteriosa do gpt-2-chatbot”

  1. Pingback: OpenAI anuncia novo modelo de LLM o GPT-4o - Horizonte AI

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima