OpenAI lança modelo de raciocínio mais avançado de sua história

Sem muito alarde, empresa liberou o3 e o4-mini.

Sem muito alarde, OpenAI anunciou nesta quarta-feira (16) o lançamento de dois novos modelos de IA: o o3 e o4-mini. O o3 é considerado o modelo de raciocínio mais avançado da empresa até agora, superando todos os anteriores. Já o o4-mini oferece equilíbrio entre preço, velocidade e desempenho.

Ambos podem gerar respostas usando ferramentas do ChatGPT, como a possibilidade de navegar na internet, e contam com processamento de imagem. Ou seja, eles podem “pensar com imagens”.

E tem mais: apesar de ser o modelo de raciocínio mais avançado da desenvolvedora até agora, o o3 está sendo ofertado por um preço bem baixo.

OpenAI lança mais dois modelos de raciocínio

Modelos de raciocínio são uma das grandes apostas do setor de IA. Eles conseguem dividir uma tarefa em diferentes etapas e revelar qual foi a linha de pensamento para chegar até uma resposta, permitindo a resolução de tarefas complexas com mais segurança.

Leia mais

O o3 é considerado o modelo de raciocínio mais avançado da OpenAI até agora, superando modelos anteriores em testes de matemática, codificação, raciocínio, ciências e compreensão visual. Segundo a empresa em comunicado, o sistema atingiu 69,1% de desempenho de ponta em um teste que mede habilidades de codificação.

O o4-mini pode não ser tão poderoso quanto o ‘irmão’, mas é considerado um bom equilíbrio entre velocidade, desempenho e preço – fatores que são levados em conta na hora de assinar um serviço de IA. Mas também não fica muito para trás: no mesmo teste de codificação, ele teve desempenho de 68,1%.

A título de comparação, o o3-mini tirou 49,3% e o Claude 3.7 Sonnet tirou 62,3%.

E ao contrário dos modelos anteriores da desenvolvedora, o3 e o4-mini podem gerar respostas usando ferramentas do ChatGPT (como navegação web), processar e gerar imagens, e executar códigos Phyton.

Comparação do desempenho dos modelos em um teste de codificação (Imagem: OpenAI/Reprodução)

No caso do processamento de imagens, a OpenAI afirma que ambos são os primeiros capazes de “pensar com imagens“. Basicamente, usuários poderão enviar imagens ao ChatGPT com um prompt (de edição, por exemplo) e os modelos poderão analisar o material e “pensar” antes de realizar uma ação.

Um terceiro modelo, o o4-mini-high (uma variante do o4-mini), também está sendo lançado nesta quarta-feira. A diferença é que ele toma ainda mais tempo para responder uma ação, permitindo uma cadeia de pensamento mais elaborada e, consequentemente, melhorando a confiabilidade do resultado.

Modelos o3 e o4-mini são capazes de analisar imagens (Imagem: OpenAI/Reprodução)

Modelos serão baratos (mas não muito)

Os três modelos já estão disponíveis para assinantes dos planos Pro, Plus e Team da OpenAI.

O preço cobrado por eles é considerado relativamente baixo. Veja:

  • O o3 custa US$ 10 (cerca de R$ 59) a cada um milhão de tokens de entrada (cerca de 750 mil palavras) e US$ 40 (cerca de R$ 235) a cada um milhão de tokens de saída;
  • O o4-mini custa o mesmo que o o3-mini: US$ 1,10 (cerca de R$ 6,50) por milhão de tokens de entrada e US$ 4,40 (cerca de R$ 25) por milhão de tokens de saída.
Logo da OpenAI em um smartphone na horizontal
OpenAI pode estar planejando mais uma novidade (Imagem: jackpress / Shutterstock.com)

OpenAI tem mais novidades em mente

A OpenAI quase não lançou o o3 no ChatGPT. O CEO da empresa, Sam Altman, disse em fevereiro que focaria em recursos mais sofisticados para usar o modelo. Aparentemente, ele mudou de ideia.

O lançamento vem em um momento em que as principais companhias do setor correm atrás de seus próprios modelos de raciocínio. É o caso do Google (com o Gemini), xAI (com o Grok) e Anthropic (com o Claude). A OpenAI foi a primeira a liberar um modelo deste tipo, o o1, mas não se contentou em ser a pioneira.

Além disso, segundo o site TechCrunch, a empresa estaria planejando lançar o o3-Pro, uma versão do o3 que usa mais recursos de computação, em breve. A ideia é que ele esteja disponível apenas para assinantes do ChatGPT Pro.

No entanto, a febre dos modelos de raciocínio pode ser pausada – pelo menos na OpenAI. Altman indicou que o o3 e o4-mini podem ser os últimos modelos “independentes”, antes que a companhia una tudo dentro de um único modelo (como o recente GPT-4.1).

OLHAR DIGITAL