OpenAI lança o modelo generativo de IA o1, focado em análise e raciocínio avançado

Novo sistema pode solucionar problemas matemáticos complexos e desafios de programação, mas ainda tem limitações, como o alto custo e restrições de uso

A OpenAI apresentou nesta quinta-feira, 12, seu novo modelo de inteligência artificial, o o1, que promete avanços significativos em tarefas que envolvem raciocínio complexo. Na verdade, o o1 é uma coleção de modelos, sendo dois deles já disponíveis: o1-preview e o1-mini, voltado para geração de código. Para acessá-los, é necessário estar inscrito no ChatGPT Plus ou Team, enquanto usuários empresariais e educacionais terão acesso na próxima semana.

Embora ainda não tenha sido testado amplamente, o modelo apresentou avanços promissores/Foto: Anadolu Agency/Getty Images

Diferente do ChatGPT, o o1 ainda não pode navegar na web ou analisar arquivos. A versão atual do modelo oferece uma experiência limitada, com análises de imagens temporariamente desativadas para ajustes. Além disso, seu uso é restrito, com limites semanais de 30 mensagens para o o1-preview e 50 para o o1-mini.

O modelo também traz um custo elevado para desenvolvedores: o o1-preview custa US$ 15 por 1 milhão de tokens de entrada (três vezes mais caro que o GPT-4o) e US$ 60 por 1 milhão de tokens de saída (quatro vezes o custo do GPT-4o).

OpenAI afirma que o o1 se destaca ao resolver desafios matemáticos e de programação, com a capacidade de “pensar” antes de responder a consultas. O modelo sintetiza os resultados de várias subtarefas, o que o torna eficaz para atividades como detectar e-mails privilegiados em uma caixa de entrada jurídica ou desenvolver estratégias de marketing.

Desempenho aprimorado em tarefas complexas

o1 foi treinado com reinforcement learning, que o ensina a “pensar” antes de responder, utilizando uma cadeia de pensamento privada. Segundo Noam Brown, cientista da OpenAI, isso se deve a um novo algoritmo de otimização e um conjunto de dados de “raciocínio”, contendo literatura científica ajustada para os modelos.

Embora ainda não tenha sido testado amplamente, o modelo apresentou avanços promissores. Em um exame qualificatório da Olimpíada Internacional de Matemática, o o1 solucionou corretamente 83% dos problemas, enquanto o GPT-4o conseguiu apenas 13%. Além disso, o modelo alcançou o percentil 89 em competições de programação online, como o Codeforces.

Porém, o o1 também tem desvantagens. Ele pode ser mais lento para responder a algumas consultas, levando mais de 10 segundos para certas questões. Outro ponto negativo é que a OpenAI optou por não mostrar as “cadeias de pensamento” geradas pelo modelo, apresentando apenas um resumo delas.

A expectativa agora é que a OpenAI torne o o1 amplamente disponível e explore novas versões que possam raciocinar por horas, dias ou até semanas para melhorar ainda mais suas habilidades.

PUBLICIDADE