OpenAI lança o modelo o1, a sua primeira IA capaz de raciocinar
Os rumores estavam corretos. A OpenAI acaba de anunciar o o1 e o1-mini, os seus primeiros modelos de inteligência artificial com capacidades de raciocínio. Estes modelos tiram partido da tecnologia conhecida internamente como Strawberry e foram concebidos para resolver tarefas complexas em domínios como a ciência, a matemática e a programação.
Utilizadores gratuitos também poderão usar o modelo
Os novos modelos estão disponíveis nas versões pagas do ChatGPT, e uma versão mini será adicionada à versão gratuita num futuro próximo.
Nos nossos testes, a próxima atualização do modelo tem um desempenho semelhante ao dos estudantes de doutoramento em tarefas de referência exigentes em física, química e biologia.
Também descobrimos que ele se destaca em matemática e programação. Num exame de qualificação para a Olimpíada Internacional de Matemática (IMO), o GPT-4o resolveu apenas 13% dos problemas corretamente, enquanto o modelo de raciocínio obteve 83%.
Afirma a OpenAI.
A OpenAI lançou o o1 em modo de pré-visualização, pelo que ainda não integrou 100% das suas funcionalidades no ChatGPT. Isto significa que ainda não pode lidar com imagens, nem pode procurar informações na Web. A equipa de Sam Altman acredita que esta nova inteligência artificial representa um salto quântico em termos de capacidades, razão pela qual decidiram dar-lhe o nome de o1.
A startup publicou alguns vídeos com exemplos que mostram o novo modelo a resolver problemas e instruções complexas, e mesmo a responder a perguntas simples que outros modelos não conseguiram responder.
OpenAI o1 answers a famously tricky question for large language models. pic.twitter.com/5ZlQIOBWEd
— OpenAI (@OpenAI) September 12, 2024
ChatGPT ganha capacidades de raciocínio com o o1 e o1-mini da OpenAI
A OpenAI afirmou que o o1 foi treinado com um conjunto de dados personalizado e um novo algoritmo de otimização. Ao contrário do GPT-4o e dos modelos anteriores, esta IA não imita os seus padrões de formação, mas utiliza reinforcement learning para resolver os problemas que lhe são apresentados por si só.
A empresa disse também que o o1 é muito menos suscetível ao jailbreaking, ou seja, às tentativas dos utilizadores de contornar as suas salvaguardas.
Num dos nossos testes de jailbreak mais difíceis, o GPT-4o obteve 22 pontos (numa escala de 0 a 100), enquanto o nosso modelo o1-preview obteve 84 pontos.
Afirmam os criadores da IA.
Quanto ao o1-mini, é uma versão mais pequena e até 80% mais barata do o1. De acordo com a OpenAI, o o1-mini destaca-se especialmente em tarefas de programação. Um facto interessante que foi partilhado é o tempo que os seus novos modelos demoram a dar uma resposta de texto simples através do ChatGPT:
- Enquanto o GPT-4o respondeu em apenas 3 segundos, o o1-mini respondeu em 9 segundos e o o1 em 32 segundos. Esse tempo extra é o tempo que a nova IA gasta a pensar e a raciocinar sobre as suas respostas.
Os assinantes do ChatGPT Plus e Team já podem aceder ao o1 e o1-mini a partir do menu de seleção do modelo. Na próxima semana, os utilizadores dos planos Enterprise e Edu poderão também aceder. Como dissemos, a versão gratuita do ChatGPT receberá o o1-mini, embora ainda não se saiba quando.
Leia também:
Por certo há quem tenha instalado o ChatGPT nas primeiras versões, em que não tinha ligação à internet nem “falava” e por aí se ficou. Escrevia-se a questão em texto e obtinha-se a resposta em texto, com a informação que tinha disponível, inicialmente até 2021
A evolução tem sido acelerada. Na versão ChatGPT-4o:
– Estão disponíveis 4 vozes, 2 masculinas e 2 femininas, Ember, Cove, Juniper e Breeze, brasileiras. Num smartphone, pode se alterar, indo à conta, em definições > voz
– Para ouvir uma resposta, de texto, carrega-se no texto e surge um pop-up com “ler em voz alta”
– Mas pode-se ter um diálogo apenas por voz (questões e respostas) premindo o símbolo dos “auscultadores”. Saindo desse modo vê-se tudo em texto.
– Aguarda-se, a introdução, progressiva, por utilizador, de novas vozes/interlocutores artificiais: Fathom, Glimmer, Harp, Maple, Orbit, Rainbow, Reef, Ridge e Vale. Com os novos interlocutores poder-se-á ter um diálogo mais natural, como seja, interrompê-lo sem aguardar pelo fim da resposta.
Quanto a novos recursos, há diversos chat temáticos. Mas podem pedir apenas para fazer uma ilustração do vosso animal de estimação, dizendo, por exemplo, a raça e cor do cão e em que ambiente gosta de estar deitado. Ou outras ilustrações.
Do que se fala do post é de uma versão com respostas mais demoradas … mas mais pensadas.
Esta coisa dos chat IA é preciso ir acompanhando porque o desenvolvimento é muito rápido. Já está muito, mas muito, para lá das versões iniciais.
+1