Apps & Software

GPT-4o: nova versão do ChatGPT interage com imagem e voz

Créditos/Foto:DepositPhotos
14/Maio/2024
Bianca Bellucci

A OpenAI, desenvolvedora do ChatGPT, anunciou nesta segunda-feira (13) o GPT-4o. Trata-se da nova versão do modelo de Inteligência Artificial (IA) da empresa e a primeira a interpretar textos, imagens e áudios em tempo real por conta própria. A novidade chega gratuitamente nas próximas semanas.

Quer ficar por dentro do mundo da tecnologia e ainda baixar gratuitamente nosso e-book Manual de Segurança na Internet? Clique aqui e assine a newsletter do 33Giga

A promessa é que o GPT-4o permitirá interações usando texto, voz e “visão”, o que significa que ele pode “visualizar” capturas de tela, fotos, documentos ou gráficos enviados pelos usuários e conversar sobre eles. Também promete aprender com conversas anteriores e fazer tradução em tempo real.

O objetivo com a atualização é ter respostas em uma velocidade mais parecida com a de uma conversa real. Segundo a OpenAI, o GPT-4o leva, em média, 320 milissegundos para responder comandos de áudio. A empresa diz que ele é muito mais veloz que os modelos antecessores: em média, o GPT-3.5 leva 2,8 segundos e o GPT-4, que é pago, toma 5,4 segundos.

Para demonstrar a evolução da tecnologia, a OpenAI divulgou uma série de vídeos. Em um deles, uma pessoa pede para o ChatGPT avaliar sua roupa para uma entrevista de emprego. Em outro, a ferramenta foi usada para criar uma música. Assista ao segundo exemplo:

Harmonizing with two GPT-4os pic.twitter.com/GerFmdzpMI

— OpenAI (@OpenAI) May 13, 2024

De acordo com a OpenAI, na versão gratuita, haverá um limite de mensagens que poderão ser trocadas com o GPT-4o. Quando atingido, o ChatGPT mudará automaticamente para o GPT-3.5 – versão anterior e gratuita. Os assinantes do serviço, por sua vez, poderão processar “cinco vezes” mais conteúdos.

*Fontes: CNN Brasil, G1 e O Globo