CEO do Google DeepMind, afirma que seu próximo algoritmo vai 'eclipsar' o ChatGPT

Em 2016, um programa de inteligência artificial chamado AlphaGo, do laboratório de IA DeepMind do Google, fez história ao derrotar um campeão de jogos de tabuleiro chamado Go. Agora, Demis Hassabis, cofundador e CEO da DeepMind, diz que seus engenheiros estão usar técnicas AlphaGo para criar um sistema de IA chamado Gemini que, segundo ele, será mais capaz do que o ChatGPT da OpenAI.

O Gemini da DeepMind, ainda em desenvolvimento, é um ótimo modelo linguístico que trabalha com texto e é semelhante em natureza ao GPT-4, que alimenta o ChatGPT. Mas, como relatado pela Wired, Hassabis diz que sua equipa combinará essa tecnologia com técnicas usadas no AlphaGo com o objetivo de fornecer ao sistema novas capacidades, como planeamento ou a capacidade de resolver problemas.

"Num alto nível, podemos pensar no Gemini como uma combinação de alguns dos pontos fortes de sistemas semelhantes ao AlphaGo com as incríveis capacidades de linguagem de modelos grandes", diz Hassabis. "Temos também algumas inovações que vão ser muito interessantes", acrescentou.

O Gemini foi revelado pela primeira vez na conferência de developers do Google no mês passado, quando a empresa anunciou uma série de novos projetos de IA.

O AlphaGo, por sua vez, foi baseado numa técnica pioneira da DeepMind chamada aprendizagem por reforço, na qual o software aprende a lidar com problemas difíceis que exigem escolher quais ações executar, como em Go ou videogames, fazendo repetidas tentativas e recebendo feedback sobre seu desempenho. Ele também usou um método chamado tree search para explorar e lembrar possíveis movimentos no tabuleiro. O próximo grande salto nos modelos de linguagem pode ser que eles executem mais tarefas na Internet e nos computadores.

Gemini ainda está em desenvolvimento, um processo que levará vários meses, diz Hassabis. Pode custar dezenas ou centenas de milhões de dólares. Sam Altman, CEO da OpenAI, disse em abril que a criação do GPT-4 custou mais de US$ 100 milhões.

Gemini pode desempenhar um papel fundamental

Quando o Gemini estiver concluído, poderá desempenhar um papel fundamental na resposta do Google à ameaça competitiva representada pelo ChatGPT e outras tecnologias de IA generativa. A empresa de pesquisa foi pioneira em muitas das técnicas que permitiram a recente torrente de novas ideias de IA, mas optou por desenvolver e implantar produtos baseados nestas com cautela.

Desde a estreia do ChatGPT, o Google lançou seu próprio chatbot, o Bard, e incorporou IA generativa em seu mecanismo de busca e muitos outros produtos. Para impulsionar a pesquisa de IA, a empresa combinou em abril a unidade DeepMind da Hasssabis com o principal laboratório de IA do Google, o Brain, para criar o Google DeepMind. Hassabis diz que a nova equipe reunirá duas potências que foram fundamentais para o progresso recente da IA.

"Se você olhar para onde estamos em IA, eu diria que 80 ou 90% das inovações vêm de um ou outro", diz Hassabis. "Há coisas brilhantes que ambas as organizações fizeram na última década." Hassabis tem experiência em navegar na corrida do ouro da IA que abala os gigantes da tecnologia, embora da última vez tenha sido ele quem desencadeou o frenesi.

Em 2014, a DeepMind foi adquirida pela Google depois de demonstrar resultados surpreendentes de um software que utilizava a aprendizagem por reforço para dominar videojogos simples. Ao longo dos anos seguintes, a DeepMind demonstrou como a técnica faz coisas que antes pareciam exclusivamente humanas, muitas vezes com habilidades sobre-humanas. Quando o AlphaGo venceu o campeão do Go Lee Sedol em 2016, muitos especialistas em IA ficaram chocados, porque acreditavam que levaria décadas até que as máquinas dominassem um jogo de tamanha complexidade.

Aprendizagem automática

Treinar um grande modelo linguístico como o GPT-4 da OpenAI envolve alimentar grandes quantidades de texto de livros, páginas da web e outras fontes em um software de aprendizado de máquina conhecido como transformador. Ele usa os padrões desses dados de treinamento para se tornar um especialista em prever as letras e palavras que devem seguir um pedaço de texto, um mecanismo simples que é surpreendentemente poderoso ao responder perguntas e gerar texto ou código.

Um passo adicional importante na criação do ChatGPT e outros modelos linguísticos semelhantes é o uso da aprendizagem por reforço baseada no feedback humano sobre as respostas de um modelo de IA para refinar seu desempenho. A vasta experiência da DeepMind em aprendizagem por reforço pode permitir que seus pesquisadores equipem a Gemini com novas capacidades.

Hassabis e sua equipe também poderiam tentar melhorar a tecnologia de grandes modelos linguísticos com ideias de outras áreas da IA. Os investigadores da DeepMind trabalham em áreas que vão da robótica à neurociência, e no início desta semana a empresa demonstrou um algoritmo capaz de aprender a executar tarefas de manipulação com uma vasta gama de diferentes braços robóticos.

Aprender com a experiência física do mundo, como fazem os seres humanos e os animais, é considerado importante para aumentar a capacidade da IA. O facto de os modelos linguísticos aprenderem sobre o mundo indiretamente, através do texto, é considerado por alguns especialistas em IA como uma grande limitação.

Futuro sombrio

Hassabis foi encarregado de acelerar os esforços de IA do Google enquanto gere riscos desconhecidos e potencialmente graves. Os recentes avanços rápidos nos modelos linguísticos deixaram muitos especialistas em IA (incluindo alguns que constroem os algoritmos) preocupados se a tecnologia será usada para fins malévolos ou difíceis de controlar. Alguns especialistas em tecnologia chegaram a pedir a suspensão do desenvolvimento de algoritmos mais poderosos para evitar a criação de algo perigoso.

Como aponta a Wired, Hassabis diz que os extraordinários benefícios potenciais da IA, por exemplo, para descobertas científicas em áreas como saúde ou clima, tornam imperativo que a humanidade não pare de desenvolver a tecnologia. Ele também acredita que impor uma pausa é impraticável, pois seria quase impossível de implementar. "Se feito corretamente, será a tecnologia mais benéfica para a humanidade", diz sobre a IA.

Isso não significa que Hassabis defenda que o desenvolvimento da IA prossiga com pressa. A DeepMind tem explorado os riscos potenciais da IA desde antes do surgimento do ChatGPT, e Shane Legg, um dos cofundadores da empresa, liderou por anos um grupo de "segurança de IA" dentro da empresa. No mês passado, Hassabis juntou-se a outras figuras importantes da IA para assinar uma declaração alertando que a IA poderia um dia representar um risco comparável a uma guerra nuclear ou pandemia.

Um dos maiores desafios da atualidade, de acordo com Hassabis, é determinar quais podem ser os riscos de uma IA mais capaz. "Acho que mais pesquisas precisam ser feitas neste campo – com muita urgência – em coisas como testes de avaliação", diz ele, para determinar o quão capazes e controláveis são os novos modelos de IA.

Para fazer isso, a DeepMind poderia disponibilizar seus sistemas para cientistas externos. "Eu adoraria que a academia tivesse acesso antecipado a esses modelos de ponta", diz ele, uma ideia que, se concretizada, poderia ajudar a resolver as preocupações de que especialistas fora das grandes empresas estão a ser deixados de fora das pesquisas mais recentes de IA.

Até que ponto devemos nos preocupar? Hassabis diz que ninguém sabe ao certo se a IA se tornará um perigo sério. Mas está confiante de que, se os progressos continuarem ao ritmo atual, não há muito tempo para desenvolver salvaguardas. "Vejo bem o tipo de coisas que estamos incorporando na série Gemini, e não temos motivos para acreditar que não funcionarão", diz.

Fonte: Wired