Google Gemini: AlphaGo-GPT?

Google Gemini: AlphaGo-GPT?

March 17, 2024
Partilhar
Autor: Big Y

Tabela de Conteúdos

1. Introdução

2. Gemini: Um Sistema Mais Capaz

3. A Multi-modalidade do Gemini

4. Treinamento em Vídeos do YouTube

5. Robocat: Agente de Fundação Autoaperfeiçoável

6. Linhas do Tempo da AGI e Melhorias Potenciais

7. A Capacidade de Planejamento do Gemini

8. O Documento de Riscos Extremos da DeepMind

9. A Perspectiva de Demis Hasabis sobre IA

10. Implicações e Salvaguardas

Introdução

Em uma entrevista recente à revista Wired, Demis Hasabis, o chefe do Google DeepMind, fez algumas declarações provocativas sobre o próximo lançamento do Gemini, um sistema que ele afirma superar o Chachi PT da OpenAI em termos de capacidades. Hasabis mencionou a intenção de combinar as forças de sistemas do tipo alphago com as capacidades linguísticas de modelos grandes. Antes de explorar os detalhes de como isso pode funcionar, vamos fornecer algum contexto para o anúncio do Gemini feito por Sundar Pichai, CEO do Google.

Pichai enfatizou o foco deles em construir sistemas de IA mais capazes e responsáveis, incluindo o Gemini, seu modelo de fundação de próxima geração. Embora ainda em treinamento, o Gemini já está mostrando impressionantes capacidades multimodais não vistas em modelos anteriores. Pichai também deu indícios de novas inovações que serão introduzidas, prometendo desenvolvimentos interessantes. É importante não subestimar o histórico da DeepMind, pois eles estiveram por trás de conquistas inovadoras como AlphaGo, AlphaZero, AlphaStar e AlphaFold, que tiveram impactos significativos em várias áreas.

Gemini: Um Sistema Mais Capaz

O Gemini, projetado desde o início para ser altamente eficiente e multimodal, tem como objetivo integrar modelos de linguagem como o GPT-4 com técnicas usadas no AlphaGo. Essa fusão espera fornecer ao Gemini novas capacidades, como planejamento e resolução de problemas. O aspecto de planejamento lembra os sistemas anteriores da DeepMind, que demonstraram habilidades de planejamento de longo prazo. No entanto, o recente Documento de Riscos Extremos destacou os perigos potenciais do planejamento de longo prazo, enfatizando a necessidade de cautela e avaliação.

A Multi-modalidade do Gemini

Espera-se que a multi-modalidade do Gemini seja aprimorada por meio do treinamento em vídeos do YouTube. A OpenAI também extraiu dados do YouTube, incluindo não apenas transcrições de texto, mas também áudio, imagens e comentários. Isso levanta a questão de se o Google DeepMind poderá utilizar o YouTube para mais do que apenas dados de treinamento no futuro. A integração de modalidades diversas pode levar a sistemas de IA mais abrangentes e contextualmente ricos.

Treinamento em Vídeos do YouTube

O uso de vídeos do YouTube para treinar o Gemini abre novas possibilidades de aprendizado a partir de uma vasta gama de informações visuais e auditivas. Ao aproveitar o amplo conteúdo disponível no YouTube, o Gemini pode adquirir potencialmente uma compreensão mais ampla do mundo. Essa abordagem está alinhada com a tendência de usar conjuntos de dados em larga escala para treinar modelos de IA, permitindo que eles capturem uma ampla gama de conhecimentos e melhorem seu desempenho.

Robocat: Agente de Fundação Autoaperfeiçoável

O recente artigo da DeepMind sobre o Robocat apresenta um agente de fundação autoaperfeiçoável para manipulação robótica. Ele demonstra a capacidade de generalizar para novas tarefas e se adaptar usando um número relativamente pequeno de exemplos. O próprio modelo pode gerar dados para iterações de treinamento subsequentes, formando um bloco básico para melhoria autônoma. Esse conceito de usar o modelo para gerar dados lembra as discussões em torno de mecanismos de autoaperfeiçoamento como o AlphaZero, onde os modelos são treinados com processos de verificação e geram dados adicionais.

Linhas do Tempo da AGI e Melhorias Potenciais

As discussões em torno das linhas do tempo da AGI frequentemente giram em torno da disponibilidade de mais dados e de treinamentos mais longos. Os pesquisadores acreditam que ainda há espaço para melhorias com os dados existentes e dados sintéticos. A capacidade de gerar mais dados por meio de iterações de treinamento, como demonstrado pelo Robocat, oferece promessas para avançar as capacidades de IA. Embora seja desafiador prever as linhas do tempo da AGI, a convergência de várias direções de pesquisa sugere que progressos significativos possam ser feitos nos próximos cinco anos.

A Capacidade de Planejamento do Gemini

A capacidade de planejamento do Gemini, inspirada no AlphaGo, visa orientar o processo de busca de forma eficiente. Ao usar um modelo de linguagem para sugerir movimentos prováveis, a árvore de busca pode ser otimizada, levando a uma tomada de decisão mais eficaz. Essa abordagem tem se mostrado bem-sucedida em jogos como Go, onde simulações e dados desempenham um papel crucial. A intenção da DeepMind de incorporar o planejamento ao Gemini indica sua ambição de expandir as habilidades do sistema na resolução de problemas.

O Documento de Riscos Extremos da DeepMind

O Documento de Riscos Extremos da DeepMind destaca os perigos potenciais associados a sistemas de IA que possuem capacidades de planejamento de longo prazo. Adaptar planos diante de obstáculos ou adversários inesperados e generalizar para configurações novas pode introduzir riscos. A DeepMind reconhece a necessidade de pesquisa e avaliação para determinar a controlabilidade e as capacidades de novos modelos de IA. Eles também concederam acesso antecipado a seus modelos de Fundação para acadêmicos e organizações como a força-tarefa de IA do Reino Unido, enfatizando a importância da colaboração e das medidas de segurança.

A Perspectiva de Demis Hasabis sobre IA

Hasabis reconhece os extraordinários benefícios potenciais da IA, especialmente na descoberta científica, saúde e áreas relacionadas ao clima. Ele acredita que impor uma pausa no desenvolvimento da IA é impraticável e que a tecnologia, se desenvolvida corretamente, será a mais benéfica para a humanidade. Hasabis reconhece a necessidade de pesquisas urgentes em testes de avaliação para avaliar as capacidades e a controlabilidade de novos modelos de IA. O compromisso da DeepMind com a colaboração e o acesso antecipado para acadêmicos demonstra sua dedicação em abordar preocupações de segurança.

Implicações e Salvaguardas

O imenso poder de modelos avançados de IA levanta preocupações sobre seu potencial...

- End -
VOC AI Inc. 8 The Green,Ste A, in the City of Dover County of Kent, Delaware Zip Code: 19901 Copyright © 2024 VOC AI Inc.All Rights Reserved. Termos e Condições Política de Privacidade
Este sítio Web utiliza cookies
A VOC AI utiliza cookies para garantir o bom funcionamento do site, para armazenar algumas informações sobre as suas preferências, dispositivos e acções passadas. Estes dados são agregados ou estatísticos, o que significa que não poderemos identificá-lo individualmente. Pode encontrar mais pormenores sobre os cookies que utilizamos e como retirar o consentimento na nossa Política de Privacidade.
Utilizamos o Google Analytics para melhorar a experiência do utilizador no nosso sítio Web. Ao continuar a utilizar o nosso sítio, está a consentir a utilização de cookies e a recolha de dados pelo Google Analytics.
Aceita estes cookies?
Aceitar todos os cookies
Rejeitar todos os cookies