Phi-2, Imagen-2, Optimus-Gen-2: Pequenos Novos Modelos para Mudar o Mundo?

Phi-2, Imagen-2, Optimus-Gen-2: Pequenos Novos Modelos para Mudar o Mundo?

March 17, 2024
Partilhar
Autor: Big Y

🤖 A Ascensão do F2: Uma Mudança de Jogo na IA Generativa

No mundo da IA generativa, 2023 deveria ser um ano de desaceleração, com mais foco em festividades do que em modelos e no MMLU. No entanto, esta semana viu o anúncio de novos modelos pequenos e poderosos que poderiam mudar o cenário da IA em 2024. Neste artigo, vamos dar uma olhada mais de perto no F2, o que ele significa e como se compara a outros modelos. Também vamos explorar a Loucura da brinkmanship do MML, o Optimus Gen 2 e muito mais.

🤖 O que é o F2?

O F2 é um modelo com 2,7 bilhões de parâmetros, o que é pequeno pelos padrões atuais. Na verdade, é tão pequeno que poderia caber localmente em um smartphone, de acordo com benchmarks. Apesar de seu tamanho, o F2 supera modelos de tamanho comparável, como os treinados usando o Mamba, bem como o novo Gemini Nano do Google. Ele também supera modelos de 202-25 vezes o seu tamanho.

🤖 A Série dos Cinco Modelos

A série dos Cinco modelos está em desenvolvimento desde o final de junho, quando Ronan Lan, um dos principais autores do artigo original do F1, foi entrevistado. Havia fortes indícios da importância do F1 no vídeo original de 2 de julho sobre "livros didáticos são tudo o que você precisa". O F1 obteve 50% na avaliação humana, um benchmark de codificação, e tudo isso funciona tão bem que para o F1.5 anunciado em setembro, exercícios sintéticos foram adicionados em raciocínio de senso comum, lógica, ciência e teoria da mente. Além disso, eles treinaram apenas com dados sintéticos, deixando aqueles dados adicionais filtrados para um modelo separado chamado 5.1.5 web.

🤖 O Lançamento do F2

O F2 foi lançado nas últimas 24 horas, com 2,7 bilhões de parâmetros treinados em apenas 14 dias em menos de 100 GPUs A100. Para referência, é relatado que a Microsoft tem até 150.000 H100s, o sucessor dos A100s. Mais parâmetros significam mais conexões que podem ser feitas e, com mais poder de processamento, é claro, isso significa que eles podem alimentar mais dados e revisar esses dados mais vezes. A quantidade de dados, incluindo leituras repetidas ou EPO, foi de 1,4 trilhão de tokens, o que é cinco vezes mais do que o F1.1.5 web.

🤖 Os Benefícios dos Dados Sintéticos

Um benefício adicional de treinar com dados sintéticos é que eles tendem a ser menos tóxicos. As pontuações de toxicidade diminuíram em todos os aspectos para o F2, e há tantas lições potenciais do F2. Como um dos pesquisadores do projeto disse: "Nossos esforços com o F2 provam que temos desperdiçado enormes quantidades de poder de processamento em dados de treinamento bastante ineficazes".

🤖 Comparação com o Gemini Nano 2 e o Mistal

A comparação com o Gemini Nano 2 e o Mistal, ambos com 7 bilhões de parâmetros, mostra que o F2 é uma mudança de jogo no mundo da IA generativa. No entanto, dado que um dos outros tópicos deste vídeo será sobre as falhas dos benchmarks, é importante observar que não podemos confiar totalmente nesses números de benchmark.

🤖 As Falhas dos Benchmarks

O MMLU é um benchmark falho em muitos aspectos. Por exemplo, a pergunta "quando uma atitude é comunicada, o que ela se torna?" tem respostas que são A, B, C ou D, mas o texto diz "redução da demanda". O MMLU também possui erros de digitação, ambiguidade gramatical e ambiguidade de formatação ao longo do teste.

🤖 A Ascensão do Optimus Gen 2

Além do F2, também vimos o lançamento do Optimus Gen 2, um robô humanoide da Tesla 10 kg mais leve na segunda geração. Assistir a este vídeo me faz pensar na sensibilidade ao toque, temperatura e pressão como modalidades totalmente novas ainda a serem exploradas.

🤖 O Nível AI Insiders no Patreon

Hoje é o lançamento completo do nível AI Insiders no Patreon. Esse nível inclui vídeos clássicos de explicação de IA, conteúdo extra, o podcast AI Insiders, tutoriais e a Insiders Arena. A Insiders Arena é onde você e qualquer outro membro com paixão por IA podem enviar explicações, e as melhores delas terão uma participação especial no AI explained.

🤖 Conclusão

Em conclusão, o F2 é uma mudança de jogo no mundo da IA generativa. Ele é pequeno, mas supera modelos de tamanho comparável e modelos de 202-25 vezes o seu tamanho. Os benefícios dos dados sintéticos são claros, assim como as falhas dos benchmarks. A ascensão do Optimus Gen 2 e o lançamento do nível AI Insiders no Patreon também são desenvolvimentos empolgantes no mundo da IA.

- End -
VOC AI Inc. 8 The Green,Ste A, in the City of Dover County of Kent, Delaware Zip Code: 19901 Copyright © 2024 VOC AI Inc.All Rights Reserved. Termos e Condições Política de Privacidade
Este sítio Web utiliza cookies
A VOC AI utiliza cookies para garantir o bom funcionamento do site, para armazenar algumas informações sobre as suas preferências, dispositivos e acções passadas. Estes dados são agregados ou estatísticos, o que significa que não poderemos identificá-lo individualmente. Pode encontrar mais pormenores sobre os cookies que utilizamos e como retirar o consentimento na nossa Política de Privacidade.
Utilizamos o Google Analytics para melhorar a experiência do utilizador no nosso sítio Web. Ao continuar a utilizar o nosso sítio, está a consentir a utilização de cookies e a recolha de dados pelo Google Analytics.
Aceita estes cookies?
Aceitar todos os cookies
Rejeitar todos os cookies