Orca: O Modelo Poucos Viram Chegar

Orca: O Modelo Poucos Viram Chegar

March 17, 2024
Partilhar
Autor: Big Y

🧐 Orca: O Novo Modelo Open Source Que Supera o GPT-3.5 e Empata com o GPT-4 em Testes de Raciocínio

Os modelos open source têm sido um tópico de discussão na comunidade de IA há algum tempo. Recentemente, um artigo concluiu que os modelos open source podem imitar o estilo, mas não a factualidade do chat GPT. No entanto, um novo relatório de 51 páginas sobre o Orca, baseado em um pequeno modelo de 13 bilhões de parâmetros, mostrou que ele supera o GPT-3.5 em vários benchmarks bem estabelecidos e até empata com o GPT-4 em alguns testes de raciocínio.

📝 Tabela de Conteúdos

- Introdução

- O que é o Orca?

- Como o Orca se sai melhor do que outros modelos?

- Os Desafios dos Modelos de Linguagem

- O Big Bench Hard Benchmark

- Como o Orca foi Treinado

- As Vantagens do Orca

- O Futuro do Orca

- Prós e Contras do Orca

- Conclusão

🤔 O que é o Orca?

O Orca é um modelo de 13 bilhões de parâmetros que aprende a imitar o processo de raciocínio de modelos maiores. Foi desenvolvido pela Microsoft e recebeu o nome de baleias assassinas, que são visitantes frequentes das costas sul-americanas. O Orca foi treinado olhando para os processos de pensamento passo a passo do GPT-4 e foi guiado pela assistência do professor Chachi PT, que é o GPT-3.5. O Orca supera modelos convencionais de última geração, como o Vicuna, em mais de 100 em benchmarks complexos de raciocínio zero-shot, como o Big Bench Hard.

🚀 Como o Orca se sai melhor do que outros modelos?

O Orca supera outros modelos open source como Llama, Alpaca e Vicuna porque esses modelos carecem de avaliação rigorosa, resultando em uma superestimação da capacidade do modelo pequeno. O Orca aprende olhando para os processos de pensamento passo a passo do GPT-4 e é guiado pela assistência do professor Chachi PT, que é o GPT-3.5. O Orca foi capaz de aproveitar as instruções do sistema, pedindo a modelos como o GPT-4 e o Chachi PT que pensassem passo a passo, o que deu ao Orca acesso a respostas detalhadas do modelo que explicam o processo de raciocínio do professor à medida que gera a resposta.

🤯 Os Desafios dos Modelos de Linguagem

Os modelos de linguagem enfrentam vários desafios, como a dedução lógica, onde eles obtiveram apenas 1,2 por cento. O Orca supera em muito o melhor modelo open source anterior, o Vicuna, e é muito competitivo com o Text DaVinci 3. O Orca tem 95 por cento da qualidade do Chat GPT e 85 por cento da qualidade do GPT-4, conforme avaliado pelo GPT-4.

🎯 O Big Bench Hard Benchmark

O Big Bench Hard benchmark é especificamente para modelos de linguagem e consiste em 23 tarefas desafiadoras em que os avaliadores humanos ainda se saíram melhor do que os modelos de linguagem. O Orca supera em muito o melhor modelo open source anterior, o Vicuna, e é muito competitivo com o Text DaVinci 3.

🤖 Como o Orca foi Treinado

O Orca foi treinado em 20.100 GPUs e levou cerca de 200 horas para ser treinado. Os autores aproveitaram as mensagens do sistema para fazer com que o Chat GPT e o GPT-4 pensassem passo a passo, levando a explicações muito mais ricas. O Orca foi capaz de aprender muito mais com essa explicação, e é por isso que é melhor do que todos os outros modelos open source.

🌟 As Vantagens do Orca

O Orca sugere que aprender com explicações passo a passo pode melhorar significativamente a qualidade dos modelos, independentemente do tamanho. O Orca supera outros modelos open source e é muito competitivo com o GPT-4 em vários testes de raciocínio.

🔮 O Futuro do Orca

O Orca é projetado exclusivamente para configurações de pesquisa, mas os autores esperam que essas informações informem o design de métodos de avaliação mais robustos em comparação com os usados para o Vicuna, por exemplo, e o avanço de técnicas de alinhamento e pós-treinamento e o uso mais eficaz de modelos poderosos como o GPT-4 como professores.

👍 Prós e Contras do Orca

Prós:

- O Orca supera outros modelos open source e é muito competitivo com o GPT-4 em vários testes de raciocínio.

- O Orca sugere que aprender com explicações passo a passo pode melhorar significativamente a qualidade dos modelos, independentemente do tamanho.

Contras:

- O Orca é projetado exclusivamente para configurações de pesquisa.

🎉 Conclusão

O Orca é um novo modelo open source que supera o GPT-3.5 e empata com o GPT-4 em testes de raciocínio. O Orca supera outros modelos open source e sugere que aprender com explicações passo a passo pode melhorar significativamente a qualidade dos modelos, independentemente do tamanho. Embora o Orca seja projetado exclusivamente para configurações de pesquisa, ele fornece informações valiosas sobre o design de métodos de avaliação mais robustos e o avanço de técnicas de alinhamento e pós-treinamento.

🤔 FAQ

Q: O que é o Orca?

A: O Orca é um modelo de 13 bilhões de parâmetros que aprende a imitar o processo de raciocínio de modelos maiores.

Q: Como o Orca se sai melhor do que outros modelos?

A: O Orca supera outros modelos open source como Llama, Alpaca e Vicuna porque esses modelos carecem de avaliação rigorosa, resultando em uma superestimação da capacidade do modelo pequeno.

Q: O que é o Big Bench Hard benchmark?

A: O Big Bench Hard benchmark é especificamente para modelos de linguagem e consiste em 23 tarefas desafiadoras em que os avaliadores humanos ainda se saíram melhor do que os modelos de linguagem.

Q: Quais são os prós e contras do Orca?

A: Prós: O Orca supera outros modelos open source e sugere que aprender com explicações passo a passo pode melhorar significativamente a qualidade dos modelos, independentemente do tamanho. Contras: O Orca é projetado exclusivamente para configurações de pesquisa.

Recursos: Nenhum mencionado.

- End -
VOC AI Inc. 8 The Green,Ste A, in the City of Dover County of Kent, Delaware Zip Code: 19901 Copyright © 2024 VOC AI Inc.All Rights Reserved. Termos e Condições Política de Privacidade
Este sítio Web utiliza cookies
A VOC AI utiliza cookies para garantir o bom funcionamento do site, para armazenar algumas informações sobre as suas preferências, dispositivos e acções passadas. Estes dados são agregados ou estatísticos, o que significa que não poderemos identificá-lo individualmente. Pode encontrar mais pormenores sobre os cookies que utilizamos e como retirar o consentimento na nossa Política de Privacidade.
Utilizamos o Google Analytics para melhorar a experiência do utilizador no nosso sítio Web. Ao continuar a utilizar o nosso sítio, está a consentir a utilização de cookies e a recolha de dados pelo Google Analytics.
Aceita estes cookies?
Aceitar todos os cookies
Rejeitar todos os cookies