Sistemas de IA estão sendo mais bem educados do que nossas crianças

Sistemas de IA estão sendo mais bem educados do que nossas crianças

Até quatro anos atrás, o verbo educar se referia a crianças e a alguns animais de estimação. O uso para animais é duvidoso, muitas pessoas acreditam que animais são treinados, não educados. Mas, nos últimos anos, o verbo tem sido usado, e com muita propriedade, quando nos referimos ao aprimoramento de sistemas de inteligência artificial. Um exemplo é o líder atual, o Cláudioda empresa Antrópico. Estudando como esses sistemas são educados, tive uma pequena epifania: esses sistemas estão sendo melhor educados do que nossas crianças e os grandes educadores da atualidade são consultores ou empregados dessas empresas.

Educar uma criança é um processo longo, que se inicia aos 5 anos e pode durar 25 anos, se contarmos uma possível pós-graduação. Estou chamando de educação tudo o que é transmitido à criança pelos outros seres humanos com quem convive e outros elementos do meio em que vive. Coisas pré-programadas no nosso genoma, como o desenvolvimento motor básico e a capacidade de observar o meio ambiente não contam.

Claude é o chatbot da da empresa Anthropic. Foto: Bruna Arimathea/Estadão

A educação começa pela socialização da criança, primeiro na família, depois com os colegas de escola. Segue com o aprendizado de uma língua e com ela vem a capacidade de se comunicar e interagir socialmente. Conceitos do que é certo, errado, respeito aos outros e aos costumes e leis da família e da sociedade fazem parte da educação. Depois vem a escrita, os princípios da matemática, o pensamento indutivo, seu local no planeta, a história, os grandes pensadores, romancistas, músicos. A química, a física e todas as ciências. E assim vai até a pessoa absorver grande parte da cultura que a humanidade produziu no passado. Mas, além do conteúdo, ensinamos princípios de comportamento, respeito e honestidade. Esse é o objetivo da educação humanista. E tudo isso é aprendido recebendo informação e interagindo com os pais, colegas, professores e a sociedade em geral. É um processo complexo pelo qual passam, com graus diferentes de sucesso, todas as crianças. É um processo massificado, pois o número de crianças se conta aos milhões.

E como ocorre a educação de um sistema de inteligência artificial? Como foi educado, por exemplo, o Claude? O primeiro passo é selecionar tudo o que se deseja que ele aprenda. Uma espécie de currículo hiper completo. Isso inclui todo o conteúdo da internet, todos os livros disponíveis, em todas as línguas. Desde histórias infantis, passando por tratados de química, filosofia, história e matemática. Tudo, absolutamente tudo, que os professores do Claude conseguem digitalizar, como figuras, tabelas e códigos de software.

Essa misturada de conhecimentos é picada em pequenos blocos e usada para alimentar o sistema de IA que descobre todas as associações que existem nessa massa de informação. O resultado é que cada pedaço de informação está relacionado a todos os outros. Um diálogo em um romance em que um personagem conta o número de frutas na mesa está relacionado à descrição do processo de enumeração e soma em um livro de matemática. Em seguida, esse modelo passa por um processo de aprendizado autosupervisionado. Essa etapa demanda uma quantidade absurda de computação, que pode levar meses para ser realizada.

O resultado é o modelo inicial que já reconhece todas as línguas e é capaz de achar os relacionamentos necessários para ler, escrever e entender perguntas. E é capaz de generalizações. Da mesma forma que uma criança que aprendeu a somar números consegue contar frutas, esse modelo aprende a contar. Tudo isso sem nenhum professor a não ser quem programou o sistema. Mas ele ainda não é capaz de interagir com humanos e responder perguntas de maneira consistente.

Aí entra a terceira etapa, que é o aprendizado supervisionado por humanos. Educadores humanos fazem perguntas e, entre as respostas fornecidas pelo sistema, escolhem as mais adequadas ou corretas. É um processo similar ao que um professor faz com a classe quando faz uma pergunta, analisa, e corrige as respostas. Esse processo ensina nossos alunos e o Claude.

Na fase seguinte, essas perguntas feitas por milhares de seres humanos e as escolhas aprimoram o que é uma resposta aceitável. Exemplo: você pergunta ao sistema o que ele deve fazer com um inimigo. Como ele absorveu tudo que Hitler, Gandhi e Maquiavel escreveram, às vezes ele sugere matar o inimigo. Aí você diz que não, que uma solução com diálogo é melhor, e que matar é errado. Os pesos no modelo mudam. Claude vai dar mais peso para Gandhi e aos textos legais. E, dessa maneira, Claude vai adquirindo uma espécie de moral. É educação na sua forma pura.

Na etapa seguinte, Claude é treinado para revisar as respostas usando uma série de princípios, que a empresa chama de constituição. É nesse ponto que ele aprende a respeitar os humanos. Em seguida, através do processo de perguntas e respostas, professores tentam burlar Claude, tentando induzir respostas erradas. Todos sabemos que esse passo ainda é falho e Claude erra como todo ser humano, mesmo os mais bem educados. E, após tudo isso, Claude é liberado para interagir com seres humanos.

O que achei surpreendente é como todo esse processo guarda enormes semelhanças com o processo que usamos para educar nossas crianças. Talvez isso não devesse ter me surpreendido, pois esses sistemas foram construídos por pessoas educadas pelo nosso método tradicional.

CONTiNUA APÓS PUBLICIDADE

Mas o fato é que, no caso de Claude, centenas de especialistas em diversas disciplinas, como lógica, filosofia, religião e nas diversas áreas da educação e pedagogia, são escalados para educar o que vai ser uma única inteligência artificial, o Claude. Só de imaginar, fico com inveja.

É claro que Claude não aprende sobre as sombras, os cantos dos pássaros, a brisa e os cheiros de uma floresta tropical, experimentando diretamente um passeio pela floresta. Mas você vai aprender tudo isso através das descrições que seres humanos fizeram de uma floresta em livros de ficção, livros científicos e poesias. Sem dúvida, apesar das semelhanças, o processo é diferente. Mas o que mais me impressiona é que, sem dúvida, a humanidade está fornecendo uma educação muito melhor para o Claude do que a recebida pelas nossas crianças. E assim, aos poucos, é inevitável que a distância entre os humanos e os Claudes da vida aumente.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Notícias Recentes