Oficina do Saber

Compartilhando experiências & construindo conhecimentos

Com informações da Universidade Sheffield –  06/09/2016

Aprendizagem de Turing cria máquinas que aprendem

Os Kilobots usados nos experimentos já haviamdemonstrado inteligência artificial coletiva em experimentos anteriores. [Imagem: U. Sheffield]

Aprendizado de máquina

Pesquisadores que trabalham com enxames de robôs – grupos de pequenos robôs que trabalham de forma cooperativa – afirmam que já é possível fazer máquinas que aprendem como sistemas naturais ou artificiais funcionam apenas observando esses sistemas – sem precisar que os humanos lhes descrevam o que está ocorrendo ou lhes digam onde procurar padrões.

Se esse conceito de fato puder ser levado adiante, ele poderá viabilizar avanços na forma como as máquinas – robôs e computadores incluídos – inferem conhecimento e utilizam esse conhecimento para detectar comportamentos e anormalidades, seja no funcionamento de máquinas em um ambiente industrial, seja de seres vivos.

Quem garante todas essas possibilidades é um trio formado por Wei Li, Melvin Gauci e Roderich Gross, da Universidade de Sheffield, no Reino Unido, que batizaram a nova forma de aprendizado de máquina de “Aprendizagem de Turing”.

De acordo com o trio, com o aprendizado de Turing os computadores tornam-se capazes de prever, entre outras coisas, como as pessoas e outros seres vivos se comportam, o que pode melhorar as aplicações de segurança e tornar os jogos de computador mais realísticos.

Aprendizagem de Turing

A inovação apresentada pelo trio é inspirada na obra do pioneiro da computação Alan Turing, que propôs um teste para estabelecer quando uma máquina poderia se fazer passar por um ser humano sem que os seres humanos percebessem – o famoso teste de Turing. Nesse teste, um interrogador troca mensagens com dois jogadores em uma sala diferente: um humano e uma máquina. O interrogador tem que descobrir qual dos dois jogadores é humano.

“Ao contrário do teste de Turing original, no entanto, os nossos interrogadores não são humanos, mas sim programas de computador que aprendem por si mesmos,” explica Gross.

A equipe colocou um enxame de robôs sob vigilância e queria saber quais regras causavam seus movimentos. Um segundo enxame – formado por robôs que aprendem – também foi posto sob vigilância. Os movimentos das duas equipes de robôs foram registrados e os dados de movimentação foram mostrados ao programa interrogador.

“Sua tarefa é distinguir entre os robôs dos dois enxames. Ele é recompensado pela categorização correta dos dados de movimento do enxame original como genuínos e aqueles do outro enxame como falsos. Os robôs de aprendizagem que conseguem enganar o interrogador – fazendo-o acreditar que seus dados de movimento eram genuínos – recebem uma recompensa,” continua Gross.

O resultado é que, depois de várias rodadas, o programa interrogador se torna capaz de monitorar movimentos de grupos e acertar quais são os movimentos genuínos, mesmo tendo de lidar com enxames de robôs que aprendem e se tornam cada vez mais craques em enganá-lo.

Máquinas que aprendem

A equipe afirma que a Aprendizagem de Turing tem a grande vantagem de eliminar a necessidade de que seres humanos informem aos programas o que e onde procurar em busca de padrões, como nas técnicas convencionais deinteligência artificial.

Imagine, por exemplo, que você queira um robô que pinte no melhor estilo Picasso. Um algoritmo de aprendizagem de máquina convencional avaliaria as pinturas do robô para o quão elas se assemelham a uma pintura de Picasso. Mas, para começar, alguém teria de suprir os algoritmos com dados que descrevam o que é considerado ser semelhante a um Picasso.

Já a aprendizagem de Turing não exige esse conhecimento prévio. Basta recompensar o robô se ele pintar algo que seja considerado genuíno pelos interrogadores. Assim, a Aprendizagem de Turing irá simultaneamente aprender como interrogar e como pintar.

Bibliografia:

Turing learning: a metric-free approach to inferring behavior and its application to swarms
Wei Li, Melvin Gauci, Roderich Gross
Swarm Intelligence
Vol.: 10: 211
DOI: 10.1007/s11721-016-0126-1

 

Comentários estão encerrados.