Un plat de neurones a peut-être appris à jouer au Pong (mal)

[ad_1]

L’un des développements les plus passionnants de l’IA a été le développement d’algorithmes capables d’apprendre par eux-mêmes les règles d’un système. Les premières versions de choses comme les algorithmes de jeu devaient recevoir les bases d’un jeu. Mais les versions plus récentes n’en ont pas besoin – elles ont simplement besoin d’un système qui garde une trace de certaines récompenses comme un score, et elles peuvent déterminer quelles actions maximisent cela sans avoir besoin d’une description formelle des règles du jeu.

Un article publié par la revue Neuron va encore plus loin en utilisant des neurones réels cultivés dans une boîte remplie d’électrodes. Cela a ajouté un niveau de complication supplémentaire, car il n’y avait aucun moyen de savoir ce que les neurones trouveraient réellement gratifiant. Le fait que le système semble avoir fonctionné peut nous dire quelque chose sur la façon dont les neurones peuvent auto-organiser leurs réponses au monde extérieur.

Dites bonjour à DishBrain

Les chercheurs à l’origine de ce nouveau travail, qui étaient principalement basés à Melbourne, en Australie, appellent leur système DishBrain. Et c’est basé sur, oui, une parabole avec un ensemble d’électrodes sur le fond de la parabole. Lorsque les neurones sont cultivés dans la boîte, ces électrodes peuvent faire deux choses : détecter l’activité des neurones au-dessus d’eux ou stimuler ces électrodes. Les électrodes sont grandes par rapport à la taille des neurones, de sorte que la détection et la stimulation (qui peuvent être considérées comme similaires à la lecture et à l’écriture d’informations) impliquent une petite population de neurones, plutôt qu’un seul.

Au-delà de cela, il s’agit d’une boîte de culture standard, ce qui signifie qu’une variété de types de cellules peuvent y être cultivées. Pour certaines expériences de contrôle, les chercheurs ont utilisé des cellules qui ne répondent pas aux signaux électriques. Pour ces expériences, les chercheurs ont testé deux types de neurones : certains disséqués à partir d’embryons de souris, et d’autres produits en induisant des cellules souches humaines à former des neurones. Dans les deux cas, comme on l’a vu dans d’autres expériences, les neurones ont formé spontanément des connexions entre eux, créant des réseaux qui avaient une activité spontanée.

Bien que le matériel soit totalement flexible, les chercheurs l’ont configuré dans le cadre d’un système en boucle fermée avec un contrôleur informatique. Dans cette configuration, les électrodes dans quelques régions du plat ont été définies comme prenant l’entrée du DishBrain ; ils sont collectivement appelés la région motrice puisqu’ils contrôlent la réponse du système.

Huit autres régions ont été désignées pour recevoir une entrée sous forme de stimulation par les électrodes, qui agissent un peu comme une zone sensorielle du cerveau. L’ordinateur pourrait également utiliser ces électrodes pour fournir une rétroaction au système, ce que nous aborderons ci-dessous.

Collectivement, ceux-ci fournissent tout ce dont un réseau de neurones a besoin pour apprendre ce qui se passe dans l’environnement informatique. Les électrodes motrices permettent aux neurones de modifier le comportement de l’environnement, et les neurones sensoriels reçoivent à la fois des informations sur l’état de l’environnement ainsi qu’un signal indiquant si ses actions ont réussi. Le système est suffisamment générique pour que toutes sortes d’environnements puissent être configurés dans la partie informatique de l’expérience – à peu près tout ce dont de simples entrées modifient l’environnement.

Les chercheurs ont choisi Pong.

[ad_2]

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*