Alors que le ver tourne : nouveaux rebondissements dans les théories d’association comportementale : un modèle multidimensionnel de la façon dont un animal apprend au fil du temps

[ad_1]

Les physiciens ont développé un modèle dynamique du comportement animal qui peut expliquer certains mystères entourant l’apprentissage associatif remontant aux chiens de Pavlov. Les Actes de l’Académie nationale des sciences (PNAS) ont publié les résultats, basés sur des expériences sur un organisme de laboratoire commun, le ver rond C. elegans.

« Nous avons montré comment les associations apprises ne sont pas médiées uniquement par la force d’une association, mais par de multiples voies presque indépendantes – au moins dans les vers », explique Ilya Nemenman, professeur de physique et de biologie à Emory dont le laboratoire a dirigé les analyses théoriques. pour le papier. « Nous nous attendons à ce que des résultats similaires soient également valables pour les animaux plus gros, y compris peut-être chez les humains. »

« Notre modèle est dynamique et multidimensionnel », ajoute William Ryu, professeur agrégé de physique au Centre Donnelly de l’Université de Toronto, dont le laboratoire a dirigé les travaux expérimentaux. « Cela explique pourquoi cet exemple d’apprentissage associatif n’est pas aussi simple que de former un seul souvenir positif. Au lieu de cela, c’est une interaction continue entre des associations positives et négatives qui se produisent en même temps. »

Le premier auteur de l’article est Ahmed Roman, qui a travaillé sur le projet en tant qu’étudiant diplômé d’Emory et est maintenant boursier postdoctoral au Broad Institute. Konstaintine Palanski, ancienne étudiante diplômée de l’Université de Toronto, est également auteur.

Il y a plus de 100 ans, Ivan Pavlov a découvert le « réflexe conditionné » chez les animaux grâce à ses expériences sur les chiens. Par exemple, après qu’un chien ait été entraîné à associer un son à l’arrivée ultérieure de nourriture, le chien commençait à saliver lorsqu’il entendait le son, avant même que la nourriture n’apparaisse.

Environ 70 ans plus tard, les psychologues se sont appuyés sur les idées de Pavlov pour développer le modèle Rescorla-Wagner du conditionnement classique. Ce modèle mathématique décrit les associations conditionnées par leur force dépendante du temps. Cette force augmente lorsque le stimulus conditionné (dans le cas du chien de Pavlov, le son) peut être utilisé par l’animal pour diminuer la surprise à l’arrivée de la réponse inconditionnée (la nourriture).

Ces connaissances ont contribué à préparer le terrain pour les théories modernes de l’apprentissage par renforcement chez les animaux, qui à leur tour ont permis des algorithmes d’apprentissage par renforcement dans les systèmes d’intelligence artificielle. Mais de nombreux mystères demeurent, dont certains liés aux expériences originales de Pavlov.

Après que Pavlov ait entraîné des chiens à associer le son d’une cloche à de la nourriture, il les exposait ensuite à plusieurs reprises à la cloche sans nourriture. Lors des premiers essais sans nourriture, les chiens ont continué à saliver lorsque la cloche a sonné. Si les épreuves duraient assez longtemps, les chiens « désapprenaient » et cessaient de saliver en réponse à la cloche. L’association aurait été « éteinte ».

Pavlov a découvert, cependant, que s’il attendait un moment puis retestait les chiens, ils saliveraient à nouveau en réponse à la cloche, même s’il n’y avait pas de nourriture. Ni Pavlov ni les théories plus récentes de l’apprentissage associatif n’ont pu expliquer avec précision ou modéliser mathématiquement cette récupération spontanée d’une association éteinte.

Les chercheurs ont exploré ces mystères à travers des expériences avec C. elegans. Le ver rond d’un millimètre ne compte qu’environ 1 000 cellules et 300 d’entre elles sont des neurones. Cette simplicité fournit aux scientifiques un système simple pour tester la façon dont l’animal apprend. En même temps, C. elegansLes circuits neuronaux sont juste assez compliqués pour relier certaines des connaissances acquises en étudiant son comportement à des systèmes plus complexes.

Des expériences antérieures ont établi que C. elegans peut être entraîné à préférer une température plus fraîche ou plus chaude en le conditionnant à une certaine température avec de la nourriture. Dans une expérience typique, les vers sont placés dans une boîte de Pétri avec un gradient de températures mais sans nourriture. Ceux entraînés à préférer une température plus fraîche se déplaceront vers le côté le plus froid du plat, tandis que les vers entraînés à préférer une température plus chaude iront vers le côté le plus chaud.

Mais que signifient exactement ces résultats ? Certains croient que les vers rampent vers une température particulière dans l’attente de nourriture. D’autres soutiennent que les vers s’habituent simplement à cette température, ils préfèrent donc y rester même sans récompense alimentaire.

L’énigme n’a pas pu être résolue en raison d’une limitation majeure de bon nombre de ces expériences – le temps qu’il faut à un ver pour traverser une boîte de Pétri de neuf centimètres à la recherche de la température préférée.

Nemenman et Ryu ont cherché à surmonter cette limitation. Ils voulaient développer un moyen pratique de mesurer avec précision la dynamique de l’apprentissage, ou comment l’apprentissage change au fil du temps.

Le laboratoire de Ryu a utilisé un dispositif microfluidique pour réduire le modèle expérimental de boîtes de Pétri de neuf centimètres en gouttelettes de quatre millimètres. Les chercheurs ont pu rapidement mener des expériences sur des centaines de vers, chaque ver enfermé dans sa gouttelette individuelle.

« Nous avons pu observer en temps réel comment un ver se déplaçait sur un gradient linéaire de températures », explique Ryu. « Au lieu d’attendre qu’il rampe pendant 30 minutes ou une heure, nous avons pu voir beaucoup plus rapidement quel côté de la goutte, le côté froid ou le côté chaud, que le ver préférait. Et nous avons également pu suivre l’évolution de ses préférences avec temps. »

Leurs expériences ont confirmé que si un ver est entraîné à associer des aliments à une température plus froide, il se déplacera vers le côté le plus froid de la gouttelette. Au fil du temps, cependant, en l’absence de nourriture, cette préférence de mémoire diminue apparemment.

« Nous avons découvert que tout à coup, les vers voulaient passer plus de temps du côté chaud de la gouttelette », explique Ryu. « C’est surprenant, car pourquoi les vers développeraient-ils une préférence différente et même éviteraient-ils la température qu’ils étaient venus associer à la nourriture? »

Finalement, le ver commence à faire des allers-retours entre les températures les plus froides et les plus chaudes.

Les chercheurs ont émis l’hypothèse que le ver n’oublie pas simplement la mémoire positive de la nourriture associée à des températures plus fraîches, mais commence plutôt à associer négativement le côté plus frais à l’absence de nourriture. Cela l’incite à se diriger vers le côté le plus chaud. Puis, au fur et à mesure que le temps passe, il commence à former une association négative de pas de nourriture avec la température plus chaude, qui, combinée à l’association positive résiduelle au froid, la fait migrer vers la température plus fraîche.

« Le ver apprend toujours, tout le temps », explique Ryu. « Il y a une interaction entre la motivation d’une association positive et une association négative qui la fait commencer à osciller entre le froid et le chaud. »

L’équipe de Nemenman a développé des équations théoriques pour décrire les interactions au fil du temps entre les deux variables indépendantes – l’association positive, ou excitatrice, qui pousse un ver vers une température et l’association négative, ou inhibitrice, qui l’éloigne de cette température.

« Le côté vers lequel le ver gravite dépend du moment exact où vous prenez les mesures », explique Nemenman. « C’est comme lorsque vous perdez vos clés, vous pouvez d’abord vérifier le bureau où vous les gardez habituellement. Si vous ne les voyez pas là tout de suite, vous courez dans différents endroits à leur recherche. Si vous ne les trouvez toujours pas, vous retournez au bureau d’origine en pensant que vous n’avez tout simplement pas regardé assez fort. »

Les chercheurs ont répété les expériences dans différentes conditions. Ils ont entraîné les vers à différentes températures de départ et les ont affamés pendant différentes durées avant de tester leur préférence de température, et les comportements des vers ont été correctement prédits par les équations.

Ils ont également testé leur hypothèse en modifiant génétiquement les vers, supprimant la voie de signalisation analogue à l’insuline connue pour servir de voie d’association négative.

« Nous avons perturbé la biologie de manière spécifique et lorsque nous avons mené les expériences, le comportement du ver a changé comme prévu par notre modèle théorique », explique Nemenman. « Cela nous donne plus de confiance que le modèle reflète la biologie sous-jacente de l’apprentissage, au moins dans C. elegans. »

Les chercheurs espèrent que d’autres testeront leur modèle dans des études sur des animaux plus grands à travers les espèces.

« Notre modèle fournit un modèle d’apprentissage quantitatif alternatif qui est multidimensionnel », explique Ryu. « Cela explique des résultats difficiles, voire dans certains cas impossibles, à expliquer par d’autres théories du conditionnement classique. »

[ad_2]

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*