Obtenir un logiciel pour « halluciner » des structures protéiques raisonnables

[ad_1]

Chimiquement, les protéines ne sont qu’une longue chaîne d’acides aminés. Leurs propriétés étonnantes sont dues au fait que cette chaîne peut se replier en une forme tridimensionnelle complexe. Ainsi, comprendre les règles qui régissent ce repliement peut non seulement nous donner un aperçu des protéines utilisées par la vie, mais pourrait potentiellement nous aider à concevoir de nouvelles protéines dotées de nouvelles capacités chimiques.

Il y a eu des progrès remarquables sur la première moitié de ce problème récemment : les chercheurs ont réglé les IA pour trier les relations évolutives entre les protéines et relier les caractéristiques communes aux structures. Pour l’instant, cependant, ces algorithmes ne sont d’aucune aide pour concevoir de nouvelles protéines à partir de zéro. Mais cela peut changer, grâce aux méthodes décrites dans un article publié mercredi.

Dans ce document, une grande équipe de chercheurs décrit ce qu’elle appelle des « hallucinations » de protéines. Ce sont les produits d’un processus qui ressemble à un jeu plus chaud/plus froid avec un algorithme, commençant par une séquence aléatoire d’acides aminés, apportant un changement et demandant : « Est-ce que cela ressemble plus ou moins à une protéine structurée ? » Plusieurs des résultats ont été testés et, en fait, se replient comme prévu.

AI hallucinations

La terminologie étrange ici ne peut pas être imputée aux auteurs du nouvel article. Au lieu de cela, le terme « hallucination » a été appliqué au travail effectué par l’équipe d’IA de Google. Ce travail impliquait de commencer par une image de pixels aléatoires et de demander à un réseau de neurones entraîné à reconnaître les fruits : « À quel point cela ressemble-t-il à une banane ? » Après quelques ajustements aléatoires, la question a été posée à nouveau; tous les changements qui augmentaient les propriétés de type banane de l’image étaient conservés et le processus répété.

Le résultat final a clairement des aspects de banane, mais il ressemble plus à un cubiste et à un impressionniste qui ont tous deux essayé les bananes avant d’exécuter quelques filtres Photoshop aléatoires. Bien que le terme ne soit pas utilisé dans le blog de Google, d’autres ont qualifié les images d' »hallucinations ».

Le bruit aléatoire (à gauche) est converti en une hallucination de type banane (à droite) par des requêtes répétées vers une IA de reconnaissance de banane.

Les chercheurs ont pensé que, si cela fonctionnait pour les IA qui gèrent la reconnaissance d’images, cela fonctionnerait peut-être aussi avec les IA qui suggèrent des structures 3D pour les protéines.

Ceux d’entre vous qui y prêtent une attention particulière peuvent cependant remarquer un problème. Les algorithmes spécifiques à la biologie n’indiquent pas si quelque chose ressemble à une structure ; au lieu de cela, ils supposent simplement qu’il existe une structure et essaient de suggérer ce que c’est. Donc, ils ne sont pas intrinsèquement configurés pour faire le genre d’évaluation de plus en plus chaud/de plus en plus froid qui est nécessaire pour créer une hallucination.

L’équipe de recherche a cependant trouvé un moyen de contourner ce problème. Les protéines non structurées ont tendance à s’étendre dans l’espace, avec seulement une poignée d’acides aminés voisins interagissant les uns avec les autres. Les protéines hautement structurées, en revanche, ont tendance à être compactes et à se replier de sorte que les acides aminés dans différentes parties de la chaîne peuvent interagir les uns avec les autres. L’algorithme qu’ils utilisaient pour la prédiction de structure, trRosetta, affiche ses prédictions sous la forme de l’emplacement relatif de chaque acide aminé dans un espace 3D. Ainsi, en utilisant une mesure de leur propagation, les auteurs ont pu fournir une sorte de réponse à la question « à quel point cela a-t-il l’air structuré ? »

En partant du hasard

Pour démarrer leurs hallucinations structurelles, les chercheurs ont généré de nombreuses protéines composées de 100 acides aminés aléatoires et les ont introduites dans le logiciel trRosetta. Comme prévu, toutes les protéines étaient non structurées au départ. Ensuite, pour chacune des 100 séquences, un acide aminé a été choisi au hasard et remplacé par un acide aminé différent qui a également été choisi au hasard. trRosetta a ensuite effectué une nouvelle analyse et les résultats ont été comparés ; tout changement qui rendait les choses plus structurées était retenu.

Par environ 20 000 répétitions de ce processus, la compacité de l’arrangement des acides aminés dans ces hallucinations était de nature similaire à celle des protéines ordinaires. Mais, de manière critique, les séquences d’acides aminés ne ressemblaient pas à celles des protéines connues. Les structures elles-mêmes non plus. Dans les protéines utilisées par la vie, il y a souvent des boucles d’acides aminés mal structurés qui remplissent des fonctions clés. Mais les hallucinations n’étaient pas sélectionnées pour leur fonction ; ils ont été sélectionnés pour leur compacité. Donc, ce genre de boucles étendues n’a pas été trouvée dans les hallucinations.

Il y a plusieurs raisons d’être sceptique quant au fait que de véritables chaînes d’acides aminés formeraient ces structures dans le monde réel. trRosetta n’est pas le dernier et le meilleur logiciel de prédiction de structure qui a fait tous les gros titres. Et trRosetta a été formé pour comprendre la structure en partie en évaluant les relations évolutives. Ces protéines sont toutes nouvelles et n’ont aucun parent évolutif. Le processus ne fonctionnerait que si le réseau neuronal utilisé dans trRosetta avait déduit les principes de la structure des protéines à partir de ces relations évolutives.

La seule façon de savoir si cela a fonctionné est de fabriquer les protéines réelles et de voir à quoi elles ressemblent. Ainsi, l’équipe de recherche a rassemblé des gènes codant pour 129 protéines hallucinatoires.

[ad_2]

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*