Pourquoi la prédiction DeepMind AI de Google de 200 millions de structures protéiques est importante

[ad_1]

Ce n’est qu’en 1957 que les scientifiques ont atteint la troisième dimension moléculaire.

Après 22 ans d’expérimentation exténuante, John Kendrew de l’Université de Cambridge a finalement découvert la structure 3D d’une protéine. C’était un schéma tordu de myoglobine, le filamenteux qui aide à infuser nos muscles en oxygène. Aussi révolutionnaire que soit cette découverte, Kendrew n’a pas tout à fait ouvert les vannes de l’architecture des protéines. Au cours de la prochaine décennie, moins d’une douzaine de plus seront identifiées.

Avance rapide jusqu’à aujourd’hui, 65 ans après cette percée gagnante du prix Nobel.

Jeudi, la société sœur de Google, DeepMind, a annoncé qu’elle avait utilisé avec succès l’intelligence artificielle pour prédire les structures 3D de presque toutes les protéines cataloguées connues de la science. C’est plus de 200 millions de protéines trouvées dans les plantes, les bactéries, les animaux, les humains – presque tout ce que vous pouvez imaginer.

« Essentiellement, vous pouvez le considérer comme couvrant l’ensemble de l’univers des protéines », a déclaré Demis Hassabis, fondateur et PDG de DeepMind, aux journalistes cette semaine.

C’est grâce à AlphaFold, le système d’IA révolutionnaire de DeepMind, qui dispose d’une base de données open source afin que les scientifiques du monde entier puissent l’impliquer dans leurs recherches à volonté et gratuitement. Depuis le lancement officiel d’AlphaFold en juillet de l’année dernière – alors qu’il n’avait identifié que quelque 350 000 protéines 3D – le programme a fait une brèche notable dans le paysage de la recherche.

« Plus de 500 000 chercheurs et biologistes ont utilisé la base de données pour visualiser plus de 2 millions de structures », a déclaré Hassabis. « Et ces structures prédictives ont aidé les scientifiques à faire de nouvelles découvertes brillantes. »

En avril, par exemple, les scientifiques de l’Université de Yale ont fait appel à la base de données d’AlphaFold pour les aider dans leur objectif de développer un nouveau, Et en juillet de l’année dernière, les scientifiques de l’Université de Portsmouth ont utilisé le système pour concevoir des enzymes qui

« Cela nous a fait avancer d’un an, sinon deux », John McGeehan, directeur du Center for Enzyme Innovation de Portsmouth et chercheur à l’origine de cette dernière étude.

Un diagramme en ruban de la protéine vitellogénine, avec des rubans bleus, jaunes et orange.

La structure 3D de la vitellogénine, qui compose le jaune d’œuf.

DeepMind

Ces efforts ne sont qu’un petit échantillon de la portée ultime d’AlphaFold.

« Au cours de la seule année écoulée, il y a eu plus d’un millier d’articles scientifiques sur un large éventail de sujets de recherche qui utilisent les structures AlphaFold ; je n’ai jamais rien vu de tel », a déclaré Sameer Velankar, collaborateur de DeepMind et chef d’équipe au Laboratoire européen de biologie moléculaire. Protein Data Bank, a déclaré dans un communiqué de presse.

D’autres qui ont utilisé la base de données, selon Hassabis, incluent ceux qui essaient d’améliorer notre compréhension de la maladie de Parkinson, les personnes qui espèrent et même certaines qui cherchent à obtenir des informations précieuses sur l’évolution humaine.

« AlphaFold change déjà la façon dont nous pensons à la survie des molécules dans les archives fossiles, et je peux voir qu’il deviendra bientôt un outil fondamental pour les chercheurs travaillant non seulement en biologie évolutive mais aussi en archéologie et autres paléosciences », Beatrice Demarchi, professeur associé à l’Université de Turin, qui a récemment utilisé le système dans une étude , a déclaré dans un communiqué de presse.

Dans les années à venir, DeepMind a également l’intention de s’associer à des équipes de la Drugs For Neglected Diseases Initiative et de l’Organisation mondiale de la santé, dans le but de trouver des remèdes pour des maladies tropicales peu étudiées, mais omniprésentes, telles que la maladie de Chagas et la leishmaniose.

« Cela incitera de nombreux chercheurs du monde entier à réfléchir aux expériences qu’ils pourraient faire », a déclaré aux journalistes Ewan Birney, collaborateur de DeepMind et directeur adjoint de l’EMBL. « Et pensez à ce qui se passe dans les organismes et les systèmes qu’ils étudient. »

Serrures et clés

Alors, pourquoi tant d’avancées scientifiques dépendent-elles de ce coffre au trésor de la modélisation 3D des protéines ? Expliquons-nous.

Supposons que vous essayez de fabriquer une clé qui s’intègre parfaitement dans une serrure. Mais vous n’avez aucun moyen de visualiser la structure de cette serrure. Tout ce que vous savez, c’est que cette serrure existe, des données sur ses matériaux et peut-être des informations numériques sur la taille de chaque crête et sur l’endroit où ces crêtes devraient être.

Développer cette clé ne serait peut-être pas impossible, mais ce serait assez difficile. Les touches doivent être précises, sinon elles ne fonctionnent pas. Par conséquent, avant de commencer, vous feriez probablement de votre mieux pour modéliser quelques fausses serrures différentes avec toutes les informations dont vous disposez afin de pouvoir créer votre clé.

Dans cette analogie, la serrure est une protéine et la clé est une petite molécule qui se lie à cette protéine.

Pour les scientifiques, qu’ils soient médecins essayant de concevoir de nouveaux médicaments ou botanistes disséquant l’anatomie des plantes pour fabriquer des engrais, l’interaction entre certaines molécules et protéines est cruciale.

Avec des médicaments, par exemple, pour savoir si cela fonctionne. Cette interaction se complique car même si les protéines ne sont que des chaînes d’acides aminés, elles ne sont ni droites ni plates. Ils se plient, se plient et s’emmêlent inévitablement sur eux-mêmes, comme des fils d’écouteurs dans votre poche.

En fait, les repliements uniques d’une protéine dictent son fonctionnement – et même la moindre erreur de repliement dans le corps humain peut .

Mais pour en revenir aux médicaments à petites molécules, il arrive parfois que des morceaux d’une protéine repliée ne puissent pas se lier à un médicament. Il peut arriver qu’ils soient pliés d’une manière étrange qui les rend inaccessibles, par exemple. Des choses comme celle-ci sont des informations très importantes pour les scientifiques qui essaient de faire adhérer leur molécule médicamenteuse. « Je pense qu’il est vrai que presque tous les médicaments qui sont arrivés sur le marché au cours des dernières années ont été, en partie, conçus grâce à la connaissance des structures protéiques », a déclaré Janet Thornton, chercheuse à l’EMBL, lors de la conférence.

C’est pourquoi les chercheurs consacrent normalement une quantité incroyable de temps et d’efforts pour décoder la structure 3D pliée d’une protéine avec laquelle ils travaillent de la même manière que vous commenceriez votre voyage de fabrication de clés en assemblant le moule de la serrure. Si vous connaissez la structure exacte, il devient beaucoup plus facile de dire où et comment une molécule se fixerait à une protéine donnée, ainsi que comment cette fixation pourrait affecter les replis de la protéine en réponse.

Mais cette entreprise n’est pas simple. Ou bon marché.

« Le coût de la résolution d’une nouvelle structure unique est de l’ordre de 100 000 dollars », a déclaré Steve Darnell, biologiste structurel et informatique de l’Université du Wisconsin et chercheur à la société de bioinformatique DNAStar.

C’est parce que la solution vient généralement de super expériences de laboratoire compliquées.

Kendrew, par exemple, a exploité une technique appelée cristallographie aux rayons X à l’époque. Fondamentalement, des cristaux solides de la protéine qui vous intéresse, placez-les dans un faisceau de rayons X et observez pour voir quel motif le faisceau crée. Ce modèle est à peu près la position de des milliers d’atomes au sein du cristal. Ce n’est qu’alors que vous pourrez utiliser le modèle pour découvrir la structure d’une protéine.

Il existe également la technique plus récente connue sous le nom de . Celui-ci est similaire à la cristallographie aux rayons X, sauf que l’échantillon de protéine est directement dynamité avec des électrons au lieu d’un faisceau de rayons X. Et même si sa résolution est considérée comme beaucoup plus élevée que l’autre technique, elle ne peut pas tout pénétrer exactement. De plus, dans le domaine de la technologie, certains ont tenté de créer numériquement des structures de repliement des protéines. Mais les premiers essais, comme quelques tentatives dans les années 80 et 90. Comme vous pouvez l’imaginer, les méthodes de laboratoire sont également fastidieuses et difficiles.

Au fil des ans, de telles barrières ont donné naissance à ce qu’on appelle le « problème de repliement des protéines ». Simplement, les scientifiques ne savent pas comment les protéines se replient et ont dû faire face à des obstacles importants pour surmonter ce problème.

L’IA d’AlphaFold pourrait changer la donne.

Graphique du nombre d'espèces représentées dans la base de données AlphaFold, montrant 5 grands cercles.  Dans chaque cercle se trouve un petit point représentant la quantité précédente de protéines dans la base de données.  Les plus grands cercles sont environ 5 ordres de grandeur plus grands.

Un diagramme fourni par DeepMind de la croissance explosive de la base de données AlphaFold, par espèce.

DeepMind

Résoudre le « problème de pliage »

En bref, AlphaFold a été formé par les ingénieurs de DeepMind pour prédire les structures des protéines sans nécessiter la présence d’un laboratoire. Pas de cristaux, pas de tir d’électrons, pas d’expériences à 100 000 $.

Pour amener AlphaFold là où il est aujourd’hui, tout d’abord, le système a été exposé à 100 000 structures de repliement de protéines connues. Puis, au fil du temps, il a commencé à apprendre à décoder le reste.

C’est vraiment aussi simple que ça. (Eh bien, mis à part le talent qui a permis de coder l’IA.)

« Il faut, je ne sais pas, un minimum de 20 000 $ et beaucoup de temps pour cristalliser une protéine », a déclaré Birney. « Cela signifie que les expérimentateurs doivent faire des choix sur ce qu’ils font – AlphaFold n’a pas encore eu à faire de choix. » Cette caractéristique de la minutie d’AlphaFold est assez fascinante. Cela signifie que les scientifiques ont plus de liberté pour deviner et vérifier, suivre un instinct ou un instinct et jeter un large filet dans leurs recherches en matière de structures protéiques. Ils n’auront pas à se soucier des coûts ou des délais.

« Les modèles comportent également une erreur de prédiction », a déclaré Jan Kosinski, collaborateur de DeepMind et modélisateur structurel à l’EMBL à Hambourg, en Allemagne. « Et généralement – en fait dans de nombreux cas – l’erreur est vraiment minime. Nous appelons donc cela une précision quasi atomique. »

En outre, l’équipe DeepMind affirme également avoir effectué une grande variété d’évaluations des risques pour s’assurer que l’utilisation d’AlphaFold est sûre et éthique. Les membres de l’équipe DeepMind ont également suggéré que l’IA, en général, pourrait comporter des risques de biosécurité que nous n’avions pas pensé à évaluer auparavant, d’autant plus que cette technologie continue d’imprégner l’espace médical.

Mais au fur et à mesure que l’avenir se déroule, l’équipe de DeepMind affirme qu’AlphaFold s’adaptera avec fluidité et répondra à ces inquiétudes au cas par cas. Pour l’instant, cela semble fonctionner – avec un univers de modèles protéiques remontant à un modeste portrait de la myoglobine.

« Il y a seulement deux ans », a déclaré Birney, « nous n’avions tout simplement pas réalisé que c’était faisable. »

Correction à 6h45 PT: Le nom de famille et le titre de Janet Thornton ont été corrigés.

[ad_2]

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*