După ce a devenit cunoscut pentru succesul său în jocuri precum șahul și acesta, grupul de inteligență artificială DeepMind a rezolvat o problemă științifică gravă care a afectat cercetătorii timp de o jumătate de secol.

acest

Cu cel mai recent program de inteligență artificială, AlphaFold, compania a demonstrat că poate prezice modul în care proteinele se pliază în forme 3D - un proces extrem de complex care este fundamental pentru înțelegerea mecanismelor biologice ale vieții.

Oamenii de știință independenți spun că descoperirea va ajuta cercetătorii să descopere mecanismele care cauzează anumite boli, să deschidă drumul către medicamente de designer, culturi îmbunătățite și „enzime verzi” care pot descompune materialele plastice, a raportat Guardian.

DeepMind spune că a început să lucreze cu o mână de grupuri de cercetare și se va concentra inițial pe malarie, boala somnului și leishmanioza, o boală parazitară.

„Este un moment interesant”, a spus Demis Hasabis, fondator și CEO al DeepMind. „Acești algoritmi sunt acum suficient de maturi și suficient de puternici pentru a fi aplicabili problemelor științifice cu adevărat provocatoare”.

Venki Ramakrishnan, președintele Societății Regale din Marea Britanie, a numit lucrarea „progres uimitor în urmă cu zeci de ani, pe care mulți oameni din domeniu îl așteptau”.

DeepMind este cel mai bine cunoscut pentru programele sale care au depășit șahul, IT, Starcraft II și jocurile clasice Atari. Dar jocul supraomenesc nu a fost niciodată obiectivul principal al companiei - jocurile au oferit un teren de antrenament pentru programe care, odată suficient de puternice, vor fi folosite pentru probleme reale.

Proteinarea pliabilă a reprezentat o provocare majoră în biologie de aproape 50 de ani și este dificil să supraestimăm importanța acesteia. Majoritatea proceselor biologice depind de proteine, iar forma proteinei determină funcția acesteia. Odată ce cercetătorii știu cum se pliază proteinele, ei pot începe să descopere exact ce face. Modul în care insulina controlează nivelul zahărului din sânge și modul în care anticorpii luptă împotriva coronavirusului sunt determinate de structura proteinelor.

Oamenii de știință au identificat peste 200 de milioane de proteine, dar structurile sunt cunoscute doar pentru o mică parte din ele. Până în prezent, structura a fost descoperită printr-o muncă de laborator meticuloasă, care poate dura ani de zile. Și, deși informaticienii au făcut progrese în această problemă, deducerea structurii proteinei nu este o sarcină ușoară. Proteinele sunt lanțuri de aminoacizi care pot fi răsucite și îndoite într-o varietate uimitoare de forme - în jurul unui gogol pe cub sau 1, urmate de 300 de zerouri.

Multe boli sunt asociate cu rolul proteinelor în catalizarea reacțiilor chimice (enzime), controlul bolii (anticorpi) sau transmiterea informațiilor (hormoni precum insulina).

Pentru a afla cum se protejează proteinele, cercetătorii DeepMind își pregătesc algoritmul într-o bază de date publică care conține aproximativ 170.000 de secvențe de proteine ​​și formele lor. Lucrul cu echivalentul a 100 până la 200 GPU - conform standardelor actuale, o cantitate relativ mică de putere de calcul - instruirea a durat câteva săptămâni.

DeepMind testează AlphaFold în evaluarea critică CASP a predicției structurii proteinelor. Participanții la competiția internațională primesc secvențe de aminoacizi pentru aproximativ 100 de proteine ​​și sunt provocați să își întocmească structura. Rezultatele echipelor care folosesc calculatoare sunt comparate cu cele bazate pe munca de laborator.

Cum funcționează provocarea?

În 1972, Christian Anfinsen a primit Premiul Nobel pentru munca sa, arătând că trebuie să fie posibil să se determine forma proteinelor pe baza secvenței blocurilor lor de aminoacizi.

La fiecare doi ani, zeci de echipe din peste 20 de țări încearcă să folosească computerele pentru a prezice forma unui set de aproximativ 100 de proteine ​​din secvențele lor de aminoacizi.

În același timp, structurile tridimensionale sunt dezvoltate în laborator de către biologi, folosind tehnici tradiționale precum cristalografia cu raze X și spectroscopia RMN, care determină locația fiecărui atom una față de cealaltă în molecula proteică.

O echipă de oameni de știință CASP a comparat apoi aceste predicții cu structurile 3D obținute folosind metode experimentale.

CASP folosește o metrică cunoscută sub numele de „test la distanță globală” pentru a estima precizia variind de la 0 la 100. Un scor de aproximativ 90 pe care îl realizează programul AlphaFold al DeepMind este considerat comparabil cu tehnicile de laborator.

AlphaFold nu numai că depășește alte programe de calculator, dar obține o precizie comparabilă cu metodele de laborator care necesită multă muncă și consumă mult timp. Când este clasat pe toate proteinele analizate, AlphaFold are un scor mediu de 92,5 din 100. Pentru proteinele cele mai dificile, scorul mediu a scăzut, dar ușor - la 87.

Hasabis spune că DeepMind a început să lucreze pentru a oferi cercetătorilor acces la AlphaFold pentru a ajuta la cercetare. Andrei Lupas, director al Institutului Max Planck pentru Dezvoltarea Biologiei din Tübingen, Germania, a declarat pentru revista Nature că a folosit deja programul pentru a rezolva o structură proteică la care oamenii de știință lucrează de un deceniu.

„Este o schimbare în joc”, a spus Lupas, care se așteaptă ca AlphaFold să schimbe modul în care lucrează și problemele cu care se ocupă. "Se va schimba medicina. Se va schimba cercetarea. Se va schimba bioinginerie. Se va schimba totul", a adăugat el.

Cum vor fi utilizate aceste informații?

Cunoașterea structurii tridimensionale a proteinelor este importantă pentru proiectarea medicamentelor și pentru înțelegerea bolilor umane, inclusiv a cancerului, demenței și a bolilor infecțioase.

Un exemplu este COVID-19, în care oamenii de știință studiază modul în care proteina „vârf” de pe suprafața virusului Sars-CoV-2 interacționează cu receptorii din celulele umane.

Oamenii de știință vor dori să se uite la date pentru a determina cât de exactă este metoda DeepMind și cât de bine se comportă la diferite niveluri.

Există încă un decalaj în cunoaștere, inclusiv înțelegerea modului în care proteinele complexe sunt formate și modul în care proteinele interacționează cu alte molecule, cum ar fi ADN și ARN.

„Acum că problema este rezolvată în mare măsură pentru proteinele unice, este deschisă calea dezvoltării de noi metode pentru determinarea formei complexelor proteice - grupuri de proteine ​​care funcționează împreună pentru a forma o mare parte a mecanismelor vieții și pentru alte aplicații, "a spus Andrei Krishtafovich de la Universitatea din California, Davis, și unul dintre judecătorii CASP.