Udostępnienie struktur 3D niemal wszystkich ludzkich białek jest wydarzeniem rewolucyjnym, porównywalnym do zsekwencjonowania ludzkiego genomu albo jeszcze ważniejszym – powiedział PAP dr Jan Kosiński z Europejskiego Laboratorium Biologii Molekularnej (EMBL) w Hamburgu.
Europejskie Laboratorium Biologii Molekularnej (EMBL) i firma DeepMind ogłosiły 23 lipca 2021 r. na łamach „Nature”, że udostępniają najbardziej kompletną bazę przewidywanych trójwymiarowych (3D) struktur ludzkich białek - tzw. ludzkiego proteomu, na który składa się ponad 20 tys. białek. Dane te będą swobodnie i bezpłatnie dostępne dla społeczności naukowej. Baza została stworzona przez Europejski Instytut Bioinformatyki (Hinxton w Wielkiej Brytanii) należący do Europejskiego Laboratorium Biologii Molekularnej (EMBL). Firma DeepMind opracowała system komputerowy do przewidywania struktur białek.
„Podpisuję się pod opinią innych naukowców, że jest to wydarzenie tej skali, co poznanie sekwencji genomu człowieka, jeśli nie większe. To jest rewolucja, która zmienia sposób pracy badaczy” – ocenił w rozmowie z PAP dr Jan Kosiński z EMBL.
Jak wyjaśnił, naukowcy potrzebują informacji o strukturze 3D białek, żeby lepiej zrozumieć mechanizm działania białek w komórkach i działanie całych komórek. „W kontekście medycyny, znając struktury 3D białek, można projektować leki - na przykład niektóre z cząsteczek, które zostały zaproponowane do zwalczania koronawirusa, zostały właśnie zaprojektowane na podstawie takich struktur” – tłumaczył dr Kosiński. Dodał, że w przypadku mutacji białek prowadzących do rozwoju raka można lepiej zrozumieć, w jaki sposób mutacja zmienia białko - i próbować to naprawić.
„To tylko niektóre przykłady, ale jest ich znacznie więcej. To trochę tak, jakbyśmy dali dziecku wszystkie klocki świata, aby mogło budować, co zechce. I to zupełnie za darmo” – tłumaczył.
Genom człowieka zawiera instrukcję do budowy ponad 20 tys. białek. Jednakże tylko dla około jednej trzeciej tych cząsteczek udało się eksperymentalnie – przy pomocy badań krystalograficznych i mikroskopii krio-elektronowej - określić strukturę trójwymiarową (3D). A w wielu wypadkach struktura ta została poznana tylko częściowo.
W 2020 r. możliwości przewidywania struktur 3D białek zmieniły się dzięki stworzeniu systemu sztucznej inteligencji AlphaFold, który opracowała firma DeepMind w Londynie. Pozwolił on przewidzieć strukturę niemal całego ludzkiego proteomu, czyli 98,5 proc. z ponad 20 tys. ludzkich białek.
Dzięki współpracy DeepMind i EMBL baza danych ze strukturami białek będzie dostępna w sposób otwarty i bezpłatny dla wszystkich.
„Eksperymenty mające na celu określenie trójwymiarowej struktury białka mogą trwać wiele miesięcy, a nawet lat. Teraz wystarczy wejść na stronę bazy i ściągnąć plik. To bardzo przyspieszy prace badawcze” - podkreślił dr Kosiński.
W bazie danych – łącznie z proteomem człowieka - znalazło się blisko 350 000 struktur białek, w tym również białka 20 biologicznie modelowych organizmów, na których prowadzone są niezliczone badania naukowe, takich jak m.in. bakteria Escherichia coli, kukurydza, muszka owocowa, mysz, ryba danio, zarodziec malarii i prątki gruźlicy.
Naukowcy podkreślają, że modele białek obecnych w bazie charakteryzują się różną dokładnością, mimo to udostępnienie ich zrewolucjonizuje badania w wielu różnych dziedzinach nauk przyrodniczych. Do końca roku baza powiększy się do 130 mln białek różnych organizmów.
Dr Kosiński zwrócił uwagę, że większość ludzkich białek występuje w różnych wersjach. „Tych wszystkich wersji w bazie danych nie ma, ale jeśli naukowiec chce uzyskać trójwymiarową strukturę danej wersji białka, może ściągnąć program AlphaFold i ją poznać” – zaznaczył. DeepMind udostępnił bowiem ulepszoną, najnowszą wersję tego systemu bezpłatnie. Metodologia stojąca za najnowszą, wysoce innowacyjną wersją AlphaFold oraz jego otwarty kod źródłowy zostały opublikowane w jednym z ostatnich numerów czasopisma „Nature”. Dzięki temu naukowcy mogą uzyskać model trójwymiarowej struktury białka nawet w ciągu godzin lub minut.
Jak wyjaśnił dr Kosiński, system AlphaFold używa technik, które zaprojektowano do tłumaczenia tekstów. „Białka to łańcuchy aminokwasów, które zwijają się w różne kształty. AlphaFold +tłumaczy+ te sekwencje aminokwasów w trójwymiarową strukturę białka” – powiedział badacz.
Skuteczność tego programu została potwierdzona pod koniec 2020 r. w olimpiadzie przewidywania struktur 3D białek (eksperyment CASP - Critical Assessment of protein Structure Prediction), która odbywa się co dwa lata. Okazało się, że modele białek wysłane przez firmę DeepMind, która stworzyła system, były dużo lepsze, niż te uzyskane z użyciem innych metod.
AlphaFold pozwala też ocenić poziom jakości przewidywanej struktury 3D białka. „Chcemy dać naukowcom korzystającym z bazy naprawdę jasny sygnał, na których częściach przewidywanej struktury mogą polegać” – skomentowała dla serwisu nature.com Kathryn Tunyasuvunakool pierwsza autorka pracy opublikowanej na łamach “Nature”, w której opisano przewidywania struktur ludzkich białek.
W miarę identyfikowania nowych białek i zwiększenia dokładności przewidywań ich struktury 3D baza udostępniona przez EMBL i DeepMind będzie aktualizowana.
"To będzie jeden z najważniejszych zbiorów danych od czasu mapowania ludzkiego genomu" – skomentował zastępca dyrektora generalnego EMBL i dyrektor EMBL-EBI Ewan Birney, cytowany w informacji prasowej przesłanej PAP.
Jego zdaniem udostępnienie struktur AlphaFold międzynarodowej społeczności naukowej otwiera wiele nowych dróg badawczych dotyczących m.in. chorób zaniedbanych czy nowych enzymów dla biotechnologii.
„Jest to wspaniałe, nowe narzędzie naukowe, które uzupełnia istniejące technologie i pozwoli nam przesunąć granice naszego rozumienia świata” – ocenił Birney.
AlphaFold jest już wykorzystywany w badaniach przez różne instytucje naukowe.
Na przykład Centre for Enzyme Innovation (CEI) University of Portsmouth (Wielka Brytania) wykorzystuje AlphaFold do opracowania szybszych enzymów do recyklingu niektórych z tworzyw sztucznych jednorazowego użytku, które najbardziej zanieczyszczają ziemię. Zespół z Uniwersytetu Kolorado w Boulder wykorzystuje przewidywania AlphaFold do badania oporności bakterii na antybiotyki, podczas gdy grupa z Uniwersytetu Kalifornijskiego w San Francisco – do lepszego zrozumienia biologii wirusa SARS-CoV-2. (PAP)
Komentarze
[ z 0]