Dwa niezależne zespoły badawcze wykorzystały uczenie maszynowe (machine learning) do przeszukania genomów bakteryjnych w poszukiwaniu białek zaangażowanych w obronę przed wirusami bakteryjnymi — bakteriofagami. Zespół Petera DeWeirdta opracował narzędzie DefensePredictor, wytrenowane na danych z 17 000 genomów bakteryjnych, które w analizie około tysiąca genomów zidentyfikowało blisko 3000 nowych grup białek obronnych — funkcję antyfagową potwierdzono eksperymentalnie w 42 przypadkach. Z kolei grupa Ernesta Mordreta zastosowała modele językowe białek (protein language models) do analizy ponad 120 milionów sekwencji, typując setki tysięcy potencjalnych białek o funkcji ochronnej przed fagami. Odkrycia te sugerują, że różnorodność bakteryjnych systemów obronnych jest znacznie większa niż dotychczas sądzono — to właśnie z bakteryjnych mechanizmów odpornościowych wywodzą się tak przełomowe narzędzia jak CRISPR-Cas9 czy enzymy restrykcyjne. Wyniki obu prac, opublikowane w Science, mogą stać się inspiracją do stworzenia nowych narzędzi biotechnologicznych.
Źródła:
- DeWeirdt P. i in., DefensePredictor: A Machine Learning Model to Discover Novel Prokaryotic Immune Systems, Science, 2026, DOI: 10.1126/science.adv7924
