ERAST przeszukuje miliard sekwencji biologicznych w milisekundy

Zespół naukowców opublikował w Nature Biotechnology nowe narzędzie bioinformatyczne ERAST (Efficient Retrieval-Augmented Search Tool), które wykorzystuje duże modele językowe (large language models, LLM) do wyszukiwania homologii w bazach danych zawierających około miliarda sekwencji biologicznych. Narzędzie integruje trzyetapowy proces optymalizacji — filtrowanie wstępne, przeszukiwanie bazy wektorowej i punktowanie wyników — dzięki czemu obsługuje zarówno sekwencje nukleotydowe, […]

Czytaj więcej

Sztuczna inteligencja odkrywa tysiące nowych systemów odpornościowych bakterii

Dwa niezależne zespoły badawcze wykorzystały uczenie maszynowe (machine learning) do przeszukania genomów bakteryjnych w poszukiwaniu białek zaangażowanych w obronę przed wirusami bakteryjnymi — bakteriofagami. Zespół Petera DeWeirdta opracował narzędzie DefensePredictor, wytrenowane na danych z 17 000 genomów bakteryjnych, które w analizie około tysiąca genomów zidentyfikowało blisko 3000 nowych grup białek obronnych — funkcję antyfagową potwierdzono […]

Czytaj więcej

Nowe narzędzie AI projektuje syntetyczne wzmacniacze ekspresji genów

Zespół prof. Steina Aertsa z VIB i KU Leuven opublikował w Nature Methods oprogramowanie CREsted (cis-regulatory element sequence training, explanation and design) — platformę opartą na uczeniu głębokim (deep learning), która umożliwia analizę i projektowanie sekwencji wzmianiających ekspresję genów (enhancerów) specyficznych dla danego typu komórki. Narzędzie integruje przetwarzanie danych o dostępności chromatyny z pojedynczych komórek, […]

Czytaj więcej