ERAST przeszukuje miliard sekwencji biologicznych w milisekundy
Zespół naukowców opublikował w Nature Biotechnology nowe narzędzie bioinformatyczne ERAST (Efficient Retrieval-Augmented Search Tool), które wykorzystuje duże modele językowe (large language models, LLM) do wyszukiwania homologii w bazach danych zawierających około miliarda sekwencji biologicznych. Narzędzie integruje trzyetapowy proces optymalizacji — filtrowanie wstępne, przeszukiwanie bazy wektorowej i punktowanie wyników — dzięki czemu obsługuje zarówno sekwencje nukleotydowe, […]
Czytaj więcej