Mapowanie genomów (ang. gene mapping) to sporządzanie map przedstawiających położenie poszczególnych genów na chromosomie. Wyróżnia się mapy genetyczne, określające odległości pomiędzy charakterystycznymi sekwencjami – markerami, oraz mapy fizyczne, przedstawiające rzeczywistą pozycję poszczególnych genów. Informacje zawarte w mapach fizycznych i genetycznych uzupełniają się nawzajem i stanowią podstawę dalszych badań nad organizacją i budową chromosomów.
Metody mapowania genomu
Istnieją dwa podstawowe rodzaje metod mapowania genomu:
• mapy genetyczne – na podstawie analizy sprzężeń genetycznych pozwalają ustalić rozmieszczenie genów i innych charakterystycznych sekwencji (markerów) w genomie oraz określają odległości genetyczne pomiędzy nimi. Jednostką w tych mapach jest % rekombinacji wyrażany w centymorganach (cM);
• mapy fizyczne – wykorzystują techniki biologii molekularnej do bezpośredniej lokalizacji różnych typów sekwencji DNA w genomie. Stosowaną jednostką są tu pary zasad (pz);
I. Mapy genetyczne
Markery
Przy tworzeniu map genetycznych, do określenia pozycji poszczególnych sekwencji stosuje się odpowiednie wyznaczniki lub inaczej markery. Pierwotnie były to tzw. markery fenotypowe, czyli geny kodujące pewne cechy fenotypowe organizmów i występujące w minimum dwóch formach allelicznych. Zmiany barwy ciała i kształtu skrzydeł u muszki owocówki – Drosophila melanogaster można obserwować za pomocą mikroskopu, natomiast podczas analizy fenotypów mikroorganizmów konieczne jest stosowanie metod biochemicznych. Obecnie wykorzystuje się również metody serologiczne i elektroforetyczne. Metoda ta nie znajduje jednak zastosowania w przypadku cech kodowanych przez więcej niż jeden gen i dlatego z czasem podczas konstruowania map genetycznych zaczęto stosować markery DNA, czyli charakterystyczne sekwencje niebędące genami. Tak jak markery fenotypowe muszą występować co najmniej w dwóch kodominujących wariantach, które identyfikuje się za pomocą technik analizy molekularnej.
Pierwszym wykorzystywanym typem markerów DNA był polimorfizm długości fragmentów restrykcyjnych (ang. restriction fragment length polymorphism; RFLP). Pozwala on określić różnice w długości poszczególnych fragmentów powstałych w wyniku cięcia specyficznymi endonukleazami, czyli enzymami restrykcyjnymi lub inaczej restryktazami. Trawią one cząsteczki DNA jedynie w ściśle określonych sekwencjach, a ich wyjątkowa specyficzność gwarantuje wysoką powtarzalność wyników. Polimorfizm długości fragmentów restrykcyjnych powstaje wtedy, kiedy sekwencja rozpoznawana przez restryktazę występuje w dwóch wariantach, z których tylko jeden może zostać rozcięty. Wielkość powstałych fragmentów wykrywa się bezpośrednio za pomocą hybrydyzacji metodą Southerna lub PCR, czyli łańcuchowej reakcji polimerazy. Zastosowanie tych markerów ma małą wartość w przypadku mapowaniu genów człowieka, ponieważ poszczególne rodziny są bardzo często homozygotyczne pod względem danego RFLP.
Tab. 1. Przykłady enzymów restrykcyjnych (według Brown T.A. i http://rebase.neb.com/rebase/) Miejsce cięcia oznaczono „_”
Jako markery DNA wykorzystuje się również polimorfizm długości prostych sekwencji (ang. simple sequence lenght polymorphism; SSLP), czyli allele różniące się między sobą liczbą powtarzalnych jednostek. Mogą mieć one wiele różnych wariantów długości, a zatem są wieloallelowe. Wśród SSLP wyróżnić można dwa podstawowe typy:
• minisatelity – charakteryzuje je zmienna liczba kilkudziesięcionukleotydowych tandemowych powtórzeń (ang. variable number of tandem repeats; VNTR) zlokalizowanych głownie na końcach chromosomów;
• mikrosatelity – zawierają proste tandemowe powtórzenia (ang. simple tandem repeats, STR) dwu, trzy lub czteronukleotydowych fragmentów. Są one dogodniej rozmieszczone w genomie niż minisatelity i łatwiej jest je oznaczyć za pomocą reakcji PCR.
Rys. 1. Oznaczanie SSLP. Allel I zawiera mniej powtórzonych motywów GA niż allel II. Różnice w długości obu fragmentów można uwidocznić za pomocą PCR. Dwa prążki na żelu świadczą o obecności obu alleli w badanym DNA.
Kolejnym typem markerów DNA jest polimorfizm punktowy (ang. single nucleotide polmorphism; SNP), czyli pojedyncze, punktowe mutacje licznie występujące w całym genomie. Każdy SNP występuje jedynie w dwóch wariantach, co wpływa na wysokie ryzyko homozygotyczności wewnątrz rodzin. Ich niewątpliwą zaletą jest jednak duża liczba i możliwość zrezygnowania z czasochłonnej elektroforezy. SNP wykrywa się analizując ich hybrydyzację z oligonukleotydami, czyli sztucznie zsyntetyzowanymi fragmentami DNA, które łączą się z badaną sekwencją jedynie w przypadku całkowitej zgodności obu fragmentów.
Miejsca połączeń wyszukuje się za pomocą:
• technologii „chip” DNA, czyli silikonowej płytki z gęsto poukładanymi oligonukleotydami. Dzięki fluorescencyjnemu wyznakowaniu testowanego DNA, wyniki hybrydyzacji można obserwować pod mikroskopem oraz oznaczać wiele SNP w trakcie jednego badania;
• dynamicznej hybrydyzacji specyficznej dla allelu (ang. dynamic allele-specyfic hybridization, DASH) wykorzystującej różnice w temperaturze topnienia DNA.
Analiza sprzężeń genetycznych
Podstawą konstruowania map genetycznych jest analiza sprzężeń, czyli skłonności poszczególnych genów do wspólnego dziedziczenia. Jeżeli dwie sekwencje znajdują się na jednym chromosomie, to w trakcie podziałów komórkowych powinny one trafić do tego samego jądra potomnego. Nie zawsze jednak tak się dzieje. Zjawisko to wyjaśnia chromosomowa teoria dziedziczności sformułowana w XX wieku przez Tomasza Hunta Morgana. Uwzględnia ona tzw. crossing-over, czyli wymianę fragmentów między chromosomami homologicznymi zachodzącą podczas profazy podziałów mejotycznych. Zjawisko to jest przyczyną zmienności rekombinacyjnej.
Częstość rekombinacji nie wykazuje bezpośredniego związku z fizyczną odległością genów na mapie. Jest ona jednak miarą odległości między dwoma genami. Jeżeli dwa geny są od siebie oddalone na chromosomie, to wtedy częstość ich rozdziału na drodze crossing-over jest większa niż w przypadku genów znajdujących się w swoim bliskim sąsiedztwie. Analiza sprzężeń pozwala zatem oznaczyć pozycję poszczególnych genów na chromosomie. Procedury te są jednak mało dokładne ze względu na występowanie tak zwanych gorących miejsc rekombinacji i podwójnego crossing-over.
Sposób przeprowadzania analizy sprzężeń zależy od rodzaju badanego organizmu. W przypadku większości eukariontów np. muszki owocówki stosuje się eksperymenty hodowlane, polegające na analizie potomstwa uzyskanego w wyniku prowadzenia eksperymentalnych krzyżówek między rodzicami o różnych genotypach. Tego typu metody nie mają jednak zastosowania u ludzi u których z przyczyn etycznych wykorzystuje się tzw. analizy rodowodów. Dostarczają ona jedynie ograniczonych danych, które następnie analizuje się statystycznie za pomocą metody lod score (ang. logarithm of the odds). Najczęściej stosowanymi markerami są tu choroby genetyczne. W przypadku bakterii, które nie przechodzą mejozy, wykorzystuje się inne naturalnie występujące metody przenoszenia fragmentów DNA, takie jak koniugacja, transdukcja i transformacja.
II. Mapy fizyczne
Wiele spośród miejsc trawionych restryktazami nie wykazuje polimorfizmu niezbędnego do tworzenia map z wykorzystaniem RFLP. Można je jednak zastosować do mapowania restrykcyjnego. DNA trawi się dwoma różnymi enzymami, a następnie na żelu agarozowym porównuje wielkość powstałych w ten sposób fragmentów. Dzięki temu można określić większość miejsc cięcia. Dalsze informacje uzyskuje się wykonując tzw. trawienie częściowe.
Metoda ta ma jednak swoje ograniczenia. Można ją stosować jedynie w przypadku cząsteczek nieprzekraczających 50kb, gdyż w przeciwnym razie tworzy się zbyt wiele fragmentów utrudniających przeprowadzenie analizy. W niektórych przypadkach trudności te można pokonać wykorzystując restryktazy rozpoznające wyjątkowo rzadkie sekwencje. Ich użycie powoduje jednak powstawanie długich fragmentów zmniejszających rozdzielczość zwykłej elektroforezy.
Do mapowania fizycznego dużych genów stosuje się częściej hybrydyzację fluorescencyjną in situ (ang. fluorescent in situ hybridization; FISH), w której poszukiwane sekwencje nukleotydowe uwidacznia się za pomocą wyznakowanych fluorescencyjnie sond DNA. Zastosowanie znaczników różniących się od siebie emitowanym kolorem pozwala na jednoczesne przyłączanie wielu różnych sond do jednego chromosomu. Jego DNA musi być jednak w formie jednoniciowej, a markery nie mogą się znajdować w stosunku do siebie bliżej niż 1Mb, gdyż w przeciwnym razie zostaną odczytane jako jeden sygnał.
Inną powszechnie stosowaną metodą jest mapowanie miejsc znaczonych sekwencyjnie (ang. sequence tagged site, STS). STS są to krótkie (100-500bp) i łatwe do rozpoznania sekwencje DNA, które posiadają unikatową lokalizację w całym genomie lub w pojedynczym chromosomie. Mogą nimi być np. sekwencyjne znaczniki ekspresji (ang. expressed sequence tags, EST) lub też markery SSLP, czyli polimorfizmu długości krótkich sekwencji (ang. simple sequence length polymorphism) działające jako drogowskazy podczas mapowania fizycznego genomu. Aby zmapować zestaw STSów potrzebna jest kolekcja zachodzących na siebie fragmentów DNA. Potrzebne dane uzyskuje się porównując które STS znajdują się w jakim fragmencie. Można w tym celu wykorzystać PCR lub analizę hybrydyzacyjną. Odległości na mapie określa się na podstawie częstości powstawania pęknięć pomiędzy markerami. Fragmentami DNA do mapowania STS mogą być np. hybrydy poradiacyjne lub biblioteki klonów.
Rys. 2. Kolekcja fragmentów do mapowania STS. Znajdujące się blisko siebie markery niebieskie występują razem w większej ilości fragmentów niż oddalone od siebie markery zielone (według Brown T.A.)
Dostępne w internecie przeglądarki genomowe:
• CEPH Genotype database http://www.cephb.fr/en/cephdb/
• NCBI Map Viewer http://www.ncbi.nlm.nih.gov/projects/mapview/
• UCSC Genome Browser http://genome.ucsc.edu/
• Ensembl Map View http://ensembl.fugu-sg.org/common/helpview?kw=mapview;ref
Autor: Anna Kurcek
Literatura:
1. Brown T.A., 2001. Genomy. Wydawnictwo Naukowe PWN. Warszawa.
2. 5. Malepszy S., 2001. Biotechnologia roślin. Wydawnictwo Naukowe PWN, Warszawa Ratledge C., Kristiansen B., 2011. Podstawy biotechnologii. Wydawnictwo Naukowe PWN, Warszawa.
3. Nawara M., Jurek M., Bal J., Mazurczak T., 2009. Mapowanie genów w 14 rodzinach z niespecyficzną niepełnosprawnością intelektualną sprzężoną z chromosomem X. Medycyna Wieku Rozwojowego. (8)2; 94-113.
4. Oficjalna strona Human Genome Project http://www.ornl.gov/sci/techresources/Human_Genome/home.shtml
5. Turner P.C., McLennan A.G., Bates A.D., White M.R.H., 2004. Biologia Molekularna. Krótkie wykłady. Wydawnictwo Naukowe PWN. Warszawa.
6. Sadakierska-Chudy A., Dąbrowska G., Goc A., 2004. Genetyka ogólna. Skrypt do ćwiczeń dla studentów biologii. Uniwersytet Mikołaja Kopernika. Toruń.
7. http://rebase.neb.com/rebase/