Zmienność w ludzkim genomie

Autor: Katarzyna Nabielec

International Human Genome Sequencing Consortium (IHGSC) podaje, że genom człowieka zawiera 3,08 mld nukleotydów (Słomski, 2008). Ich ułożenie w sekwencję to informacja genetyczna, która stanowi wspólną cechę genomów wszystkich ludzi. Jednakże, każdy genom ludzki posiada charakterystyczny dla siebie zbiór różnic, zwanych zmiennością. Porównanie ich w obrębie różnych populacji oraz bezpośrednie zestawienie indywidualnych genomów spokrewnionych osób, wykazuje istnienie tzw. polimorfizmu (Marcinkowska i Kozłowski, 2011). Warianty sekwencji obejmują do 0,1% euchromatyny człowieka (Słomski, 2008). Większość z nich to polimorfizmy o charakterze zmian jednego nukleotydu (SNP – ang. single nucleotide polymorphism). Innymi zaobserwowanymi polimorfizmami są insercje i delecje oraz zmienności/warianty liczby kopii długich sekwencji DNA (CNV – ang. copy number variation) (Szczerbal i in., 2014). Według Słomskiego i in. (2008) termin polimorfizm dotyczy sekwencji DNA, dla której najrzadszy allel występuje w populacji z częstością 1% lub większą, w innym przypadku wariant sekwencji jest mutacją. Polimorfizm genetyczny, odpowiada w znacznym stopniu za zróżnicowanie w obrębie ludzkiej populacji. Różnice dotyczą cech fenotypowych, takich jak poziom markerów biochemicznych, stan zdrowia i wygląd zewnętrzny. Polimorfizm genetyczny może powodować choroby, zwiększać ryzyko zachorowania, zaostrzać objawy, przebieg choroby oraz modyfikować reakcje na zastosowaną. Do tej pory sądzono, że większość różnic stanowią polimorfizmy typu SNP. Najnowsze badania udowodniły, że w genomie człowieka występują także polimorfizmy CNV, które obejmują setki tysięcy par zasad łańcucha DNA. Takie warianty często dotyczą genów i innych funkcjonalnych elementów genomu (Marcinkowska i Kozłowski, 2011). IHGSC szacuję liczbę genów człowieka, które kodują białka na 20-25 tys. a liczbę eksonów w genomie na ok. 23 tys., z czego średnio 10,4 egzonu w locus oraz 9,1 egzonu w transkrypcie (Słomski, 2008).

Mechanizmy prowadzące do powstania zmienności w ludzkim genomie, powodują również zmiany fenotypowe. Wyróżniamy cztery podstawowe mechanizmy rearanżacji genomowych: nie-homologiczne łączenie końców (NHEJ – ang. non-homologous end-joining), nie-alleliczna homologiczna rekombinacja (NAHR – ang. non-allelic homologous recombination), model replikacji indukowanej przez pęknięcia w rejonach mikrohomologii (MMBIR – ang. microhomology mediated break induced replication) oraz model blokowania widełek i przyłączania matrycy (FoSTeS – ang. fork stalling and template switching) (Jaroniec, 2012).

Proces NHEJ zachodzi zarówno w fazach G1, jak i G2 cyklu komórkowego, organizmów eukariotycznych. Jest podstawowym narzędziem naprawy dwuniciowych pęknięć DNA (Natarajan i Palitti, 2008). Pęknięcia powstają w wyniku rekombinacji lub są wywołane przez czynniki patologiczne (promieniowanie jonizujące). NHEJ nie wymaga obecności sekwencji homologicznych w łańcuchu DNA. Mechanizm ten generuje duplikację oraz delecję (Jaroniec, 2012).

Proces NAHR może w dużym stopniu zmienić strukturę genomu w trakcie gametogenezy, przez tworzenie przegrupowań chromosomalnych. W efekcie delecje, inwersje, duplikacje i inne zmiany wywołane przez NAHR, które ulegają przekształceniu, związane są z wieloma ludzkimi zaburzeniami genetycznymi (Sasaki i in., 2009). Ma to istotne konsekwencje kiedy odwrócony segment zawiera geny. Gen może ulec skróceniu lub całkowicie utracić swoją funkcję. NAHR wymaga, aby w DNA znajdowały się segmenty o niemal takiej samej sekwencji w obrębie LCR (ang. low–copy repeats, sekwencje liczące powyżej tysiąca par zasad i identyczne w co najmniej 90%). NAHR najczęściej ma miejsce między segmentowymi duplikacjami, które leżą w ramieniu jednego chromosomu (w odległości <1 miliona par zasad) (Marcinkowska i Kozłowski, 2011). Nie-alleliczna homologiczna rekombinacja, zachodzi podczas mitozy i mejozy (Jaroniec, 2012).

Trzecim mechanizmem powstawania rearanżacji w genomie jest FoSTeS, który powiązany jest z replikacją DNA. Badania przekształceń genomowych, w których wykorzystano nowe techniki molekularne, przyczyniły się do odkrycia procesu FoSTeS (Lee i in., 2007). Mechanizm ten w odróżnieniu od NAHR i NHEJ, które wyjaśniają powstawanie prostych przekształceń, tłumaczy zmiany złożone. FoSTeS ma miejsce podczas replikacji DNA, gdy nastąpią błędy podczas tego procesu.

Mechanizm MMBIR podobnie jak FoSTeS, wyjaśnia powstanie złożonych, chromosomowych i genomowych przekształceń. Oprócz wyżej opisanych procesów również retrotranspozycja przy udziale mRNA, może przyczyniać się do powstawania wariantów strukturalnych. Zmiany powstałe przy udziale retrotranspozycji mają istotne znaczenie dla funkcjonowania ludzkiego genomu (Jaroniec, 2012).

Powszechnym rodzajem polimorfizmu w genomie człowieka jest SNP. Celem projektu o nazwie International HapMap Project, Programs for Genomic Applications (NHLBI-PGA) zajmuje się jest dokładne scharakteryzowanie tych zmienności (Marcinkowska i Kozłowski, 2011). Ciągle poszerzająca się baza SNP, w 2011 roku zawierała ponad 27 mln pozycji tego polimorfizmu, podczas gdy obecnie jest to już ponad 113 mln pozycji (Ziętkiewicz, 2013). Podczas sekwencjonowania DNA, SNP są najłatwiej wykrywalnymi polimorfizmami. Znajdują się w sekwencjach niekodujących (introny), kodujących (codingSNP, cSNP) oraz sekwencjach regulatorowych np. promotorowych (rSNP, regulatorySNP) (Uruski, 2012). SNP stanowią blisko 90% wszystkich zmienności i występują średnio w ilości 1 na 300 – 1000 par zasad (pz). Jednak nasycenie i gęstość polimorfizmów jednego nukleotydu, nie są takie same w obrębie całego genomu. Największe zagęszczenie tego polimorfizmu, obserwuje się na chromosomie 6, w locus HLA. Z kolei na chromosomie X zidentyfikowano najdłuższy fragment, o długości ok. 1,7 miliona par zasad (Mpz), w którym nie wykryto żadnego SNP. Jest to tzw. „pustynia SNP” (Bal i Bocian, 2013). Polimorfizmy te, tworzą się w wyniku mutacji, które są utrwalane wybiórczo w różnych populacjach. Ważną cechą SNP jest silny związek częstości alleli z diagnozowaną populacją. Szacuje się, że w ludzkim genomie znajduje się ok. 3 mln markerów genetycznych typu SNP.

Postęp genomiki oraz prowadzenie badań określających rolę SNP, pozwolił na wyselekcjonowanie kluczowych polimorfizmów, które mogą stanowić czynnik podatności na zachorowanie. Opisano różne metody poszukiwania asocjacji SNP z chorobami. Znaczna część opiera się na identyfikacji haplotypów i genotypów związanych ze stanem chorobowym. Rozpoznanie polega na odnajdywaniu różnicy częstości alleli danego polimorfizmu, pomiędzy chorymi osobami a grupą kontrolną (Jaroniec, 2012). Analiza asocjacji markerów SNP doprowadziła do identyfikacji miejsc w genomie, których zmienność związana jest z powszechnie występującymi chorobami. Jednym z największych osiągnięć jest identyfikacja loci, których związek z astmą, cukrzycą, rakiem piersi, prostaty, płuc czy chorobami krążenia, potwierdzono w wielu różnych populacjach. Jednak dotychczas wykryte, korelujące z chorobą markery SNP wyjaśniają niewielki procent (<5%) zmienności genetycznej analizowanych chorób. W wielu przypadkach nie udało się zidentyfikować wariantów sekwencji modyfikujących ryzyko choroby, mimo zidentyfikowania sygnału asocjacji (Marcinkowska i Kozłowski, 2011). Pomimo tego, Bal i Bocian (2013) twierdzą, że wynik analiz SNP, może w przyszłości stać się podstawą tworzenia genetycznych „wizytówek” człowieka.

Kolejne polimorfizmy, które występują w całym genomie człowieka i stanowią znaczące zmiany strukturalne, nazywane są wariantami/zmiennością liczby kopii (CNV) (Marcinkowska i Kozłowski, 2011). To segmenty DNA o długości od 1 tysiąca par zasad (kpz) do kilku Mpz, w których zauważono zmniejszenie lub zwiększenie liczby kopii, podczas porównywania genomów między sobą (Scherer i in., 2007). Badania całego genomu wykazały, że w rejonach o wielkości 50 kpz – 10 Mpz, które otoczone są przez segmentowe duplikacje, CNV występują czterokrotnie częściej (Shaw i Lupski, 2004). Do powstania CNV mogą prowadzić inwersje, translokacje, duplikacje oraz triplikacje (Jaroniec, 2012). Polimorfizmy te występują zarówno w postaci insercji jak i delecji. Znaczną część insercji stanowią duplikacje znanych fragmentów genomu, które mają charakter tandemowych, bezpośrednich powtórzeń i przybierają formę powtórzeń wielokrotnych. W wyniku wielokrotnych delecji, insercji oraz inwersji, część CNV posiada charakter złożonych rearanżacji. Końce CNV, które stanowią miejsca pęknięć chromosomu, mogą występować w obrębie segmentowych duplikacji zwanymi LCR. Z tego powodu najczęstszym mechanizmem powstania CNV jest NAHR (Marcinkowska i Kozłowski, 2011). CNV może mieć charakter zmian somatycznych (zależnych tkankowo), powstawać de novo oraz być dziedziczony z pokolenia na pokolenie (Bal i Bocian, 2013). Polimorfizm CNV może wpływać na ekspresję genów poprzez przeniesienie fragmentu genu, przerwanie/uszkodzenie genu czy modyfikację elementów regulatorowych np. regionów promotorowych. Wykazano również wpływ CNV na poziom mRNA. Zmiana liczby kopii może zatem modyfikować poziom białka powstającego w procesie translacji. W obrębie poznanych regionów CNV wyróżniamy setki funkcjonalnych i znaczących fragmentów genomu np. geny kodujące białka związane z chorobami. Dotyczy to zarówno pacjentów zdrowych i chorych. Przykładem jest polimorfizm CNV genów kodujących β-defensyny, który zwiększa ryzyko łuszczycy (Marcinkowska i Kozłowski, 2011).

Polimorfizmy typu insercja lub delecja (indel) to najczęstsze obok SNP polimorfizmy, które występują w genomach eukariotycznych. Długoś zmienności typu indel waha się w przedziale od 1 pz do kilku milionów pz. Polimorfizmy te dzieli się na tzw. małe indele (od 1 do 100 pz) i duże indele o wielkości ≥ 100 pz. (Ziółkowski i in., 2010).

Polimorfizm SNP występuje w sekwencjach kodujących, niekodujących oraz w regionach międzygenowych. W zależności od lokalizacji występowania tych zmienności, dzielimy je na synonimiczne tzw. modyfikacja cicha (zmiana w sekwencji nukleotydowej DNA nie wpływa na sekwencję aminokwasów w białku) oraz niesynonimiczne (zmiana w sekwencji nukleotydowej DNA wpływa na sekwencję aminokwasów w białku (Bautembach-Koberda, 2013). Obecność SNP w sekwencji kodującej często powoduje zmianę w budowie białek. Występowanie we fragmentach regulatorowych może z kolei skutkować zmianą ekspresji genu (Uruski, 2012). Polimorfizm SNP polega na wymianie jednego nukleotydu w łańcuchu DNA. W przypadku zmiany niesynonimicznej, skutkiem podstawienia innego nukleotydu jest powstanie różnych cząsteczek informacyjnego RNA, zmiana aminokwasowej sekwencji łańcucha białkowego następnie budowy i funkcji białka, które stanowi produkt ekspresji genu. Białka mogą pełnić rolę enzymów, wchodzić w skład receptorów, apoprotein oraz hormonów. Istnienie genetycznych polimorfizmów w obrębie danego białka odgrywa ważną rolę w predyspozycji organizmu do rozwoju zaburzeń lub chorób (Adamska i Ostrowska, 2010).

Zmienności występujące w ludzkim DNA mogą być przyczyną zaburzeń metabolicznych, które prowadzą do nieprawidłowości w budowie lub funkcjonowaniu danego organu, zmian reakcji i odpowiedzi organizmu na substancje chemiczne, leki czy patogeny. genetycznego szczegółowe badania wykazały, że niektóre zmiany w sekwencjach aminokwasowych białek prowadzą do powstania wad rozwojowych (Bautembach-Koberda, 2013).

Przykładami zmienności genetycznej typu SNP wpływającej na metabolizm człowieka są:
• polimorfizm rs1800206 w obrębie PPARα, który może być przyczyną podwyższenia w organizmie stężenia całkowitego cholesterolu oraz frakcji LDL.
• polimorfizm rs659366, który występuje w obrębie promotora genu kodującego białko UCP2 i ma wpływ na zmniejszenie oksydacji lipidów oraz zwiększenie oksydacji węglowodanów (Adamska i Ostrowska, 2010).
• polimorfizm rs4988235 w genie kodującym hydrolazę lakolizyny laktazy, który powoduje nietolerancje laktozy (Koek i in., 2010).

Bibliografia:
1. ADAMSKA E. i L. OSTROWSKA, 2010.Nutrigenetyka i nutrigenomika a leczenie otyłości i chorób towarzyszących. Forum Zaburzeń Metabolicznych, 1(3), 156-167.
2. BAL J. i E. BOCIAN, 2013. Podstawy genetyki i genomiki. W: J. BAL, red. Biologia molekularna w medycynie. Elementy genetyki klinicznej. Warszawa: Wydawnictwo Naukowe PWN, s. 4-39.
3. BAUTEMBACH-KOBERDA, 2013. Polimorfizm w genie DSPP w populacji osób nie prezentujących fenotypu dentinogenesis imperfecta typu II i/lub III oraz dysplazji zębiny. Gdańsk. Rozprawa doktorska.
4. JARONIEC M. i D. OSTALSKA-NOWICKA, 2012. Zaburzenia genomowe – konsekwencje kliniczne i zastosowanie w diagnostyce. Postępy Biologii Komórki, 39(1), 112-118.
5. KOEK W., J. VAN MEURS, B. VAN DER EERDEN, F. RIVADENEIRA, M. ZILLIKENS, A. HOFMAN, B. OBERMAYER-PIETSCH, P. LIPS, H. POLS, A. UITTERLINDEN i J. VAN LEEUWEN, 2010. The T-13910C polymorphism in the lactase phlorizin hydrolase gene is associated with differences in serum calcium levels and calcium intake.Journal of Bone and Mineral Research, 25(9), 1980-1987.
6. LEE J., C. CARVALHO i J. LUPSKI, 2007. A DNA replication mechanism for generating nonrecurrent rearrangements associated with genomic disorders. Cell, 131(7), 1235-1247.
7. MARCINKOWSKA M. i P. KOZŁOWSKI, 2011. Wpływ polimorfizmu liczby kopii na zmienność fenotypową człowieka. Postępy Biochemii, 57(3), 240-248.
8. NATARAJAN A. i F. PALITTI, 2008. DNA repair and chromosomal alterations. Mutation Research, 657(1), 3-7.
9. SASAKI M. J. LANGE i S. KEENEY, 2010. Genome destabilization by homologous recombination in the germ line. Nature ReviewsMolecular Cell Biology, 11(3), 182-95.
10. SCHERER S., C. LEE, E. BIRNEY, D. ALTSHULTER, E EICHLER, N. CARTER, M. HURLES I L. FEUK, .2007. Challenges and standards in integrating surveys of structural -variation. Nature Genetics, 39(7), 7-15.
11. SŁOMSKI R., M. SZALATA i K. WIELGUS, 2008. Poznanie genomu człowieka i perspektywy analiz DNA. W: R. SŁOMSKI, red. Analiza DNA. Teoria i praktyka. Poznań: Wydawnictwo Uniwersytetu Przyrodniczego w Poznaniu, s. 24-29.
12. SZCZERBAL I., D. MRÓZ i M. ŚWITOŃSKI, 2014. Jak polimorfizmy DNA w sekwencjach intronowych wpływają na fenotyp? Przegląd Hodowlany, 5, 8-10.
13. URUSKI P., 2012. Związek polimorfizmu pojedynczych nukleotydów w genach szlaku jak/stat oraz w genach kandydujących z występowaniem pierwotnego nadciśnienia tętniczego. Poznań. Rozprawa doktorska.
14. SHAW C. i J. LUPSKI, 2004. Implications of human genome architecture for rearrangement-based disorders: the genomic basis of disease. Human Molecular Genetics, 13(1), 57-64.
15. ZIĘTKIEWICZ E.., 2013. Genetyczna różnorodność współczesnych populacji ludzkich. W: J. BAL, red. Biologia molekularna w medycynie. Elementy genetyki klinicznej. Warszawa: Wydawnictwo Naukowe PWN, s. 50-66.
16. ZIÓŁKOWSKI P., D BABULA-SKOWROŃSKA, M. KACZMAREK, A. CIEŚLA i J. SADOWSKI, 2010. Sekwencjonowanie porównawcze genomów: generowanie markerów genetycznych typu INDEL i SNP. Biotechnologia, 4(91), 53-68.