Y хромозомна ДНК


Съдържание:

Всички знаем за усуканата спирала на дезоксирибонуклеиновата киселина (ДНК). Нуклеотид е двойката бази от аденин (A), тиамин (T), цитозин (C), гуанин (G), молекулите, които свързват двете вериги.  Аденин винаги се комбинира с тиамин, цитозин винаги се комбинира с гуанин. Всеки нуклеотид има своя позиция (адрес).

Особеността на Y-хромозомата да не се рекомбинира и по този начин да се запазва и предава от баща на син почти непроменена е много ценно за популационната генетика. Тя е като нишка през вековете по която може да стигнем с десетки хилядолетия назад в историята.


Short Tandem Repeats – STR

Друго понятие при Y-хромозомата е Short tandem repeats (късо тандемно повторение)– това са повтарящи се последователности от 2 до 6 бази (т.е. една последователност от 2 до 6 бази може да се повтаря от 3 до 100 пъти). При STR не се интересуваме от молекулата  аденин A, тиамин T, цитозин C, гуанин G, а се интересуваме колко пъти се повтаря. Там където има STR няма снип. И там където има снип няма STR.

Всяка подобна позиция от повторяеми бази има своя код (всеки STR се обозначава с композиция от букви и цифри), като на схемата по-горе са посочени част от тях.

  • D е за ДНК
  • Y е за Y хромозома.
  • S, Z, или F е за сложността на повторението
    • S е за уникален сегмент
    • Z е за повторяеми сегменти в една и съща локация на хромозомата
    • F е за повторяем сегмент, който се е копиран многократно в различни локации на в Y хромозомата.

При предаването на Y-хромозомата от баща на син са възможни изменения на броя повторения, както в увеличение така и в намаление. Различни позиции имат различна склонност на промяна – някои са „бързи” – променят се често в рамките на няколко поколения, други са „бавни” – нужди са хилядолетия за да настъпи промяна.

Например: повторение DYS464 – тук има 4 бази, всяка от които се повтаря по определен брой пъти, като при различните индивиди се повтаря по различен брой пъти, например:

  • 14-16-17-18
  • 13-13-13-15
  • 15-16-16-17
  • 16-16-16-16
  • 14-16-16-16
  • 13-15-15-18
  • 14-16-17-17
  • 14-14-15-19

Анализът на тези повторения на Y хромозомата се използва за генетични изследвания в популационната генетика, както и за откриване на роднински връзки по пряка мъжка линия. На фигура 2 – Схема на Y хромозома са посочени имената и позициите на първите 12 къси тандемни повторения (STR) :

DYS393         DYS390        DYS19**       DYS391        DYS385        DYS426        DYS388        DYS439            DYS389I       DYS392        DYS389II***

Обикновено тези 12 STR са предмет на научни изследвания и публикации, докато при потребителската генетика се счита за златен стандарт изследването на поне 67 STR-а. За българите е достатъчно изследване на 37 STR-а.

На мен са ми известни 481 къси тандемни повторения в Y-хромозомата. FTDNA предлага потребителски тестове на 111 от тях, като са възможни следните тестове  в зависимост от броя на STR-ите– 12, 25, 37, 67, 111. Останалите 370 са бързо променящи се и строго индивидуални и не приложими за популационната генетика.

Тук прилагам сертификат за такъв тест от 67 STR-а на баща ми.

За съжаление този тест не предостави повече информация от колкото първия тест от Y12 STR-а. Този тест може и да е полезен за западняците, когато искат да отсеят стотиците съвпаденци на по-горните нива било то Y12, Y25 или Y37. Но когато съвпаденците на ниво Y12 са малко, тестване за повече маркери няма да ги увеличи. Много начинаещи в тестовете смятат, че повече маркери ще доведат до повече съвпаденци. Напротив. Маркерите на ниво Y12 са най-стабилни, най-стари и следователно са разпространение сред по-голяма част от популацията на земята. Знам, че не е много добро сравнение, но си помислете за 12 те маркера като срещани във всички сортове ябълки. Включвайки още маркери от 13ти до 37ми ще наблюдаваме различни стойности на маркерите. Зелените ябълки ще имат едни стойности за 13ти до 37ми маркер, различни от стойностите на тези за червените ябълки. Ако добавим още маркери – от 38 до 67ми, то по стойностите на тези маркери ще различим ябълките „грени свит“ от останалите зелени ябълки.

Обратно към съдържание


Single Nucleotide Polymorphism – SNP

Промени в Y-хромозомата се случват само в резултат на единични, произволни замени на базите. Има участъци, които са изключително стабилни. С течение на времето – столетия и хилядолетия – започват да се натрупват промени.

Тези промени са подмяна на молекулата в нуклеотидната база (замяна на една молекула с друга – било то аденин A, тиамин T, цитозин C, гуанин G) и се нарича единичен нуклеотиден полиморфизъм (ЕНП) – SNP (single nucleotide polymorphism).

На български съкращението „SNP” се чете като „снип“; в множествено число „снипове“.

Анализът на тези подмени води до групиране на еднакви и близки резултати в групи, подреждането им и изграждане на дърво. Различните разклонения по дървото се наричат хаплогрупа.  Клон на дървото може да се определи от един или набор от снипове. В зависимост от натрупаните данни от изследванията, в последствие наборът от снипове може да бъде раздробен на множество клонове директно от един ствол – разширяване на короната, или на стъпки на един клон (удължаване на клона).

В момента се правят опити да се определи през колко години настъпват подобни подмени в базите, като има различни виждания. За някои изследователи критерия е броя поколения, като се приема средно 30 години на поколение. Няма общо съгласие, но в повечето случаи се възприема 150 години между появата на два снипа. 

Сниповете биват наименувани, като компанията направила откритието го кръщава по свой собствен начин. Името е комбинация от букви и числа, буквите – инициали на фирмата, лабораторията или учения, числата последователност на откриване на снипа. Името на снипа не е обвързано по никакъв начин с позицията на снипа върху Y хромозомата. Може един до друг да са снипове открити от различни компании, като в същото време те да дефинират съвсем различни и отдалечени групи…..

За да бъде приет снип за определящ хаплогрупа и да получи своето място на дървото има редица процедури. Водещ в поддържането и развитието на дървото на хаплогрупите на Y хромозомата е ISOGG (International Society of Genetic Genealogy) – Международното общество за Генетична Генеалогия. Тази доброволна организация има строги правила по които се приемат предложения. Има изисквания за технологията чрез която са извършени тестовете (резултати от чип тестове не се приемат), в колко не родствени индивида е открит снипа, как се доказва позиционирането му спрямо други вече открити снипове – дали е хронологично е настъпил преди или след тях в дървото. Линк към сайта http://www.isogg.org/tree/ .

„Хаплогрупа“ е широко използван термин в областта на генетичната генеалогия, където се проучват Y-хромозомната хаплогрупа (Y-ДНК), митохондриалната (мтДНК) и MHC-хаплогрупата, като винаги хаплогрупа означава група от индивиди с ДНК с еднакви стойности в съответните нуклеотидните бази.

Хаплогрупите също биват наименувани, но тук процесът не е толкова хаотичен както при сниповете. Те могат да се изписват по два начина: дълъг и кратък.

  • Дългият начин представлява пълния път по дървото от стартовата буква – например E1b1b1a1b. Редуват се цифри и букви, като само първата буква се изписва като главна. Недостатък на това изписване е, че с откриването на нови клонове или пък откриване на „междинни станции” тази последователност се променя. Предимство е, че две хаплогрупи могат лесно да бъдат съпоставени – например E1b1b1b2a1a2 и E1b1b1a1b1a. Тук е ясно, че и двете групи са по общ клон до E1b1b1, където след това се разделят – едната по клон E1b1b1a другата по клон E1b1b1b.
  • Краткото изписване е първата главна буква или до няколко символа и крайния дефиниращ снип за групата. Например E1b1b1a1b1a  ще се изпише като E-V13, защото крайния дефиниращ снип е V13.  Хаплогрупа E1b1b1b2a1a2 ще се изпише като Е-L791. Недостатък е, че по този начин не може да се направи бърз извод къде и как са позиционирани една спрямо друга E-V13 и Е-L791. Предимството е, че колкото и междинни звена да се вмъкват, обозначаването на хаплогрупата не се променя.

Когато  абревиатурата на хаплогрупата завършва на звезда – например –  J1c3d* – това означава, че индивидът е отрицателен за всички знайни снипове  надолу по дървото. В този случай индивидът е представител на стара хаплогрупа, която е родоначалник на няколко други подгрупи. 

В този текст ще срещате и дългия и краткия начин на изписване на хаплогрупите.

Обратно към съдържание


Генетична разлика и родство

При съпоставяне на резултатите на стойностите на късите тандемни повторения (STR) между два индивида се пресмята генетична разлика. Разликата бива положителна и отрицателна – т.е. в увеличение или намаление на броя повторения. Но когато се изчислява общата генетична разлика не е позволено нетиране, т.е. разлика в увеличение на компенсира разлика в намаление. Пресмята се разлика по абсолютна стойност. Колкото по-голяма е разликата, толкова родствено по-отдалечени са индивидите. Всеки мъж притежава своите стойности за тези къси тандемни повторения (STR), като колкото по-близка е роднинската връзка толкова по-малки ще са разликите. Установено е, че колкото е по-възрастен бащата при зачеването на момчето, толкова е по-голям шанса да се увеличи разликата в стойностите STR маркерите.

STR Маркери генетично разстояние (GD)
12 0
25 2
37 4
67 7
111 10

В таблицата по-горе са дадени стойностите на генетичното разстояние над което FTDNA – фирмата изготвяща тестовете не показва съвпаденци. А как да се разчете генетичното разстояние в контекста на родствена връзка?

Таблицата е публикувана на сайта на FTDNA на WEB адрес – https://www.familytreedna.com/learn/y-dna-testing/y-str/expected-relationship-match/

От горната таблица се вижда, че близко родство с тестване на 12 или 25 STR маркера не може да се докаже. Но пък може да отхвърли родство. Съща така за генеалогични цели се приема горна граница от 15 поколения.

Обратно към съдържание


Хаплотип

В текста използвам често думата хаплотип. „Хаплотип“ има няколко значения, но тук ще се употребява в смисъл на набор от индивидуални стойности на къси тандемни повторения. Хаплогрупата е понятие свързано с понятието снип, а хаплотипа е свързан с понятието STR

Например – изследват се 50 човека за 12 STR-а и  резултатите са както следва :

В този случай казваме, че петдесетте изследвани проби се групират в 5 хаплотипа.

Горният пример е от Голямото Българско Изследване и това са няколко от многото хаплотипове открити в хаплогрупа E-V13. Колкото повече хаплотипа има в една хаплогрупа при един народ, толкова по-отдавна е съществувал на дадената територия и е част от населението на тази територия.

Горецитираното изследване определя, че близо 18% от българите са  хаплогрупа E-V13 групирани в 52 хаплотипа. За разлика във Великобритания E-V13 сред англичаните (не се среща сред шотландците) е с много нисък процент и с ограничен брой хаплотипове. Това означава, че при англичаните E-V13 е скорошен примес – от времето на римските легиони и е внесено от ограничен брой индивиди. Същевременно за България това означава, че E-V13 е  местна и от много хилядолетия на тази територия хаплогрупа. За достигането на подобно разнообразие е необходим голям период от време, за да се даде възможност на бавните STR да се променят и да достигнат това разнообразие. Колкото е по-голямо разнообразието, толкова по-назад във времето се поставя първоизточника. 

Обратно към съдържание


Връзка между STR и снип

И пак да напомня – хаплогрупа се дефинира от сниповете (подмените в базите – т.е. каква е точно базата), докато хаплотипа се дефинира от броя повторения на базите.

При изследване във FTDNA всеки получава два сертификата – за Хаплогрупа (снип) и за Хаплотип (STR). Това са двата типа промени, които настъпват в Y хромозомата и са независими една от друга.

Има индиректна връзка между хаплогрупата и STR-ите.

Мъже с различни стойности на 12 вида къси тандемни повторения може да имат достатъчно различни стойности за голяма част от  12те повторния и в същото време да принадлежат към една и съща хаплогрупа, защото имат една и съща стойност за точно определен снип, който дефинира групата.

Съгласно дефиницията за снип – това е промяна в стойността на нуклеотида в определена позиция – т.е. първоначалния G-C се замества с T-A или обратно, и най-често тази промяна се случва в един единствен индивид в определена точка от времето. Този индивид предава Y хромозомата на своето мъжко поколение без рекомбиниране  – предава както късите тандемни повторения (STR), така и снипа. С времето част от стойностите на късите тандемни повторения (STR) се променят – едни се увеличават, други намаляват. Така отдалечавайки се във времето, все повече и повече индивиди, ще носят този снип, ще го предават на поколението си от мъжки пол, но ще предават и своите вече променени стойности на STR маркерите. Колкото по-назад във времето е родоначалникът при който е възникнал този определящ снип, толкова по-разнообразни ще са хаплотиповете принадлежащи към хаплогрупата определена от него.

В популационната генетика при наличие на хаплотипове с данни за 67 или 111 STR маркера, принадлежащи към една хаплогрупа (т.е. група дефинирана от един снип), чрез прилагане на статистически методи се изчислява времето до именно този родоначалник , в който е възникнал снипа.

На този принцип са изчислени годините в дърветата на хаплогрупите, които са по-надолу в текста. (да не си помислите, че аз съм изчислявала тези години! – те са предмет на научни публикации, от екипи с голям брой участващи учени; в повечето публикации дори се правят изчисления по няколко методики и се представят данните, като се отбелязва възможните граници и грешка в изчисленията).

Разнообразието на хаплотипове в определен регион или държава дава информация за времето до общия прародител. Колкото е по-голямо разнообразието – толкова е по-отместено назад времето до общия прародител. При съпоставка на именно това изчисление, в момента се спори дали на територията на днешна Украйна или на територията на днешен Афганистан е произлязла хаплогрупата  R1a1a-M198.

Моята надежда е, че с популяризирането на този вид изследвания чрез тази книжка ще се намерят българи, които да се тестват, за да излезе наяве разнообразието на хаплотиповете в различните ни групи. Колкото по-разнообразни хаплотипове, толкова по-голяма възраст на хаплогрупата. За съседни народи, които притежават само част от хаплотиповете открити при нас, може да кажем със сигурност, че посоката на разпространение е от нас към тях, а не обратното.  И ще се докаже, че сме потомци на древни народи, дали генетичен материал на цяла Европа.

Академичните изследвания прилагат няколко метода. Най-напред тестват пробите за  ограничен брой STR-и, предимно между 9 и 12, след това ги групират по хаплотипове и тогава започват за тестване на снипове. На база натрупани емпирични данни може да се предположи кой хаплотип към коя хаплогрупа принадлежи – E1b1b1, R1a, R1b, G2, J1, J2, I1, I2- както и до две три позиции по-надолу. Тестването на снипове е, за да потвърди принадлежността, както и да се постигне дълбочина на изследването. Например знаем, че тази проба е E1b1b1,  но колко по-надълбоко може да стигнем – дали е E1b1b1b2a1a2 или E1b1b1a1b1a  или може още няколко позиции да добавим?

Обратно към съдържание


Как нови снипове развиват дървото

Разработих този пример с цел да покажа процеса на развитие на дървото, като всичко в него е примерно. Реалните данни са в съответния раздел за съответната хаплогрупа.

Например до този момент са открити осем нови снипа в 12 участника от Италия, Франция, Англия, като всички 12 участника са положителни за всички осем снипа – да речем A1, A2, A3, A4, A5, A6, A7, A8. Приема се, че всички осем снипа са на едно ниво. Подава се заявка до ISOGG за регистриране на сниповете в дървото.

Дървото ще изглежда така:

  • E1b1b1a1 –
    • E1b1b1a1a – снипове A1, A2, A3, A4, A5, A6, A7, A8 – Италия, Франция, Англия

След време се появява индивид, който е положителен за три от тях – A2, A7, A8 и отрицателен за останалите пет.  Този индивид е българин. Така сниповете се разбиват на две нива, като A2, A7, A8 формират едно ниво, подгрупа на което са сниповете A1, A3, A4, A5, A6.

Тогава дървото ще изглежда така:

  • E1b1b1a1 –
    • E1b1b1a1a – снипове A2, A7, A8 – България
      • E1b1b1a1a1 – снипове A2, A7, A8, A1, A3, A4, A5, A6 – Италия, Франция, Англия

След време се появява нов индивид, който е положителен за A2, A7, A8 плюс A4 и отрицателен за A3,A5, A6. Този индивид също е българин. Тогава вече имаме едно ново междинно ниво и дървото ще изглежда така:

  •  E1b1b1a1 –
    • E1b1b1a1a – снипове A2, A7, A8 – България
      • E1b1b1a1a1a – снипове A2, A7, A8, A4 – България
        • E1b1b1a1a1a1 – снипове A2, A7, A4A8, A1, A3,A5, A6 – Италия, Франция, Англия

След време се появяват участници положителни за снипове A2, A7, A8, A4, но и за новооткрити снипове B1 и B13 и отрицателни за A3,A5, A6 – това са българин, сърбин, македонец, както и участници положителни за A2, A7, A8 и D12 и отрицателни за A3, A4, A5, A6 – българин, албанец и грък.

Тогава дървото се разклонява настрани и би изглеждало така:

  • E1b1b1a1 –
    • E1b1b1a1a – снипове A2, A7, A8 – българин
      • E1b1b1a1a1a – снипове A2, A7, A8, A4 – българин
        • E1b1b1a1a1a1 – снипове A2, A7, A8, A4, A1, A3,A5, A6 – българин, сърбин, македонец
        • E1b1b1a1a1a2 – снипове A2, A7, A8, A4, B1, B13 – италианец, французин, англичанин
    • E1b1b1a1a1b – снипове A2, A7, A8, D12 – българин, грък, албанец

Виждате как от дърво с една стъпка дървото се задълбочи и разраства настрани. На всяко разклонение може да се присвои възраст. 

Много често в текста по-нататък ще споменавам как резултатите от нашите изследвания  разклоняват дървото или вмъкват нови нива в дървото. Ако не се бяха тествали българи то примерното дървото нямаше да има тези допълнителни нива и щеше да остане скрито къде и как се е зародил съответния клон. Италианците, французите и англичаните ще си присвояват  правото да твърдят, че те са първоизточника.

Общото правило е , че при българите няма да се открият сниповете, които са се зародили след миграцията на носителя на запад, освен ако няма обратна миграция, както и на запад няма да има сниповете зародили се тук в останалото тук население. Е може да се появи някой българин, който се пише за англичанин….

Обратно към начало на страницата