• ¡Welcome to Square Theme!
  • This news are in header template.
  • Please ignore this message.
Здравейте гост! Вход Регистрация


Рейтинг:
  • 22 Гласа - 3.14 Средно
  • 1
  • 2
  • 3
  • 4
  • 5
FASTA извлечена от BAM на тест BIG Y
#1
Снощи след постинга на Трифуд писах на Ян.

Ето и отговора му:

Thanks for the email.
I have seen several sequences from the Full Genomes Corp. (FGC) ; but the quality has been very variable. so just sequence is ow on GenBank.
However, I have not seen any of FTDNA's Big-Y results - which seems a bit surprising.

But I guess your results show what happens - with sometimes the results being good and othe time very poor.
I think for the first sequence, we could just submit it with the


MT-YF01913 number;
and it should be accepted without a problem. (I don't expect GenBank will look too closely and just treat the sequence as an ordinary one.)
However the second sequence is very poor and not worth submitting.
It appears to be a Haplogroup I1a1 sequence. 

So if you want to submit the first sequence, let me have the appropriate details and I'll make a submission file.
 
Reply
#2
Моят въпрос е много подобен: има ли онлайн средства или уиндоус приложения за извличане на 16Кв FASTA извлечена от BAM на тест Данте Лабс WGS 30x?
Миналата седмица най-после получих HDD с всичките си сурови данни оттам и ги подадох в YFULL за Y и mT анализ, но той ще отнеме може би месец. Временно определената ми Y група е G-Z44226* (при мои ръчни проверки- G-Z44370), a mT-DNA не е и временно определена.
Така че на въпроса- докато чакам YFULL пробвах BAM файла с програмката BAM_Analysis_Kit_1_8.
Програмата ме определи като H85, но извлече мутациите на mT-хромозомата не във FASTA формат, а във VCF формат. Притесни ме една от бележките във VCF файла- че някои прочитания може да се филтрират ако са с ниско качество- т.е. генерираният файл може и да не съдържа всички мутации...
Както и да е, намерих онлайн сайт, който прави анализ mT-DNA от VCF файлове (https://haplogrep.uibk.ac.at/).
Доста е информативен и прилага четири различни метода на mT анализ (по Kulczynski, Hamming, Jaccard, Kimura2P). Та по тези 4 метода се получиха три различни резултата за MT Haplogroup assignment ([J2a1a1a], [H2a2a1], [H85]). Тук ми е въпросът по същество: това нормално ли е, или може да се дължи на поорязан VCF файл с не всички mT мутации? YFULL отчита 100% качествени мутации и прочитания (които не са още готови), а този сайт чете vcf файла като 0,67.... И накрая отново техническият въпрос- има ли вариант за директно извличане на FASTA файл от BAM файл?
 
Reply
#3
Честито за резултатите, колега Smile Надявам се някой тук да може да ти помогне Smile

Аз съм H2a2a1, интересно дали и ти ще си от нея, а от къде ти е правата женска линия? Smile
EU-100
J-CTS6061
H2a2a1
 
Reply
#4
Здрасти колега, от село Скребатно, Гоцеделчевско, близо до Ковачевица и Огняново. И по майчина и по бащина линия. Въпреки че доста хора от двете ми страни са се заселвали още преди 1915 г. не на север към София, а на северо-изток- Велинград-Батак-Пещера-Пазарджик-Пловдив, а аз самият съм в София. Основните родове в това село са местни плюс бежанци от Дойранско-Леринско.
 
Reply
#5
Не мога да коментирам за програмите, но по принцип пълен мтДНК от .бам файл може да е неточна. Зависи от качеството на файла и дали има много no calls. Преди Big Y даваше и прочитания за мтДНК, но от ФТДНА почнаха да ги чистят да не се конкурират с другия им по-скъп тест. Тогава някои рапортуваха, че има разлики с предишния им mtFull тест.
[H2a2a1] е всъщност референтната секвенция с нула разлики, затова има нещо гнило, ако ти дава и J2a1a1a.
МтДнк: Т2
 
Reply
#6
(03-23-2019, 11:40 PM)KTonev Писа: Здрасти колега, от село Скребатно, Гоцеделчевско, близо до Ковачевица и Огняново. И по майчина и по бащина линия. Въпреки че доста хора от двете ми страни са се заселвали още преди 1915 г. не на север към София, а на северо-изток- Велинград-Батак-Пещера-Пазарджик-Пловдив, а аз самият съм в София. Основните родове в това село са местни плюс бежанци от Дойранско-Леринско.

Ясно, това са християнски села в региона нали така, както и Лещен, значи хората от там масово отиват най-вече в Пловдивско и Пазарджишко, а диалекта,какъв е в смисъл македонски български или от източните говори, но може би тези села са прекалено на запад за да са източни, въпреки ,че повечето хора от Гоце Делчев, които знам, звучат по-скоро източно отколкото западно, много интересно Smile А иначе си мисля,че ти колега ще си Н, но ще се разбере, успех Smile
EU-100
J-CTS6061
H2a2a1
 
Reply
#7
(03-25-2019, 09:05 PM)Yaan Писа:
(03-23-2019, 11:40 PM)KTonev Писа: Здрасти колега, от село Скребатно, Гоцеделчевско, близо до Ковачевица и Огняново. И по майчина и по бащина линия. Въпреки че доста хора от двете ми страни са се заселвали още преди 1915 г. не на север към София, а на северо-изток- Велинград-Батак-Пещера-Пазарджик-Пловдив, а аз самият съм в София. Основните родове в това село са местни плюс бежанци от Дойранско-Леринско.

Ясно, това са християнски села в региона нали така, както и Лещен, значи хората от там масово отиват най-вече в Пловдивско и Пазарджишко, а диалекта,какъв е в смисъл македонски български или от източните говори, но може би тези села са прекалено на запад за да са източни, въпреки ,че повечето хора от Гоце Делчев, които знам, звучат по-скоро източно отколкото западно, много интересно Smile А иначе си мисля,че ти колега ще си Н, но ще се разбере, успех Smile

Изключая Уикипедия, ето един по-рядък краеведчески източник за района: "Македония. Етнография и Статистика" на Васил Кънчов (Неврокопска каза) http://www.promacedonia.org/vk/vk_2_21.htm. И преди да се върнем на тукашната тема, твоите корени, Yaan, са от?

Иначе по темата, която може да е интересна и на други:
1. BAM_Analysis_Kit_1_8 ми генерира VCF файл от bam файла (първа производна);
2. Този VCF файл бе приет и анализиран от (https://haplogrep.uibk.ac.at/), и освен това генерира FASTA файл (втора производна);

3. Този FASTA файл бе обработен както следва:

3.1. от mitomap.org като H85;
3.2. от haplofind.unibo.it като H2a2a;
и
3.3. от https://dna.jameslick.com/mthap като Best mtDNA Haplogroup Matches: H2a2a1
Defining Markers for haplogroup H2a2a1:
HVR2:
CR:
HVR 1:
Marker path from rCRS to haplogroup H2a2a1 (plus extra markers):
H2a2a1(rCRS) ⇨ (315.1C) 4511C 16291T 16390A
Good Match! Your results also had extra markers for this haplogroup:
Extras(3): (315.1C) 4511C 16291T 16390A

Но вместо разни мои производни тестове, наистина очаквам първичния анализ на YFULL...
 
Reply
#8
Имаш 2 екстра мутации в HVR1 - 16291T 16390A, възможно е да си някой неоткрит клон. При Карачанак има една Н секвенция 16291 16390 16519, може да сте родствени.
МтДнк: Т2
 
Reply
#9
(03-25-2019, 11:17 PM)KTonev Писа:
(03-25-2019, 09:05 PM)Yaan Писа:
(03-23-2019, 11:40 PM)KTonev Писа: Здрасти колега, от село Скребатно, Гоцеделчевско, близо до Ковачевица и Огняново. И по майчина и по бащина линия. Въпреки че доста хора от двете ми страни са се заселвали още преди 1915 г. не на север към София, а на северо-изток- Велинград-Батак-Пещера-Пазарджик-Пловдив, а аз самият съм в София. Основните родове в това село са местни плюс бежанци от Дойранско-Леринско.

Ясно, това са християнски села в региона нали така, както и Лещен, значи хората от там масово отиват най-вече в Пловдивско и Пазарджишко, а диалекта,какъв е в смисъл македонски български или от източните говори, но може би тези села са прекалено на запад за да са източни, въпреки ,че повечето хора от Гоце Делчев, които знам, звучат по-скоро източно отколкото западно, много интересно Smile А иначе си мисля,че ти колега ще си Н, но ще се разбере, успех Smile

Изключая Уикипедия, ето един по-рядък краеведчески източник за района: "Македония. Етнография и Статистика" на Васил Кънчов (Неврокопска каза) http://www.promacedonia.org/vk/vk_2_21.htm. И преди да се върнем на тукашната тема, твоите корени, Yaan, са от?

Иначе по темата, която може да е интересна и на други:
1. BAM_Analysis_Kit_1_8 ми генерира VCF файл от bam файла (първа производна);
2. Този VCF файл бе приет и анализиран от (https://haplogrep.uibk.ac.at/), и освен това генерира FASTA файл (втора производна);

3. Този FASTA файл бе обработен както следва:

3.1. от mitomap.org като H85;
3.2. от haplofind.unibo.it като H2a2a;
и
3.3. от https://dna.jameslick.com/mthap като Best mtDNA Haplogroup Matches: H2a2a1
Defining Markers for haplogroup H2a2a1:
HVR2:
CR:
HVR 1:
Marker path from rCRS to haplogroup H2a2a1 (plus extra markers):
H2a2a1(rCRS) ⇨ (315.1C) 4511C 16291T 16390A
Good Match! Your results also had extra markers for this haplogroup:
Extras(3): (315.1C) 4511C 16291T 16390A

Но вместо разни мои производни тестове, наистина очаквам първичния анализ на YFULL...

Правата женска е от Горско Калугерово Търновско, освен това по майка имам Габровско и Дряновско, правата мъжка е от Елхово ,преселници от Панагюрище, по мъжка имам и Елховско преселници от Копривщица, няколко линии, още Панагюрище, Узунджово Хасковско и те заселени в Елховско и вече по спекулативни от Родопите и Чирпан Smile
EU-100
J-CTS6061
H2a2a1
 
Reply
  


Към форум: