Você está na página 1de 58

Estudo de caso

Estimativa de Ancestralidade e
Análise do DNA
Introdução:

O objetivo desse análise é fazer uma avaliação crítica sobre as estimativas de ancestralidade feitas
pelas empresas comerciais e, com base nas evidências científicas e nos modelos apresentados
pelo Gedmatch, não enviesados pela subjetividade do analista-expert das empresas comerciais,
investigar os casos de descendentes de açorianos do sul do Brasil (Luiz Fernando e Deise) e
comparar com descendentes de imigrantes alemães e italianos, também do sul do Brasil.
Pressupostos:
a) Luiz Fernando e Deise descendem de açorianos que emigraram para o Brasil por volta de 1750 e
que se misturaram com brasileiros vindos do PR e SP conhecidos como Tropeiros, que por sua
vez já carregavam dna ameríndio, bem como com indígenas do RS (guaranis e outros). Luiz
Fernando tem um bisavô italiano (12,5% italiano) e Deise (?)
b) Eduardo Bauer Londero é 50% alemão, 25% italiano e 25% “brasileiro do RS” (“brasileiro do RS”
= Luiz F. e Deise)
c) Lizete Stumpf é 100% descendente de alemães
Sumário:
1. Slides 4 e 5 – Estimativas de ancestralidade de Lizete, Eduardo e Luiz Fernando pelo Genera.
2. Slide 6 - Estimativas de ancestralidade de Lizete e Eduardo pelo My Heritage
3. Slides 7 a 11 – Algumas informações básicas do Genoma Humano necessárias para entender como funcionam as análises
de dna comuns (não genoma total) realizadas pelas empresas comerciais
4. Slides 12 a 17 – Análise dos dados brutos do dna da Lizete feito no Genera e uma comparação com os meus, do Fernando
e da mãe dele no início do cromossoma 1
5. Slides 18 a 20 - Análise das correspondências genéticas com a Lizete usando a ferramenta Gedmatch “Autosomal One-to-
one Comparison”
6. Slides 21 a 29 – Análise do meu perfil genético com base no Projeto 1000 Genomas e estimativa de ancestralidade minha
no Adntro e no Family Tree Dna como exemplo dos ajustes que as empresas comerciais fazem para estimar a ancestralidade
5. Slides 30 a 48 – Estimativas de ancestralidade (Admixtures) no Gedmatch (programas executáveis sem a interferência
pessoal) da Lizete, Eduardo, Luiz Fernando e Deise.
6. Slides 49 a 54 – Exemplo de um “mapa” (gráfico de Análise de Componentes Principais – PCA) pelo admixture Eurogenes
K15 com a plotagem do perfil genético da Lizete, do Eduardo, da minha família, da Deise e da Vera e de portugueses
continental e dos Açores.
7. Análise das estimativas de ancestralidade e os grupos genéticos dos meus familiares e da Deise e da Vera no My Heritage.
8. Conclusões e considerações finais.
Genera
Pela minha experiência a análise do dna do Genera em si é boa (ver comparação dos SNPs com o de outras empresas adiante), porém as
estimativas de ancestralidade europeias feitas por eles ainda estão em desenvolvimento (mais Leste Europeu do que E. Ocidental e Ibéria 5%,
para quem descende só de alemães?). As estimativas a nível continental (Europa, Américas e África) parecem boas no geral, já que aponta
100% Europa para a Lizete e 95% para o Eduardo.
Genera
Na realidade, eu pedi para o Eduardo (que é meu amigo) fazer o teste de dna porque queria ver como era o resultado do dna de uma pessoa que não fosse
descendente de açorianos (eu pensei que ele fosse 50% alemão e 50% italiano). Só depois do resultado que ele disse que a mãe do pai dele era “brasileira”. Ao
comparar os resultados no Genera antes da correção e no Gedmatch eu passei a achar que dada as muitas semelhanças entre eu e ele (principalmente o ibérico),
ele não poderia ser 50% alemão. Daí pedi para uma colega minha de trabalho que é 100% descendente de alemães fazer o teste. Aparentemente, depois da
correção do Genera, que jogou meu norte europeu bem para cima e o ibérico bem para baixo, assim como os dele, as nossas estimativas continuaram um tanto
semelhantes. As menores do Eduardo nas Américas e Oriente Médio e Magrebe em relação a mim se justificam e confirmam a descendência 25% “brasileira”.
My Heritage
Empresa americana. Foi onde fiz meu primeiro teste de dna. A estimativa deles pareceu bem melhor. Eles, por serem americanos, tem uma
base de dados melhor para norte europeus. Pela história da Alemanha é possível o componente do Leste Europeu para a Lizete, que
aparentemente o Genera superestimou. Aqui eles também fizeram uma estimativa dos grupos genéticos para ela como sendo principalmente
da Alemanha, seguida da Polônia, o parece bem coerente com a estimativa feita. No caso do Eduardo a estimativa de norte europeu (45,2 +
12 = 57,2%) confirmaria os 50% de descendência de alemães. As estimativas de “brasileiro” (24,6 + 5,9 = 30,5%) e de italiano (8,5 + 3,8 =
12,3%) seriam possíveis dado que o pai do Eduardo poderia ter passado mais dos 50% da mãe (“brasileira”) do que do pai (italiano). Os 7,2%
em “excesso” do norte europeu tanto podem ter vindo dos açorianos quanto dos italianos. Os grupos genéticos da Alemanha, Brasil e Itália
do Eduardo são coerentes com essa estimativa e também confirmam a etnia esperada dele.
O genoma humano (https://pt.wikipedia.org/wiki/Genoma_humano)
O genoma humano é o conjunto completo de sequências de ácido nucleico codificado como DNA dentro dos 23
pares de cromossomos nos núcleos das células e em uma pequena molécula de DNA encontrada nas mitocôndrias
individuais. Usualmente, o genoma mitocondrial é tratado separadamente do genoma nuclear.

Os genomas humanos são compostos tanto por genes de DNA codificadores de proteínas quanto por DNAs não
codificadores.

Os genomas humanos haplóides estão contidos nas células germinativas (óvulos e espermatozóides) e são
constituídos por três bilhões de pares de bases de DNA, enquanto os genomas diplóides (encontrados em células
somáticas) tem o dobro do conteúdo de DNA. Embora existam diferenças significativas entre os genomas de
indivíduos humanos (na ordem de 0,1%), estes são consideravelmente menores que as diferenças entre humanos e
seus parentes vivos mais próximos, os chimpanzés (aproximadamente 4%) e os bonobos.

O genoma humano haplóide (23 cromossomos) tem cerca de 3 bilhões de pares de bases e contém cerca de 30 000
genes. Como cada par de bases pode ser codificado por 2 bits, isso significa aproximadamente 750 megabytes de
dados. Uma célula somática individual (diploide) contém o dobro dessa quantidade, isto é, cerca de 6 bilhões de
pares de bases. Os homens têm menos que as mulheres porque o cromossomo Y tem cerca de 57 milhões de pares
de bases, enquanto o X é cerca de 156 milhões, mas em termos de informação os homens têm mais porque o
segundo X contém quase as mesmas informações que o primeiro. Como os genomas individuais variam em
sequência em menos de 1% um do outro, as variações do genoma de um dado humano a partir de uma referência
comum podem ser compactadas sem perda para aproximadamente 4 megabytes.
O genoma humano (https://pt.wikipedia.org/wiki/Genoma_humano)
Embora a sequência do genoma humano tenha sido quase totalmente sequenciada, ela ainda não é totalmente
compreendida. A maioria dos genes foi identificada por uma combinação de abordagens experimentais e de bioinformática
de alto rendimento, mas ainda há muito trabalho a ser feito para elucidar melhor as funções biológicas de seus produtos
(proteínas e RNA).
Existem cerca de 19 000 a 20 000 genes codificadores de proteínas humanas. A estimativa do número de genes humanos foi
repetidamente revisada para baixo de previsões iniciais de 100 000 ou mais, já que a qualidade da sequência do genoma e os
métodos de detecção de genes melhoraram e poderiam continuar a cair ainda mais. Sequências codificadoras de proteínas
representam apenas uma pequena fração do genoma (aproximadamente 1,5%), e o resto é associado com moléculas de RNA
não codificante, sequências reguladoras de DNA, LINEs, SINEs, intróns, e sequências de funções ainda indeterminadas.
Organização molecular e conteúdo genético
O comprimento total do genoma humano é superior a 3 bilhões de pares de bases (ver tabela 1, próximo slide). O genoma é
organizado em 22 cromossomos pareados, mais o cromossomo X pareado com outro cromossomo X em fêmeas, e, em
machos, com um cromossomo Y.
Cromossomos são grandes moléculas lineares de DNA contidas no núcleo da célula. O genoma também inclui o DNA
mitocondrial, uma molécula circular com tamanho bem menor que o do DNA nuclear e que se localiza nas mitocôndrias.

Na tabela a seguir, estão expostas informações básicas sobre o genoma humano, baseadas em uma referência. Logo, a tabela
não representa a sequência de nenhum indivíduo específico. (Fonte de dados: Ensembl genome browser release 87,
December 2016 para a maioria dos valores; Ensembl genome browser release 68, julho de 2012 para miRNA, rRNA, snRNA,
snoRNA.)
Número Quanti- Quanti- Posição
Compri- de genes dade de dade de do Cumu-
Cromos- Número de Pseudo- Misc
mento Variações que RNA não RNA não miRNA rRNA snRNA snoRNA Centro- lativo
somo pares de base genes ncRNA
(mm) codificam codifican- codifican- mero (%)
proteínas tes longos tes curtos (Mbp)
1 85 248956422 12151146 2058 1220 1200 496 134 66 221 145 192 125.0 7.9
2 83 242193529 12945965 1309 1023 1037 375 115 40 161 117 176 93.3 16.2
3 67 198295559 10638715 1078 763 711 298 99 29 138 87 134 91.0 23.0
4 65 190214555 10165685 752 727 657 228 92 24 120 56 104 50.4 29.6
5 62 181538259 9519995 876 721 844 235 83 25 106 61 119 48.4 35.8
6 58 170805979 9130476 1048 801 639 234 81 26 111 73 105 61.0 41.6
7 54 159345973 8613298 989 885 605 208 90 24 90 76 143 59.9 47.1
8 50 145138636 8221520 677 613 735 214 80 28 86 52 82 45.6 52.0
9 48 138394717 6590811 786 661 491 190 69 19 66 51 96 49.0 56.3
10 46 133797422 7223944 733 568 579 204 64 32 87 56 89 40.2 60.9
11 46 135086622 7535370 1298 821 710 233 63 24 74 76 97 53.7 65.4
12 45 133275309 7228129 1034 617 848 227 72 27 106 62 115 35.8 70.0
13 39 114364328 5082574 327 372 397 104 42 16 45 34 75 17.9 73.4
14 36 107043718 4865950 830 523 533 239 92 10 65 97 79 17.6 76.4
15 35 101991189 4515076 613 510 639 250 78 13 63 136 93 19.0 79.3
16 31 90338345 5101702 873 465 799 187 52 32 53 58 51 36.6 82.0
17 28 83257441 4614972 1197 531 834 235 61 15 80 71 99 24.0 84.8
18 27 80373285 4035966 270 247 453 109 32 13 51 36 41 17.2 87.4
19 20 58617616 3858269 1472 512 628 179 110 13 29 31 61 26.5 89.3
20 21 64444167 3439621 544 249 384 131 57 15 46 37 68 27.5 91.4
21 16 46709983 2049697 234 185 305 71 16 5 21 19 24 13.2 92.6
22 17 50818468 2135311 488 324 357 78 31 5 23 23 62 14.7 93.8
X 53 156040895 5753881 842 874 271 258 128 22 85 64 100 60.6 99.1
Y 20 57227415 211643 71 388 71 30 15 7 17 3 8 12.5 100.0
mtDNA 0.0054 16569 929 13 0 0 24 0 2 0 0 0 N/A 100
total 3088286401 155630645 20412 14600 14727 5037 1756 532 1944 1521 2213
Single-nucleotide polymorphism (SNP)
Polimorfismo de nucleotídeo único ou polimorfismo de
nucleotídeo simples em genética, (em inglês single nucleotide
polymorphism; SNP) é uma variação na sequência de DNA que
afeta somente uma base adenina (A), timina (T), citosina (C)
ou guanina (G) na sequência do genoma entre indivíduos de
uma espécie ou entre pares de cromossomos de um
individuo. Um polimorfismo de nucleotídeo único (SNP) é
uma substituição da linha germinativa de um
único nucleotídeo em uma posição específica no genoma. Por
exemplo, em uma posição de base específica no genoma
humano, o nucleotídeo C pode aparecer na maioria dos
indivíduos, mas ocorre que em uma minoria de indivíduos a
posição é ocupada por um A. Isso significa que existe um SNP
nesta posição específica, e as duas variações de nucleotídeos
possíveis — C ou A — são chamadas de alelos para esta posição
específica. Um estudo das proteínas relacionados aos mesmos,
pode determinar qual forma é a mais original que não sofreu
entropia genética e acúmulo de mutações deletérias nas
populações ancestrais e qual forma foi mutada que aparece
com maior frequência nas populações atuais.
Single-nucleotide polymorphism (SNP)
- O termo “mutação” é usado para variações no genoma que são muito raras e que tem
consequências fenotípicas, ao passo que “polimorfismo” é usado para descrever aquelas
diferenças que são mais comuns.

- Mutação é usualmente usado para uma variante rara que pode ter um significado patogênico.
SNPs ocorrem em uma maior frequência na população em geral e uma vez que se apresenta em
pessoas saudáveis elas são provavelmente benignas, ou pelos menos não tem um impacto
claramente patogênico.

- SNPs ocorrem normalmente ao longo de todo o DNA de uma pessoa. Eles ocorrem uma vez a
cada 1000 nucleotídios em média, o que significa aproximadamente 4 a 5 milhões de SNPs no
genoma de uma pessoa (0,13 a 0,12% do genoma total, respectivamente)

Número de SNPs lidos nos cromossomos autosômicos (1-22) por: Genera = 617232
Family Tree Dna = 612271
Obs: Eu verifiquei esses dados nos arquivos que tenho e cada empresa lê
diferentes SNPs, apesar de em certos intervalos lerem os mesmos My Heritage = 576157
Genera – O exame (raw dna data) Cromossomo Núm. pares base SNPs Genera % Genoma Frequência
1 248956422 49322 0.0198 5048
2 242193529 53067 0.0219 4564
Calculei o número de SNPs no Raw_Dna_Data da 3 198295559 42570 0.0215 4658
4 190214555 37993 0.0200 5007
Lizete lidos por cromossomo e, em geral com 5 181538259 36630 0.0202 4956
pequenas variações entre os cromossomos, 6 170805979 42843 0.0251 3987
corresponde a aproximadamente 0,02% do genoma 7 159345973 34151 0.0214 4666
8 145138636 31067 0.0214 4672
total. 9 138394717 26288 0.0190 5265
As exceções se dão nos cromossomos Y (cerca de um 10 133797422 30736 0.0230 4353
terço) e no mtDNA (cromossomo mitocondrial, lido 11 135086622 31510 0.0233 4287
12 133275309 29433 0.0221 4528
em bem maior frequência (6%)). O pequeno 13 114364328 24189 0.0212 4728
tamanho deste último permite que com um menor 14 107043718 19682 0.0184 5439
15 101991189 20231 0.0198 5041
número de leituras se chegue a essa maior
16 90338345 20926 0.0232 4317
cobertura. Essa é a razão também para os primeiros 17 83257441 21075 0.0253 3951
estudos de dna para análise populacional terem 18 80373285 17471 0.0217 4600
19 58617616 15726 0.0268 3727
utilizado o dna mitocondrial. 20 64444167 14568 0.0226 4424
Em média a frequência de leitura foi de uma a cada 21 46709983 8438 0.0181 5536
4700 posições. 22 50818468 9316 0.0183 5455
mtDNA 16569 986 5.9509 17
X 156040895 27520 0.0176 5670
Y 57227415 3809 0.0067 15024
total 3088286401 649547 0.0210 4755
autosomal 2875001522 617232 0.0215 4658
Aqui fiz a comparação dos primeiros 100 SNPs lidos no DNA
Genera – O exame (raw dna data) da Lizete comigo, com o Fernando e a mãe dele (1 a 33)
Lizete Luiz F Fernando M. Teresa
RSID CHROMOSOME POSITION RESULT RSID CHROMOSOME POSITION RESULT RSID CHROMOSOME POSITION RESULT RSID CHROMOSOME
POSITION RESULT
1 rs9651229 1 567667 CC rs9651229 1 567667 CC rs9651229 1 567667 CC rs9651229 1 567667 CC
2 rs9701872 1 568208 TT rs9701872 1 568208 TT rs9701872 1 568208 TT rs9701872 1 568208 TT
3 rs11497407 1 568527 GG rs11497407 1 568527 GG rs11497407 1 568527 GG rs11497407 1 568527 GG
4 rs116587930 1 727841 GG rs116587930 1 727841 GG rs116587930 1 727841 GG rs116587930 1 727841 GG
5 rs3131972 1 752721 GG rs3131972 1 752721 GG rs3131972 1 752721 GG rs3131972 1 752721 GG
6 rs114525117 1 759036 GG rs114525117 1 759036 GG rs114525117 1 759036 GG rs114525117 1 759036 GG
7 rs12127425 1 794332 GG rs12127425 1 794332 GG rs12127425 1 794332 GG rs12127425 1 794332 GG
8 rs79373928 1 801536 TT rs79373928 1 801536 TT rs79373928 1 801536 TT rs79373928 1 801536 TT
9 rs116452738 1 834830 GG rs116452738 1 834830 GG rs116452738 1 834830 GG rs116452738 1 834830 GG
10 rs72631887 1 835092 TT rs72631887 1 835092 TT rs72631887 1 835092 TT rs72631887 1 835092 TT
11 rs4970383 1 838555 CA rs4970383 1 838555 CA rs4970383 1 838555 CC rs4970383 1 838555 CC
12 rs28678693 1 838665 TT rs28678693 1 838665 TT rs28678693 1 838665 TT rs28678693 1 838665 TT
13 rs4970382 1 840753 TC rs4970382 1 840753 TC rs4970382 1 840753 TT rs4970382 1 840753 TT
14 rs4475691 1 846808 CT rs4475691 1 846808 CC rs4475691 1 846808 CC rs4475691 1 846808 CC
15 rs72631889 1 851390 GG rs72631889 1 851390 GG rs72631889 1 851390 GG rs72631889 1 851390 GG
16 rs7537756 1 854250 AG rs7537756 1 854250 AA rs7537756 1 854250 AA rs7537756 1 854250 AA
17 rs13302982 1 861808 GG rs13302982 1 861808 GG rs13302982 1 861808 GG rs13302982 1 861808 GG
18 rs376747791 1 863130 AA rs376747791 1 863130 AA rs376747791 1 863130 AA rs376747791 1 863130 AA
19 rs2880024 1 866893 TC rs2880024 1 866893 TC rs2880024 1 866893 CC rs2880024 1 866893 CC
20 rs13302914 1 868404 TT rs13302914 1 868404 TT rs13302914 1 868404 TT rs13302914 1 868404 TT
21 rs76723341 1 872952 CC rs76723341 1 872952 CC rs76723341 1 872952 CC rs76723341 1 872952 CC
22 rs148327885 1 878331 CC rs148327885 1 878331 TT rs148327885 1 878331 CC rs148327885 1 878331 CC
23 rs143853699 1 879911 GG rs143853699 1 879911 GG rs143853699 1 879911 GG rs143853699 1 879911 GG
24 rs2272757 1 881627 GA rs2272757 1 881627 GA rs2272757 1 881627 GA rs2272757 1 881627 GA
25 rs67274836 1 884767 GG rs67274836 1 884767 GG rs67274836 1 884767 GG rs67274836 1 884767 GG
26 rs3748597 1 888659 CC rs3748597 1 888659 CC rs3748597 1 888659 CC rs3748597 1 888659 CC
27 rs3828049 1 889238 GG rs3828049 1 889238 GG rs3828049 1 889238 GG rs3828049 1 889238 GG
28 rs77608078 1 891277 CC rs77608078 1 891277 CC rs77608078 1 891277 CC rs77608078 1 891277 CC
29 rs13303010 1 894573 AA rs13303010 1 894573 AA rs13303010 1 894573 AA rs13303010 1 894573 AA
30 rs13303229 1 897564 CC rs13303229 1 897564 CC rs13303229 1 897564 CC rs13303229 1 897564 CC
31 rs3935066 1 900730 AA rs3935066 1 900730 AA rs3935066 1 900730 AA rs3935066 1 900730 AA
32 rs6669800 1 903321 AA rs6669800 1 903321 AA rs6669800 1 903321 AA rs6669800 1 903321 AA
33 rs35241590 1 904752 TT rs35241590 1 904752 TT rs35241590 1 904752 TT rs35241590 1 904752 TT
*Em vermelho os que são diferentes
Comparação dos primeiros 100 SNPs lidos no DNA da
Genera – O exame (raw dna data) Lizete comigo, com o Fernando e a mãe dele (34 a 66)
Lizete Luiz F Fernando M. Teresa
RSID CHROMOSOME
POSITION RESULT RSID CHROMOSOME
POSITION RESULT RSID CHROMOSOME
POSITION RESULT RSID CHROMOSOME
POSITION RESULT
34 rs28561399 1 910473 GA rs28561399 1 910473 GG rs28561399 1 910473 GA rs28561399 1 910473 GA
35 rs3748588 1 911101 CC rs3748588 1 911101 CC rs3748588 1 911101 CC rs3748588 1 911101 CC
36 rs186101910 1 914749 CC rs186101910 1 914749 CC rs186101910 1 914749 -- rs186101910 1 914749 CC
37 rs41285816 1 917640 GG rs41285816 1 917640 GG rs41285816 1 917640 GG rs41285816 1 917640 GG
38 rs2341354 1 918573 AG rs2341354 1 918573 GG rs2341354 1 918573 AG rs2341354 1 918573 AG
39 rs6605059 1 919419 CC rs6605059 1 919419 CC rs6605059 1 919419 CC rs6605059 1 919419 TC
40 rs4970414 1 919501 GT rs4970414 1 919501 TT rs4970414 1 919501 GT rs4970414 1 919501 GT
41 rs116781904 1 919855 GG rs116781904 1 919855 GG rs116781904 1 919855 GG rs116781904 1 919855 GG
42 rs61770779 1 919927 GG rs61770779 1 919927 GG rs61770779 1 919927 GG rs61770779 1 919927 GG
43 rs202075563 1 949472 GG rs202075563 1 949472 GG rs202075563 1 949472 GG rs202075563 1 949472 GG
44 rs2799064 1 957898 GG rs2799064 1 957898 GG rs2799064 1 957898 GT rs2799064 1 957898 GT
45 rs28591569 1 959509 TT rs28591569 1 959509 TT rs28591569 1 959509 TT rs28591569 1 959509 TG
46 rs3121578 1 974894 TT rs3121578 1 974894 TT rs3121578 1 974894 TT rs3121578 1 974894 TT
47 rs138288952 1 978762 GG rs138288952 1 978762 GG rs138288952 1 978762 GG rs138288952 1 978762 GG
48 rs144164397 1 978804 CC rs144164397 1 978804 CC rs144164397 1 978804 CC rs144164397 1 978804 CC
49 rs79016973 1 978974 GG rs79016973 1 978974 GG rs79016973 1 978974 GG rs79016973 1 978974 GG
50 rs143324306 1 979397 GG rs143324306 1 979397 GG rs143324306 1 979397 GG rs143324306 1 979397 GG
51 rs113288277 1 979748 AA rs113288277 1 979748 AA rs113288277 1 979748 AA rs113288277 1 979748 AA
52 rs112039851 1 980824 GG rs112039851 1 980824 GG rs112039851 1 980824 GG rs112039851 1 980824 GG
53 rs146243145 1 980868 GG rs146243145 1 980868 GG rs146243145 1 980868 GG rs146243145 1 980868 GG
54 rs200684031 1 981139 GG rs200684031 1 981139 GG rs200684031 1 981139 GG rs200684031 1 981139 GG
55 rs149268246 1 982968 CC rs149268246 1 982968 CC rs149268246 1 982968 CC rs149268246 1 982968 CC
56 rs149762107 1 983005 GG rs149762107 1 983005 GG rs149762107 1 983005 GG rs149762107 1 983005 GG
57 rs142620337 1 983243 CC rs142620337 1 983243 CC rs142620337 1 983243 CC rs142620337 1 983243 CC
58 rs536657086 1 983256 CC rs536657086 1 983256 CC rs536657086 1 983256 CC rs536657086 1 983256 CC
59 rs111818381 1 984971 GG rs111818381 1 984971 GG rs111818381 1 984971 GG rs111818381 1 984971 GG
60 rs2275811 1 985460 TT rs2275811 1 985460 TT rs2275811 1 985460 TT rs2275811 1 985460 TT
61 rs143143061 1 985905 CC rs143143061 1 985905 CC rs143143061 1 985905 CC rs143143061 1 985905 CC
62 rs145444272 1 986165 GG rs145444272 1 986165 GG rs145444272 1 986165 GG rs145444272 1 986165 GG
63 rs144245019 1 986732 GG rs144245019 1 986732 GG rs144245019 1 986732 GG rs144245019 1 986732 GG
64 rs145116277 1 986963 CC rs145116277 1 986963 CC rs145116277 1 986963 CC rs145116277 1 986963 CC
65 rs113261977 1 987253 CC rs113261977 1 987253 CC rs113261977 1 987253 CC rs113261977 1 987253 CC
66 rs74223856 1 988902 CC rs74223856 1 988902 CC rs74223856 1 988902 CC rs74223856 1 988902 CC
Comparação dos primeiros 100 SNPs lidos no DNA da
Genera – O exame (raw dna data) Lizete comigo, com o Fernando e a mãe dele (67 a 100)
Lizete Luiz F Fernando M. Teresa
RSID CHROMOSOME POSITION RESULT RSID CHROMOSOME POSITION RESULT RSID CHROMOSOME POSITION RESULT RSID CHROMOSOME
POSITION RESULT
67 rs2465136 1 990417 TC rs2465136 1 990417 TT rs2465136 1 990417 TC rs2465136 1 990417 TC
68 rs7526076 1 998395 AG rs7526076 1 998395 GG rs7526076 1 998395 GG rs7526076 1 998395 GG
69 rs113592356 1 1004331 CC rs113592356 1 1004331 CC rs113592356 1 1004331 CC rs113592356 1 1004331 CC
70 rs9442372 1 1018704 AG rs9442372 1 1018704 GG rs9442372 1 1018704 AG rs9442372 1 1018704 AG
71 rs115723010 1 1022223 GG rs115723010 1 1022223 GG rs115723010 1 1022223 GG rs115723010 1 1022223 GG
72 rs114326054 1 1022423 GG rs114326054 1 1022423 GG rs114326054 1 1022423 GG rs114326054 1 1022423 GG
73 rs61766340 1 1023114 GG rs61766340 1 1023114 GG rs61766340 1 1023114 GG rs61766340 1 1023114 GG
74 rs12132100 1 1023788 CC rs12132100 1 1023788 CC rs12132100 1 1023788 CT rs12132100 1 1023788 CT
75 rs116334314 1 1026428 GG rs116334314 1 1026428 GG rs116334314 1 1026428 GG rs116334314 1 1026428 GG
76 rs115662838 1 1026913 CC rs115662838 1 1026913 CC rs115662838 1 1026913 CC rs115662838 1 1026913 CC
77 rs77334480 1 1027888 CC rs77334480 1 1027888 CC rs77334480 1 1027888 CC rs77334480 1 1027888 CC
78 rs12731175 1 1030374 GG rs12731175 1 1030374 GG rs12731175 1 1030374 GG rs12731175 1 1030374 GG
79 rs9651273 1 1031540 AG rs9651273 1 1031540 GG rs9651273 1 1031540 GG rs9651273 1 1031540 GG
80 rs6671356 1 1040026 TT rs6671356 1 1040026 TT rs6671356 1 1040026 TC rs6671356 1 1040026 CC
81 rs147606383 1 1045331 GG rs147606383 1 1045331 GG rs147606383 1 1045331 GG rs147606383 1 1045331 GG
82 rs12080505 1 1045606 AC rs12080505 1 1045606 AA rs12080505 1 1045606 AA rs12080505 1 1045606 AA
83 rs61766344 1 1054091 CC rs61766344 1 1054091 CC rs61766344 1 1054091 CC rs61766344 1 1054091 CC
84 rs9442373 1 1062638 AA rs9442373 1 1062638 AA rs9442373 1 1062638 CA rs9442373 1 1062638 CC
85 rs4072537 1 1065296 TC rs4072537 1 1065296 CC rs4072537 1 1065296 CC rs4072537 1 1065296 TC
86 rs11260598 1 1065726 TT rs11260598 1 1065726 TT rs11260598 1 1065726 TT rs11260598 1 1065726 TT
87 rs61766346 1 1068883 GG rs61766346 1 1068883 GG rs61766346 1 1068883 GG rs61766346 1 1068883 GG
88 rs139475585 1 1070467 GA rs139475585 1 1070467 GG rs139475585 1 1070467 GG rs139475585 1 1070467 GG
89 rs141230226 1 1072181 CT rs141230226 1 1072181 CC rs141230226 1 1072181 CC rs141230226 1 1072181 CC
90 rs11260603 1 1079198 TC rs11260603 1 1079198 TT rs11260603 1 1079198 TT rs11260603 1 1079198 TT
91 rs116661896 1 1079261 GA rs116661896 1 1079261 GG rs116661896 1 1079261 GG rs116661896 1 1079261 GG
92 rs74045142 1 1092071 CA rs74045142 1 1092071 CC rs74045142 1 1092071 CC rs74045142 1 1092071 CC
93 rs77791262 1 1092205 GT rs77791262 1 1092205 GG rs77791262 1 1092205 GG rs77791262 1 1092205 GG
94 rs57527288 1 1092563 GG rs57527288 1 1092563 GT rs57527288 1 1092563 GG rs57527288 1 1092563 GG
95 rs61768477 1 1095130 TT rs61768477 1 1095130 TT rs61768477 1 1095130 TT rs61768477 1 1095130 TT
96 rs9442385 1 1097335 GG rs9442385 1 1097335 GG rs9442385 1 1097335 GG rs9442385 1 1097335 GG
97 rs76051810 1 1099840 AA rs76051810 1 1099840 AA rs76051810 1 1099840 AA rs76051810 1 1099840 AA
98 rs61768480 1 1103150 GG rs61768480 1 1103150 GG rs61768480 1 1103150 GG rs61768480 1 1103150 GG
99 rs112695918 1 1104584 TT rs112695918 1 1104584 -- rs112695918 1 1104584 TT rs112695918 1 1104584 TT
100 rs11260542 1 1110019 AA rs11260542 1 1110019 AA rs11260542 1 1110019 AA rs11260542 1 1110019 AA
Comparação dos primeiros 100 SNPs lidos no DNA da Lizete
Genera – O exame (raw dna data) comigo, com o Fernando e a mãe dele
Aqui faço uma estatística dos SNPs iguais (mesmas letras). Antes, no entanto, tenho de
1 a 100 Lizete Luiz F. Fernando M. Teresa
fazer uma consideração sobre um provável erro de leitura*: na 22a leitura (posição
Lizete - 85 80 81
genômica 878331) a minha leitura não poderia ser TT já que o Fernando apresenta CC e
Luiz F. - - 91 89
a mãe dele também CC; no caso o Fernando teria de ser CT (recebe um do pai e outro da
Fernando - - - 96
mãe); dessa forma, eu deveria de ter pelo menos um C para o Fernando ser CC.
M. Teresa - - - -
Considero que o mais provável é que eu seja CC, como os demais. Fazendo essa correção
Todos iguais - - - 76
ficaria assim a estatística:

Esse segmento de DNA do início do cromossomo 1 é de 1110019 pares de bases (0,45% do cromossomo 1). Para se ter uma ideia, 1cM (centi
Morgan), a unidade usada para se fazer as correspondências genéticas, corresponde em média a 1Mbp (1.000.000 de pares de bases). O
mínimo que se considera para um compartilhamento resultante de um parentesco mais próximo seria de 5 ou 7cM, ou seja, mesmo que
tívessemos pelo menos uma letra igual no par ao longo desse segmento (half-match), esse não seria um segmento longo o suficiente para
garantir algum parentesco mais próximo com a Lizete. Se fizer essa análise (pelo menos uma letra igual) a Lizete teria um half-match com Luiz
Fernando e com o Fernando mas não com a M. Teresa (na posição 79 e na 84, Lizete TT e AA, ao passo que a M. Teresa tem CC nas duas).

Nesse segmento 76% dos SNPs são iguais para todos. A Lizete é mais parecida com Luiz F (85%) do que com Fernando e Maria Teresa (80 e
81%). Luiz F. é mais parecido com M. Teresa do que com Lizete e mais com Fernando do que com todos.

* Os sequenciadores usados para ler o dna podem não conseguir leitura (no call, representado por --, conforme pode ser visto na 36a leitura
do Fernando (posição 914749) e na 99a do Luiz F (posição 1104584). Pode também ter erros de leitura, como aventei. Por isso, nas análises de
dna mais caras, de genoma total, os sequenciadores repetem as leituras 30x ou 100x. Ao assumirem esses erros nos cálculos os algoritmos
usados para a identificação das correspondências genéticas podem gerar erros também.
Comparação dos primeiros 300 SNPs lidos no DNA da Lizete
Genera – O exame (raw dna data) comigo, com o Fernando e a mãe dele
Aqui faço uma atualização da estatística dos SNPs iguais (mesmas letras) até a 400a No calls SNPs Cr.1 % SNPs No Call
leitura (esta, junto com as 100 primeiras vou colocar no anexo). Dessa forma, temos
Lizete 431 49034 0.88
então a leitura até a posição 2.410.698 (2,4Mbp, ou 0,97% do cromossomo 1).
LF 810 48951 1.65
Fazendo uma estatística do número de “no calls” no cromossomo 1 se pode observar que Fernando 894 48951 1.83
nas análises mais antigas (Luiz F. e Fernando) o percentual de “no calls” foi maior do que M. Teresa 497 48951 1.02
na da M. Teresa e Lizete (mais recentes), o que pode indicar uma melhora na qualidade
das análises. 1 a 400 Lizete Luiz F. Fernando M. Teresa
Lizete - 83,0 84,8 80,3
Quanto ao half-match da Lizete com Luiz Fernando (pelo menos uma letra igual, esse Luiz F. - - 85,0 80,8
persiste até a posição 2189580 (315a linha), uma vez que nas próximas 5 posições se tem Fernando - - - 87,0
Lizete AA-AA-CC-GG-TT e Luiz F. GG-CC-CA-GG-GG, ou seja, 3 SNPs diferentes (ver M. Teresa - - - -
confirmação no próximo slide). Todos iguais - - - 74,3

Assim, nesse segmento do cromossomo 1, até a posição 2.410.698, 74% dos SNPs são iguais para todos. A Lizete, é mais parecida com o
Fernando (84,8%), seguida do Luiz F. (83.0%) e depois com a M. Teresa (80,3%), ou seja, uma variação de 4,5%. A semelhança de Fernando é
maior com a M. Teresa do que com Luiz F. Essa análise é muito preliminar, já que envolve uma pequena fração de um único cromossomo; no
entanto, aponta para uma semelhança genética muito próxima entre todos, de um com outro (sem considerar Fernando com os pais) ao
redor de 82%. Interessante notar que nesse segmento a semelhança de Lizete é menor com M. Teresa, que tem mais DNA alemão (25%), do
que com Luiz F. e Fernando, sendo que a semelhança de Luiz F. com M. Teresa e com Fernando é da mesma ordem que Lizete com eles. Nos
slides xx a xx avento que essas semelhanças podem ter relação com as etnias. Evidentemente, está sendo analisado um pequeno segmento
em que Lizete e Luiz F. possuem um compartilhamento genético. Se essa relação for válida, esse segmento de Luiz F. estaria relacionado a
uma etnia alemã ou polonesa, ao menos no half-match com Lizete.
Fiz a comparação com a ferramenta do Gedmatch “Autosomal
One-to-one Comparison”, utilizando segmentos de até no
mínimo 3cM, e essa confirmou que existe de fato um half-match
no início do cromossomo 1 com a Lizete que se extende até a
posição 2.189.580, correspondendo a 4,5cM. Ele teria vindo da
minha mãe, porém nos meus irmãos ele se extende até um
pouco mais (2357.367 no caso do meu irmão). Isso pode ter
acontecido por conta deles terem recebido essa parte que vai
mais além do meu pai. Considerando que meu pai e minha mãe
são ambos descendentes de açorianos, não é de duvidar que
tenham muitos segmentos pequenos com half-match (5,1-4,9 =
0.2 cM). Compartilhamento maior que 5cM já permitiria uma
estimativa de MRCA (Most Recent Common Ancestor), caso dos
meus irmãos para esse segmento (5,1cM), mas não para a mim e
para a minha mãe.
Comparing Kit FD9999526 (Luiz Fernando Spinelli Pinto) [Genera] and Kit PL9661562 (Lizete Stumpf) [Genera]
Segment threshold size will be adjusted dynamically between 200 and 400 SNPs
Minimum segment cM to be included in total = 5.0 cM
Largest segment = 5.9 cM
Total Half-Match segments (HIR) 5.9cM (0.164 Pct)
Estimated number of generations to MRCA = 7.6
1 shared segment found for this comparison.

Comparing Kit QJ1620270 (Maria Teresa Perret Schulte) [Genera] and Kit PL9661562 (Lizete Stumpf) [Genera]
Segment threshold size will be adjusted dynamically between 200 and 400 SNPs
Minimum segment cM to be included in total = 5.0 cM
Largest segment = 5.2 cM
Total Half-Match segments (HIR) 5.2cM (0.144 Pct)
Estimated number of generations to MRCA = 7.7
1 shared segment found for this comparison.

Comparing Kit AE3000028 (Fernando Schulte Pinto) [Genera] and Kit PL9661562 (Lizete Stumpf) [Genera]
Segment threshold size will be adjusted dynamically between 200 and 400 SNPs
Minimum segment cM to be included in total = 5.0 cM
Largest segment = 5 cM
Total Half-Match segments (HIR) 10.1cM (0.281 Pct)
Estimated number of generations to MRCA = 7.2
2 shared segments found for this comparison.

Considerando os outros cromossomos eu teria um segmento >5cM com a Lizete, assim como a M. Teresa. Este é um bom exemplo do que
pode acontecer com os compartilhamentos genéticos quando se tem pessoas com origens comuns e muitos casos de consaguinidades nas
familias, como ocorreu entre os açorianos e seus descendentes. O Fernando tem um compartilhamento genético maior que os pais e uma
estimativa de MRCA (Most Recent Common Ancestor) com a Lizete menor (7.2 contra 7.6 e 7.7).
O normal seria diminuir de 1 a 2 o MRCA quando passa de uma geração para a outra. Quase certo que o ancestral comum da Lizete com
Maria Teresa e Luiz Fernando deve ser bem anterior a 8a geração (8 x 30 anos = 240 anos, por volta de 1700-1740). A colonização dos Açores
e a chegada de norte europeus lá se deu entre 1450 e 1500; dessa forma, o ancestral comum deve ser anterior a essa período.
No entanto, como tanto Maria Teresa como Luiz Fernando devem ter pais que são aparentados por serem descendentes de açorianos, deve
ter acontecido o mesmo que aconteceu com o Fernando, se não recebeu um segmento comum com a Lizete de um lado recebe do outro.
Assim ocorreria uma estabilização desse dna compartilhado com o ancestral comum de uma geração para a outra, fazendo com que esse
dna comum com um ancestral muito distante chegasse a gerações bem posteriors como se fosse mais próximo.
Continuando a comparação com a Lizete, esse segmento de 4,9cM no cromossomo 1 é o
maior que minha mãe tem com ela, o que não permitiu a estimativa de MRCA. No caso meu
e dos meus irmãos todos temos segmentos >5cM; eu e minha irmã 1 segmento de 5,9 e de
5,1cM (MRCA 7,6 e 7,7), respectivamente; mas no caso do meu irmão são 4 segmentos,
sendo um de 9,1cM, o que deu um MRCA de 5,4. Não tenho o DNA do meu pai para poder
confirmar se veio dele esses segmentos maiores de dna . O que se pode afirmar é que existe
uma consistência de todos terem o compartilhamento de em torno de 5cM no cromossomo
1 e que eu e meu irmão compartilhamos o segmento de 5,9cM no cromossomo 10 nas
mesmas posições genômicas.
Análise do meu perfil genético (genetic admixture) usando o banco de dados do Projeto 1000 Genomas
Aumento da
minha
similaridade
genética com
subpopulações
no banco de
dados do
projeto 1000
genomas

Repara que a
diferença entre as
populações
europeias é muito
pequena 94.6 –
93.7 = 0.9%
População que tenho mais similaridade genética no banco de dados do
projeto 1000 genomas (94.6%) conforme o site do Adntro

No entanto, o pessoal do Adntro fez essa estimativa de ancestralidade para mim


Esse site é da Espanha. Eles claramente me detectaram como sendo da América do Sul porque tenho dna indígena (8%) e assumiram que
sou principalmente de descendência ibérica. Me encaixaram dentro da Espanha na Galícia, que é onde na península ibérica há mais dna
germânico (suevos e visigodos).
O que quero dizer é que as empresas fazem uma espécie de acomodação, de acordo com sua experiência. Como a imensa maioria das
pessoas não conhece a sua árvore genealógica eles preferem acomodar para não se incomodar de ter de dar explicações encima de
especulações.
Como as diferenças genéticas entre as populações da Europa é muito pequena as empresas preferem montar os seus próprios bancos de
dados com os dados dos usuários e usar a localização geográfica deles como referência.
Quando se olha onde nos cromossomos eles teriam encontrado essas etnias se vê que tem cromossomos onde eles não conseguiram
identificar nada ou quase nada (2, 6, 12, 14, 15) com as populações que usam como referência e que tem cromossomos onde claramente a
maioria identificada é French & German (1, 8, 17 e 22), o que é contraditório com a estimativa de 1% para essa etnia. Por isso acredito que
eles tenham assumido o que não identificaram (em cinza) como sendo ibérico.
Family Tree Dna (FTDNA) estimativa de ancestralidade
A primeira estimativa deles (V2 results),
Luiz Fernando Spinelli Pinto (V2 results) Marlene Spinelli Pinto (V2 results)
que ainda pode ser baixada no site, foi essa:
Continent Population Percentage
Continent Population Percentage
European West and Central Europe 48
Este é um exemplo de como os experts ajustam as estimativas de etnicidade. Eu European West and Central Europe 47
European Iberia 22
interagi com alguns deles que administram a página do grupo do yourDNAportal European Southeast Europe 26
European Southeast Europe 18
European Iberia 15
no Facebook group. Para mim eles tendem a ajustar com base no país de origem New World North and Central America 9
New World North and Central America 8
da pessoa. Assim, como os brasileiros típicos com os quais tenho correspondência Trace Results North Africa <2
New World South America 3
Trace Results South America <2
tendem a ter origem ibérica eles buscam ajustar nesse sentido.
Na 3ª versão (V3) fizeram uma (V3 results) (V3 results)
“correção” na estimativa,
aumentando o nosso componente
Iberian e diminuindo o West and
Central Europe:

Aqui dá para pontuar algo sobre as estimativas do ameríndio (Américas). Eu notei que algumas plataformas, como o My Heritage, tendem a superestimar esse componente em
nós, provavelmente por usar populações mestiças como referência. Sabemos que mesmo nas tribos indígenas atuais muitos não tem mais o dna 100% ameríndio. Note que a
estimativa das Américas aqui é menor que a do My Heritage e concorda com o Genera e os admixture do Gedmatch (entre 8-9%). Outra questão se refere a distinguir de onde
veio esse dna ameríndio (Am do Norte, Central ou Sul), já que ele pode ter vindo de tribos atualmente extintas. Temos o exemplo no RS dos Charruas
(https://en.wikipedia.org/wiki/Charr%C3%BAa), cuja mistura deu o primeiro Gaúcho (o original). Eu tenho uma lista de kits do Gedmatch, tanto de amostras atuais como
ancestrais, para verificar onde no meu dna haveria o realmente o indígena com base nos comparilhamentos.
Esse raciocínio de usar a localização geográfica da pessoa não está em si errado e tem uma certa base científica, como
podemos ver nessa apresentação do Johannes Krause, da Universidade de Tubingen (Alemanha) (ver principalmente a parte de
13:30 a 18:30). Nessa figura vemos o resultado da análise do dna de 2500 europeus cujos pais e avós são da mesma região,
colocados em um gráfico de análise de componentes principais (PCA).
O pesquisador pontua que basicamente o que se obtém
é uma distribuição que se assemelha ao mapa da
Europa, mostrando a concentração dos dados das
Grã-Bretanha
pessoas seguindo um padrão relacionado
geograficamente a região de onde elas vieram, com
afastamento proporcional a distância geográfica das
Países do Leste Europeu
pessoas de outros países. França e
Europa Central

Países Eslávicos

Portugal e Espanha

Itália

(https://www.youtube.com/watch?v=Dk65TbJRN_A&t=412s)
Ferramentas de estimativa de ancestralidade (admixture) do Gedmatch
Estimativa pelo MDLP World-22
Com base no perfil genético das 22 populações referência
(antigas), eles caracterizaram em 253 populações atuais do
mundo o quanto teria de cada uma dessas 22 populações
referência (ver na planilha do excel anexa). Então o software pega
o perfil genético da pessoa e aplica análise de componentes
principais (PCA) de forma a ver onde o perfil se encaixa em
relação a essas populações. Segundo eles quando chegar próximo
a @5.0 o perfil estaria caindo encima de uma dessas populações.
Assim, o perfil da Lizete teria já com uma população se encaixado
com a população German-North_(derived). Parece muito bom em
relação ao que foi informado da origem da Lizete (100%
descendente de alemães).
Só o que destoa é quando faz uma aproximação com uma
população secundária, que mostra uma população do Oriente
Médio (3 a 4%).
Population German-North Verificando na planilha do excel que preparei, o perfil
Pygmy 0.1 genético da população German-North se encaixa
West-Asian 5.21 perfeitamente com o da Lizete no que se refere às
North-European-Mesolithic 4.71 populações europeias (North-East-European, Atlantic_
Indo-Tibetan 0.4
Mediterranean_Neolithic e North-European-Mesolithic).
Mesoamerican 0.1
Arctic-Amerind 0
O único valor que dá uma leve destoada é o Near_East
South-America_Amerind 0.3 que é 4x mais alto em relação à população German-
Indian 0.1 North. Considerando o histórico da Alemanha, pode ser
North-Siberean 0 o caso de algum judeu na família. Por isso no Oracle
Atlantic_Mediterranean_Neolithic 30.76 simples com uma população secundária eles colocaram
Samoedic 0.3 4% de árabe ou judeu com German_North. Ainda bem
Indo-Iranian 1.6
que essa tecnologia não estava disponível no tempo do
East-Siberean 0
North-East-European 54.71
nazismo na Alemanha, imagina, marcaria a Lizete como
South-African 0.1 sendo impura em relação à raça Alemã.
North-Amerind 0.2
Sub-Saharian 0.1
East-South-Asian 0
Near_East 1
Melanesian 0.2
Paleo-Siberian 0.1
Austronesian 0
No Oracle-4, assim como no oracle simples o perfil da Lizete já encaixou no
German_North (<@5). Com duas, três ou quatro populações eles estariam
testando o caso de pessoas com origens étnicas misturadas. Quer dizer que o
perfil genético da Lizete se encaixariam com a de uma pessoa que tivesse um pai
estoniano e uma mãe ibérica e assim por diante, considerando até 3 ou 4 avós
de origens étnicas diferentes. Esse encaixe com o ibérico poderia vir do
Near_East um pouco mais alto (provavelmente judeu), já que o ibérico teve na
sua formação a participação de fenícios e mouros, o que dá a ele esse
componente mais alto (ver tabela abaixo). Talvez o pessoal do Genera estivesse
considerando um modelo desse tipo para pegar aquele componente ibérico para
a Lizete. Esse tipo de erro é que leva o pessoal a ajustar pela localização
geográfica (ver slide xx).

Population Iberian
Pygmy 0.1
West-Asian 3.9
North-European-Mesolithic 1.1
Indo-Tibetan 0.3
Mesoamerican 0.1
Arctic-Amerind 0.1
South-America_Amerind 0.2
Indian 0.4
North-Siberean 0
Atlantic_Mediterranean_Neolithic 48.75
Samoedic 0.1
Indo-Iranian 1.4
East-Siberean 0
North-East-European 30.97
South-African 0
North-Amerind 0.2
Sub-Saharian 1.5
East-South-Asian 0
Near_East 10.59
Melanesian 0.1
Paleo-Siberian 0.1
Austronesian 0.1
No meu caso para o encaixe com uma população o @número é bem maior que @5.0
(>10), significando que o meu perfil genético não cai encima de nenhuma das
populações no PCA. O mais próximo seria de populações dos balcãs (romeno,
búlgaro, gagauz (moldavo) e macedônio) ou de judeu ashkenaze. As minhas etnias
esperadas pelo meu histórico familiar aparecem em 6º (Italian_North) e 16º
(Portuguese), ou seja invertido em relação ao esperado (tenho só um bisavô
italiano). No meu caso, o esperado pelos sobrenomes da família e pela suposta
herança indígena, dividindo por bisavós, seria 75% português, 12,5% italiano e 12,5%
indígena. Coloco somente em 12,5% o indígena pois nenhum dos meus bisavós tinha
traços claramente indígenas e apesar de eu mostrar supostos traços (pele morena e
cabelos pretos) nem meus irmãos ou meus primos-irmãos mostram. Essa contradição
com a esperada etnia portuguesa ou ibérica em primeiro se acentua no sentido de
que acima da portuguesa aparece o Swiss e o German-South. Essa contradição se
acentua mais ainda quando o modelo tenta encaixar uma população secundária, o
que aproxima ou abaixa do índice @5, o que é feito misturando uma população
indígena da América do Norte (Costanoan) ou um Judeu Asquenaze com uma
população norte europeia, nenhuma ibérica.
No meu caso, para poder comparar meu perfil
genético com as populações europeias, eu
LF só Europa Portuguese Iberian Italian_North Italian-Center Italian-South recalculei meu perfil genético retirando as
0 0.1 0.1 0.1 0.1 0.1 populações ameríndias (8,78%). Usei as
12.01 4.99 3.9 11.4 21.48 21.56 populações portuguesa, ibérica e italianas para
3.83 2 1.1 1.5 0.5 0.2 comparação. A principal diferença observada
0 0.1 0.3 0.2 0.1 0.4 nas populações referência se dá no meu
0 0.2 0.1 0 0.1 0.1
Atlantic_Mediterranean_ Neolithic que é de
0 0 0.1 0.2 0.1 0
0 0 0.2 0 0.1 0.1 5.7-7.4% a 12.1-14.3% mais baixo em relação
0 0.4 0.4 0.3 0 0 às populações italianas e ibéricas,
0.77 0 0 0.4 0.1 0.1 respectivamente, e no North-European_
34.43 46.51 48.75 41.8 40.16 40.32 Mesolithic que é de 1.9-3.5x maiores que as
0.11 0.2 0.1 0.1 0.1 0 populações ibéricas e de 2.5-19x mais alto que
0.13 1.5 1.4 0.4 0.7 1
as italianas. Na realidade esse é muito próximo
0 0 0 0.1 0 0
33.23 29.64 30.97 34.1 18.88 16.87
ao da Lizete (4.11, slide xx). O meu North-East-
0 0.1 0 0.1 0 0.3 European mais alto afasta das populações do
0 0 0.2 0.1 0 0 centro e sul da Itália, aproximando mais do
1.75 2 1.5 0 0 0 Norte da Itália, que é conhecida por ter
0 0 0 0.1 0 0.1 componentes norte europeus (influência da
12.47 11.88 10.59 8.7 17.38 18.46
Áustria, que é caso dos imigrantes italianos
0 0.1 0.1 0.1 0.1 0.1
0 0.2 0.1 0.2 0 0.1
que vieram para o RS). No caso, fica claro que
1.27 0.1 0.1 0.1 0.1 0.2 existe um traço genético diferente na minha
etnia europeia em relação as etnias esperadas
(ibéricas e italianas).
No próximo slide selecionei as populações que tem Atlantic_ Mediterranean_Neolithic < 34.4 e North-
European_ Mesolithic > 3.7 e resultaram nas seguintes populações: CEU_V (Residentes do estado de Utah
da Europa Ocidental e do Norte), German-North, German_V, Norwegian_V, Swedish e Swedish_V.
Population LF só Europa CEU_V German-North German_V Norwegian_V Swedish Swedish_V
Pygmy 0 0 0.1 0 0 0.1 0
West-Asian 12.01 5.3 5.21 7.71 2.8 3 1.2
North-European-Mesolithic 3.83 4.8 4.71 3.7 9.8 7.79 10.09
Indo-Tibetan 0 0.2 0.4 0.2 0 0.3 0.3
Mesoamerican 0 0.3 0.1 0.1 0 0.1 0.2
Arctic-Amerind 0 0.1 0 0.1 0.1 0.1 0
South-America_Amerind 0 0.1 0.3 0.1 0.3 0 0.3
Indian 0 0.4 0.1 0.3 0 0.1 0.5
North-Siberean 0.77 0.1 0 0 0 0 0
Atlantic_Mediterranean_Neolithic 34.43 33.7 30.76 33.13 34.4 31.77 29.77
Samoedic 0.11 0.2 0.3 0.4 0.3 0.3 0.4
Indo-Iranian 0.13 1.7 1.6 1.5 3.8 1.6 2.9
East-Siberean 0 0.1 0 0 0 0 0
North-East-European 33.23 50.7 54.71 50.15 48.1 53.65 54.35
South-African 0 0.1 0.1 0 0.1 0.1 0
North-Amerind 0 0.1 0.2 0 0 0.3 0
Sub-Saharian 1.75 0.1 0.1 0.1 0 0.2 0
East-South-Asian 0 0 0 0 0 0 0
Near_East 12.47 1.8 1 2.3 0 0.1 0
Melanesian 0 0.1 0.2 0.1 0.1 0.1 0
Paleo-Siberian 0 0 0.1 0 0 0 0
Austronesian 1.27 0.1 0 0.1 0.2 0.4 0
No Oracle-4, assim como no oracle simples, o meu perfil não se encaixou em uma
população próxima de @5. Com duas populações encaixa, mas com uma mistura na
América do Norte, de um povo indígena de lá com um galês (Grã-Bretanha). Com 3
populações entra um elemento do sul da Europa (Córsega) com o indígena da América
do Norte e um Russo do Norte. Ambas, com 2 e 3 populações, não relacionadas a
minha provável origem. Com 4 populações, à semelhança do oracle simples com
população secundária, o modelo prevê a mistura de 25% judeu asquenaze ou indígena
costanoan com populações mistas do sul e do norte da Europa ou ambos (asquenaze +
costanoan) com populações do norte da Europa. Claramente o modelo não consegue
captar a minha provável mistura de etnias europeias, já que nessa teria de entrar o
português/ibérico e o italiano.
O perfil genético do Eduardo B. Londero não apresenta uma população única
Eduardo Bauer Londero próxima ou menor que @5.0, o que seria esperado dada a mistura de Alemão
com Italiano e Português. O maior ajuste com a população Swiss parece lógica
já que a Suiça tem relação com alemães, franceses e italianos.
As misturas com uma população secundárias envolvem uma mistura com
populações primárias ibéricas, norte europeias e italianas, o que não é de todo
inesperado dada a origem conhecida do Eduardo.
No Oracle-4, assim como no oracle simples o perfil do Eduardo não se encaixou com uma
população menor ou próxima a @5. Com duas, três ou quatro populações (pessoas com
origens étnicas misturadas), o que seria o caso do Eduardo, não aparecem populações
similares a origem esperada do Eduardo (50% Alemão + 25% Italiano + 25% Português).
Quer dizer que para o Eduardo, assim como para mim, o modelo não conseguiu encaixar
as populações europeias com maior precisão.
Comparando o perfil do Eduardo com as populações europeias as quais provavelmente teria relação o que mais se destaca é o Atlantic_Mediterranean_
Neolithic menor que as populações Ibéricas e Italianas e maior um pouco que a German-North, o que faz sentido em relação a sua mistura étnica. O North-
East-European é mais próximo do Italian_North do que do German-North, valendo aqui a observação que o Italiano do Norte tem muita influência austríaca,
o que de certa forma não se afasta da mistura étnica do Eduardo de alemães com italianos. O que se diferencia é o North-European-Mesolithic que é mais
alto que todas as populações listadas aqui, muito parecido com o das populações escandinavas (ver slide xx).
Por outro lado, pode ser observada a semelhança do Luiz Fernando com o Eduardo nas três populações europeias mais altas (Atlantic_Mediterranean_
Neolithic , North-East-European e Near_East), com o mesmo desvio para cima do North-European-Mesolithic que aproxima das populações escandinavas.
Essa análise justifica o que coloquei no início, de uma certa semelhança do meu perfil genético com o do Eduardo.
Deise Soares Guimarães O teu caso é muito semelhante ao meu, com uma população o @número é bem
maior que @5.0 (>10), significando que o teu perfil genético não cai encima de
nenhuma das populações no PCA. O mais próximo seria de uma população
mestiça das Américas (Porto Rico), que tem um percentual europeu elevado (ver
slide xx). Após entram vários outros ligados a Europa com o Português em oitavo,
depois do italiano do Norte, o que, assim como para mim, não é coerente em
relação a nossa etnia esperada de açorianos, que deveria ter o português
primeiro. O teu indígena é parecido com o meu (3.4+2.62+4.05=10.07%), o que
não é uma surpresa. Para chegar abaixo de @5 pelo menos a população primária
utilizada (Puerto-Rican) tem um componente ibérico; no entanto, para a
população secundária foram utilizadas por primeiro populações diferentes das
relatadas que existiriam nos Açores (italianos, franceses, flamengos e ingleses).
Deise Soares Guimarães
Assim como para mim, para poder comparar
teu perfil genético com as populações
europeias, eu recalculei o perfil genético
retirando as populações ameríndias
(10,07%). Usei o meu perfil e as populações
portuguesa, ibérica e italianas para
Deise só Europa LF só Europa Portuguese Iberian Italian_North Italian-Center Italian-South
0.00 0.00 0.10 0.10 0.10 0.10 0.10
comparação. O teu caso se assemelha ao
9.99 12.01 4.99 3.90 11.40 21.48 21.56 meu, Atlantic_Mediterranean_Neolithic um
2.55 3.83 2.00 1.10 1.50 0.50 0.20 pouco mais baixo que as populações italianas
0.00 0.00 0.10 0.30 0.20 0.10 0.40
0.00 0.00 0.20 0.10 0.00 0.10 0.10 e ibéricas e o North-European_ Mesolithic
0.00 0.00 0.00 0.10 0.20 0.10 0.00 um pouco mais alto, porém de uma forma
0.00 0.00 0.00 0.20 0.00 0.10 0.10
0.43 0.00 0.40 0.40 0.30 0.00 0.00
menos acentuada. Dessa forma, assim como
0.00 0.77 0.00 0.00 0.40 0.10 0.10 no meu caso, parece existir no teu traço
38.05 34.43 46.51 48.75 41.80 40.16 40.32 genético um desvio em relação a etnia
0.00 0.11 0.20 0.10 0.10 0.10 0.00
0.00 0.13 1.50 1.40 0.40 0.70 1.00
esperada (ibérica), para populações norte
0.00 0.00 0.00 0.00 0.10 0.00 0.00 europeias.
30.38 33.23 29.64 30.97 34.10 18.88 16.87
0.00 0.00 0.10 0.00 0.10 0.00 0.30
0.00 0.00 0.00 0.20 0.10 0.00 0.00
5.15 1.75 2.00 1.50 0.00 0.00 0.00
0.00 0.00 0.00 0.00 0.10 0.00 0.10
12.24 12.47 11.88 10.59 8.70 17.38 18.46
0.30 0.00 0.10 0.10 0.10 0.10 0.10
0.91 0.00 0.20 0.10 0.20 0.00 0.10
0.00 1.27 0.10 0.10 0.10 0.10 0.20
Deise Soares Guimarães
Como visto anteriormente, o ajuste para uma população ibérica com um certo percentual
indígena (Puerto-Rican) não é suficiente para definir o teu perfil genético, já que deu @número
bem maior que @5.0 (>10). Com duas populações baixou de @5, porém o ajuste foi com uma
população búlgara e com 3 populações combinou o judeu sefardita com uma população eslava,
não trazendo a população italiana, o que seria o esperado em função dos relatos dos Açores.
Eurogenes EUtest V2 K15 4-Ancestors Oracle – Lizete Stumpf
No caso da Lizete o modelo desenvolvido especificamente para populações europeias não parece apontar uma direção tão clara. Com
uma população tem o alemão do leste, o que seria adequado, porém o @número um pouco superior a 5 indicaria a falta de uma ou
mais populações para compor a mistura étnica. Com duas populações atinge, porém com uma população da Grã-Bretanha. Os
orcadianos seriam uma população do norte da Grã-Bretanha (Escócia) com influência viking. Com 3 populações não muda muito pois
pega duas populações da Grã-Bretanha para compor os outros 50% com o polonês.
Com 4 populações o quadro permanece, pois na maioria das vezes combina com populações da
Grã-Bretanha. Nessa aparente confusão o que se sobressai é o Alemão com influência do Leste
Europeu (Polônia, Estônia, Lituânia), do Anglo-Saxão (Grã-Bretanha e Holanda) e dos
Escandinavos (Noruega e Suécia) e Finlândia. Pode ser que o Eurogenes K15 esteja captando uma
mistura étnica do norte da Europa mais antiga, influenciada pelos vikings, pois esses fizeram uma
bagunça no Mar do Norte e no Leste Europeu, fazendo um leva e trás de genes nas suas viagens
de ida e volta pela Grã-Bretanha e Islândia, além das outras incursões feitas por todo o norte da
Europa. No My True Ancestry que usa o dna dos esqueletos, as correspondências genéticas da
Lizete com vikings aponta nessa direção.
Eurogenes EUtest V2 K15 4-Ancestors Oracle – Luiz Fernando Spinelli Pinto
Com uma população, Portuguese, seguido de North_Italian, pareceu bom, porém o índice é @12, bem acima de 5. Já com 2 populações 50% Italiano parece
exagerado, já que teoricamente eu seria somente 12,5% Italiano. Porém, com 3 populações 50% Danish (Dinamarquês) é totalmente inesperado; 25% Tunisian
poderia ser ok devido a presença dos mouros na Península Ibérica, já 25% Sardinian, mais ligado ao sul da Itália, diverge um pouco de onde o meu ancestral
italiano (Spinelli) veio (Gênova) . Com 4 populações vieram várias outras etnicidades inesperadas além do Danish (Norwegian, English, Ashkenazi, West
German, North Swedish, Irish, Scottish, French). No caso dos judeus eu esperava sefarditas (mais relacionadas à Península Ibérica, Libyan and Algerian jewish,
ok) mas não Ashkenazi (mais relacionado ao Leste Europeu). Na aproximação com 4 populações, das vinte, treze incluem 50% de populações norte europeias,
justificando a estimativa de 3 populações com 50% Danish.
Interpretando os @ números no contexto da análise de componentes principais (PCA): começou com @12.2 para uma população mas não diminuiu de @10.7
com 4 populações, indicando assim que seriam necessárias bem mais de 4 populações para chegar próximo a @5.0. Apesar dessa análise mostrar que deve ter
uma mistura muito grande de diferentes populações para mim, o número com uma população não começa muito alto (>@30) porque eu devo ter uma maioria
bem mais expressiva de populações europeias, que são bem mais próximas entre si do que essas com as da África subsariana, Américas (Amerindians), Sul da
Ásia (Chineses, Japoneses, etc) e Oceania (Aborígenes da Austrália e Polinésios). Em suma, o modelo aponta que devo ter uma mistura muito grande de etnias
europeias onde uma não se sobressai muito em relação as outras, tipo menos de 25% que é a margem com que o modelo trabalha.
Aparentemente essa mistura
grande vem mais pelo lado da
minha mãe do que do pelo do
meu pai (com 4 populações ela
tem @11.23 contra @7.46 e
@7.54 dos meus tios
paternos). De qualquer forma,
essa mistura grande vem tanto
pelo lado materno quanto
paterno, com meus irmãos
mostrando @10.02 e @9.51,
ou seja, índices intermediários
entre meu pai e minha mãe.
Eurogenes EUtest V2 K15 4-Ancestors Oracle – Eduardo Bauer Londero
Para o Eduardo, o @número superior a 5 é esperado dado a sua mistura. No entanto, devido ao seu percentual
maior de alemão, o ajuste maior com ibérico para a aproximação com 1 população é surpreendente, vindo o
alemão somente em 17º lugar, depois do italiano em 15º lugar. Uma hipótese seria o do seu italiano ter um
componente ibérico. Com duas populações o alemão do leste e o espanhol parece apontar para a direção certa,
com o @número próximo de 5; porém, com 3 populações não surge o esperado, que seria acrescentar o
italiano. Com 4 populações, assim como com 3 populações, se destaca a mistura do Francês com o Françês
Basco com uma população Ibérica e um da Moldávia, que é um país que fica entre a Romênia e a Ucrânia, que
parece não ter relação nenhuma com a Itália e a Alemanha.
O alemão, assim como o italiano, com aproximação com 1
população, aparece muito pouco como uma das populações
na aproximação para 4 populações. Aparentemente o
modelo não estaria funcionando muito bem para o caso do
Eduardo.
Seria o caso de pegar os valores das populações referências e
comparar com o perfil do Eduardo para buscar alguma pista,
já que do ponto de vista do modelo estaria acontecendo a
proximidade de @5.
Eurogenes EUtest V2 K15 4-Ancestors Oracle – Deise Soares Guimarães
Semelhantemente a mim, com uma população veio primeiro Portuguese, também com um índice bem acima de 5 (@11.5). Com 2 populações é 50%
Spanish e 50% Serbian ainda com @11.3, sendo o Serbian inesperado. Com 3 populações manteve 50% Spanish porém colocando 25% de uma população
norte europeia (Swedish) e 25% Tunisian. Spanish e Tunisian é uma mistura esperada pela influência moura na península Ibérica. A colocação de uma população
escandinava com 3 populações também aconteceu no meu caso (Danish), porém com 50%. Com 4 populações continuou o @número bem acima de @5, da
mesma forma como para mim, vindo sempre uma população norte europeia, a maioria delas (18) da Grã-Bretanha (Irish, Orcadian, English, Scottish), uma
German e uma Norwegian, confirmando os 25% norte europeu com 3 populações, porém com a população do sul da Europa sendo representada em 19
delas pelo French_Basque e somente em uma por uma população ibérica (Spanish_Murcia); a terceira população das quatro sempre veio representada por
uma população do norte da África (Algerian, Moroccan, Mozabite_Berber, Tunisian) e a quarta população sendo 19 vezes dos Balcãs (Romanian, Bulgarian)
e uma Southwest_French (justamente a que acompanhou a única ibérica). Assim como para mim, esse modelo indica uma mistura com número maior do
que 4 populações (ainda bem >@5) e com populações inesperadas em relação às relatadas nos Açores. A diferença em relação a mim é que no meu caso o
componente norte europeu aparece em maior proporção com 3 e com 4 populações, sendo essas mais diversificadas e incluído frequentemente
populações judaicas.
Neste site se entra com os dados das 15 populações que o Eurogenes K15 do Gedmatch calculou e o ele calcula as coordenadas para se colocar no mapa (que
na realidade é o gráfico resultado da análise de componentes principais – PCA). À esquerda entrei com os meus dados e a direita com os da Deise e ele mostra
as coordenadas. Assim procedi com as outras pessoas e plotei no mapa mostrado nos slides xx e xx.
East_Med_K15

Atlantic_K15 Baltic_K15

Eastern_Euro_K15
West_Asian_K15 North_Sea_K15

Repara que a maior concentração do


West_Med é na ilha da Sardenha, que é
justamente a população que tem o dna
mais semelhante aos dos povos que
West_Med_K15 trouxeram a agricultura para a Europa
cerca de 8000 anos atrás.
Baltic Eastern_Euro
North_Sea
Siberian
Atlantic

Amerindian

West_Med

West_Asian

East_Med
NorthEast_African

Red_Sea

South_Asian

Aqui eu mostro o mapa completo com a localização de 13 das 15


populações do Eurogenes K15 (em preto) e das populações atuais
com as quais eles fazem a localização em função do percentual que
Sub_Saharan cada uma tem dessas 15 populações
Aqui eu mostro parte do mapa, sendo que a
elipse em vermelho mostra onde as nossas
coordenadas (de descendentes de açorianos do
RS) se localizam. O sombreado de cinza separa
as populações judaicas. Essa mostra que os
Judeus Asquenazitas, Italianos e Sefarditas estão
na Europa, os tunisianos e libianos no Oriente
Médio e os iranianos e curdos na Ásia Oeste.
Population Lizete Eduardo Luiza Fernando M. Teresa Marlene Luiz F. José V. Ana L. Paulo P. Luiz P. Vera G. Deise S. Edith V. Xico Abner F. Esmeralda
LS EL LW FP MT MS LF JV AL PP LP VG DS EV X AF ED
North_Sea 29,68 20,70 25,68 23,38 23,74 19,39 19,05 19,65 19,03 15,65 20,05 15,27 17,68 21,10 24,73 21,52 19,26
Atlantic 23,56 27,83 21,55 19,51 18,08 19,11 21,26 21,76 21,03 26,41 19,15 24,51 24,56 26,64 26,84 26,00 22,87
Baltic 18,44 9,55 6,51 4,83 13,86 4,58 4,29 4,36 4,03 5,54 9,68 6,98 6,71 2,60 1,52 7,38 7,24
Eastern_Euro 12,95 5,55 8,34 3,57 2,33 5,93 5,40 5,25 5,59 8,15 7,35 3,49 3,82 2,26 5,51 4,26 2,72
West_Med 7,26 18,02 16,72 22,85 20,36 16,80 19,10 20,33 19,22 18,40 19,75 14,48 16,05 19,08 21,66 21,12 23,30
West_Asian 2,11 5,39 3,41 3,55 1,85 4,01 2,25 0,00 1,49 1,71 1,59 5,09 3,11 3,36 1,30 0,00 0,18
East_Med 0,00 5,12 11,53 9,80 7,05 15,63 12,94 14,90 16,05 10,21 9,64 8,58 9,84 10,38 10,64 10,62 14,98
Red_Sea 2,43 2,58 0,46 2,16 4,34 1,58 3,22 2,41 1,88 3,07 1,99 3,22 3,04 4,27 4,10 4,67 3,78
South_Asian 0,37 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,27 0,00 1,59 0,82 0,32 0,00 0,00 0,00
Southeast_Asian 0,47 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,65 0,95 0,00 0,21 0,50 0,00 0,00 0,00
Siberian 0,00 0,25 1,53 0,60 0,00 0,80 0,73 0,08 0,66 0,00 0,00 0,00 0,08 1,59 0,11 0,00 0,56
Amerindian 0,00 4,00 2,63 8,07 4,47 10,49 9,85 8,73 8,22 6,21 6,92 11,05 9,13 3,57 0,23 0,00 0,31
Oceanian 0,00 0,00 1,02 0,00 0,00 0,36 0,13 0,00 0,53 0,00 0,00 0,91 0,00 0,00 0,00 0,95 0,45
Northeast_African 2,72 1,00 0,14 1,68 3,54 0,00 0,58 1,53 1,95 3,41 1,09 1,89 3,26 0,00 2,33 2,60 1,84
Sub-Saharan 0,00 0,00 0,49 0,00 0,37 1,34 1,21 0,99 0,32 0,33 1,84 2,91 1,68 4,31 1,02 0,87 2,52

eixo x 351 377 383 394 353 482 440 402 441 426 422 488 442 356 282 295 313
eixo y 156 196 229 269 282 282 285 294 297 301 277 332 321 336 301 303 343

Lizete Stumpf: 100% alemão


Eduardo Bauer Londero: 50% alemão + 25% italiano + 25% brasileiro
Luiza P. Wolff (filha Ana Luiza): 50% alemão (parte holandês-família Bos)
Fernando (filho Luiz F.): 12,5% alemão
Maria Teresa Schulte (mãe Fernando): 25% alemão
Marlene (mãe José V., Luiz F. e Ana Luiza): 25% italiano
Paulo P. e Luiz P. (tios paternos José V., Luiz F. e Ana Luiza)
Vera G. (mãe Deise S.):
Edith Vargas (ex-sogra Luiz F.): descendente só de açorianos
Xico: Português do Portugal continental
Abner Fontes e Esmeralda Dias: açorianos nativos
A Lizete (LS) (100% alemã)
cai bem próxima da
população E. German,
confirmando o que vimos
anteriormente.

O Eduardo (EL) e a Luiza (LW) (50%


alemães) estão mais acima, em
posições mais para o norte,
refletindo a maior presença dessa
etnia norte europeia. Interessante
que o próximo mais acima é o
Fernando (FP) (12,5% alemão) e não
a mãe dele (MT) (25% alemão),
sendo que ela, nesses sentido, está
no mesmo nível para o norte do que
meu tio Luiz (LP), minha mãe (MS) e
eu (LF).

Repara que nós (descendentes de açorianos do RS da família do meu pai e da minha mãe) nos localizamos
bem no centro, distante de qualquer uma das populações que eles usam como referência, mais perto de
populações dos Balcãs (Sérvia, Romênia e Bulgária) e da Itália (Italianos do Norte e Toscanos) do que de
Portugal e da Espanha. A minha mãe (MS) é a que mais se aproxima da dos Balcâs e a Vera (VG) e a Deise
(DS) da Toscana e da Tesália (Grécia), enquanto que a Edith (EV) fica entre populações da Itália e a
Portuguesa (o que é mais coerente para um descendente de açoriano). Entre os açorianos nativos a
Esmeralda (ED) é mais parecida com a Edith (EV), porém mais puxando para o português e o sardenho, ao
passo que o Abner (AF) cai bem próximo do português, junto com o português continental Xico (X).
Estimativas de Etnia no My Heritage
2ª Prima Tia-avó
materna materna
Etnia L Fernando José Vicente Ana Luiza Marlene Luiz E F Pinto Paulo Pinto Katia Hilda Edith Deise Vera
Ibérico 37,9 22,5 42,7 30,8 50,1 38,8 17,9 40,7 79,5 21,7 36,8
Norte Europeu e Europeu Ocidental 7,8 32,4 33,4 6,5 24,9 45,3 34,0 0,0 0,0 11,6 0,0
Escandinavo 19,4 0,0 0,0 0,0 4,0 0,0 2,9 0,0 0,0 0,0 0,0
Finlandês 0,0 0,0 0,0 0,0 0,0 0,0 0,0 4,8 0,0 0,0 0,0
Inglês 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 4,0
Irlandês, Escocês e Galês 0,0 0,0 0,0 0,0 0,0 0,0 0,0 3,8 2,7 18,9 18,4
Europa do Leste 0,0 0,0 0,0 9,6 0,0 0,0 0,0 0,0 0,0 0,0 0,0
Balcânico 0,0 0,0 0,0 0,0 0,0 0,0 15,0 0,0 0,0 0,0 0,0
Italiano 7,5 22,1 0,0 29,7 0,0 0,0 0,0 7,9 0,0 19,3 5,1
Grego e Italiano do Sul 0,0 0,0 0,0 0,0 0,0 0,0 6,2 4,6 0,0 0,0 0,0
Judeu Asquenaze 0,0 0,0 0,0 0,0 6,0 6,0 3,6 8,4 2,9 0,0 9,4
Judeu Sefardita - Norte Africano 11,8 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
Oriente Médio 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 1,1 0,0 0,9
Norte Africano 0,0 11,8 8,3 9,2 0,0 0,0 4,8 4,1 6,0 10,7 5,0
Nigeriano 0,0 0,0 1,3 1,9 0,0 0,0 1,3 3,8 1,7 1,8 2,8
América 15,6 11,2 14,3 12,3 14,1 9,9 14,3 21,9 6,1 16,0 17,6
Inuíte 0,0 0,0 0,0 0,0 0,9 0,0 0,0 0,0 0,0 0,0 0,0

Média Família (menos Edith)


Não faz sentido as diferenças de estimativa muito grandes entre eu e meus irmãos e entre meus dois tios paternos, visto
Ibérico 35.2
que os pais nos dois casos são etnicamente semelhantes (ambos descendentes majoritariamente de açorianos). No meu
Norte e Leste Europa 28.6 caso e dos meus irmãos no italiano, o meu irmão teria 22.1%, eu 7,5% e minha irmã 0%, o que é muito improvável.
Itália e Balcãs 10.9
Eu tenho observado constantemente que as estimativas de ibérico na nossa família em todas as plataformas em relação
Judeu 4.5
aos outros descendentes de açorianos é bem mais baixa (pelo menos metade). A grande maioria dos descendentes de
Norte África 4.8 açorianos tem a estimativa de ibérico ao redor dos 70% para mais, como a Dona Edith (minha ex-sogra). Todos os
Nigeriano 1.0 açorianos e seus descendentes, por outro lado, tem estimativas de etnia de italianos e de etnias do norte da Europa, mas
América 14.2 em geral sempre abaixo dos 10% individualmente, ao contrário de nós que dá mais alto que isso.
Contradições de Estimativas de Etnia do My Heritage e a estimativa minha
revisada pelo Genera
Etnia Luiz Fernando Maria Teresa Fernando
Ibérico 37.9 24.6 14.8
Norte Europeu e Europeu Ocidental 7.8 26.8 51.1
Escandinavo 19.4 7.5 3.4
Europa do Leste 0.0 10.9 0.0
Balcânica 0.0 11.3 0.0
Italiano 7.5 6.7 5.3
Judeu Asquenaze 0.0 0.0 0.0
Judeu Sefardita - Norte Africano 11.8 0.0 0.0
Norte Africano 0.0 4.4 14.6
Nigeriano 0.0 2.0 0.8
América 15.6 5.8 10.0

Luiz F M Teresa Fernando É contraditório o My Heritage ter estimado 14.8% de ibérico para o
Norte Europa 27.2 45.2 54.5 Fernando e 54.5% do Norte da Europa com eu e a mãe dele tendo
Sul Europa 45.4 42.6 20.1 mais ibérico e menos norte europeu do que ele.
Norte África 11.8 6.4 15.4 Interessante é que a estimativa do Genera minha deu muito
Américas 15.6 5.8 10.0 semelhante a dele no My Heritage.

O próximo slide confirma para 5 das 8 pessoas da minha família o reconhecimento de grupos genéticos diferentes do esperado (do norte da Europa e Itália).
Grupos Genéticos dos familiares (descendentes de portugueses açorianos) Não esperada dada a origem étnica.

Grupo Genético L. Fernando Marlene J. Vicente Ana Luiza Paulo Pinto Luiz Pinto Katia Hilda Edith Vera Deise Fernando Maria T
Brasil (Rio Grande do Sul) e Uruguai
Brasil (Santa Catarina) #1
Brasil (Santa Catarina) #2
Brasil (paraná)
Brasil (São Paulo) #2
Brasil (Rio de Janeiro, São Paulo e Minas Gerais)
Brasil (Minas Gerais) #2
Brasil #5
Venezuela #1
Portugal #1
Portugal #2
Portugal (Porto e Aveiro)
Portugal (Leiria)
Portugal (Açores) #2
Portugal (Açores) #5
Itália (Veneto e Friuli-Venezia Giulia) #2
Itália (Veneto e Lombardia)
Itália (Lucca)
Suíça (Berna)
Suíça (Lucerna)
Alemanha (Freiburg) e norte da Suíça
Nordeste da Holanda e Alemanha (Baixa Saxônia)
Países Baixos #4
Polônia e Alemanha #
Sul dos EUA #13
Suécia (Uppsala e Estocolmo)
Finlândia (Ostrobótnia Central e Ostrobótnia)

Brasil (São Paulo) #2: Colonos portugueses e italianos de Portugal e do nordeste de Itália no Brasil (São Paulo)
Brasil #5: Portugueses e alguns colonos italianos do norte de Portugal e do norte de Itália no Brasil
Brasil (Santa Catarina) #2: Colonos portugueses, alemães e italianos de Portugal (Açores), Alemanha (Renânia-Palatinado e Renânia do Norte-Vestefália) e nordeste de Itália no Brasil (Santa Catarina)
Brasil (Minas Gerais) #2: Portugueses e alguns colonos italianos de Portugal e do norte de Itália no Brasil (Minas Gerais)
Brasil (Rio de Janeiro, São Paulo e Minas Gerais): Colonos portugueses e alguns italianos de Portugal e do norte de Itália no Brasil (Rio de Janeiro, São Paulo e Minas Gerais)
Sul dos EUA #13: Ingleses, alemão e alguns irlandeses, escoceses, franceses e suíços no sul dos Estados Unidos
Conclusões e observações finais
- A conclusão que chego é que descendemos de pessoas com etnias muito diversas, o que não é uma
novidade uma vez que isso é reportado para os Açores, conforme o próprio testemunho do Jorge Forjaz, de
que teriam sido atraído para lá pessoas de todos os cantos da Europa.

- Porém, a maioria dos açorianos mostram um perfil de ibérico (português) bem mais dominante, em acordo
com os estudos de dna das populações atuais dos Açores. Ao contrário, em nós, o perfil de português não
é dominante sobre os outros, o que é apontado pelos modelos de estimativa de etnia do Gedmatch
(admixture), de tal forma que a análise de componentes principais mostra a necessidade de mais de 4
populações para o ajuste poder chegar próximo de alguma combinação que represente a nossa mistura de
ancestralidade. O mapa com a localização das populações, onde nenhum de nós cai próximo de alguma
delas, ilustra graficamente esta situação.

- A minha hipótese é a de que até a época da vinda dos açorianos para cá (em torno de 1750) existiam ainda
algumas famílias nos Açores que descendiam em grande parte de açorianos não lusos e que vieram para cá
e por casamentos consanguíneos mantiveram aqui esse perfil genético (o nosso caso). Por outro lado, nos
Açores, a partir de 1750 esse perfil não predominantemente lusitano dessas famílias teria sido diluído por
casamentos não consanguíneos em uma população com dna majoritariamente português.

Você também pode gostar