Você está na página 1de 27

1

2
3
4
5
6
7
8
9

INCLUDING NON-ADDITIVE EFFECTS USING GBLUP MODEL IS INDEED


EFFECTIVE? A SIMULATION AND REAL DATA CASE

10

caracteres quantitativos uma etapa importante durante a fase de seleo de

11

materiais genticos em que possvel a fixao por meio de clonagem ou obteno de

12

hbridos. Viabilizao econmica do uso massivo de marcadores moleculares permite

13

uma dissecao em nvel genmico de efeitos no-aditivos. O mtodo GBLUP o

14

mais utilizado na explorao de informao em nvel de DNA em programas de

15

melhoramento e estudos bsicos. Nesse trabalho foi avaliado em um caso de

16

simulao e de dados de circunferncia altura do peito de Eucalyptus spp. o

17

comportamento do modelo GBLUP com estruturas de parentesco com variaes

18

comuns encontradas na literatura. Modelos reduzidos incluindo apenas efeitos

19

aditivos; efeitos aditivos e de dominncia; e completos, incluindo efeitos aditivos e de

20

dominncia e epistticos foram comparados. Os resultados evidenciam que h uma

21

boa recuperao de informao gentica aditiva e de dominncia com o emprego

22

desses modelos, porm efeitos epistticos no so bem recuperados. Novos modelos

23

que contemplam ortogonalidade de maneira mais eficiente so necessrios.

24

Discusses sobre algumas alternativas para melhorar a estimao em ortogonalidade

25

so estabelecidas.

26
27
28

INTRODUO

Jhonathan Pedroso Rigal dos Santos; Luiz Paulo Miranda Pires; Renato Coelho
de Castro Vasconcellos; Marcio Balestre; Renzo Garcia Von Pinho.
RESUMO
A compreenso da importncia de efeitos no-aditivos na expresso de

29

A seleo genmica atualmente tem se tornado uma prtica usual em

30

programas de melhoramento gentico. Escolha de modelos inadequados de regresso

31

direta no genoma pode ter grande impacto interpretativo no entendimento da

32

arquitetura gentica de populaes em anlises genmicas (Vitezica, et al., 2013), e

33

em tomadas de deciso em programas de melhoramento.

34

Grandes avanos foram realizados no ltimo sculo na rea cientfica de

35

modelagem de caracteres quantitativos. O primeiro modelo gentico foi proposto por

36

Sir Ronald Fisher. Esse modelo supe que caracteres quantitativos so controlados

37

por um conjunto infinito de locos no ligados, com pequenos efeitos de mesma

38

magnitude, os quais seguem uma distribuio normal comum e que dependem da

39

frequncia allica de uma populao de referncia (Fisher, 1918).

Aps essa

40

proposta, Fisher despertou grande interesse no aperfeioamento e desenvolvimento

41

de outros modelos genticos.

42

Cockerham (1954) props uma extenso lgica do modelo fisheriano, propondo

43

a decomposio dos componentes epistticos em efeitos de interao do tipo aditivo-

44

aditivo, aditivo-dominante, dominante-aditivo e dominante-dominante entre locos.

45

Outros modelos genticos ad hoc foram propostos, por exemplo, o proposto por

46

Hayman & Mather (1955), em que os valores genticos so funo exclusivamente

47

dos valores genotpicos dos indivduos, sem levar em conta a frequncia allica de

48

uma populao de referncia. Esse modelo conhecido popularmente como mtrica F

49

infinito. A maior desvantagem desse modelo que os componentes de varincia e os

50

efeitos genticos no so decompostos em condio de ortogonalidade, o que pode

51

levar a concluses inadequadas em relao arquitetura gentica de uma populao

52

em estudo (Kao & Zeng, 2002; Zeng, et al., 2005).

53

No princpio, esses modelos foram utilizados com frequncia em anlises

54

tradicionais de decomposio de componentes de varincia (Brim, et al., 1961; Lee, et

55

al., 1968; Stuber & Moll, 1971). Incluses de efeitos no-aditivos tambm foram

56

realizadas em anlises de mapeamento de QTLs (Cockerham & Zeng, 1996). Porm,

57

poucos trabalhos investigaram em profundidade a decomposio de componentes de

58

varincia e efeitos genticos em modelos de regresso direta no genoma (Vitezica, et

59

al., 2013).

60

Os efeitos genticos podem ser decompostos em trs classes de efeitos: (i)

61

aditivos; (ii) dominncia; e (iii) epistasia. Efeitos aditivos so considerados como

62

efeitos lineares de cada alelo que so integralmente herdveis ao longo de geraes.

63

Efeitos de dominncia so efeitos quadrticos, oriundos da interao de alelos de um

64

loco, por exemplo, o valor resultante de dois alelos juntos, especificamente, na

65

constituio de um dado gentipo. Por fim, efeitos epistticos so desvios adicionais

66

devido combinao de dois ou mais genes, ou seja, a falta de aditividade dos valores

67

genotpicos de dois genes diferentes (Falconer & Mackay, 1996; Zeng et al., 2005).

68

Diferentes conceitos de epistasia so encontrados na literatura. A epistasia

69

funcional, que descreve a ao molecular onde protenas ou outros produtos gnicos

70

interagem entre si em rotas metablicas. A epistasia composicional, a qual refere-se

71

ideia clssica de epistasia, onde um alelo de um determinado loco interfere na

72

expresso de outro loco, sendo ento restrita ao indivduo. A epistasia estatstica,

73

definida como um desvio mdio resultante da combinao de alelos nos diferentes

74

locos em uma populao de gentipos. Esse ltimo tipo de epistasia a mais

75

estudado na gentica quantitativa, pois, devido quantidade de locos envolvidos na

76

adaptabilidade de um indivduo, torna-se quase impossvel estimar a epistasia

77

composicional para todos os locos (Phillips, 2008).

78

O entendimento da predominncia de efeitos aditivos, dominantes e epistticos

79

de populaes em melhoramento so preponderantes em tomadas de deciso, por

80

exemplo, escolha de parentais em cruzamentos, escolha de populaes em

81

melhoramento promissoras em esquemas de seleo recorrente e escolha de clones

82

para comercializao em espcies perenes, que so cabveis de fixao de efeitos

83

epistticos e dominantes.

84

Nesse sentido, a eficincia de programas de melhoramento de plantas, que

85

depende do ganho gentico por unidade de tempo, tem grande potencial de aumento

86

com

87

desenvolvimento de tcnicas de genotipagem em larga escala, por exemplo,

88

Genotyping-by-sequencing (GBS) (Elshire et al., 2011), e a diminuio do custo de

89

genotipagem, associado a forte tendncia de aumento de gastos com fenotipagem,

90

estimula grande interesse na utilizao de tcnicas visando explorar informaes

91

genmicas, focando em minimizar custos em programas de melhoramento (Heslot et

92

al., 2014).

explorao

de

efeitos

no-aditivos.

Nos

ltimos

anos,

devido

ao

93

Um grande esforo cientifico est sendo direcionado no sentido de aumentar

94

a eficincia desses programas com a utilizao de mtodos analticos genmicos.

95

Atualmente, o emprego dessas tcnicas varia desde a compreenso da arquitetura

96

gentica da inteligncia de humanos at a compreenso de mecanismos genticos de

97

resistncia de plantas contra patgenos (Davies et al., 2011; Edae et al., 2014).

98

Aplicaes dessas tcnicas analticas, que recuperam informaes de natureza

99

gentica, focando principalmente no aumento da eficincia de procedimentos de

100

seleo, imputao, predio e avaliao de gentipos em mltiplos ambientes foram

101

e esto sendo conduzidos, proporcionando grandes avanos no melhoramento de

102

plantas (Heslot et al., 2014).

103

O modelo de regresso direta no genoma mais adotado em anlises

104

estatsticas o GBLUP (Genomic Best Linear Unbiased Predictor), devido a sua

105

simplicidade

106

computacionalmente e intuitivo geneticamente (Gianola et al., 2014). A adoo

107

generalizada de modelos considerando efeitos aditivos tm sido realizado em vrios

108

trabalhos, devido sua simplicidade e importncia em interpretaes genticas

109

(Albrecht et al., 2014; Massman et. al., 2013; Technow et al., 2014). Modelos

110

assumindo efeitos de dominncia e epistticos foram propostos (Su et al., 2012;

111

Vitezica et al., 2013), porm ainda so muito pouco utilizados no melhoramento de

112

plantas, apesar da forte evidncia de importncia, j h alguns anos, na arquitetura

interpretativa,

flexibilidade

de

modelagem,

ser

pouco

intensivo

113

gentica de caracteres quantitativos (Carlborg & Haley, 2004). Todos esses modelos

114

genticos, independentemente de ser o GBLUP, variam com a adio ou remoo de

115

variveis explicativas genticas populacionais, como os j mencionados, efeitos

116

aditivos, de dominncia e epistticos e com a forma de estimao de parentesco entre

117

integrantes de um populao atual, que apresentam relacionamentos crpticos em

118

relao uma populao de referncia (de los Campos, et al., 2013; Powell, 2010;

119

VanRaden, 2008; Zeng, et al., 2005b).

120

O GBLUP apesar de proposto recentemente (VanRaden, 2008), j h muitos

121

anos teve seu fundamento elucidado (Henderson, 1984), trata-se de um modelo

122

semelhante ao modelo BLUP, mas em vez do parentesco entre indivduos ser

123

estimado por pedigree, so estimados com marcadores moleculares. Por muitos anos

124

o modelo BLUP foi o mais utilizado no melhoramento animal, e menos popular no

125

melhoramento de plantas (Piepho et al., 2008; Smith et al., 2005). A adio de efeitos

126

no-aditivos em modelos mistos foi proposta primeiramente por Henderson (1985),

127

porm ainda no modelo BLUP. A maior desvantagem da utilizao desse modelo o

128

fato da epistasia ser baseada em parentesco mdio, no considerando informaes de

129

forma direta em nvel de DNA. Com a utilizao do modelo GBLUP, possvel no s

130

estimar efeitos aditivos de marcadores moleculares, mas tambm estimar efeitos de

131

dominncia e epistticos em nvel genmico.

132

Efeitos

no-aditivos

so

informaes

importantes

principalmente

para

133

programas de melhoramento de espcies em que possvel a fixao desses efeitos,

134

conforme j enfatizado, como por exemplo, em melhoramento de Eucalyptus e outras

135

em que so comercializados clones, os quais so cabveis a fixao de alelos por

136

clonagem (Silva et al., 2004). Apesar do grande nmero de trabalhos buscando

137

estimar esses efeitos com modelos de regresso direta no genoma, ainda no h

138

estudos que procuram compreender minuciosamente com estudos de simulao e

139

com dados reais a preciso dessas estimativas, e se de fato essas refletem os valores

140

paramtricos de uma determinada populao.

141

A tendncia nesse momento em estudos genmicos o aprimoramento e o

142

aumento da eficincia de predio com o modelo GBLUP (Gianola et al., 2014). Os

143

trs principais objetivos que justifica a execuo deste trabalho so: (i) examinar um

144

modelo G-BLUP considerando efeitos epistticos de segunda ordem; (ii) verificar qual

145

a estrutura de matriz de parentesco mais conveniente para o modelo avaliado; (iii)

146

obter resultados prvios em um estudo de simulao exploratrio com controle de

147

valores paramtricos genticos e (iv) validar as concluses em conjunto de dados

148

genotpicos e fentipos reais da cultura do gnero Eucalyptus spp. da empresa Fibria

149

S. A.

150
151

MATERIAL E MTODOS

152
153

Modelos estatsticos

154

Nesse trabalho foram utilizados trs classes de modelos: (i) aditivo GBLUP-A;

155

(ii) aditivo/dominante GBLUP-AD e (iii) episttico GBLUP-EP. Houve a adoo

156

desses modelos nas duas etapas de anlise, tanto com os dados simulados, quanto

157

com os dados reais fenotpicos. Na sequncia ser descrito o modelo G-BLUP geral e

158

as variaes i, ii, e iii.

159

O modelo G-BLUP geral pode ser definido por:

160

+
+
=

161

onde o vetor de observaes fenotpicas () decomposto no vetor dos efeitos fixos

162

) n 1, que so obtidos pelo produto da matriz de incidncia de


das observaes (

163

) k 1, tambm decomposto em
efeitos fixos () n k com o vetor de efeitos fixos (

164

valores genticos aleatrios das observaes () n 1, dado pelo produto da matriz

165

de incidncia dos valores genticos aleatrios () n p com o vetor de valores

166

genticos aleatrios () p 1, e por fim decomposto no vetor de erros associados as

167

observaes () n 1. As variveis n, k, e p correspondem ao nmero de observaes

168

fenotpicas, de efeitos fixos e valores genticos aleatrios, respectivamente.

169

As distribuies dos efeitos aleatrios so consideradas como ~ MVN (, )

170

e ~ MVN (, ). As observaes so assumidas como ~ MVN (, ). A matriz

171

estruturada por:
() = + =

172
173

onde: uma matriz de varincia-covarincia gentica, uma matriz de varincia-

174

covarincia residual e a matriz de varincia-covarincia fenotpica.

175

Para cada modelo foram utilizadas trs estruturas de matriz de parentesco

176

aditiva (). A primeira equivale a matriz proposta por Vitezica et al., (2013) (v)

177

(equao X):

178

179

onde a frequncia do alelo favorvel e frequncia do alelo desfavorvel; a

180

matriz de desvio dos marcadores codificados por 2 (dois alelos favorveis), 1 (um alelo

181

favorvel), 0 (nenhum alelo favorvel) centralizados em (mdia do alelo favorvel

182

em um dado loco) ; a soma da varincias dos locos.

183

A segunda matriz a proposta por Powell et al. (2010) (p) (equao X).

184

= {

( )( )

(+ ) +

185

onde a matriz de parentesco unificada de Powell, a posio em linha do

186

parentesco na matriz, a posio em coluna do parentesco na matriz, a soma de

187

alelos (marcas) de um dado loco, com cada alelo favorvel codificado por 1 e cada

188

desfavorvel por 0 e o nmero de marcas.

189

Tambm houve o ajuste dessa matriz pela formula emprica (equao X)

190

proposta por Yang et al., (2010), que conforme afirmado pelos autores, apresenta a

191

finalidade de eliminar o vis associado ao fato de utilizar um nmero finito de locos.

192

= (

)
( )

193

A terceira matriz foi proposta por Meuwissen et al. (2011) (m), que conforme

194

afirmado pelos prprios autores, equivale a matriz de Powell et al., (2010), porm sem

195

calcular a diagonal separadamente, e com o acrscimo de uma constante ( 104 ) na

196

diagonal da matriz.

197

Tambm foram utilizadas trs estruturas de matriz de parentesco de desvio de

198

dominncia (), sendo a primeira proposta por Vitezica et al. (2013) (v):

199

200

onde = {
para os gentipos {


()

201

A segunda matriz empregada foi construda em pairwise, conforme a matriz

202

de Powell et al. (2010) (p), com o mesmo conceito gentico de derivao da matriz

203

sugerida por Vitezica et al. (2013).

204

J a terceira matriz foi construda da mesma forma que a matriz de

205

Meuwissen et al. (2011) (m), com o mesmo conceito gentico de derivao da matriz

206

sugerida por Vitezica et al. (2013).

207

As matrizes de parentesco epistticas foram obtidas pelo produto de Hadamard

208

(#) da seguinte forma: #, #, #. Conforme apresentado por Henderson (1985)

209

no caso de matrizes de parentescos estimadas por pedigree.

210

No modelo aditivo, o nico valor gentico estimado corresponde ao valor

211

). Portanto, =
e = 2 . J o aditivo/dominante dado pelo
gentico aditivo (

212

). Assim, =
e = 2 + 2.
com o desvio de dominncia (
+
somatrio de

213

O modelo episttico foi construdo pelo acrscimo de covariveis epistticas do tipo

214

aditiva-aditiva

),
(

aditiva-dominante

),
(

dominante-dominante

).
(

+
+
e
+
+
=

2
= 2 + 2 + #
+

215

Consequentemente,

216

2
2
#
+ #
. A optimizao da funo de mxima verossimilhana restrita

217

(REML) de todos os componentes de varincia dos modelos descritos acima foram

218

realizados pelo algoritmo Expectation-Maximization (EM) de Dempster et al. (1977),

219

com todas as programaes realizadas na plataforma R.

220
221

Decomposio espectral

222

Algumas matrizes durante a conduo do trabalho caracterizaram-se por ser

223

negativa definida, devido a isso, foi realizado um procedimento de decomposio

224

espectral. O procedimento foi basicamente a decomposio das matrizes de

225

parentesco em matrizes de auto-valores (Diagonal) e de auto-vetores. Na matriz

226

diagonal dos autovalores, onde os elementos eram negativos, foi zerado e adicionado

227

uma pequena constante (10-4) de magnitude decrescente ao longo de cada elemento

228

diagonal da matriz. Aps a reconstruo, obteve-se uma matriz positiva definida, que

229

caracteriza o processo gaussiano necessrio para o modelo misto adotado neste

230

trabalho. As matrizes que tiveram problemas de autovalores negativos foram: A

231

estrutura v (dados reais); A estrutura v e D estrutura m (dados da simulao).

232
233

Correlaes estimadas no estudo por simulao

234

A eficincia dos trs modelos foi avaliada por duas estatsticas genticas. Uma

235

delas foi correlao de Pearson ( ) entre os valores genticos paramtricos com

236

os valores genticos estimados pelos diferentes modelos.

237

A outra estatstica foi o coeficiente de herdabilidade, estimado por:


238

239

onde poder ser: a, d, aa, ad, dd ou combinaes dependendo do modelo.

240
241

Estudo com dados reais: Validao cruzada e correlaes

242

O mtodo de validao cruzada empregado foi o K-Fold. O conjunto de 611

243

observaes foi subdividido aleatoriamente em seis grupos de dados, sendo cinco

244

grupos constitudos por 100 observaes e o ltimo por 111. No processo de anlise

245

era eliminado sequencialmente um grupo, para ser utilizado a populao resultante

246

como de treinamento, e o grupo excludo da anlise como de validao, at que todos

247

os grupos foram utilizados como populao de validao. Na predio dos valores

248

genticos dos gentipos integrantes do grupo de validao, eram realizadas duas

249

modificaes nas estruturas das matrizes e : (i) eliminao das linhas da matriz

250

relacionadas aos gentipos integrantes do grupo de validao; (ii) eliminao das

251

linhas e colunas da matriz relacionadas aos gentipos do mesmo grupo.

252

A eficincia foi estimada por dois parmetros genticos, semelhante ao que foi

253

realizado no estudo por simulao. O primeiro foi correlao de Pearson entre os

254

valores genticos preditos do grupo de validao, com os valores genticos estimados

255

na anlise considerando os seis grupos (611 observaes). O segundo foi o estimador

256

de herdabilidade ( ) adotado no estudo de simulao.

257
258

Estudo por simulao

259

Na etapa do estudo por simulao, os dados foram obtidos via o software

260

QGene 4.3.1 (Joehanes & Nelson, 2008). Foram simulados 40 QTLs (Quantitative trait

261

loci) no total, sendo 20 QTLs de efeitos aditivos (a) e de dominncia (d), outros 20

262

QTLs com efeitos epistticos do tipo aditivo-aditivo (aa), aditivo-dominante (ad) e

263

dominante-dominante (dd).

264

A construo dos valores genotpicos verdadeiros foram realizados no software

265

R (R Core Team, 2014), com base nas estimativas dos efeitos de cada marca e

266

posio ao longo do genoma dos gentipos gerados e informados pelo software

267

QGene 4.3.1. Ao final da simulao foram gerados 500 gentipos, com 6.080 marcas

268

simuladas cada. Os parmetros populacionais simulados podem ser observados na

269

Tabela (1).

270
271

Tabela 1 Valores paramtricos populacionais utilizados no processo de simulao.


Parmetros
Valores paramtricos simulados

2.000,00

0,30

183.735,50

257.233,25

400.612,00

212.265,25

64.646,00

2.609.814,67

272
273
274
275
276
277

: mdia populacional; : coeficiente de herdabilidade no sentido amplo; 2 :varincia


2
gentica aditiva; 2 : varincia gentica de dominncia;
: varincia gentica
2
2
episttica aditiva-aditiva; : varincia gentica episttica aditiva-dominncia;
:
2
varincia gentica episttica aditiva-dominncia; : varincia gentica episttica
dominncia-dominncia; 2 : varincia residual.

278

Estudo com dados reais fenotpicos e moleculares

279
280

Todos os dados fenotpicos e de marcadores SNPs/GBS foram disponibilizados

281

pela empresa Fibria S.A. Os dados so oriundos de uma populao de hbridos

282

derivada de cruzamentos entre E. grandis, E. urophylla e E. globulus. A populao foi

283

avaliada em um ensaio desbalanceado, com repeties variando de duas a quatorze.

284

O delineamento experimental adotado foi em ltice, com parcelas compostas por uma

285

planta (single tree plot). A populao foi estruturada por 611 gentipos oriundos de 68

286

prognies.

287

A populao foi fenotipada aos 24 meses de idade e o carter avaliado foi

288

circunferncia altura do peito (cm) (CAP). Paralelamente ao processo de

289

fenotipagem, foi extrado o DNA de todas as plantas avaliadas. J em relao ao

290

processo de genotipagem, foi realizado o uso da tcnica Genotyping-by-Sequence

291

(GBS) proposta por Elshire et al. (2011), tendo como resultado 33,527 SNPs.

292

Marcadores perdidos foram imputados pela funo A.mat, mtodo mean, com o

293

pacote rrBLUP (Endelman, 2011) do software R.

294

Na elaborao da matriz de parentesco A e D nas estruturas m e p h

295

restries na utilizao de alelos em baixa frequncia. Devido formulao

296

matemtica dessas matrizes, quando utilizados alelos em baixa frequncia, o

297

parentesco acaba tendendo ao infinito (Endelman & Jannink, 2012). Para remediar

298

esse problema foram filtrados alelos em frequncia inferior a 0.05 e superior a 0.95 na

299

construo das matrizes m e p. Aps a eliminao houve a reduo de 33,527 para

300

23,283 marcadores. Na estimao da matriz v no foi realizado esse procedimento de

301

filtragem de marcas, pois no existe essa restrio de construo matemtica, sendo

302

portanto, essa ausncia de necessidade de processamento de marcas, uma vantagem

303

dessa matriz.

304
305

RESULTADOS

306

Resultados da simulao

307

Os componentes de varincia estimados pelos modelos GBLUP-A, GBLUP-AD e

308

GBLUP-EP do conjunto de dados simulados, com as trs estruturas de parentesco,

309

podem ser visualizados na Tabela (2).

310
311

Tabela 2 Componentes de varincia da anlise dos dados simulados (s) estimados

312

pelos modelos com as estruturas de parentesco v, m e p episttica com os modelos

313

aditivo (GBLUP-A), modelo aditivo-dominante (GBLUP-AD) e modelo episttico

314

(GBLUP-EP).
GBLUP-A

Parmetros
u2
e2

s
-

236.772,4

236.839,9007

250.187,2304

4.272.326

4.272.238,5946

4.015.325,0418

GBLUP-AD
u2

2
g2

e2

279.493,6999

279.577,3998

298.897,8012

216.129,5994

216.117,7996

229.586,1999

495.623,2993

495.695,1994

528.484,0011

4.021.444,8511

4.021.322,9447

3.694.471,0978

GBLUP-EP
u2

183.735,50

241.797,3486

241.840,4427

244.147,025

257.233,25

211.866,5033

211.845,102

223.621,7689

2
uu

400.612,00

507.107,2684

507.412,9618

171.773,7068

u2

212.265,25

450.011,4428

449.094,4509

94.993,3421

64.646,00

649.935,5665

649.685,1715

468.250,0646

g2

1.118.492,00

2.060.718,1300

2.059.878,1290

1.202.785,9070

e2

2.609.814,67

2.473.756,8278

2.474.222,5478

2.409.016,3655

315
316

Conforme pode ser observado, tanto nos modelos com as matrizes m quanto v

317

apresentaram estimativas semelhantes dos componentes de varincia, por exemplo, o

318

modelo GBLUP-EP com u de 241.797,3486 (v) e 241.840,4427 (m). Porm, em nvel

319

de efeitos de marcas foi observado uma maior preciso na estimativa dos efeitos

320

aditivos, com a utilizao da matriz v, com maior aproximao dos valores estimados

321

com os simulados em todos os modelos (Figura 1).

322

323
324

Figura 1: Grfico Manhattan dos efeitos aditivos obtidos utilizando as trs estruturas

325

de parentesco (na ordem da esquerda para a direita), Vitezica (v), Meuwissen (m) e

326

Powell (p), respectivamente. Distribuio das marcas ao longo dos 10 cromossomos

327

(cada cor um cromossomo) com seus efeitos. Os valores paramtricos das marcas

328

foram ajustados para ficarem na mesma escala em relao as estimativas obtidas com

329

o uso de todas as estruturas de parentesco, para isso foi dividido por 280 (v), 30 (m) e

330

15 (p). Os valores simulados so os pontos pretos. A: modelo aditivo (GBLUP-A), B:

331

modelo aditivo-dominante (GBLUP-AD) e C: modelo episttico (GBLUP-EP) Apenas

332

efeitos positivos das marcas estimados pelo GBLUP foram plotados.

333
334

Considerando efeitos de dominncia das marcas, tambm possvel constatar

335

o mesmo comentrio reportado anteriormente, com bom poder de deteco dos

336

efeitos das marcas simuladas com a utilizao da matriz v e m (Figura 2). O

337

componente de varincia gentica total foi melhor recuperado pela estrutura p ( g2 =

338

1.202.785,9070) em relao ao valor simulado ( g2 = 1.118.492,00), ao passo que com

339

as matriz v ( g2 = 2.060.718,1300) e m ( g2 = 2.059.878,1290) esse valor foi

340

inflacionado.

341
342

Figura 2: Grfico Manhattan dos efeitos de dominncia obtidos utilizando as trs

343

estruturas de parentesco (na ordem da esquerda para a direita), Vitezica (v),

344

Meuwissen (m) e Powell (p), respectivamente. Distribuio das marcas ao longo dos

345

10 cromossomos (cada cor um cromossomo) com seus efeitos. Os valores

346

paramtricos das marcas foram ajustados para ficarem na mesma escala em relao

347

as estimativas obtidas com o uso de todas as estruturas de parentesco, para isso foi

348

dividido por 190 (v), 330 (m) e 250 (p). Os valores simulados so os pontos pretos. A:

349

modelo aditivo-dominante (GBLUP-AD), B: modelo episttico (GBLUP-EP). Apenas

350

efeitos positivos das marcas estimados pelo GBLUP foram plotados.

351
352

As estimativas dos componentes de varincia utilizando a matriz p diferiram

353

das demais, apresentando maior magnitude (Tabela 2) e tambm as piores

354

estimativas dos efeitos das marcas para todos os efeitos de natureza gentica (Figura

355

1 e 2) no foi elaborado Grfico Manhattan para os efeitos epistticos devido a

356

impossibilidade de construo de matriz de desvios (W), j que a construo

357

promovida pelo produto direto das matrizes de parentesco. No emprego de todas

358

essas estruturas de parentesco no houve boa preciso nas estimativas dos

359

componentes de varincia relacionados epistasia (Tabela 2). Por exemplo, entre os

360

valores estimados de epistasia, a estimada com maior eficincia ( u = 94.993,3421)

361

ainda ficou bem distante do valor paramtrico simulado ( u = 212.265,25),

362

considerando o modelo GBLUP-EP com a matriz p. Apesar desse baixo desempenho,

363

para todas as estruturas de parentesco no modelo GBLUP-EP, os modelos com a

364

matriz p foram os que mais aproximaram do valor paramtrico simulado. Portanto, a

365

ordem de qualidade de preciso das estimativas dos componentes de varincia

366

seguiu: u : v, m e p; : p, m e v; : p, m, v; uu : v, m, p; u : p, m, v; e : p,

367

m, v.

368

J em relao a preciso das estimativas dos valores genticos, assim como

369

houve equivalncia nas estimativas dos componentes de varincia para os modelos

370

com matrizes v e m, tambm houve para a correlao entre os valores simulados e

371

estimados (Tabela 3).

372
373 Tabela 3 Correlaes da anlise dos dados simulados (s) e estimados pelos modelos
374 com as estruturas de parentesco v, m e p episttica, com os modelos aditivo (GBLUP375 A), modelo aditivo-dominante (GBLUP-AD) e modelo episttico (GBLUP-EP).
Parmetros
aa
gg

v
0,7382
0,2328

aa
dd
gg

0,7211
0,6504
0,325

aa
dd
aaaa

adad

dddd

gg

0,7408
0,6691
0,1820
0,1626
0,0014
0,3379

GBLUP-A
m
0,7383
0,2328
GBLUP-AD
0,7212
0,6502
0,325
GBLUP-EP
0,7408
0,6690
0,1819
0,1626
0,0015
0,3379

p
0,7343
0,2338
0,658
0,651
0,3524
0,6931
0,6676
0,1214
0,1595
0,0062
0,3320

376
377

Da mesma forma, os modelos com as matrizes v e m apresentaram maior

378

correlao entre os valores simulados e estimados para os efeitos aditivos nos trs

379

modelos utilizados. Apesar dos modelos com as matrizes v e m terem evidenciado

380

menor eficincia na estimao dos componentes de varincia de natureza episttica,

381

esse mesmo fato no foi verdadeiro para as correlaes genticas epistticas do tipo

382

aa e ad. J para o efeito de dominncia, o modelo reduzido GBLUP-AD com a matriz

383

p apresentou a maior correlao entre o valor simulado e estimado, porm, no modelo

384

completo, essa estimativa foi ligeiramente pior que as demais estruturas de

385

parentesco. A matriz p demonstrou maior eficincia na aproximao dos componentes

386

de varincia do tipo dd e proporcionou maiores valores de correlao para esse efeito.

387

A recuperao da informao gentica total foi superior nos modelos reduzidos

388

GBLUP-A e GBLUP-AD (Tabela 4) com o uso da matriz p, e mais preciso para o

389

modelo completo com as matrizes v e m, dado o maior valor de correlao preditiva

390

observado (Tabela 3).

391

As estimativas dos coeficientes de herdabilidade seguem na Tabela (4). Como

392

esperado houve similaridade entre os coeficientes de herdabilidade com o uso de

393

todos os modelos para as estruturas v e m, j que os componentes de varincia foram

394

semelhantes. Os valores mais altos foram obtidos pelos modelos considerando a

395

estrutura p, por exemplo, no modelo GBLUP-EP a a2 foi 0,1054, ao passo que com

396

esse mesmo modelo, considerando a estrutura v e m, a a2 foi de 0,0516, mais bem

397

aproximado em relao ao valor simulado (a2 = 0,0493). No modelo GBLUP-AD, a

398

utilizao da estrutura de parentesco p proporcionou a melhor aproximao entre os

399

valores de herdabilidade para o efeito de dominncia, simulados e estimados, que

400

foram de 0,0690 e 0,0514, respectivamente. Para o modelo GBLUP-EP, foi observado

401

um comportamento semelhante ao descrito anteriormente, onde os coeficientes de

402

2
herdabilidade nesse modelo foram inflacionados em todos os casos, exceto para ad
,

403

que apresentou valor de 0,0569 paramtrico e 0,044 estimado (Tabela 4). Todos os

404

modelos para todas as matrizes de parentesco inflacionaram a herdabillidade no

405

sentido amplo (g2 ) no modelo GBLUP-EP, com valores oscilando de 0,4505 para

406

matriz m 0,4651 para matriz p. A g2 no foi inflacionada no modelo GBLUP-A e

407

GBLUP-AD para as matrizes v e m, porm teve superestimao em todas as

408

configuraes de modelo com a utilizao da matriz p.

409
410 Tabela 4 Herdabilidades da anlise dos dados simulados (s) e estimados pelos
411 modelos com as estruturas de parentesco v, m e p episttica, com os modelos aditivo
412 (GBLUP-A), modelo aditivo-dominante (GBLUP-AD) e modelo episttico (GBLUP-EP).
Parmetros
a2
g2

s
-

a2
d2
g2

a2
d2
2
aa

2
ad

2
dd

g2

0,0493
0,0690
0,1075
0,0569
0,0200
0,3000

GBLUP-A
v
m
0,0512
0,0512
0,0512
0,0512
GBLUP-AD
0,058
0,058
0,0489
0,0489
0,1069
0,1069
GBLUP-EP
0,0516
0,0516
0,0472
0,0472
0,1114
0,1115
0,0992
0,099
0,1414
0,1413
0,4506
0,4505

p
0,1083
0,1083
0,1264
0,0531
0,1795
0,1054
0,0514
0,154
0,044
0,1103
0,4651

413
414

Resultados dos dados reais

415

As estimativas dos componentes de varincia associados anlise gentica da

416

populao de Eucaliptus spp. segue na Tabela (5). Observa-se que no modelo

417

GBLUP-A h pouca diferena na magnitude dos componentes de varincia aditiva

418

com a utilizao de todas as matrizes de parentesco testadas. Adicionalmente, foi

419

possvel observar que, na validao cruzada, ocorreu sobreposio nas estimativas

420

dos componentes de varincia, conforme pode ser observado por meio dos desvios

421

padres associados a essas estimativas. Com a incluso do efeito de dominncia no

422

modelo (GBLUP-AD) observa-se que ainda assim houve alta variao dos efeitos

423

aditivos na expresso do carter CAP, com maior magnitude do componente de

424

varincia u em relao ao , apesar da alta estimativa de observada, que de

425

fato esperado, por ser uma cultura perene no-endogmica. No modelo GBLUP-EP,

426

observa-se que mesmo com a adio dos efeitos epistticos no modelo, tambm

427

ocorreu alta variao dos efeitos aditivos em relao aos demais efeitos, por exemplo,

428

a contribuio percentual da varincia aditiva em relao varincia gentica total, para

429

as trs estruturas de parentesco foi de: 55,23% (v), 55,03% (m), 64,58% (p).

430
431
432

Tabela 5 Componentes de varincia da anlise dos dados reais de Eucalyptus spp.

433

estimados pelos modelos com as estruturas de parentesco v, m e p episttica, com os

434

modelos aditivo (GBLUP-A), modelo aditivo-dominante (GBLUP-AD) e modelo

435

episttico (GBLUP-EP).

GBLUP-A
v

AC

VC SD

AC

VC SD

AC

VC SD

u2

14,99

15,57 2,55

15,34

15,98 3,07

15,33

15,94 2,47

e2

45,29

44,94 2,77

44,73

44,37 3,21

30,19

29,25 4,75

GBLUP-AD
u2

12,54

13,72 1,99

12,82

13,69 3,17

12,76

13,42 2,48

7,57

9,14 4,25

9,74

10,04 3,02

7,56

8,93 2,49

g2

20,11

22,87 3,77

22,56

23,74 2,95

20,32

22,361,70

e2

39,34

37,21 3,53

38,58

37,88 1,94

15,35

13,31 2,65

GBLUP-EP
u2

12,33

13,09 2,70

12,91

13,73 3,27

12,26

13,60 2,10

5,13

5,16 3,03

7,81

7,22 3,54

6,09

4,50 0,84

2
uu

3,69

3,27 0,89

0,84

1,14 0,12

1,21

1,26 0,55

u2

1,27

1,49 0,34

1,07

1,53 0,15

0,88

0,94 0,38

0,52

0,68 0,17

1,55

2,26 0,36

0,71

0,76 0,01

g2

22,95

23,70 2,35

24,18

25,89 2,98

21,15

21,06 1,69

e2

37,00

36,48 1,69

37,27

36,15 1,74

6,69

7,74 4,21

436
437
438

AC: anlise completa com todos os dados; VC: estimativa obtida pela validao
cruzada; SD: desvio padro das estimativas.

439

Com relao a preciso na estimao dos efeitos genticos, de maneira geral,

440

a utilizao das estruturas de parentesco v e m proporcionaram maiores magnitudes

441

de correlao (Tabela 6). Entretanto, para o modelo GBLUP-EP, a oscilao dessas

442

estimativas, considerando a matriz v e m, foram superiores quando comparadas aos

443

obtidos na simulao, em que os resultados foram praticamente idnticos, porm,

444

esse fato no foi suficiente para alterar a ordem de preciso da estimativa dos efeitos,

445

independentemente da estrutura de parentesco ser v ou m. Por exemplo, pode ser

446

verificado que, para a estrutura v a ordem de preciso no modelo GBLUP-EP foi: a, d,

447

aa, ad, dd; e para estrutura m o mesmo foi observado.

448

Para todos os modelos utilizados, a aplicao da matriz p proporcionou

449

menores estimativas das correlaes, corroborando os resultados obtidos via

450

simulao, com exceo da correlao para o efeito episttico do tipo dominante-

451

dominante, onde o dddd


assumiu valor de 0,0062 e se mostrou superior as demais

452

estruturas de parentesco.

453
454 Tabela 6 - Correlaes da anlise dos dados reais de Eucalyptus spp. estimados pelos
455 modelos com as estruturas de parentesco v, m e p episttica, com os modelos aditivo
456 (GBLUP-A), modelo aditivo-dominante (GBLUP-AD) e modelo episttico (GBLUP-EP).

457

Parmetros
aa
gg

v SD
0,90 0,04
0,90 0,04

aa
dd
gg

0,91 0,03
0,64 0,06
0,80 0,05

0,91 0,03
aa
0,65 0,06
dd
0,47 0,06
aaaa

0,31 0,06
adad

0,16 0,14
dddd

0,76 0,06
gg
SD: desvio padro das estimativas.

GBLUP-A
m SD
0,89 0,04
0,89 0,04
GBLUP-AD
0,90 0,04
0,63 0,04
0,79 0,06
GBLUP-EP
0,90 0,04
0,64 0,05
0,38 0,10
0,29 0,09
0,22 0,08
0,77 0,06

p SD
0,65 0,08
0,65 0,08
0,67 0,07
0,27 0,05
0,47 0,08
0,68 0,07
0,28 0,05
0,16 0,09
0,08 0,09
0,05 0,06
0,40 0,08

458
459

As estimativas de coeficiente de herdabilidade de todos os modelos, utilizando

460

todas as configuraes de matrizes de parentesco podem ser observadas na Tabela

461

(7). A incluso de efeitos de dominncia e epistticos promoveu a reduo na

462

estimativa da herdabilidade no sentido resitrito, possivelmente, os efeitos epistticos

463

absorveram os efeitos aditivos. Houve tambm uma evidncia clara de baixa

464

intensidade de efeitos epistticos no controle gentico do carter CAP de Eucalyptus

465

spp., conforme evidenciado pela pequena magnitude de herdabilidade desses efeitos.

466
467

Tabela 7 - Herdabilidades da anlise dos dados reais de Eucalyptus spp. estimados

468

pelos modelos com as estruturas de parentesco v, m e p episttica, com os modelos

469

aditivo (GBLUP-A), modelo aditivo-dominante (GBLUP-AD) e modelo episttico

470

(GBLUP-EP).
v
a2
g2

AC
0,23
0,25

VC SD
0,26 0,04
0,26 0,04

GBLUP-A
m
AC
VC SD
0,26
0,26 0,05
0,26
0,26 0,05

AC
0,34
0,34

p
VC SD
0,36 0,08
0,36 0,08

GBLUP-AD
a2

0,2109

0,22 0,05

0,21

0,22 0,05

0,36

0,39 0,08

d2

0,1272

0,13 0,03

0,16

0,16 0,04

0,21

0,23 0,06

g2

0,3381

0,35 0,03

0,37

0,38 0,04

0,57

0,62 0,07

GBLUP-EP

471
472
473

a2

0,22

0,22 0,05

0,21

0,22 0,05

0,44

0,46 0,10

d2

0,09

0,09 0,05

0,13

0,12 0,05

0,22

0,18 0,09

2
aa

0,06

0,05 0,01

0,01

0,02 0,01

0,04

0,04 0,03

2
ad

0,02

0,02 0,01

0,02

0,02 0,01

0,03

0,03 0,02

2
dd

0,01

0,01 0,01

0,03

0,04 0,01

0,03

0,02 0,01

g2

0,38

0,39 0,03

0,39

0,42 0,04

0,76

0,73 0,11

AC: anlise completa com todos os dados; VC: estimativa obtida pela validao
cruzada; SD: desvio padro das estimativas.

474
475

DISCUSSES

476
477

A incorporao de efeitos no-aditivos pode aumentar a acurcia de predio

478

no estudo de caracteres quantitativos. A utilizao de marcadores moleculares com o

479

modelo GBLUP permite a explorao direta desses efeitos em nvel genmico,

480

conforme nossos resultados evidenciaram, principalmente efeitos de dominncia.

481

Outras alternativas de decomposio dos componentes de varincia, sem utilizao de

482

marcadores moleculares, necessitam populaes durante vrias geraes, com

483

padro de segregao, que permite o isolamento de componentes genticos de

484

natureza no-aditiva. Esses delineamentos requerem gastos expressivos em

485

fenotipagem, tempo e no so viabilizados em esquemas comerciais de programas de

486

melhoramento (Bernardo, 2010).

487

Por exemplo, Silva et al. (2004) gerou populaes de Eucalyptus globulus em

488

um esquema de cruzamento dialelico. Esse delineamento oneroso, pois exige vrias

489

combinaes parentais. Alm disso, o emprego desse delineamento por Silva et al.

490

(2004) necessitou quatro anos de avaliaes fenotpicas. A anlise foi realizada em

491

dois estgios: (i) estimou a varincia gentica aditiva e fenotpica utilizando modelos

492

mistos, com estrutura de parentesco estimado por pedigree; (ii) e isolou efeitos de

493

dominncia e epistasia baseado em decomposies de esperana, da capacidade

494

geral e especfica de combinao definidas por Griffing (1956). Todavia, esse

495

procedimento pouco coerente, pois utilizado um modelo com estrutura de

496

varincia-covarincia dada como conhecida para estimar componente de varincia, e

497

depois empregado os princpios de decomposio de esperana de modelos que

498

assumem independncia entre as observaes. Esse exemplo mostra de forma ntida

499

a limitao em termos de tempo, da necessidade de atendimento de fortes

500

pressupostos, e das restries tericas de metodologias tradicionais sem a utilizao

501

de informao de marcadores moleculares.

502

O uso de marcadores moleculares permite a explorao de componentes

503

aditivos e no aditivos, com informaes de contrastes em nvel genmico, que auxilia

504

na superao das restries comuns que so encontradas nos delineamentos

505

tradicionais.

506
507

Matrizes de parentesco

508

Conforme enfatizado na metodologia, o conjunto de dados fenotpicos e

509

genotpicos foram simulados considerando frequncia allica 0.5. Nessa condio,

510

esperado que os modelos GBLUP com as estruturas v e m apresentem resultados

511

idnticos, fato que foi confirmado com os resultados obtidos neste trabalho, devido a

512

expresso matemtica de parentesco. Comportamento de oscilao dos componentes

513

entre as estruturas v e m foi verificado no conjunto de dados reais, onde a frequncia

514

allica foi diferente de meio, que de fato esperado.

515

Nossos resultados corroboram com os obtidos por Meuwissen et al., (2011),

516

que no verificam diferenas significativas quando utilizaram essas duas estruturas de

517

parentesco, em um procedimento de simulao. Porm, esses mesmos autores

518

afirmam que optaram pela utilizao da matriz m, por essa matriz estabelecer maior

519

peso aos alelos de baixa frequncia, que so esperados como causais na expresso

520

de caracteres quantitativos. Essa afirmao, apesar de intuitiva no ponto de vista

521

gentico, h restries no ponto de vista matemtico. Conforme enfatizado por

522

Endelman (2011), na formulao da construo da matriz m e p, em situaes com

523

alelos de baixa frequncia, essas matrizes tendem a possuir elementos tendendo ao

524

infinito. Essa afirmativa foi confirmada em nosso trabalho, com a utilizao de

525

marcadores com frequncia allica inferior a 0.05, onde foi observado elementos da

526

matriz de parentesco tendendo ao infinito. Nossa estratgia para eliminar essa

527

restrio, conforme enfatizado anteriormente, foi promover anlise apenas com locos

528

com frequncia allica superior a 0.05 e inferior a 0.95. Esses resultados sugerem

529

que, caso ocorra problemas estruturais na construo das matrizes v ou m, como

530

presena de autovalores negativos ou valores tendendo ao infinito, a outra pode servir

531

como opo e vice-versa, dado que, conforme comprovado neste trabalho, no h

532

diferena to expressiva na explorao de informaes genticas entre as matrizes,

533

tanto no caso com a utilizao dos dados de simulao quanto com dados reais.

534

Powell et al. (2010) comentou que a matriz p, proposta em seu trabalho, estima

535

de forma no viesada a varincia gentica total, pois, na construo dessa matriz,

536

realizado um ajuste que elimina a restrio da utilizao de uma amostra de tamanho

537

finito, fato que no executado na matriz v e m. Nossos resultados confirmam essa

538

afirmativa, dado que a g2 foi estimada de forma no viesada, conforme observado

539

nos resultados da simulao com o modelo GBLUP-EP. Porm, observamos que em

540

termos de decomposio da varincia gentica total, h intenso vis nas estimativas

541

dos componentes de varincia gentica aditiva. Esse componente o mais importante

542

em inferncias durante a escolha de parentais, quando o objetivo a elaborao de

543

populaes em programas de melhoramento.

544

reparametrizao da diagonal da matriz, durante o ajuste do vis inerente ao uso de

545

nmero finito de locos amostrados.

Essa inflao realizada devido a

546
547

Decomposio espectral

548

Durante o processo de anlise todos os modelos convergiram perfeitamente.

549

Porm, na anlise com dados reais, a matriz A com a estrutura v e a matriz D com a

550

estrutura p apresentaram problemas estruturais, com autovalores negativos. O

551

problema foi resolvido com o procedimento de decomposio espectral, descrito

552

anteriormente, o que evitou as restries de convergncia que so frequentemente

553

reportados em trabalhos envolvendo efeitos epistticos com o uso do modelo GBLUP.

554

Por exemplo, Nishio & Satoh (2014) reporta que os componentes de varincia

555

durante o processo iterativo fugiram do espao paramtrico, com o modelo

556

considerando efeitos de epistasia. Com o procedimento de decomposio espectral

557

descrito nesse trabalho, possvel eliminar esse problema. Porm, recomendamos

558

sempre a verificao da quantidade de informao perdida com esse procedimento.

559

Nesse trabalho no houve perda de informao significativa, j que tanto a matriz m

560

quanto a v apresentaram resultados praticamente idnticos na estimao dos efeitos

561

aditivos, aps o procedimento de decomposio espectral da matriz v de parentesco

562

aditivo (A) (dados reais) fato esperado em ausncia de problema estrutural na

563

matriz, com pequena oscilao de u , porque a frequncia allica foi diferente de

564

meio, evidenciando, dessa forma, que no houve prejuzo analtico com esse

565

procedimento.

566
567

Decomposio de componentes de varincia

568

Uma propriedade desejvel durante a modelagem a obteno de modelos

569

que promovam a decomposio de componentes de varincia e efeitos de maneira

570

ortogonal, ou seja, no caso de modelos genticos, que no exista confundimento entre

571

os valores dos componentes obtidos pela decomposio da varincia gentica total ou

572

do valor gentico total. Existem trs situaes em que esse fenmeno pode ocorrer: (i)

573

presena de desiquilbrio de ligao;

574

ortogonalidade; e (iii) presena de interao gentipos por ambientes (Gianola et al.,

575

2014; Zeng et al., 2005). No caso do modelo GBLUP essa restrio seria a falta de

576

ortogonalidade relacionada matriz de desvios W, utilizada para construo das

577

matrizes de parentesco. Um problema ainda mais grave encontrado na construo

578

da matriz de parentesco episttica, sugerida primeiramente por Henderson (1985) e

579

proposta recentemente por Su et al. (2012) no GBLUP. Essa matriz inconsistente

580

com a mtrica proposta por Cockerham (1954), apesar de afirmado por Henderson

581

(1985). Na primeira proposta de Henderson (1985) sugerido apenas o produto direto

582

das matrizes, por exemplo, a matriz AA construda pelo produto direto A#A em vez

583

de ser realizado o produto de Kronecker parcial (), ou seja, com a elaborao de

584

todas as combinaes duas-a-duas entre os ndices sem recprocos, para assim

585

construir a matriz de desvios episttica do tipo aa ortogonal (Kao & Zeng 2002; Zeng

586

et al., 2005). Uma forte restrio desse procedimento o alto recurso computacional

587

para a obteno dessas matrizes em condio de hiperparametrizao. Pesquisas

588

procurando maximizar a obteno de matrizes de desvios de maneira mais prxima

589

possvel da ortogonalidade, com menor demanda de recurso computacional so

590

necessrias. Uma possibilidade seria a amostragem de forma sistemtica de um

591

nmero restrito de locos ao longo dos cromossomos e a construo de uma matriz

592

ortogonal com um nmero reduzido de marcas, com a amostragem buscando uma boa

593

cobertura ao longo de todos os cromossomos. Modelos que promovam a seleo de

(ii) emprego de matrizes de incidncia sem

594

variveis epistticas relevantes tambm pode ser uma alternativa para lidar com esse

595

problema de p>>n. Pesquisas buscando essas estratgias mencionadas esto sendo

596

desenvolvidas nesse momento.

597

Falta de ortogonalidade durante as construes das matrizes de parentesco

598

so evidenciadas de forma clara nos resultados da simulao, onde ocorre um forte

599

confundimento de u no componente u no modelo GBLUP-AD. Esse fenmeno

600

evidenciado quando empregado o modelo GBLUP-EP, em que com a introduo da

601

u2 ocorre uma reduo em magnitude da u2 , que antes estava confundida com a

602

u2 no modelo reduzido. Esse fato ilustra a restrio da construo da matriz de

603

parentesco episttico obtida por produto direto entre matrizes de parentesco A ou D.

604

Problema de falta de ortogonalidade na decomposio de componentes de varincia

605

tambm foi reportado por Su et al. (2012) com o emprego do modelo GBLUP-EP.

606
607

Anlise da populao de Eucalyptus spp.

608

Neste trabalho foi pela primeira vez empregado o modelo GBLUP-EP no

609

estudo de componentes aditivos e no-aditivos na espcie de Eucalyptus spp.

610

Adicionalmente, foi avaliado a eficincia de trs matrizes de parentesco que

611

representam bem as construes que aparecem frequentemente na literatura

612

cientifica. Os resultados evidenciaram um predomnio de efeitos aditivos em relao

613

aos efeitos de dominncia, utilizando todas as matrizes de parentesco, com a razo

614

entre e u de 0.3949 (v), 0.5593 (m) e 0.3309 (p), e tambm foi observado baixa

615

contribuio dos efeitos de epistasia, conforme evidenciado pelos componentes de

616

varincia de pequena magnitude. Esses resultados confirmam os obtidos por Silva et

617

al. (2004), que apesar de ter utilizado o modelo BLUP com informao de pedigree,

618

tambm observou predomnio de efeitos aditivos em relao aos demais efeitos.

619

A primeira proposta de utilizao do modelo GBLUP-EP em espcies perenes

620

foi realizada por Muoz et al., (2014). Esse trabalho comparou a capacidade do

621

modelo GBLUP-EP em decompor componentes de varincia de maneira ortogonal e

622

predizer valores genticos totais com o modelo BLUP tradicional com informao

623

recuperada de matrizes construdas por pedigree. A espcie modelo utilizada nesse

624

trabalho foi Pinus taeda. Apesar de inovador, esse trabalho apresentou limitaes de

625

modelagem, tendo como base os resultados obtidos no nosso trabalho e alguns

626

aspectos tericos j enfatizados na literatura (Da, et al. 2014; Kao & Zeng, 2002;

627

Vitezica et al., 2013; Zeng et al., 2005). Por exemplo, houve a utilizao de duas

628

formulaes diferentes para construo da matriz A e D. Especificamente da matriz A,

629

utilizaram a estrutura de parentesco p, que foi mostrado nesse trabalho ser a menos

630

eficiente em termos de acurcia de predio, e na estimao da matriz D utilizaram

631

uma mtrica completamente diferente, que se trata da utilizada por Su et al. (2012),

632

que corresponde exatamente a formulao da mtrica F infinito proposta por Hayman

633

& Mather (1955), que conforme enfatizado por Kao & Zeng (2002) e Zeng et al., (2005)

634

apresenta serias retries em termos de decomposio ortogonal de componentes de

635

varincia. Esse fato facilmente comprovado ao observar os resultados obtidos por

636

Muoz et al., (2014), em que ocorre uma oscilao na magnitude dos componentes de

637

varincia, medida que era adicionado outros componentes do modelo reduzido ao

638

completo. Esses autores justificam que a falta de ortogonalidade poderia ser explicada

639

pela distribuio das frequncias allicas. De fato, essa afirmativa verdadeira, j que

640

foi utilizado na formulao da matriz D uma mtrica que no considera a frequncia

641

allica populacional, conforme a mtrica de Cockerham (1954) pressupe,

642

considerando apenas a presena ou ausncia de locos heterozigticos. Esse efeito

643

prejudicial na ortogonalidade fica ainda mais agravante, dado a imperfeio do uso do

644

produto direto das matrizes para construo das matrizes de parentesco, conforme j

645

enfatizado na subseo anterior.

646
647

Kernel methods na estimao de efeitos genticos.

648

Alm da utilizao do modelo GBLUP-EP na estimao de efeitos aditivos e

649

no-aditivos, comum observar na literatura o emprego de Kernel methods na

650

tentativa de capturar sinais genticos de populaes de plantas e animais. A essncia

651

desses mtodos o tratamento de modelos de forma linear nos parmetros e de

652

forma no linear nas covariveis, com a diferenciao entre os mtodos na opo de

653

kernels e procedimento de regularizao (Morota & Gianola, 2014). Por exemplo,

654

empregado frequentemente kernels baseados em distncia euclidiana, funo de

655

covarincia de Matrn e regularizadores L1 norm e L2 norm. O principal fator que

656

incentivou a proposta desses modelos foi a baixa capacidade de modelos bayesianos

657

e mistos em capturar efeitos no aditivos, considerando apenas modelos reduzidos

658

com efeitos aditivos. Entretanto, aps a primeira proposta de Gianola et al., (2006), a

659

respeito desses mtodos semi-paramtricos, foi observado que h pouca diferena em

660

termos de capacidade de predio em relao mtodos bayesianos e paramtricos

661

j consolidados no meio cientifico, com uma pequena vantagem de kernel methods em

662

procedimentos de predio (Gianola et al., 2014; Heslot et al., 2012; Morota, et al.,

663

2014; Ober et al., 2011).

664

Por outro lado, na maioria dos trabalhos empregando esses mtodos no so

665

adicionados efeitos no-aditivos no modelo GBLUP para uma comparao direta com

666

mtodos semi-paramtricos, se existe, como o caso do trabalho de Ober et al., (2011),

667

no h detalhamento da elaborao das matrizes de parentesco, que conforme

668

mostramos no trabalho, tem uma influncia direta na acurcia de predio e no

669

desempenho da decomposio dos componentes de varincia. Conforme pode ser

670

observado nos resultados apresentados, ocorre grande impacto no aumento d

671

acurcia de predio com a incluso de efeitos no-aditivos, principalmente o efeito de

672

dominncia. Por exemplo, ao adicionar o efeito de dominncia ao modelo puramente

673

aditivo na configurao v, houve um incremento na herdabilidade no sentido amplo de

674

0,26 para 0,35. Outra desvantagem desses mtodos que no so convenientes

675

quando o objetivo inferncia, apesar de apresentarem seu espao quando o principal

676

interesse a predio (Gianola et al., 2014). Novos estudos comparando Kernel

677

methods com o modelo GBLUP considerando efeitos no-aditivos so necessrios.

678
679

CONCLUSO

680
681

Ambas as estruturas v e m apresentam comportamento semelhante mesmo

682

em condio de frequncia allica diferente 0.5. A matriz p apresenta maior eficincia

683

na estimao de componentes de varincia no-aditivos e de varincia gentica total,

684

e deve ser opo quando o objetivo inferncia sobre presena de efeitos no-

685

aditivos.

686

empregadas no modelo GBLUP. A decomposio espectral uma alternativa em

687

situaes de problemas de convergncia. H um predomnio de efeitos aditivos em

688

relao aos no-aditivos no controle gentico do carter CAP de Eucalyptus spp.

689

Novos modelos que contemplem da melhor maneira possvel a decomposio

690

ortogonal dos componentes de varincia so necessrios.

As matrizes v e m oferecem maior capacidade de predio quando

691
692

REFERNCIAS BIBLIOGRFICAS

693
694
695
696
697
698

Albrecht, T., Auinger, H.-J., Wimmer, V., Ogutu, J. O., Knaak, C., Ouzunova, M.,
Schn, C.-C. (2014). Genome-based prediction of maize hybrid performance
across genetic groups, testers, locations, and years. TAG. Theoretical and Applied
Genetics. Theoretische Und Angewandte Genetik. doi:10.1007/s00122-014-2305z

699
700

Bernardo, R. (2010). Breeding for quantitative traits in plants (2nd ed., p. 390).
Woodbury: Stemma Press.

701
702

Brim, C. A., Cockerham, C. C., Carolina, N., Exp, A., & The, S. (1961). Inheritance of
Quantitative Characters in Soybeans.

703
704

Carlborg, O., & Haley, C. S. (2004). Epistasis: too often neglected in complex trait
studies? Nature Reviews. Genetics, 5(8), 61825. doi:10.1038/nrg1407

705
706
707

Cockerham, C. C. (1954). An extension of the concept of partitioning hereditary


variance for analysis of covariances among relatives when epistasis is present.
Genetics, 39, 859882.

708
709
710
711

Cockerham, C. C., & Zeng, Z. B. (1996). Design III with marker loci. Genetics, 143(3),
143756. Retrieved from
http://www.pubmedcentral.nih.gov/articlerender.fcgi?artid=1207411&tool=pmcentr
ez&rendertype=abstract

712
713
714
715

Costa E Silva, J., Borralho, N. M. G., & Potts, B. M. (2004). Additive and non-additive
genetic parameters from clonally replicated and seedling progenies of Eucalyptus
globulus. TAG. Theoretical and Applied Genetics. Theoretische Und Angewandte
Genetik, 108(6), 11139. doi:10.1007/s00122-003-1524-5

716
717
718

Da, Y. ., Wang, C. ., Wang, S. ., & Hu, G. . (2014). Mixed model methods for genomic
prediction and variance components estimation of additive and dominance effects
using SNP markers. Plos One, 110.

719
720
721
722

Davies, G., Tenesa, a, Payton, a, Yang, J., Harris, S. E., Liewald, D., Deary, I. J.
(2011). Genome-wide association studies establish that human intelligence is
highly heritable and polygenic. Molecular Psychiatry, 16(10), 9961005.
doi:10.1038/mp.2011.85

723
724
725

De Los Campos, G., Hickey, J. M., Pong-Wong, R., Daetwyler, H. D., & Calus, M. P. L.
(2013). Whole-genome regression and prediction methods applied to plant and
animal breeding. Genetics, 193(2), 32745. doi:10.1534/genetics.112.143313

726
727

Dempster, A. P. (1977). Maximum likelihood from incomplete data via the EM


algorithm. Journal of the Royal Statistical Society, 39(1), 138.

728
729
730
731
732

Edae, E. a, Byrne, P. F., Haley, S. D., Lopes, M. S., & Reynolds, M. P. (2014).
Genome-wide association mapping of yield and yield components of spring wheat
under contrasting moisture regimes. TAG. Theoretical and Applied Genetics.
Theoretische Und Angewandte Genetik, 127, 791807. doi:10.1007/s00122-0132257-8

733
734
735
736

Elshire, R. J., Glaubitz, J. C., Sun, Q., Poland, J. a, Kawamoto, K., Buckler, E. S., &
Mitchell, S. E. (2011). A robust, simple genotyping-by-sequencing (GBS)
approach for high diversity species. PloS One, 6(5), e19379.
doi:10.1371/journal.pone.0019379

737
738

Endelman, J. B. (2011). Ridge regression and other kernels for genomic selection with
R package rrBLUP. Plant Genome, 4, 250255.

739
740
741

Endelman, J. B., & Jannink, J.-L. (2012). Shrinkage estimation of the realized
relationship matrix. G3 (Bethesda, Md.), 2(11), 140513.
doi:10.1534/g3.112.004259

742
743

FALCONER, D. S., & MACKAY, T. F. (1996). Introduction to quantitative genetics (4th


ed., p. 464). London: Longman group Ldt.

744
745

Fisher, R. A. (1918). The correlation between relatives on the supposition of Mendelian


inheritance. Transactions of the Royal Society of Edinburgh, 52, 399433.

746
747
748

Gianola, D. ., Morota, G. ., & Crossa, J. . (2014). Genome-enabled Prediction of


Complex Traits with Kernel Methods: What Have We Learned? In Proceedings,
10th World Congress of Genetics Applied to Livestock Production (p. 6).

749
750
751

Gianola, D., Fernando, R. L., & Stella, A. (2006). Genomic-assisted prediction of


genetic value with semiparametric procedures. Genetics, 173(3), 176176.
doi:10.1534/genetics.105.049510

752
753
754

Gianola, D., Weigel, K. a, Krmer, N., Stella, A., & Schn, C.-C. (2014). Enhancing
Genome-Enabled Prediction by Bagging Genomic BLUP. PloS One, 9(4), e91693.
doi:10.1371/journal.pone.0091693

755
756

Griffing, B. (1956). CONCEPT OF GENERAL AND SPECIFIC COMBINING ABILITY


IN RELATION TO DIALLEL CROSSING SYSTEMS, (2), 463493.

757
758

Hayman, B. I. ., & Mather, K. . (1955). The description of genetic interactions in


continuous variation. Biometrics, 11(1), 6982.

759

Henderson, C. R. (1984). Applications of Linear Models in Animal Breeding Models.

760
761

Henderson, C. R. (1985a). Best Linear Unbiased Prediction of Nonadditive Genetic


Merits in Noninbred Populations. Journal of Animal Science, 60(1), 111117.

762
763
764
765
766

Henderson, C. R. (1985b). MIVQUE and REML Estimation of Additive and Nonadditive


Genetic Variances C . R . Henderson The online version of this article , along with
updated information and services , is located on the World Wide Web at: M I V Q
U E A N D REML ESTIMATION OF A D D. Journal of Animal Science, 61(1), 113
121.

767
768

Heslot, N., & Mark, J. J. (2014). Perspectives for genomic selection applications and
research in plants, 130. doi:10.2135/cropsci2014.03.0249

769
770
771

Heslot, N., Yang, H.-P., Sorrells, M. E., & Jannink, J.-L. (2012). Genomic Selection in
Plant Breeding: A Comparison of Models. Crop Science, 52(1), 146.
doi:10.2135/cropsci2011.06.0297

772
773

Joehanes, R., & Nelson, J. C. (2008). QGene 4.0, an extensible java QTL-analysis
platform. Genetics and Population Analysis, (1), 12.

774
775
776
777

Kao, C.-H., & Zeng, Z.-B. (2002). Modeling epistasis of quantitative trait loci using
Cockerhams model. Genetics, 160(3), 124361. Retrieved from
http://www.pubmedcentral.nih.gov/articlerender.fcgi?artid=1462022&tool=pmcentr
ez&rendertype=abstract

778
779
780
781

Lee, J. A. ., Cockerham, C. C. ., & Smith, F. H. . (1968). The inheritance of gossypol


level in gossypim I. additive, dominance, epistatic, and maternal effects
associated with seed gossypol in two varieties of gossypium Hirsutum L. Genetics,
59(1), 285298.

782
783
784
785

Massman, J. M., Jung, H.-J. G., & Bernardo, R. (2013). Genomewide Selection versus
Marker-assisted Recurrent Selection to Improve Grain Yield and Stover-quality
Traits for Cellulosic Ethanol in Maize. Crop Science, 53(1), 58.
doi:10.2135/cropsci2012.02.0112

786
787
788
789

Meuwissen, T. H. E., Luan, T., & Woolliams, J. A. (2011). The unified approach to the
use of genomic and pedigree information in genomic evaluations revisited. Journal
of Animal Breeding and Genetics, 128(6), 429439. doi:10.1111/j.14390388.2011.00966.x

790
791
792
793

Morota, G., Boddhireddy, P., Vukasinovic, N., Gianola, D., & Denise, S. (2014). Kernelbased variance component estimation and whole-genome prediction of precorrected phenotypes and progeny tests for dairy cow health traits. Frontiers in
Genetics, 5(March), 56. doi:10.3389/fgene.2014.00056

794
795
796

Morota, G., & Gianola, D. (2014). Kernel-based whole-genome prediction of complex


traits: a review Kernel-based whole-genome prediction of complex traits: a
review. doi:10.3389/fgene.2014.00363

797
798
799

Muoz, P. ., Resende Jr., M. F. R. ., Gezan, S. A. ., Resende, M. D. V. ., de los


Campos, G. ., Kirst, M. ., Peter, G. F. . (2014). Unraveling additive from nonadditive effects using genomic relationship matrices. Genetics.

800
801
802

Nishio, M., & Satoh, M. (2014). Including dominance effects in the genomic BLUP
method for genomic evaluation. PloS One, 9(1), e85792.
doi:10.1371/journal.pone.0085792

803
804
805

Ober, U., Erbe, M., Long, N., Porcu, E., Schlather, M., & Simianer, H. (2011a).
Predicting Genetic Values: A Kernel-Based Best Linear, 188(July), 695708.
doi:10.1534/genetics.111.128694

806
807
808

Ober, U., Erbe, M., Long, N., Porcu, E., Schlather, M., & Simianer, H. (2011b).
Predicting genetic values: a kernel-based best linear unbiased prediction with
genomic data. Genetics, 188(3), 695708. doi:10.1534/genetics.111.128694

809
810
811

Phillips, P. C. (2008). Epistasis--the essential role of gene interactions in the structure


and evolution of genetic systems. Nature Reviews. Genetics, 9(11), 85567.
doi:10.1038/nrg2452

812
813
814

Piepho, H. P., Mhring, J., Melchinger, A. E., & Bchse, A. (2008). BLUP for
phenotypic selection in plant breeding and variety testing. Euphytica, 161(1-2),
209228. doi:10.1007/s10681-007-9449-8

815
816

Powell, J. E. (2010). Reconciling the analysis of IBD and IBS in complex trait studies
(Supplementary information S2). Nature Reviews. Genetics, 11(1), 12.

817
818
819

Powell, J. E., Visscher, P. M., & Goddard, M. E. (2010). Reconciling the analysis of IBD
and IBS in complex trait studies. Nature Reviews. Genetics, 11(1), 800805.
doi:10.1038/nrg2865

820
821
822
823

Smith, A. B., Cullis, B. R., & Thompson, R. (2005). The analysis of crop cultivar
breeding and evaluation trials: an overview of current mixed model approaches.
The Journal of Agricultural Science, 143(06), 449462.
doi:10.1017/S0021859605005587

824
825

Stuber, C. W. ., & Moll, R. H. . (1971). Epistasis in maize (Zea Mays L.). II: Comparison
of selected with unselected populations. Genetics, 67(1), 137149.

826
827
828
829

Su, G., Christensen, O. F., Ostersen, T., Henryon, M., & Lund, M. S. (2012). Estimating
additive and non-additive genetic variances and predicting genetic merits using
genome-wide dense single nucleotide polymorphism markers. PloS One, 7(9),
e45293. doi:10.1371/journal.pone.0045293

830
831
832

Team, R. core. (n.d.). R: A language and environment for statistical computing. Vienna,
Austria: R Foundation for Statistical Computing. Retrieved from URL http://www.Rproject.org/. 2014.

833
834
835
836

Technow, F., Schrag, T. a, Schipprack, W., Bauer, E., Simianer, H., & Melchinger, A.
E. (2014). Genome Properties and Prospects of Genomic Prediction of Hybrid
Performance in a Breeding Program of Maize. Genetics, 197(August), 13431355.
doi:10.1534/genetics.114.165860

837
838

VanRaden, P. M. (2008). Efficient methods to compute genomic predictions. Journal of


Dairy Science, 91(11), 441423. doi:10.3168/jds.2007-0980

839
840
841

Vitezica, Z. G., Varona, L., & Legarra, A. (2013a). On the additive and dominant
variance and covariance of individuals within the genomic selection scope.
Genetics, 195(4), 122330. doi:10.1534/genetics.113.155176

842
843
844

Vitezica, Z. G., Varona, L., & Legarra, A. (2013b). On the additive and dominant
variance and covariance of individuals within the genomic selection scope.
Genetics, 195(4), 122330. doi:10.1534/genetics.113.155176

845
846
847
848

Yang, J., Benyamin, B., McEvoy, B. P., Gordon, S., Henders, A. K., Nyholt, D. R.,
Visscher, P. M. (2010). Common SNPs explain a large proportion of the heritability
for human height (Supplementary Information). Nature Genetics, 42(7), 5659.
doi:10.1038/ng.608

849
850
851

Zeng, Z.-B., Wang, T., & Zou, W. (2005a). Modeling quantitative trait Loci and
interpretation of models. Genetics, 169(3), 171125.
doi:10.1534/genetics.104.035857

852
853
854

Zeng, Z.-B., Wang, T., & Zou, W. (2005b). Modeling quantitative trait Loci and
interpretation of models. Genetics, 169(3), 171125.
doi:10.1534/genetics.104.035857

855
856
857
858
859
860

Você também pode gostar