Associação genômica entre marcadores SNPs e conteúdo de óleo, proteína e peso de grãos em soja
Doutorado em Biotecnologia Aplicada à Agricultura
Autor: Damião do Nascimento
Orientador: Ivan Schuster
Defendido em: 09/12/2016
Este trabalho teve como objetivo avaliar a utilização do método de análise sequencial de modelos lineares mistos (MLM) e regressão linear múltipla (RLM) para identificar haplótipos de marcadores SNPs associados à QTLs associados às variações no peso de grãos e nos conteúdos de proteína e de óleo nos grãos de soja. Foram utilizadas 168 cultivares de soja, avaliadas em cinco ambientes, e genotipadas com um painel de 6 mil marcadores SNP. Para a análise de associação genômica entre genótipo e fenótipo, marcadores significativos a 1% de probabilidade na análise de MLM foram utilizados para a análise de RLM com método stepwise de seleção do modelo. Haplótipos de marcadores obtidos por MLM, RLM e pela associação dos dois métodos foram comparados pela observação das médias fenotípicas de cada haplótipo. Com a análise exclusivamente por MLM, foram identificados QTLs para o conteúdo de proteína em dois dos três locais considerados, e para o conteúdo de óleo, em quatro dos cinco locais, e nenhum QTL para o peso de grãos. Na análise sequencial de MLM e RLM, foram identificados QTLs para as três características em todos os ambientes. Utilizando haplótipos constituídos pelos marcadores identificados sequencialmente pelos dois métodos de análise, foi possível discriminar melhor as médias dos fenótipos do que utilizando apenas os marcadores identificados por cada método individualmente. Foram identificados sete QTLs para conteúdo de proteína, 15 QTLs para conteúdo de óleo e seis QTLs para o peso de grãos. A utilização sequencial de MLM e RLM pode ser uma estratégia para aumentar a eficiência na detecção de QTLs nos estudos de associação genômica ampla.
Polimorfos; Manhatan plot; Mapeamento por Associação; Glycine max; NIR.
This work aimed to evaluate the use of sequential analysis of mixed linear models (MLM) and multiple linear regressions (MLR) to identify haplotypes of marker SNPs associated with QTLs controlling variation in grain weight and protein and oil content in soybean grains. A total of 168 soybean cultivars were evaluated in five environments and genotyped with a panel of 6,000 SNP markers. To analyze genomic association between genotype and phenotype, markers at 1% significance probability in the MLM analysis were used for the MLR analysis with stepwise method for model selection. Haplotypes of markers obtained by MLM, MLR and by the association of the two methods were compared by observing the phenotypic means of each haplotype. When analyzed exclusively by MLM, QTLs for protein content were identified in two of the three sites considered, for oil content in four of the five sites, and no QTL was identified for grain weight. In the sequential analysis of MLM and MLR, QTLs were identified for the three characteristics in all environments. Using haplotypes for the markers identified sequentially by the two methods of analysis, it was possible to discriminate better the means of the phenotypes than using only the markers identified by each method individually. Seven QTLs for protein content, 15 QTLs for oil content and six QTLs for grain weight were identified. The sequential use of MLM and MLR may be a strategy to increase the efficiency in the detection of QTLs in studies of genomewide association.
Polymorphs; Manhatan plot; Mapping by Association; Glycine max; NIR