CRISTIANE RACHEL DE PAIVA FELIPE MÉTODOS DE PREDIÇÃO E ESTIMAÇÃO DE VALOR GENOTÍPICO E ESTRATIFICAÇÃO AMBIENTAL PARA AVALIAÇÃO E RECOMENDAÇÃO DE CULTIVARES Tese apresentada ao Programa de PósGraduação em Agronomia, da Universidade Federal de Goiás, como requisito parcial à obtenção do título de Doutor em Agronomia, área de concentração: Produção Vegetal. Orientador: Prof. Dr. João Batista Duarte Goiânia, GO – Brasil 2008 2 Dados Internacionais de Catalogação-na-Publicação (CIP) (GPT/BC/UFG) Felipe, Cristiane Rachel de Paiva. Métodos de predição e estimação de valor genotípico e estratificação ambiental para avaliação e recomendação de cultivares [manuscrito] / Cristiane Rachel de Paiva Felipe. – 2008. 113 f.: il., figs, tabs. Orientador: Prof. Dr. João Batista Duarte. Tese (Doutorado) – Universidade Federal de Goiás, Escola de Agronomia e Engenharia de Alimentos, 2008. Bibliografia. Inclui lista de tabelas e de figuras. 1. Milho – Melhoramento genético 2. Método (AMMI) 3. Shrinkage I. Duarte, João Batista. II. Universidade Federal de Goiás, Escola de Agronomia e Engenharia de Alimentos. III. Título. CDU: 633.15 Permitida a reprodução total ou parcial desse documento, desde que citada a fonte – A autora F315m 3 Ofereço este trabalho a todos aqueles que ousaram trilhar novos caminhos e que nessa jornada conseguiram enxergar além do óbvio! Ademais “bom mesmo é ir à luta com determinação, abraçar a vida e viver com paixão, perder com classe e viver com ousadia. Pois o triunfo pertence a quem se atreve, e a vida é muito bela para ser insignificante.” (Charles Chaplin) Ao meu filho Nícolas, companheiro fiel desde a época do mestrado. Por todos os minutos roubados de ti, por todas as alegrias a mim proporcionadas e pelo meu maior aprendizado. A você, amor da minha vida, eu Dedico. “Todos os modelos são errados, mas alguns são úteis.” (George E. P. Box) 4 09 AGRADECIMENTOS Ao Estado de Goiás, em nome da Agência Goiana de Desenvolvimento Rural e Fundiário – AgenciaRural, pela oportunidade desta qualificação. À Escola de Agronomia e Engenharia de Alimentos da Universidade Federal de Goiás, em especial aos professores e funcionários da pós-graduação em Agronomia. À Luciene Fróes Camarano de Oliveira, idealizadora do projeto de avaliação de variedades de milho, pela cessão dos dados dos experimentais e pela amizade durante tantos anos de trabalho em equipe e convivência. Ao João Dias Lino, pelo comprometimento e esmero na instalação e condução dos experimentos do Programa Milho da AgenciaRural, e a todas as pessoas que colaboraram direta ou indiretamente para a realização deste estudo. Ao meu orientador e professor Dr. João Batista Duarte, pelo valioso convívio, confiança, amizade e por manter a filosofia do conhecimento científico sempre presente em seus ensinamentos. Ao professor Dr. José Carlos Seraphin, pela amizade e valioso suporte à minha formação. Ao professor Dr. Marcos Deon Vilela de Resende, pela inspiração e pelas valiosas contribuições. Ao Dr. Álvaro Eleutério da Silva, pela oportunidade de crescimento em pesquisa agropecuária. Aos meus pais Orestes e Terezinha, por terem investido em minha educação e pelo apoio, confiança e amor a mim conferidos. Ao meu irmão Júnior, pelos momentos de convivência com o Nícolas. Ao meu esposo José Paulo, por seu estímulo, colaboração, paciência e compreensão incondicional. Ao Nícolas, meu filho querido, por iluminar minha caminhada, por todo amparo afetivo e por ser maravilhosamente bom na sua tarefa de me ensinar a ser mãe. A Deus, pela iluminação, oportunidade e proteção, sempre. 5 SUMÁRIO RESUMO GERAL......................................................................................................... GENERAL ABSTRACT............................................................................................... 1 2 2.1 2.2 2.3 INTRODUÇÃO GERAL.................................................................................. REVISÃO DE LITERATURA.......................................................................... IMPORTÂNCIA DO MILHO E ASPECTOS DO SEU MELHORAMENTO GENÉTICO.......................................................................................................... ESTIMAÇÃO E PREDIÇÃO DE VALORES GENÉTICOS............................. SIMULAÇÃO NO ESTUDO DE PROPRIEDADES DE ESTIMADORES E PREDITORES GENOTÍPICOS........................................................................... 7 9 11 15 15 17 21 23 23 26 29 29 30 30 33 33 36 38 39 40 51 53 53 54 54 57 57 59 61 62 63 72 74 2.4 INTERAÇÃO DE GENÓTIPOS COM AMBIENTES....................................... 2.4.1 Conceitos básicos................................................................................................ 2.4.2 Estratificação ambiental para avaliação e recomendação de cultivares....... 3 COMPARAÇÃO DE MÉTODOS DE ESTIMAÇÃO E PREDIÇÃO DE MÉDIAS GENOTÍPICAS EM ENSAIOS VARIETAIS DE MILHO ......... RESUMO......................................................................................................................... ABSTRACT…………............……………..................................................................... 3.1 INTRODUÇÃO.................................................................................................... 3.2 MATERIAL E MÉTODOS.................................................................................. 3.2.1 Caracterização dos ensaios................................................................................ 3.2.2 Estimação e predição das médias genotípicas.................................................. 3.2.3 Implementação computacional.......................................................................... 3.2.4 Comparação dos diferentes estimadores e preditores..................................... 3.3 RESULTADOS E DISCUSSÃO......................................................................... 3.4 CONCLUSÕES.................................................................................................... 4 PROPRIEDADES DE ESTIMADORES E PREDITORES DE VALORES GENOTÍPICOS EM ENSAIOS VARIETAIS DELINEADOS EM LÁTICE............................................................................................................... RESUMO......................................................................................................................... ABSTRACT………............………………..................................................................... 4.1 INTRODUÇÃO.................................................................................................... 4.2 MATERIAL E MÉTODOS.................................................................................. 4.2.1 Caracterização dos ensaios simulados.............................................................. 4.2.2 Estimação e predição de médias genotípicas.................................................... 4.2.3 Implementação computacional.......................................................................... 4.2.4 Comparação dos diferentes estimadores e preditores..................................... 4.3 RESULTADOS E DISCUSSÃO......................................................................... 4.4 CONCLUSÕES.................................................................................................... APÊNDICES................................................................................................................... 6 5 ESTRATIFICAÇÃO AMBIENTAL PARA AVALIAÇÃO E RECOMENDAÇÃO DE VARIEDADES DE MILHO NO ESTADO DE 83 GOIÁS................................................................................................................. RESUMO......................................................................................................................... 83 ABSTRACT……............…………………..................................................................... 84 5.1 INTRODUÇÃO................................................................................................... 84 5.2 MATERIAL E MÉTODOS................................................................................. 86 5.2.1 Caracterização dos experimentos..................................................................... 86 5.2.2 Análises estatísticas para obtenção das médias genotípicas........................... 88 5.2.3 Análise da interação GxE e estratificação ambiental...................................... 90 5.3 RESULTADOS E DISCUSSÃO......................................................................... 92 5.4 CONCLUSÕES.................................................................................................... 102 6 7 CONCLUSÕES GERAIS.................................................................................. REFERÊNCIAS................................................................................................. 103 105 RESUMO GERAL FELIPE, C. R. de P. Métodos de predição e estimação de valor genotípico e estratificação ambiental para avaliação e recomendação de cultivares. 2008. 113 f. Thesis (Ph.D. in Agronomy: Plant Production)-Escola de Agronomia e Engenharia de Alimentos, Universidade Federal de Goiás, Goiânia, 2008.1 O presente trabalho teve como objetivo avaliar diferentes abordagens estatísticas em relação à seleção e ordenação de genótipos, no contexto de ensaios varietais de milho. Para isso, utilizaram-se dados reais de ensaios delineados em látice, conduzidos no Estado de Goiás, nas safras 2002/2003, 2003/2004, 2004/2005 e 2005/2006, bem como dados de experimentos simulados, nos quais se buscaram cobrir situações similares a essa realidade. O estudo propôs-se, ainda, a quantificar os efeitos da interação de genótipos com ambientes (GxE), a partir dos ensaios reais, visando-se à estratificação ambiental para a cultura do milho no Estado, com ênfase na avaliação e recomendação de cultivares. A partir desses objetivos, o trabalho apresenta-se estruturado na forma de três artigos científicos. No primeiro deles (Capítulo 3), avaliaram-se os efeitos das abordagens de 1 Orientador: Prof. Dr. João Batista Duarte. EA-UFG. 7 modelo fixo (FF), modelo misto com efeito aleatório de blocos (AF), modelo misto com efeito aleatório de tratamentos (FA), modelo aleatório (AA) e do estimador de James-Stein (JS), na seleção e ordenação de genótipos testados na rede dos ensaios de variedades de milho, coordenada pela Agência Goiana de Desenvolvimento Rural e Fundiário (AgenciaRural – Goiás). Os experimentos, em número de 47, foram instalados em látice, com três repetições, tendo sido conduzidos durante os quatro anos agrícolas citados. No segundo artigo (Capítulo 4), as mesmas abordagens foram avaliadas em termos de acurácia, desvio preditivo médio e precisão de suas estimativas/predições, considerando-se os experimentos simulados, também em látice. Foram considerados 48 casos, correspondentes às combinações de diferentes tamanhos experimentais (15, 54, 105 e 450 tratamentos), coeficientes de determinação genotípica – h2' (6%, 15%, 25%, 48%, 63% e 82%) e duas distribuições de probabilidade para a geração dos efeitos genotípicos (normal e uniforme). Foram gerados 1.000 ensaios para cada caso, totalizando 48.000 experimentos. O terceiro e último artigo (Capítulo 5) refere-se ao estudo da interação GxE, com ênfase na referida estratificação ambiental, para o qual se adotou a abordagem de genótipos vencedores, associada à análise AMMI (modelo de efeitos principais aditivos e interação multiplicativa). Entre os resultados e conclusões obtidos, destacam-se: i) a adoção de abordagens estatísticas que promovem shrinkage das médias genotípicas resultam na seleção de menor número de genótipos, especialmente quando à média das cultivares testemunhas (referência para a seleção genotípica), que é superior à média experimental, reduzindo o número de genótipos pouco produtivos nos ciclos seguintes do programa de seleção; ii) o uso de modelos com efeitos fixos de tratamentos leva a um maior percentual de seleção de genótipos, sobretudo nos experimentos cuja média das testemunhas supera a média experimental; iii) entre as abordagens estatísticas shrinkage avaliadas, o modelo AA deve ser preferido para a seleção de genótipos, em razão de sua melhor capacidade de predição dos efeitos genotípicos paramétricos (maior acurácia e menor desvio preditivo médio), independentemente de esses efeitos terem distribuição normal ou uniforme; iv) contrariamente, o modelo FF demonstra o pior desempenho relativo, excetuando-se as situações em que a variabilidade entre os tratamentos genéticos é elevada (h2’→1,0); v) sob baixos valores de h2’ (6%), o modelo FA apresenta eficiência similar ao modelo AA; vi) dois estratos ambientais estabelecidos mostraram-se consistentes, ao longo dos anos, mesmo alterando-se os genótipos testados de uma safra agrícola para a outra: Ipameri, Inhumas e Senador Canêdo, (estável em quatro anos), e Porangatu e Orizona (estável em três anos); vii) com os agrupamentos obtidos é possível reduzir, pelo menos 16%, o número de locais de teste atualmente utilizados e, ou, efetuar a substituição de locais redundantes por outros pontos de teste que melhor representem a região alvo da recomendação, de modo a aumentar a eficiência da avaliação da interação GxE, no âmbito do programa de melhoramento; viii) a variedade ALBandeirante apresenta alto potencial produtivo e grande adaptabilidade às condições de cultivo do milho no Estado de Goiás. Palavras-chave: modelo misto, modelo aleatório, James-Stein, shinkage, acurácia seletiva, AMMI, zoneamento ecológico. 8 GENERAL ABSTRACT FELIPE, C. R. de P. Breeding value prediction and estimation methods and environmental stratification for cultivar evaluation and recommendation. 2008. 113 f. Thesis (Doctorate in Agronomy: Crop Production)-Escola de Agronomia e Engenharia de Alimentos, Universidade Federal de Goiás, Goiânia, 2008.2 This research had the objective of evaluating the effects of different statistical approaches for the selection and ranking of genotypes, in the context of maize varieties trials. For that, data from real trials designed in lattice were used, in the Goiás State, Brazil, in the growing seasons of 2002/2003, 2003/2004, 2004/2005 and 2005/2006, as well as data from simulated experiments, aiming to cover situations related to that reality. The study also intended to quantify the effects of the genotype by environment interactions (GxE) from the real trials, aiming for the environmental stratification for the maize cultivation in the State, pointing out the cultivar evaluation and recommendation. Considering those objectives, the study is divided in three scientific articles. In the first one (Chapter 3), the effects of approaches of fixed model (FF), mixed model with random effect of blocks (AF), mixed model with random effect of treatments (FA), random model (AA), and James-Stein’s estimator (JS) were evaluated on the selection and ranking of genotypes tested on the maize varieties trials, coordinated by the Agência Goiana de Desenvolvimento Rural e Fundiário (AgenciaRural – Goiás). The experiments, in number of 47, were installed in lattice design, with three replications, during the four cited harvest years. In the second article (Chapter 4), the same approaches were evaluated, in terms of accuracy, mean predictive deviation and precision of their estimates/predictions, considering the simulated trials, also in lattice. Forty-eight cases were considered, corresponding to the combinations of different experimental sizes (15, 54, 105, and 450 treatments), genotypic determination coefficients – h2' (6%, 15%, 25%, 48%, 63% and 82%), and two probability distributions for the generation of genotypic effects (normal and uniform). One thousand trials were simulated for each case, reaching the total of 48,000 experiments. The third and last article (Chapter 5) refers to the study of the GxE interaction, emphasizing the already mentioned environmental stratification, where the winner genotypes approach in association with the AMMI analysis (additive main effects and multiplicative interaction model) was adopted. Among the results and conclusions achieved through this study, it is possible to point out: i) the adoption of statistical approaches with shrinkage effect on the genotypic means results in the selection of a lower number of genotypes, especially in those trials whose mean of the check cultivars (baseline to the genotypic selection) is higher than the experimental grand mean; this fact reduces the number of genotypes with low yield potential in the next cycles of the selection program; ii) the use of models with fixed effects of treatments leads to a higher percentage of selected genotypes, mainly in the experiments whose check varieties mean overcomes the experimental grand mean; iii) among the shrinkage statistic approaches evaluated, the AA model must be preferred for the selection of genotypes, due to its capacity for better predicting the parametric genotypic effects (higher accuracy and lower mean predictive deviation), no matter if these effects are normally or uniformly distributed; iv) on the other hand, the FF model shows the worst relative performance, except for the situations where the variability among the genetic treatments is high (h2’→1,0); v) considering low values for h2’ (6%), the FA model shows efficiency similar to the AA model; vi) two established 2 Adviser: Prof. Dr. João Batista Duarte. EA-UFG. 9 environmental strata showed to be consistent throughout the years, even when the tested genotypes were altered from one harvest season to the other: Ipameri, Inhumas and Senador Canêdo (stable to four years), and Porangatu and Orizona (stable along three years); vii) considering the obtained clustering, it is possible to reduce, at least 16%, the number of test locations currently used, and/or substitute the redundant locations by test places which better represent the recommended target region, aiming to increase the evaluation efficiency of the GxE interaction, in the scope of the genetic plant breeding program; viii) the ALBandeirante variety presents high yield potential and adaptability to the maize cultivation conditions in the Goiás State. Key words: mixed model, random model, James-Stein, shrinkage, selective accuracy, AMMI, ecological zoning. 10 1 INTRODUÇÃO GERAL No Brasil, é comum a utilização de variedades de polinização aberta de milho em pequenas propriedades e nas condições de agricultura familiar. Dessa forma, o desenvolvimento de variedades modernas possibilita, além de um ganho substancial de produtividade, a incorporação de características de arquitetura de planta desejáveis, como a baixa altura de plantas e de inserção de espigas, folhas mais eretas e pendões menos volumosos, além de resistência a doenças foliares e ao acamamento. A opção do produtor pelas variedades ocorre, principalmente, em função da baixa disponibilidade de recursos para investir na lavoura, já que o preço das sementes de milho está associado à constituição genética das cultivares. Usualmente, o custo da semente decresce na ordem: híbrido simples, híbrido triplo, híbrido duplo, variedade. Essa variação de preços resulta dos custos relacionados à tecnologia utilizada na geração de cada um destes produtos. A adoção de variedades de polinização aberta garante ao agricultor, além do menor custo com a aquisição de sementes, a possibilidade de utilização das sementes colhidas na sua lavoura do ano anterior. A seleção e a recomendação de genótipos nos programas de melhoramento genético dependem grandemente da execução de experimentos varietais. Usualmente tais experimentos são realizados em rede, visando cobrir ampla faixa de variações ambientais. Independentemente de outras finalidades que esses experimentos possam ter, seu principal objetivo é, sempre, a identificação de genótipos superiores. O sucesso da seleção depende de uma experimentação adequada e do uso de procedimentos estatísticos eficientes para a estimação/predição dos valores genéticos associados aos genótipos em teste. Nos ensaios varietais devem ser adotados delineamentos apropriados ao número de genótipos envolvidos na avaliação e às variações ambientais de cada local de teste. São também de grande importância, o número de repetições de cada tratamento, a forma, a orientação e o tamanho da parcela no campo, assim como os critérios para tomada imparcial de dados. Daí em diante, o sucesso da seleção passa a depender da abordagem 11 estatística escolhida para a estimação de componentes de variância, bem como dos métodos para a estimação ou predição dos valores genotípicos. O estabelecimento do modelo estatístico, que explica as fontes de variação envolvidas na análise de dados quantitativos, os seus componentes de variância e a construção apropriada de testes para as hipóteses de interesse, depende, sobretudo, da suposição acerca dos efeitos de tratamentos sob avaliação. Apesar de não ser assim tão óbvia, a decisão de admitir certos efeitos como fixos ou aleatórios pode levar, em situações práticas, à diferentes resultados no processo de seleção (Searle et al., 1992; Duarte, 2000; Ramalho et al., 2005). De acordo com Steel & Torrie (1996), os efeitos de um modelo linear são classificados em fixos ou aleatórios. Geralmente, quando o conjunto de efeitos sob estudo é selecionado pelo pesquisador ou, quando cada tratamento refere-se à uma população específica sobre a qual se deseja inferir, os efeitos são assumidos como fixos, impedindo que as estimativas sejam extrapoladas para outros níveis de tratamentos. Quando os efeitos em teste são obtidos por sorteio ou se referem à amostra de uma população de referência, os efeitos são tidos como aleatórios. Enfim, efeitos fixos são constantes e efeitos aleatórios constituem variáveis estocásticas, às quais estão associadas distribuições de probabilidade. Da especificação desses efeitos depende a classificação do modelo estabelecido para descrever a variabilidade dos dados. Assim, eles podem ser classificados como modelo linear fixo, modelo aleatório ou modelo misto. No primeiro, apenas o termo associado ao erro experimental ou resíduo é de efeito aleatório, no segundo, apenas a constante média é de efeito fixo, e no modelo linear misto, coexistem efeitos fixos e aleatórios, além da constante média e do resíduo, sempre aleatório (Bearzoti, 2005). É de suma importância que a escolha da abordagem estatística recaia naquela que possa atingir a máxima acurácia seletiva. A acurácia da avaliação genotípica é o parâmetro capaz de informar sobre o correto ordenamento dos genótipos sob seleção e, também, sobre a eficácia da inferência acerca do valor genotípico de uma cultivar, ou, em outros termos, do seu valor de cultivo e uso – VCU (Resende, 2002). Tal parâmetro depende da magnitude da variação residual, do número de repetições utilizadas no experimento e da variação genética. Em outras palavras, depende da proporção entre as variações de natureza genética e residual, ou seja, da herdabilidade ou coeficiente de determinação genotípica associada aos caracteres sob avaliação, e do número de repetições (Resende & Duarte, 2007). 12 A herdabilidade refere-se à proporção herdável da variabilidade total de um caráter (variabilidade fenotípica), que é dependente dos efeitos aditivos dos genes (Borém, 1997). A variabilidade fenotípica resulta da ação conjunta dos efeitos genéticos e ambientais, o que torna de suma importância a escolha de métodos de melhoramento, dos locais para testes de campo, do número de repetições e do método usado para a estimação dos ganhos de seleção. Em geral, quanto maior for a variabilidade decorrente do ambiente, em relação à variabilidade total, mais árdua é a seleção efetiva de genótipos superiores. Para Borém (1997), compõem o ambiente todos os fatores que afetam o desenvolvimento das plantas, que não são de origem genética. Genótipos cultivados em diferentes ambientes podem ter desempenhos relativos distintos, isto é, um material pode ser bastante produtivo em certo ambiente e muito pouco em outro, onde genótipos distintos se sobressaem em decorrência de adaptações específicas. A avaliação de genótipos em diferentes anos e localidades, freqüentemente, evidencia as interações genótipos x localidades, genótipos x anos e genótipos x localidades x anos, para a maioria das características agronômicas. Entende-se por interação de genótipos com ambientes (GxE), o efeito diferencial de ambientes distintos sobre os genótipos neles testados. Dessa forma, o desempenho de um mesmo genótipo pode variar em função das características ambientais a que é submetido, e dois tipos de interação GxE podem estar presentes. A interação GxE é classificada como simples, quando não mostra alterações na classificação dos genótipos dentro dos ambientes, ao longo da série de ensaios; ou pode ser complexa, quando essa classificação se altera. A interação simples permite uma recomendação de cultivares de forma generalizada, pois indica a presença de genótipos adaptados a uma ampla faixa de ambientes. Já a interação complexa ou cruzada revela a existência de materiais genéticos adaptados a ambientes peculiares, o que, geralmente, ocasiona complicação à recomendação de uma cultivar, pois neste caso dever-se-ia restringir aos ambientes específicos de sua adaptação (Ramalho et al., 1993). O presente trabalho teve como objetivo avaliar os efeitos de diferentes abordagens estatísticas na seleção e ordenação de genótipos, no contexto dos ensaios varietais de milho. Para isso, utilizaram-se dados reais de experimentos conduzidos no Estado de Goiás, nas safras 2002/2003, 2003/2004, 2004/2005 e 2005/2006, bem como dados de experimentos simulados em computador, nos quais se buscaram cobrir algumas situações similares a essa realidade. Essa segunda abordagem, embora artificial, tem a 13 vantagem de permitir a avalição da qualidade das estimativas e predições obtidas, relativamente aos parâmetros genotípicos alvo da inferência, o que não é passsível de avaliação com dados reais. O estudo propôs-se, ainda, quantificar os efeitos da interação de genótipos com ambientes (GxE) a partir dos ensaios reais, visando-se a estratificação ambiental para a cultura do milho no Estado, com ênfase na avaliação e recomendação de cultivares. 14 2 2.1 REVISÃO DE LITERATURA IMPORTÂNCIA DO MILHO E ASPECTOS DO SEU MELHORAMENTO GENÉTICO O milho é um dos principais insumos para o segmento produtivo, sendo utilizado na produção de carnes, ovos e leite, na indústria de amido, óleos, farinhas e outros alimentos, tendo também grande importância para o consumo direto na alimentação humana. Em muitas regiões do mundo, serve como a principal fonte de carboidratos e proteínas na alimentação humana. Pinazza (1993) acredita que, no futuro, as possibilidades da utilização do milho e seus derivados – utilizados principalmente nos setores alimentício, farmacêutico, têxtil, de bebidas, papéis, curtumes e colas – se abram ainda mais. Um exemplo disso é a crescente demanda de milho a ser destinado à produção de etanol (Perrin, 2008). Cerca de 160 países produzem e comercializam o milho desde a década de 1960. Dada à importância da cultura, avanços consideráveis têm sido observados nas produtividades de milho. Em relação àquela época, a produtividade média mundial exibiu aumentos de 24%, 50%, 90% e 119%, nas décadas de 1970, 1980, 1990 e 2000, respectivamente. Nos Estados Unidos, as produtividades atuais superam em 97% às observadas na década de 1960. Já no Brasil, esses aumentos foram da ordem de 146% (FAO, 2006). Vários fatores encontram-se ligados aos aumentos de produtividade na cultura do milho. Entre eles, podem ser citadas as tecnologias de mecanização para semeadura e colheita, o controle fitossanitário, a correção e a adubação do solo, o uso de irrigação e o melhoramento genético. Com o melhoramento, foram beneficiados a arquitetura e o porte das plantas, bem como a sua resistência a doenças, pragas, elementos tóxicos no solo, entre outras. Também foi possível a melhoria da qualidade nutricional dos grãos e o aumento da produtividade da cultura (Bandel, 1987). A principal finalidade do melhoramento de plantas é identificar combinações genotípicas de alta produtividade para a produção comercial. Nenhum material é 15 recomendado sem avaliação prévia em condições ambientais capazes de refletir aquelas encontradas na fase de produção comercial. Por isso, a etapa de avaliação dos materiais é a fase mais cara e exigente em termos de dedicação dos melhoristas (Ramalho et al., 2005). Para esses autores, um dos desafios da avaliação de cultivares está relacionado à precisão experimental, já que, com o avanço dos programas de melhoramento, as diferenças no incremento de produtividade entre as cultivares ficam cada vez menores, tornando necessária a utilização de técnicas experimentais apuradas para detectá-las. Acrescentam que, mesmo com os avanços da biotecnologia, a avaliação de campo dificilmente será eliminada dos programas de melhoramento. Os objetivos dos ensaios de competição de cultivares recaem sobre a inferência sobre os valores genotípicos dos tratamentos e a correta ordenação desses valores, visando-se a seleção dos materiais mais promissores. Contudo, o que acontece na prática é que as decisões basicamente são tomadas em função dos fenótipos, já que estes podem ser diretamente observados e medidos. Sabe-se, porém, que o sucesso da seleção genotípica depende das variâncias genéticas presentes no material disponível e da herdabilidade dos caracteres objeto do melhoramento. A herdabilidade é uma importante propriedade dos caracteres quantitativos e se refere à proporção da variação fenotípica total que é atribuída ao efeito médio das causas genéticas (Nunes, 1998). No sentido amplo, a herdabilidade refere-se à relação entre a variância genética total e a variância fenotípica; no sentido restrito, é determinada pelo quociente entre a variância genética aditiva e a variância fenotípica (Dudley & Moll, 1969; Falconer, 1987). Sendo assim, o coeficiente de herdabilidade expressa a relação entre a variação genética e a variação fenotípica total (Vencovsky, 1987). A herdabilidade depende da magnitude de todos os componentes da variância, que, por sua vez, dependem das freqüências gênicas que podem se alterar de uma geração para outra. Assim, caracteres como ciclo vegetativo, porte da planta, inflorescência e outros exibem diferentes valores de herdabilidade. Em geral, os caracteres que exibem baixa herdabilidade são mais estreitamente relacionados à produção (Nunes, 1998). Por isso, nos ensaios de competição de cultivares de milho, em que, geralmente, a importância maior recai sobre a produtividade de grãos, o pesquisador deve estar atento à herdabilidade dessa característica, que não deve ser admitida como máxima. Outro aspecto importante nesse contexto é a escolha do delineamento experimental adequado ao número de genótipos a ser avaliado e às condições ambientais 16 de cada local de teste. De acordo com Ramalho et al. (2005), os delineamentos em blocos completos casualizados e em blocos incompletos são os mais utilizados na avaliação de cultivares, sendo o último grupo, o de maior capacidade de controle da heterogeneidade ambiental, devido à possibilidade de se empregar blocos de tamanho reduzido. Entre os delineamentos de blocos incompletos, os látices, introduzidos por Yates (1936), são os mais adotados nos ensaios de competição de genótipos em milho. Estes delineamentos apresentam desbalanceamento planejado, o que permite, além da avaliação de grande número de tratamentos, vários tipos de análises. Entre estas, destacaram-se, inicialmente, a análise intrablocos e a análise com recuperação da informação interblocos (Cochran & Cox, 1976). Mais recentemente, porém, vem recebendo destaque as análises que recuperam, adicionalmente, a chamada informação intergenotípica, vinculadas à adoção da metodologia de modelos mistos (Federer, 1996; Wolfinger et al., 1997; Federer, 1998; Federer & Wolfinger, 1998). 2.2 ESTIMAÇÃO E PREDIÇÃO DE VALORES GENÉTICOS Os valores genéticos são valores paramétricos não observáveis, estimados ou preditos a partir dos valores fenotípicos observáveis. Assim, valores genéticos estimados ou preditos não são iguais aos valores genéticos verdadeiros dos indivíduos. A proximidade entre eles pode ser avaliada com base na estatística denominada acurácia (acuidade), que indica a correlação entre os valores genéticos estimados ou preditos e os valores genéticos verdadeiros, associados aos indivíduos avaliados (Van Vleck et al., 1987). A acurácia depende da herdabilidade e repetibilidade do caráter, da quantidade e qualidade das informações e dos procedimentos de predição dos valores genéticos (Resende, 2002). Valores ideais de acurácia devem estar próximos à unidade ou 100%, sendo mais altos à medida que se minimizam os desvios absolutos entre os valores genéticos paramétricos e os valores genéticos estimados ou preditos. Outra estatística relacionada às diferenças entre as estimativas/predições e os respectivos parâmetros por elas avaliadas é o erro quadrático médio (EQM). Segundo Resende & Duarte (2007), a estatística EQM pode ser definida como a distância Euclideana média entre a ˆ ) e o correspondente parâmetro (θ), sendo também expresso por: estimativa/predição ( θ ˆ )- θ; e PEV é a chamada variância do erro de EQM = (vício)2 + PEV; sendo: vício = E( θ 17 predição. Logo, EQM congrega, simultaneamente, os conceitos de vício e de precisão, os quais estão implícitos no conceito de acurácia. A predição de valores genéticos é comumente feita utilizando-se três procedimentos básicos: BP (best prediction – melhor predição); BLP (best linear prediction – melhor predição linear) e BLUP (best linear unbiased predictor). Segundo ˆ = f ( y ) , um preditor de interese relacionado ao vetor y de Henderson (1984), sendo w observações, o melhor preditor (BP) requer o conhecimento da distribuição conjunta de w e y (com todos os seus parâmetros) para derivar a média condicional E[w|y]. Este requesito, entretanto, raramente é atendido na prática. Já o BLP pode ser usado quando não se conhece a forma de distribuição conjunta de y e w, mas sim seus primeiros e segundos momentos distribucionais, isto é, requer o conhecimento de médias e variâncias, sendo o preditor que, na classe das funções lineares de y, maximiza a acurácia ( rw ˆ w ) e minimiza o erro quadrático de predição. Sob normalidade dessa distribuição, tal preditor equivale ao BP em termos de propriedades desejáveis. Já nos casos em que não se conhecem médias, mas apenas as variâncias e com acurácia suficiente para assumir suas estimativas como valores paramétricos, a opção disponível é o BLUP. Como também, muitas vezes, primeiros e segundos momentos são desconhecidos, dispondo-se somente de suas estimativas, de acordo com Littell et al. (1996), o termo BLUP não mais se aplica, devendo ser substituído por EBLUP (emprirical best linear unbiased predictor), que indica tal aproximação. Resende (2002) descreve a aplicação de três destes preditores da seguinte forma: BP é usado quando se dispõem de iguais quantidades e precisões das informações associadas aos candidatos à seleção, cujas médias (primeiros momentos) e variâncias associadas (segundos momentos) são conhecidas, sob a suposição de normalidade multivariada; BLP aplica-se quando se utiliza diferentes quantidades e precisões de informação associadas a todos os candidatos à seleção, com médias e variâncias conhecidas e sem a suposição de normalidade; e BLUP, quando diferentes quantidades e precisões relativas às informações associadas aos candidatos à seleção são disponíveis, sendo a variância conhecida e a média desconhecida. Entre os preditores lineares não viciados, BLUP tem sido apontado como sendo o mais adequado à predição de valores genotípicos, em situações em que a variância é conhecida, mas a média (µy) não. Isso, graças às suas propriedades estatísticas superiores, 18 como a menor dispersão de predições, maior confiabilidade e melhores predições de progresso genético. Neste procedimento, sendo µy não conhecida, o preditor é forçado a ser ˆ = µ a + C 'V − 1 y − Xβˆ , em que â é a predição do valor não-viciado, de modo que: a genético do tratamento; µa é a média de a, C é a matriz de covariância entre a e y; V é a ˆ = X' V − 1 X matriz de variância de y; X é a matriz de incidência para β; e β ( ) ( ) − X' V − 1 y é o estimador de quadrados mínimos generalizados, ou o melhor estimador linear não viciado (BLUE) do vetor β de efeitos fixos (Resende, 2002). O preditor BLUP apresenta o menor erro quadrático médio dentre todos os preditores lineares não-viciados. De acordo com Milliken & Johnson (1992), modelos mistos foram desenvolvidos para descrever dados de experimentos que envolvam efeitos fixos e outros aleatórios. Modelos mistos se destinam, por exemplo, à estimação das médias de blocos, pelo método dos quadrados mínimos generalizados, dos componentes de variância e à predição de valores genéticos num modelo de delineamento em blocos. Neles, a covariância genética entre as observações é considerada e os genótipos são ponderados com desigual número de informações (Resende, 2002). Nos ensaios de competição de cultivares com um grande número de genótipos sob avaliação, Piepho (1994) afirma que a modelagem dos efeitos genotípicos como aleatórios pode ser preferível, mesmo quando existe interesse nas respostas genotípicas individuais, o que recai na adoção de modelos mistos. Resende & Duarte (2007) também recomendam que os modelos estatísticos utilizados no melhoramento genético e na avaliação de cultivares adotem, quase sempre, efeitos aleatórios para os genótipos e suas interações. Segundo eles, se os efeitos ambientais (blocos, locais) podem ser considerados como fixos ou aleatórios, dependendo da situação, o mesmo não deve ser feito para os efeitos genéticos, que são aleatórios por natureza. Dessa forma, os modelos matemáticos deveriam ser mistos ou aleatórios. Um modelo linear de efeitos fixos pode ser descrito da seguinte forma: y = Xβ + ε ; sendo y, o vetor de observações; X, a matriz de incidências conhecida dos parâmetros; β, o vetor de efeitos fixos desconhecidos a serem estimados; e ε, o vetor de erros, com E ( ε ) = φ 2 e V( ε ) = I σ ε . O vetor β é estimado por quadrados mínimos ˆ = ( X' X ) − X' y . Já o modelo misto de Henderson é descrito como ordinários como: β y = Xβ + Zu + e , em que: y é o vetor de observações; X é a matriz de incidência dos efeitos 19 fixos; β é o vetor de efeitos fixos a serem estimados; Z é a matriz de incidências dos efeitos genotípicos, tomados como aleatórios; u é o vetor de valores genotípicos ou de efeitos aleatórios a serem preditos, assumindo u~ N ( φ ,G ) ; e e é o vetor de erros aleatórios associados às observações, tal que e~ N ( φ , R ) . Assim, o BLUP(u), não-viciado no sentido ˆ ) = φ e com mínima variância do erro de predição, é obtido pela solução das de que E ( u equações do seguinte sistema (equações do modelo misto): ˆ   X' R − 1 y   X' R − 1 X X' R − 1 Z   β =   −1 −1 −1   −1  Z' R X Z' R Z + G ˆ u      Z' R y  em que: G e R são, respectivamente, as matrizes de variâncias-covariâncias dos vetores ˆ , com V = ZGZ ' + R aleatórios u e e. Isso resulta, ainda, em: BLUP(u) = GZ ' V − 1 y − Xβ (Henderson, 1984). Resende & Duarte (2007) afirmam que assumir os efeitos de genótipos como aleatórios não implica, necessariamente, na obrigação de estimar componentes de variância explicitamente. Segundo eles, um coeficiente análogo à herdabilidade pode ser obtido diretamente do valor de F da ANOVA, mesmo quando os efeitos de genótipos são tratados como fixos. Nesse caso, segundo eles, o valor genotípico predito, isto é, o valor de cultivo ˆ = VCU = m + ( 1 − 1 / F )( Yi . − m ) , em que e uso (VCU) de uma cultivar é dado por: g Yi . é a média amostral da cultivar i (i = 1, 2,..., T tratamentos). Esta abordagem usa ( ) implicitamente todos os fundamentos genéticos da avaliação genotípica e atende, simultaneamente, qualquer das abordagens científicas alternativas para o problema da estimação/predição de efeitos de tratamentos: abordagem tradicional de efeitos fixos (admitindo o uso de estimadores viesados), metodologia de modelos mistos (efeitos aleatórios de tratamentos) e estimadores shrinkage de James & Stein (1961). Um estimador do tipo shrinkage tem a forma de um escalar, variando entre zero e um, multiplicado por um vetor de médias estimadas por quadrados mínimos ou por máxima verossimilhança; ou seja, multiplicam-se as médias fenotípicas por um fator de “encolhimento” que depende da confiabilidade que se tem naquelas estimativas. Resende & Duarte (2007) justificam o uso de estimadores shrinkage pelo fato de que as médias fenotípicas provenientes de experimentos de melhoramento genético não se repetem em cultivos comerciais e, também, pela superioridade das médias experimentais em relação às 20 médias dos cultivos comerciais. Dessa forma, a aplicação de abordagens do tipo shrinkage torna as estimativas e predições mais confiáveis. O estimador de James & Stein (1961) da média populacional é dado por M * = k (Yi.. − Y... ) + Y... , em que k é um fator regressor da média amostral de determinado tratamento sobre a média geral. O fator k é dado por: k = 1− ( T − 3 ) σˆ 2 ∑ ( Yi .. − Y... )2 2 , em que: σˆ é a variância residual estimada sem vício pelo quadrado médio residual e; T é o número de tratamentos avaliados. Esta proposição se deveu ao fato de que, segundo Stein (1955), o uso da média aritmética para a estimação da média populacional não é admissível já que, existem estimadores que propiciam menor erro quadrático médio ou menor risco que este (Resende & Duarte, 2007). De acordo com estes autores, a filosofia associada aos estimadores do tipo shrinkage coaduna-se perfeitamente às aplicações em genética e melhoramento de plantas, pois permite evitar a suposição implícita e irreal de que a herdabilidade é máxima (h 2=1,0), o que, segundo os autores, mesmo sob pequeno número de tratamentos em teste (menor que dez), é inadmissível. Com o regressor shrinkage, os efeitos residuais de ambiente, embutidos nos dados fenotípicos são eliminados pela multiplicação do valor fenotípico corrigido, por uma função da herdabilidade do caráter sob seleção. 2.3 SIMULAÇÃO NO ESTUDO DE PROPRIEDADES DE ESTIMADORES E PREDITORES GENOTÍPICOS A metodologia denominada método de Monte Carlo é uma técnica estocástica e probabilística utilizada mundialmente para a simulação, visando a solução de problemas pela simulação direta de um processo físico. De acordo com Eckhardt (1987), o método foi desenvolvido originalmente por Stanislaw Ulam e John von Neumann, durante a Segunda Guerra, sendo, atualmente, aplicado a uma grande faixa de problemas nas diferentes áreas do conhecimento. O método de Monte Carlo seleciona aleatoriamente valores para a construção de cenários para o problema sob avaliação. Estes valores são obtidos aleatoriamente de uma faixa pré-fixada, objetivando sua adequação a uma distribuição de probabilidade. Assim, por meio de valores aleatórios e probabilidades estatísticas, busca-se uma resposta, que é utilizada para resolução de um problema (Simulation Module, 2008). 21 A simulação é uma ferramenta de grande importância para as análises e operações de sistemas e processos complexos. A técnica foi inicialmente implementada para resolver problemas de reações nucleares, se estendendo posteriormente a áreas ligadas ao desenvolvimento político e, finalmente, ao desenvolvimento agropecuário (Rodrígues & Bermúdez, 1995). A simulação inclui o processo necessário à operacionalização de um modelo capaz de mimetizar o comportamento de um sistema real, bem como o desenvolvimento da lógica e do fluxo de diagramas inscritos no código de um computador, e sua implementação computacional (Jones et al., 1987). Sauvant (1999), ao revisar conceitos ligados aos sistemas, aponta a presença de termos como conjunto de elementos, relações, totalidade, organização, finalidade e não aditividade. Nesse contexto, um modelo pode ser definido como a representação matemática de um sistema, sendo a modelagem o processo de desenvolvimento desta representação. Já o sistema, refere-se à coleção de componentes e suas inter-relações, as quais podem ser agrupadas com o propósito de estudar algo no mundo real (Jones et al., 1987). A seleção dos componentes inclusos num modelo depende dos objetivos do estudo e da ocorrência de efeitos que representem uma visão científica simplificada de realidade. Logo, a modelagem é a abstração e simplificação da realidade, capaz de integrar as principais interações e comportamentos estudados, apta a ser manipulada com o objetivo de prever as conseqüências da modificação de um ou vários parâmetros sobre o comportamento do sistema (Spedding, 1988). Segundo Rodrígues & Bermúdez (1995), a técnica de simulação normalmente exige uma grande quantidade de cálculos, pressupondo a disponibilidade de ajuda eletrônica no processamento dos dados. A execução de um experimento de simulação fundamenta-se na operacionalização das seguintes etapas: i) formulação do problema sob investigação; ii) formulação do modelo de simulação que, geralmente, é um modelo matemático; iii) elaboração de um programa computacional para o modelo de simulação, incluindo sua descrição e desenvolvimento; iv) julgamento da validade do modelo e do programa computacional; e v) desenvolvimento do experimento simulado. Assim, segundo os autores, a experimentação por meio da simulação consiste numa série de exercícios de computação, que permite a eliminação de erros do modelo e a sua validação. Modelos de produção podem ser utilizados por pesquisadores para examinar hipóteses científicas. Nos mais simples, o modelo é usualmente a hipótese do comportamento do sistema. Nos modelos complexos o teste de hipótese é comumente 22 associado ao funcionamento de um dado processo ou à identificação da resposta produtiva a um fator particular. Modelos de produção têm sido utilizados com sucesso na organização de dados experimentais e, devido ao seu foco mecanicista e compreensivo, esses modelos passaram a ser utilizados para mimetizar características genéticas de plantas. Dessa forma, a hipótese destes modelos recai sobre os tratamentos genéticos que otimizam a performance produtiva em ambientes específicos (Boote et al., 1996). Nos estudos genéticos, estatísticos e experimentais, a modelagem deve retratar os fenômenos de interesse, utilizando-se rotinas adequadas ao processamento do problema sob investigação para que possa ser avaliada a influência de certos fatores. Além disso, o modelo deve ser suficientemente simples para ser operacionalizado e interpretado adequadamente, apresentando desempenho comparável ao que se espera em um modelo real (Cruz, 2001). Para Ferreira (2001), o uso da simulação justifica-se nas situações em que se busca a comparação da eficiência de um novo procedimento ou técnica em relação a outros já existentes. Dessa forma, a qualidade das estimativas/predições de parâmentros genéticos pode ser prontamente estabelecida para os diferentes estimadores/preditores sob teste, já que, com a prévia atribuição dos parâmetros, consegue-se averiguar, de forma direta, a proximidade de suas estimativas/predições em relação aos verdadeiros valores pré-estabelecidos no estudo. De acordo com Duarte (2000), um dos critérios utilizados para ˆ – θ)2, que é esse propósito é o erro quadrático médio (EQM), definido como EQM = Ê( θ ˆ em relação ao parâmetro θ, para capaz de avaliar o grau de dispersão das estimativas θ cada método de estimação. Outra estatística passível de ser avaliada por meio de simulação é a acurácia. Como resultado, podem ser identificadas entre diferentes abordagens para seleção genotítica, as opções de maior acurácia e menor erro quadrático médio, o que seria impossível em casos reais pelo desconhecimento dos valores genéticos dos materiais sob avaliação. 2.4 INTERAÇÃO DE GENÓTIPOS COM AMBIENTES 2.4.1 Conceitos básicos De acordo com Ramalho et al. (2005), as grandes empresas de milho híbrido no Brasil avaliam anualmente 50 mil parcelas experimentais em seus programas de melhoramento. Nas regiões tropicais, em que as condições climáticas e de solo são mais 23 heterogêneas, as avaliações de cultivares tornam-se mais difíceis, principalmente pela ocorrência da interação dos genótipos com os ambientes (GxE). A diversidade edafoclimática, aliada aos diferentes sistemas de produção adotados, torna necessária a identificação das cultivares adaptadas às condições de cada sub-região destinada ao cultivo, já que este é um fator imprescindível para a obtenção de altos rendimentos. Embora as variedades de polinização livre sejam consideradas de ampla adaptação, pois espera-se que genótipos heterozigotos sejam menos suscetíveis às variações ambientais que os homozigotos e que populações heterogêneas sejam mais tolerantes que as homogêneas, tem-se verificado a ocorrência da interação GxE em qualquer grupo de cultivares (Becker & Leon, 1988). A presença de interação GxE significativa dificulta a identificação de cultivares de ampla adaptabilidade, o que pode ser atribuído a dois tipos de variações ambientais: as previsíveis, devido a fatores permanentes do ambiente, tais como fertilidade do solo; e as imprevisíveis, constituídas por alterações aleatórias, normalmente ligadas a fatores como temperatura e precipitação pluvial (Allard & Bradshaw, 1964). Para que a recomendação de cultivares seja feita com maior segurança, busca-se a redução do efeito destas interações, identificando-se cultivares mais apropriadas para determinada condição ambiental ou região. Para isso, a avaliação mais comumente empregada é o estudo da estabilidade fenotípica (Cruz & Regazzi, 1997; Ramalho et al., 2005). A estabilidade está relacionada à previsibilidade de comportamento de um genótipo em função do estímulo ambiental a que é submetido; já a adaptabilidade está relacionada à capacidade da cultivar em responder positivamente ao estímulo ambiental (Mariotti et al., 1976; Verma et al., 1978; Resende et al., 1995). Existem métodos que visam identificar genótipos geneticamente superiores em adaptabilidade e estabilidade. Tais procedimentos vão desde aquelas que utilizam regressão, como a de Eberhart & Russell (1966), até as que empregam análise multivariada como o método AMMI (additive main effects and multiplicative interaction – análise de efeitos principais aditivos e de interação multiplicativa), apresentada por Kempton (1984) e Gauch (1988). Revisões sobre boa parte desses métodos podem ser encontradas, por exemplo, em Brasil (1990), Crossa (1990), Avelar et al. (1996), Cruz & Regazzi (1997), Duarte & Vencovsky (1999), Ribeiro et al. (1999), Oliveira et al. (2003), Silva Jr. (2004), Pacheco (2004), entre outros. Dentre os métodos tradicionais de estudo de adaptabilidade e estabilidade, alguns permitem estratificar a população de ambientes em sub-regiões, dentro das quais a 24 interação não se mostra significativa, permitindo, assim, recomendações generalizadas (Brasil, 1990; Duarte & Zimmermann, 1991). Entre os métodos multivariados destaca-se a análise AMMI, muito utilizada nos últimos anos, que representa um modelo linear (efeitos aditivos) e bi-linear (efeito multiplicativo), que integra a análise de variância para os efeitos principais (genótipos e ambientes) com a análise de componentes principais (ACP) para os efeitos multiplicativos que compõem a interação GxE (Gauch & Zobel, 1996). O número de eixos ou componentes da ACP retidos para a maioria das aplicações é o menor possível (em geral um e, no máximo, três), com o qual se pretende reduzir a dimensão do sistema e fornecer uma descrição parcimoniosa acerca da estrutura da interação. A análise AMMI auxilia tanto na identificação de genótipos com alta produtividade e amplamente adaptados, quanto na realização do zoneamento agronômico, no intuito de proporcionar a realização de recomendações regionalizadas (Gauch & Zobel, 1996). O método também permite obter e representar graficamente estimativas mais precisas das respostas genotípicas. O gráfico denominado biplot contém duas categorias de pontos marcadores, a dos genótipos e a dos ambientes. Em suma, o método destina-se à seleção de um modelo que explique o padrão subjacente à interação, descartando-se ruídos presentes nos dados e sem interesse agronômico. Quando o modelo AMMI engloba apenas o primeiro eixo principal de interação, denotado por IPCA1, as categorias de marcadores (genótipos e ambientes) são representadas no gráfico biplot AMMI1, cujo eixo de abscissas representa os efeitos principais (médias de genótipo e de ambientes) e eixo de ordenadas expressa os escores de genótipos e de ambientes para os efeitos de interação estimados na análise. Se o modelo engloba dois eixos da ACP, utiliza-se o biplot AMMI2, que representa os efeitos de interação referentes aos dois primeiros eixos: IPCA1 e IPCA2. A interpretação de um biplot, quanto à interação GxE, é feita pela magnitude e o sinal dos escores de genótipos e de ambientes para o(s) eixo(s) que descreve(m) o padrão da interação. De tal modo, escores baixos (próximos de zero) são característicos de genótipos e ambientes que contribuíram pouco para a interação, assinalados como estáveis. Ademais, combinações de escores genotípicos e ambientais de magnitude elevada e de mesmo sinal revelam adaptações específicas que deveriam ser exploradas. De acordo com Vencovsky & Barriga (1992), a adaptabilidade e estabilidade são fenômenos relacionados que não devem ser considerados como um só. A adaptabilidade é a capacidade dos genótipos apresentarem, em ambientes desfavoráveis, 25 rendimentos elevados e constantes, acrescida da sua habilidade de responder à melhoria das condições ambientais (Verma et al., 1978). Por outro lado, a capacidade do genótipo apresentar comportamento constante, sob diferentes ambientes, ou seja, a inexistência de plasticidade fenotípica, denomina-se estabilidade biológica, enquanto a alta previsibilidade da resposta comportamental do genótipo designa-se estabilidade agronômica (Becker, 1981). Por isso, Fox et al. (1997) relacionaram a idéia da estabilidade agronômica com o ordenamento dos genótipos nos diferentes ambientes, sendo estável aquele que é consistentemente bem ordenado. Com o uso do método AMMI torna-se possível a identificação de: i) genótipos estáveis, ou seja, cuja resposta fenotípica tenha alta previsibilidade; ii) genótipos de ampla adaptabilidade, cujo desempenho para o caráter sob avaliação seja superior na maioria dos ambientes avaliados; e iii) genótipos adaptados a ambientes específicos, demonstrado pela proximidade dos pontos representativos dos genótipos e dos ambientes no respectivo biplot da análise (Duarte & Vencovsky, 1999). 2.4.2 Estratificação ambiental para avaliação e recomendação de cultivares A detecção da interação GxE depende da avaliação de genótipos em, pelo menos, dois ambientes. Uma vez identificada esta interação, os caminhos seguidos pelos melhoristas são: a identificação de genótipos adaptados a ambientes particulares, a identificação de genótipos de ampla adaptabilidade e a estratificação ambiental (zoneamento agronômico). Para Ramalho et al. (1993), a estratificação ambiental engloba a identificação e a divisão de uma grande área, em sub-regiões contíguas ou não, ecologicamente semelhantes, visando a atenuação dos efeitos da interação GxE. Segundo Vencovsky et al. (1990), o estudo de zoneamento nos experimentos de competição de cultivares é de grande importância, pois impede que a escolha dos ambientes da rede de avaliação seja subjetiva ou influenciada por fatores que não são relacionados com aspectos da cultura. Entre as vantagens da construção da rede de avaliação de genótipos, de acordo com similaridades ambientais, estão a atenuação da interação GxE e a redução de custos pela eliminação de ambientes semelhantes. Além disso, a estratificação ambiental permite que os melhoristas trabalhem com herdabilidades mais altas e, consequentemente, com progressos mais rápidos em seus programas de melhoramento genético (Gauch & Zobel, 1997). 26 A formação de estratos pode ser apoiada em variáveis edafoclimáticas ou no desempenho médio dos genótipos nos diferentes ambientes (Milligan, 1994). Annicchiarico (2002) acrescenta que, além dos dados provenientes da avaliação de cultivares, devem ser consideradas as informações sobre variáveis edafoclimáticas, fatores bióticos e de manejo da cultura, já que estes podem auxiliar na identificação das fronteiras geográficas dos estratos ambientais. Um dos trabalhos pioneiros objetivando a estratificação ambiental foi desenvolvido com a cultura de aveia por Horner & Frey (1957). De lá para cá, muitos pesquisadores trabalharam com o assunto (McCain & Schultz, 1959; Miller et al., 1959; Liang et al., 1966; Abou-El-Fittouth et al., 1969; Murray & Verhalen, 1970; Sampaio & Silva, 1972; Ghaderi et al., 1980; Brasil, 1990; May & Kozub, 1995, Mundel et al., 1995; Gauch & Zobel, 1997; Pacheco, 2004; Maranha, 2005). O maior problema relacionado aos diferentes métodos de estratificação ambiental se refere à construção de zonas inconsistentes, ou seja, ao longo de diferentes anos agrícolas os mesmos locais se reunem em diferentes estratos. Dessa forma, a similaridade ambiental observada em um ciclo de seleção nem sempre se repete nos demais, ainda que os genótipos e os locais sejam repetidos ao longo de vários períodos. Além disso, Gauch (1992) afirma que o número de estratos deve ser o mínimo necessário, ou seja, o objetivo da estratificação só é atingido quando o número de estratos formados com a abordagem é pequeno, mas não único. Pacheco (2004), trabalhando com genótipos de soja, comparou os resultados obtidos com três abordagens de estratificação: a de Horner & Frey (1957), e mais outras duas fundamentadas na análise AMMI, associadas aos desenvolvimentos apresentados em Gauch (1990, 1992), Gauch & Zobel (1997) e Ebdon & Gauch (2002). Destas, apenas uma produziu resultados animadores, a estratificação baseada nos chamados genótipos vencedores, que resultou em estratos consistentes ao longo dos períodos. De acordo com o autor, em geral, houve tendência de aumento no número de estratos ambientais ao se adotar modelos AMMI mais parametrizados (ex: AMMI3, AMMI4). Ademais, foi constatado aumento na consistência dos agrupamentos formados ao longo dos anos, com a redução na ordem do modelo AMMI utilizado. Assim, a maior consistência dos agrupamentos ocorreu quando se empregou o modelo AMMI1, corroborando as argumentações de outros autores (Gauch, 1990, 1992; Ebdon & Gauch, 2002). Maranha (2005), objetivando a estratificação ambiental para genótipos de algodão, testou três abordagens, também baseadas na análise AMMI, incluindo a de 27 genótipos vencedores. Seus resultados corroboraram a capacidade que esse método possui para a formação de estratos consistentes, pois foi o único a possibilitar a formação de dois estratos estáveis ao longo de três anos, o que não foi observado com os estratos estabelecidos pelos demais métodos. Para a autora, os estratos ambientais formados pela abordagem dos genótipos vencedores baseiam-se em critérios estatísticos de fácil entendimento e de apresentação gráfica clara. A teoria estatística da abordagem de genótipos vencedores, baseada na análise AMMI, foi descrita por Gauch (1992) e Gauch & Zobel (1997). A análise preconiza o ajuste de uma família de modelos entre os quais, um deve ser selecionado para o ajuste definitivo. Dessa forma, a primeira decisão é a da escolha do modelo AMMI a ser utilizado, ou seja, a identificação dos eixos IPCA a serem retidos para explicação do padrão da interação GxE e, conseqüentemente, daqueles a serem descartados por se tratarem de ruídos. Freqüentemente, AMMI1 ou AMMI2 são mais acurados, embora, eventualmente, um modelo de ordem mais elevada possa ter maior acurácia preditiva. Para o caso de estratificação de ambientes, em geral, recomenda-se o uso do modelo AMMI1 (Ebdon & Gauch, 2002). A definição dos estratos ambientais é feita em função do genótipo vencedor em cada um dos ambientes tomando-se como base a estimativa AMMI da resposta de cada genótipo em cada ambiente. Dessa forma, cada genótipo com uma ou mais vitórias determina um estrato. Segundo Pacheco (2004), o método permite, ainda, a definição de uma quantidade mínima de ambientes em que um genótipo deve vencer para, efetivamente, determinar um estrato. Outra vantagem reportada pelo autor, associada à abordagem de uso de genótipos vencedores para a estratificação ambiental, é a informação integrada da recomendação de genótipos de adaptação específica para cada estrato estabelecido. 28 3 COMPARAÇÃO DE MÉTODOS DE ESTIMAÇÃO E PREDIÇÃO DE MÉDIAS GENOTÍPICAS EM ENSAIOS VARIETAIS DE MILHO RESUMO O objetivo deste trabalho foi avaliar diferentes abordagens estatísticas para a estimação/predição de médias genotípicas de variedades de milho, a partir de experimentos delineados em látice. As abordagens analíticas avaliadas foram: o modelo fixo (FF), isto é, com efeitos de bloco e de tratamento assumidos como fixos, e que corresponde à análise intrablocos; o modelo misto com efeito aleatório de blocos (AF), correspondente à análise com recuperação da informação interblocos; o modelo misto com efeito aleatório de tratamentos (FA), cuja análise recupera a informação intergenotípica; modelo aleatório (AA), que recupera ambas as informações; e a média amostral de James-Stein (JS), que corresponde a um estimador “encolhido” (shrinkage) alternativo para as médias genotípicas (os modelos FA e AA também as produzem). Foram utilizados dados de 47 experimentos, conduzidos no Estado de Goiás, pela rede de avaliação de cultivares de milho da Agência Goiana de Desenvolvimento Rural e Fundiário (AgenciaRural), nas safras de 2002/03, 2003/04, 2004/05 e 2005/06. O delineamento experimental adotado foi em látice, com três repetições e número de tratamentos variando entre 15 e 28 genótipos, dependendo da safra. Duas cultivares por safra foram consideradas testemunhas, com a produtividade média entre elas servindo como referência para a seleção de genótipos superiores. Independentemente da safra, o uso das diferentes abordagens resultou em percentuais distintos de seleção, relativamente à média das testemunhas, e em ordenamento diferenciado das médias genotípicas. A adoção de abordagens com efeito shrinkage sobre as médias dos genótipos (FA, AA e JS) levou a um maior descarte de genótipos (com médias inferiores à média das testemunhas), na maioria dos experimentos. Os modelos com tratamentos de efeito fixo (FF e AF), em geral, resultam na preservação de genótipos de baixo potencial produtivo, entre os selecionados, uma vez que tais abordagens selecionam maior número de cultivares, mesmo sob baixo coeficiente de determinação genotípica (h2’). Sob elevados valores de h2’, a seleção de genótipos pelas diferentes abordagens foi bastante coincidente, porém, com diferenças no ordenamento dos genótipos. Palavras-chave: modelo linear misto, valor genético, látice, estimador James-Stein, ordenação de tratamentos, shrinkage. 29 30 ABSTRACT COMPARISON AMONG ESTIMATION AND PREDICTION METHODS OF GENOTYPIC MEANS IN MAIZE VARIETY TRIALS The objective of this study was to assess different statistical approaches to estimate/predict genotypic means of maize varieties, from trials planned in lattice design. The analytical approaches evaluated were: fixed model (FF), that is, the one under the effect of blocks and treatments considered fixed, corresponding to the intrablocks analysis; mixed model with random blocks effects (AF), related to the analysis that deals with the recovering of the interblocks information; mixed model with random treatments effects (FA), whose analysis recovers the intergenotypic information; random model (AA), which recovers both information; and the estimator of sampling average by James-Stein (JS), which is an alternative shrinkage estimator for the genotypic means (also obtained with the FA and AA models). Data from 47 trials, carried out in the State of Goiás, Brazil, were used by the program of evaluation of maize cultivars from the Agência Goiana de Desenvolvimento Rural e Fundiário (AgenciaRural), at the 2002/03, 2003/04, 2004/05 and 2005/06 growing seasons. The lattice design was the one adopted, with three replications and number of treatments ranging from 15 to 28, depending on the growing season. Two cultivars per season were considered as checks, with the average yield between them being used as a reference to the best genotypes selection. The use of the different approaches, independently of the growing season, resulted in distinct percentages of selected varieties in relation to the average of checks, and in differentiated disposition of the genotypic means. The adoption of approaches with a shrinkage effect over these means (FA, AA and JS) resulted in a greater discard of genotypes (with means lower than the checks means), in most trials. The models based in fixed effect treatments (FF and AF) resulted, in general, keeping some genotypes with low yield potential, among the selected ones, because such approaches select a bigger number of cultivars, even under low genotypic determination coefficients (h2’). Under high values of h2’, the genotypic selection from the different approaches was quite coincident, however, with differences at the ranking of genotypes. Key words: mixed linear model, lattice, breeding value, James-Stein estimator, treatments ranking, shrinkage. 3.1 INTRODUÇÃO A adoção de tecnologias modernas, como o uso de cultivares melhoradas, mecanização e insumos, tem proporcionado aos agricultores do Estado de Goiás a obtenção de uma das mais altas produtividades de milho, em relação às demais regiões do Brasil. A média de produção do Estado tem se mantido como a segunda maior do país nos 31 últimos dez anos. Enquanto o aumento na média de produtividade nacional da cultura foi de 5%, de 2000 para 2005, a média de produtividade goiana aumentou em 30% no mesmo período, atingindo 6.187 kg.ha-1 no ultimo ano (IBGE, 2008). Ganhos em produtividade resultam da significativa contribuição do melhoramento das características de interesse agronômico da espécie, que se destaca como uma das culturas geneticamente mais bem estudadas (Bandel, 1987; Ramalho et al., 1990). O aumento do potencial produtivo das cultivares de milho tem sido citado como exemplo da contribuição da genética para a produção de alimentos, resultando em incremento na produtividade média da ordem de 70% na última década (Tavares, 2005). Em conseqüência, o alto índice de produtividade obtido pela cultura faz com que o melhoramento genético da espécie se torne cada vez mais complexo e com difíceis ganhos de seleção. Nos programas de melhoramento de plantas, a estimação de médias de genótipos a partir de análises estatísticas baseadas em modelo fixo é uma prática comum, mesmo em situações em que o modelo é naturalmente misto como, por exemplo, quando os tratamentos são obtidos por amostragem numa população (Duarte & Vencovsky, 2001). Segundo os autores, um dos motivos que aponta para a escolha de modelo misto é o fato de que os blocos deveriam sempre ter efeitos aleatórios, uma vez que, havendo a perda do experimento e a necessidade de sua reinstalação, a formação dos blocos no experimento substituto não requer a alocação aos mesmos blocos utilizados anteriormente. Isso evidencia que o bloco não é uma “entidade” constante (efeito fixo), devendo o seu efeito ser tratado como aleatório. A falta de vivência com os modelos mistos (Bueno Filho, 1997) e a baixa utilização de sistemas estatístico-computacionais mais avançados como o SAS® (Statistical Analysis System), ou o R (The R Project for Statistical Computing) estão entre os motivos pelos quais os melhoristas, no Brasil, praticamente ainda não utilizam predições baseadas em modelos mistos. Ainda que a aplicação de modelos mistos seja exeqüível e leve em consideração covariâncias biologicamente conhecidas, não só nos testes estatísticos, mas também na estimação e predição de efeitos de implicação direta no ordenamento e na seleção dos genótipos. Em boa parte dos casos, a modelagem mista é utilizada apenas para a estimação de componentes de variância e para a construção de testes F associados à análise de variância (Duarte, 2006). De acordo com o autor há a “crença” de que os efeitos 32 prejudiciais da abordagem tradicional são mínimos, a ponto de não compensar os esforços com a adoção de abordagens mais rigorosas, já que, se os ensaios seguem delineamentos ortogonais e balanceados, a ordem de classificação dos genótipos normalmente não é alterada. Entretanto, deve ser ressaltado o fato de que o desbalanceamento não-planejado, decorrente da perda de parcelas, por exemplo, quase sempre ocorra nesse tipo de experimentação, especialmente quando os genótipos são avaliados em redes. Na abordagem de modelos mistos com efeito aleatório de tratamentos, a estimação ou a predição (termo preferido por se tratar de uma variável aleatória) das médias desses tratamentos é feita a partir do chamado BLUP (best linear unbiased predictor) dos efeitos genotípicos ( û ), derivado das equações de modelo misto (MME) de ˆ , Henderson (1984). Segundo Resende (2002), o BLUP é definido como û = C' V − 1 y − Xβ em que: C é a matriz de covariância entre os valores genotípicos (não observáveis) e os valores observáveis (dados); V-1 é a inversa da matriz de variância dos valores observáveis; y é o vetor de dados; X é a matriz de incidências para β (o vetor de efeitos fixos no modelo) ˆ é o vetor de efeitos fixos estimados pelo chamado BLUE (best linear unbiased e; β estimator). De acordo com Robinson (1991), o BLUP é um preditor não-viciado (E[û]=E[u]) e com efeito shrinkage (encolhido), em razão de seus componentes serem menos dispersos do que os correspondentes estimadores de quadrados mínimos, usados na avaliação dos efeitos fixos. Esse “encolhimento” resulta do fato de este preditor levar em consideração uma relação de co-variâncias ( C' V − 1 ), cujo valor varia entre 0 e 1, e que correspondente a um coeficiente de determinação genotípica como, por exemplo, a herdabilidade (h2). Assim, o uso do BLUP em situações em que as variâncias genotípicas (C) são baixas relativamente às variações fenotípicas (V), leva à maior concentração dos valores genotípicos preditos em torno da média experimental. Num processo seletivo intrapopulacional, isso se explica pela eliminação dos efeitos residuais de ambiente embutidos nos dados fenotípicos, em razão da multiplicação do valor fenotípico corrigido pelo coeficiente de herdabilidade do caráter sob seleção. Resende & Duarte (2007) afirmam que a aplicação de preditores shrinkage evita a suposição implícita e pouco realista, associada aos modelos fixos, de que a herdabilidade seja máxima (h2 = 1,0). Segundo Stein (1955), estimadores do tipo shrinkage são necessários sempre que houver mais de dois tratamentos em teste, independentemente se seus efeitos são assumidos como fixos ou aleatórios. A obtenção de médias por quadrados mínimos, quase ( ) 33 sempre inadimissível, segundo o autor, só é adequada quando se têm dois tratamentos em avaliação. Sua proposta alternativa, formalizada como estimador de James-Stein (1961), também apresenta efeito shrinkage sobre a média amostral (fenotípica), não requerendo, porém, qualquer suposição referente a efeitos fixos ou aleatórios, ou sobre distribuições das médias a serem estimadas (Efron & Morris, 1977). Há apenas a necessidade do relaxamento da suposição de não-vício. Nesse contexto, é relevante o fato de que abordagens analíticas distintas, resultantes do estabelecimento do efeito de determinado fator ser fixo ou aleatório, podem resultar em diferentes médias ajustadas e com possível alteração no seu ordenamento (Federer, 1996; Federer & Wolfinger, 1998; Bueno Filho, 1997; Duarte & Vencovsky, 2001; Resende, 2004; Duarte, 2000, 2006). Dessa forma, o sucesso de um programa de desenvolvimento de cultivares pode ser grandemente influenciado pela escolha da metodologia de análise estatística para os dados dos ensaios. Daí a importância de avaliações sistemáticas dos diferentes procedimentos disponíveis, objetivando a identificação daqueles que propiciem estimativas ou predições genotípicas mais acuradas. Este trabalho teve por objetivo comparar diferentes abordagens estatísticas disponíveis para a estimação e, ou, a predição de médias genotípicas, e avaliar as suas implicações no ordenamento dos genótipos em teste e na proporção de genótipos selecionados relativamente a cultivares testemunhas. Cinco abordagens estatísticas foram avaliadas: modelo fixo, modelo misto com efeito aleatório de blocos, modelo misto com efeito aleatório de tratamentos, modelo aleatório e o estimador de James-Stein. 3.2 MATERIAL E MÉTODOS 3.2.1 Caracterização dos ensaios Foram utilizados dados de produtividade de grãos provenientes de 47 experimentos da rede de ensaios regionais de avaliação de variedades de milho, conduzida pela Agência Goiana de Desenvolvimento Rural e Fundiário de Goiás (AgenciaRural), em parceria com a Fundação de Desenvolvimento Assistência Técnica e Extensão Rural de Goiás (Fundater). Os ensaios foram conduzidos durante quatro safras de verão: 2002/03, 2003/04, 2004/05 e 2005/06. Ao longo de todo o período foram avaliados 41 genótipos (Tabela 3.1), em 19 locais (Tabelas 3.2 e 3.3), totalizando 47 ensaios nas quatro safras. 34 Tabela 3.1. Genótipos testados nos ensaios da rede de avaliação de variedades de milho da Agência Goiana de Desenvolvimento Rural e Fundiário, empresa produtora e anos agrícolas das avalições. Genótipo Airã AL200205 AL25 AL30 AL34 AlBandeirante AlBianco Alvorada AREgo18 AsPreto BR106 BRS1010 BRS2020 BRS4150 BRS473 BRSCaimbé Cativerde1 Cativerde2 Cerrado Emca202 Emgopa501 1 Tipo1 V V V V V V V V V V V HS HD V V V V V V V V Empresa Produtora Cegran/IAC Cati Cati Cati Cati AgenciaRural Cati Cati AgenciaRural Embrapa AgenciaRural Embrapa Embrapa Embrapa Embrapa Embrapa Cati Cati Embrapa Emcapa AgenciaRural 2002/ 2003/ 2004/ 2005/ 03 x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x 2 04 2 05 2 06 2 Genótipo IAC8333 Ipiranga IPR114 IPV7352 Orion PC0201 PC0202 PC0203 PC9703 PC9902 PC9903 Piratininga Samambóleo Samambaia Saracura SHS3030 SHS3031 Sol da manhã UFVM100 UFVM200 - Tipo HV V V V V V V V V V V V V V V V V V V - Empresa Produtora IAC Cati Iapar Iapar 2002/ 2003/ 2004/ 2005/ 032 x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x 042 052 x x x x x 062 HM PhDSementes Iapar Iapar Iapar Iapar Iapar Iapar Cati UFG UFG Embrapa S. Helena S. Helena Embrapa UFV UFV - - V, variedade; HS, híbrido simples; HD, híbrido duplo; HM, híbrido duplo modificado; e HV, híbrido intervarietal. 2 - A presença do x nas colunas indica a inclusão do genótipo na avaliação da referida safra. Tabela 3.2. Ambientes, coordenadas geográficas e datas de plantio dos ensaios de competição de variedades de milho, na rede de ensaios da Agência Goiana de Desenvolvimento Rural e Fundiário, nas safras 2002/03 e 2003/04, em Goiás. Ambientes Latitude Sul 1 Longitude Oeste 1 Altitude (m) Safra 2002/03 Data de Plantio Safra 2003/04 Data de Plantio Campo Alegre Goianésia Goiatuba Inhumas Ipameri Itaberaí Itumbiara Morrinhos Orizona Palmeiras Porangatu Rio Verde Senador Canêdo Senador Canêdo2 1 17º41’15” 47º48’55” 15º18’45” 49º03’45” 18º03’45” 49º18’45” 16º18’45” 49º26’15” 17º41’15” 48º11’15” 28” 16º03’45” 49º48’45” 18º26’15” 49º11’15” 17º41’15” 49º03’45” 17º03’45” 48º18’45” 16º48’45” 49º56’15” 13º26’15” 49º11’15” 17º48’45” 50º 56’15” 16º41’15” 49º03’45” 16º41’15” 49º03’45” 920 670 580 800 800 640 420 830 910 560 620 745 741 741 x x x x x x x x x x 26/11/2002 7/12/2002 13/11/2002 x x x x x x x x x x x 22/11/2003 12/11/2003 10/11/2003 1/12/2003 2/12/2003 5/11/2003 31/10/2003 18/11/2003 14/11/2003 4/11/2003 27/11/2002 8/11/2002 20/11/2002 7/11/2002 29/11/2002 - Fonte: http://www.cdbrasil.cnpm.embrapa.br/go/ (Coordenadas referentes aos pontos centrais dos locias, acesso em: 01/12/2006). 35 Tabela 3.3. Ambientes, coordenadas geográficas e datas de plantio dos ensaios de competição de variedades de milho, na rede de ensaios da Agência Goiana de Desenvolvimento Rural e Fundiário, nas safras 2004/05 e 2005/06, em Goiás. Latitude Longitude Altitude Safra Data de Safra Data de Sul1 Oeste1 18º11’15” 49º41’15” Bom Jesus 16º56’15” 51º48’45” Caiapônia 17º41’15” 47º48’55” Campo Alegre 15º18’45” 49º03’45” Goianésia 18º03’45” 49º18’45” Goiatuba 16º56’15” 49º11’15” Hidrolândia 16º18’45” 49º26’15” Inhumas 17º41’15” 48º11’15” Ipameri 28” 16º03’45” 49º48’45” Itaberaí 18º26’15” 49º11’15” Itumbiara 16º03’45” 51º26’15” Montes Claros 17º41’15” 49º03’45” Morrinhos 17º03’45” 48º18’45” Orizona 16º48’45” 49º56’15” Palmeiras 13º26’15” 49º11’15” Porangatu 17º48’45” 50º 56’15” Rio Verde Senador Canêdo 16º41’15” 49º03’45” 1 Ambientes (m) 619 750 950 670 650 775 800 800 640 420 472 771 910 560 620 836 741 2004/05 x x x x x x x x x x x x x x x Plantio 5/11/2004 25/11/04 9/12/2004 20/11/2004 26/11/2004 2/12/2004 10/11/2004 15/11/2004 9/11/2004 3/12/2004 30/10/2004 29/10/2004 11/11/2004 12/11/2004 04/11/04 2005/06 x x x x x x x x Plantio 11/11/2005 05/11/2005 25/11/2005 14/11/2005 10/11/2005 08/11/2005 25/11/2005 16/11/2005 x x x x 04/11/2005 28/12/2005 25/11/2005 03/12/2005 - Fonte: http://www.cdbrasil.cnpm.embrapa.br/go/ (Coordenadas referentes aos pontos centrais dos locais, acesso em: 01/12/2006). Nos experimentos das diferentes safras foram utilizadas três repetições por tratamento, sendo adotado o delineamento em látice, com as seguintes variações: látice 5 x 3, com 15 tratamentos em 2002/03; látice 6 x 4, com 24 tratamentos em 2003/04; látice 7 x 4, com 28 tratamentos em 2004/05; e látice 6 x 3, com 18 tratamentos em 2005/06. Os tratamentos consistiram de variedades e híbridos pré-comerciais e comerciais, tendo variado de um ano para outro, como resultado da substituição natural de genótipos em programas de melhoramento genético de plantas. Cada parcela consistiu de duas linhas com as seguintes variações: 4,0 m a 5,0 m de comprimento, espaçadas de 0,4 m a 1,0 m nas entrelinhas. Por esse motivo, os dados individuais de produção por parcela foram ajustados por análise de covariância, para uma população inicial de 60 mil plantas por hectare, conforme preconizam Vencovsky & Barriga (1992). Na análise de cada experimento, o modelo geral do delineamento em látice, a menos das suposições assumidas para os seus efeitos, é o seguinte: Yijk = µ + ρj + βk(j) + τi + εijk (1) em que: Yijk é o valor observado do tratamento i, no bloco k, dentro da repetição j; µ é a média geral do experimento; ρj é o efeito da repetição com j; βk(j) é o efeito do bloco k 36 dentro da repetição j; τi é o efeito do tratamento i e; εijk é o erro experimental associado à observação Yijk. 3.2.2 Estimação e predição das médias genotípicas Para facilitar a operacionalização computacional das análises associadas às diferentes abordagens estatísticas em avaliação, o modelo (1) foi reescrito agrupando-se os efeitos de blocos e repetições em uma única fonte de controle local da variação. Isso não interfere nos ajustes dos efeitos dos tratamentos, embora garanta a obtenção de médias estimáveis, por exemplo, no ajuste do modelo através do SAS®. Dessa forma, o modelo adotado foi: Yij = µ + βj + τi + εij (2) em que: Yij é o valor observado do tratamento i, no bloco j; µ é a média geral do experimento; τi é o efeito do tratamento i; βj é o efeito do bloco; e εijk é o erro experimental associado à observação Yijk. Portanto, a partir daqui o índice j cobre todos os blocos do experimento, independentemente da repetição. As abordagens estatísticas em avaliação foram identificadas de maneira resumida, seguindo a notação de Santos (2001), em que “A” indica efeito aleatório e “F”, efeito fixo; e, primeiramente o efeito do bloco, depois o de tratamento, conforme a ordem apresentada no modelo (2). Assim, as abordagens avaliadas foram: o modelo fixo (FF), isto é, com efeitos de bloco e de tratamento assumidos como fixos, e que corresponde à análise intrablocos; o modelo misto com efeito aleatório de blocos (AF), correspondente à análise com recuperação da informação interblocos; o modelo misto com efeito aleatório de tratamentos (FA), cuja análise recupera a informação intergenotípica; e o modelo aleatório (AA), que recupera ambas informações. Adicionalmente foi avaliado o estimador de James-Stein (1961), aqui designado por JS, que corresponde a um estimador shrinkage alternativo para as médias genótípicas, haja vista que os modelos FA e AA também produzem médias shrinkage. No modelo (2), assumiram-se a independência entre os termos µ, βj, τi e εij e as seguintes distribuições para as respectivas abordagens: FF – εij~N(0,σ2e); AF – βj~N(0,σ2b) e εij~N(0,σ2e); FA – τi~N(0,σ2g) e εij~N(0,σ2e); e AA – βj~N(0,σ2b), τi~N(0,σ2g) e εij~N(0,σ2e). Conforme Efron & Morris (1977), o estimador de James-Stein (1961) não 37 requer quaisquer suposições referente aos efeitos fixos ou aleatórios, ou sobre distribuições das médias a serem estimadas. Matricialmente, o modelo FF, em que blocos e tratamentos são admitidos como fixos, pode ser escrito em notação como: y = Χβ + ε , sendo y o vetor de observações; X, a matriz de incidência do delineamento; β, o vetor de efeitos fixos desconhecidos (µ, βj e τi); e ε, o vetor de erros de efeito aleatório, com var(ε) = Iσ2 e, conseqüentemente, var(y) = V = Iσ2. Nesse caso, o vetor de médias genotípicas é uma função paramétrica dos efeitos em β, ou seja, L’β, cujo melhor estimador linear não-viciado (BLUE) pode ser ˆ , sendo L’ a matriz de coeficientes dos efeitos fixos apresentado como: BLUE(L’β) = L’ β naquela função. A descrição genérica dos modelos mistos e aleatório (AF, FA e AA) pode ser: y = Χβ + Zu + ε , em que y é o vetor de observações; X é a matriz de incidência dos efeitos contidos em β (somente µ no caso do modelo AA), que corresponde ao vetor de efeitos fixos a serem estimados; Z é a matriz de incidência dos efeitos contidos em u, que é o vetor dos efeitos aleatórios a serem preditos, assumido u~N(φ,G); e ε é o vetor de erros, assumido ε ~N(φ,R). Por conseguinte, E(y) = Xβ e var(y) = V = ZGZ’ + R, em que G e R são as matrizes de variâncias-covariâncias dos vetores aleatórios u e ε, respectivamente. Dessa forma, as covariâncias entre vetores diferentes são assumidas como nulas (Henderson, 1984). Essa modelagem, segundo Duarte (2000), generaliza qualquer estrutura de correlação entre as observações, seja pela inclusão de novos fatores aleatórios no modelo (matriz G), seja pela existência de correlação espacial ou temporal entre as unidades de observação (matriz R). No presente caso, por simplificação, adotararam-se as seguintes estruturas para essas matrizes: G = Iσ2b, em AF; G = Iσ2g, em FA; G = [Iσ2b ⊕ Iσ2g] (sendo ⊕ o operador soma direta), em AA; e, ainda, R = Iσ2e em todos esses casos. O BLUE de β (vetor de efeitos fixos), obtido como solução de quadrados ˆ = Χ' V ˆ -1 Χ mínimos generalizados, dada por β ( ) − ˆ − 1 y , resulta da solução do sistema de Χ' V equações do modelo misto de Henderson (MME). Desta solução resulta também a predição ˆ , em que: C ˆ 'V ˆ − 1 y − Xβ ˆ é a dos efeitos aleatórios ((BLUP de u), expressa por: û = C matriz de covariância entre os valores genotípicos (não observáveis) e os valores ˆ = G ˆ Z' , e V ˆ − 1 é a inversa de uma estimativa da observáveis (dados), dada também por: C ( ) 38 ˆ . Dessa forma, o vetor de médias genotípicas é uma função linear que combina matriz V efeitos fixos e aleatórios, isto é: w = L’β + u, sendo L’ a matriz de coeficientes dos efeitos fixos na respectiva função. Searle et al. (1992) apontam que, para L’β estimável, o preditor de w possui propriedades de BLUP (erro quadrático mínimo, linearidade em relação a y e ˆ+ u ˆ. não-tendenciosidade), podendo ser calculado como: BLUP(w) = L' β As médias dos tratamentos resultantes da aplicação do estimador de JamesJS Stein (JS) são obtidas pela expressão: Yi = k (Yi. − Y..) + Y.. , sendo k o fator regressor da média amostral de determinado genótipo sobre a média geral, dado por: k = 1 − x F , em que F é o valor obtido do teste F de Snedecor (centrado na média geral) para a fonte de variação tratamentos, na análise de variância do modelo (2) assumido como fixo. Resende & Duarte (2007) recomendam que o valor x varie com o número de tratamentos avaliados, o que, no presente estudo, resultou na Tabela 3.4. Tabela 3.4 Valores de x para determinação do fator k de encolhimento (shrinkage) a ser utilizado na expressão do estimador de James-Stein (1961) para a média amostral, em função do número de tratamentos envolvidos em cada experimento. Número de tratamentos 15 18 x 0,86 0,88 Número de tratamentos 24 28 x 0,909 0,921 3.2.3 Implementação computacional As planilhas eletrônicas com os dados experimentais foram construídas no aplicativo Microsoft Excel®, com as seguintes informações nas colunas: número do experimento, safra, ambiente (local), tratamento (cultivar), repetição, bloco, produtividade (kg.ha-1) e população de plantas por hectare, como no exemplo a seguir: Experimento 1 Safra S2002_03 Local Goiatub a Cultivar Saracura Repetição 1 Bloco 5 Produção 5193 População de plantas 46667 Para a implementação das diferentes abordagens de estimação e predição de médias genotípicas, com exceção do estimador de James-Stein, foi utilizado o PROC 39 MIXED (procedure for mixed models) do SAS®, com estimação dos componentes de variância por máxima verossimilhança restrita (REML), a partir dos seguintes comandos: Title “Modelo fixo - FF” proc mixed data= TESE; classes EXPERI SAFRA LOCAL CULT BLOCO; model RENDGRAO = BLOCO CULT; lsmeans CULT; ods listing exclude lsmeans; ods output lsmeans = FIXO; by EXPERI; run; Title “Modelo misto com efeito aleatório de blocos - AF” proc mixed data= TESE; classes EXPERI SAFRA LOCAL CULT BLOCO; model RENDGRAO = CULT; random BLOCO; lsmeans CULT; ods listing exclude lsmeans; ods output lsmeans = BLOALE; by EXPERI; run; Title “Modelo misto com efeito aleatório de tratamentos - FA” proc mixed data= TESE; classes EXPERI SAFRA LOCAL CULT BLOCO; model RENDGRAO = BLOCO; random CULT / solution; ods listing exclude solutionr; ods output solutionr = TRATAL; by EXPERI; run; Title “Modelo aleatório - AA” proc mixed data= TESE; classes EXPERI SAFRA LOCAL CULT BLOCO; model RENDGRAO = ; random BLOCO CULT / solution; ods listing exclude solutionr; ods output solutionr = ALEATO; by EXPERI; run; As estimativas de James-Stein foram obtidas por meio de planilha eletrônica Excel®, com os cálculos envolvendo a função lógica: “se F > 1, k = 1- (x/F); se F < 1, k = JS 0”, mais a expressão Yi = k (Yi. − Y..) + Y.. . Assim, ao se assumir k = 0, a média James- Stein das cultivares correspondeu à média geral do experimento ( Y..) . Dessa forma, a planilha eletrônica reuniu, por exemplo, as seguintes informações por tratamento, sendo as cinco primeiras colunas obtidas do ajuste do modelo FF: Experimento 1 Safra 2002_03 Cultivar Airã Yi. 7357 Y.. 6459 F 1,4287 k 0,398074 YiJS 6816,44 3.2.4 Comparação dos diferentes estimadores e preditores Nos diferentes experimentos, foram avaliados: i) os percentuais de genótipos selecionados relativamente às cultivares testemunhas, previamente escolhidas, por abordagem estatística, isto é, a proporção dos genótipos avaliados cujas médias estimadas/preditas foram superiores à média dessas testemunhas; ii) a coincidência nessa seleção de genótipos entre os diferentes pares de abordagens estatísticas; e iii) as diferenças no ordenamento dos genótipos em função das médias estimadas/preditas pelas diferentes abordagens. Como referência para a seleção dos genótipos, adotou-se a média da produtividade de duas cultivares testemunhas, em cada safra. A escolha destas testemunhas incluiu: a cultivar ALBandeirante, em razão de ter sido avaliada em todas as safras e, 40 também, por apresentar alta produtividade; e outra cultivar, que variou conforme a safra, em função da elevada produtividade média (Saracura em 2002/03, IPR114 em 2003/04, Emcapa202 em 2004/05 e BR106 em 2005/06). Após a estimação da média de cada testemunha, por modelo fixo (FF), calculou-se a média aritmética de suas produtividades, o que representou o valor de corte (referência) para a seleção de genótipos, em cada experimento. Dessa forma, foram selecionados aqueles cujas médias superaram esse valor de referência, em cada abordagem estatística e experimento. Em seguida, calcularam-se o percentual dos genótipos avaliados que foram selecionados por abordagem, bem como a porcentagem de coincidência desses genótipos entre pares de abordagens. A partir das estimativas das variâncias obtidas do ajuste do modelo AA, foi calculado também o coeficiente de determinação genotípica (h2’), parâmetro análogo à herdabilidade intrapopulaconal no sentido amplo: 2 ˆg σ h '= 2 ˆg + σ ˆ2 ˆ2 σ b + σe 2 ˆ 2g é a variância genotípica estimada entre cultivares; σ ˆ 2b é a variância estimada em que: σ ˆ 2e é a estimativa da variância residual. entre blocos; e σ Esse parâmetro foi estimado para se avaliar o nível de controle genético relativo em cada experimento e, também, com o propósito de se constituírem classes de experimentos similares neste quesito. Assim, a comparação entre as abordagens estatísticas considerou, também, as classes de variação genotípica dos experimentos. 3.3 RESULTADOS E DISCUSSÃO De forma geral, os coeficientes de variação experimental (CV) e as médias de produtividades dos 47 ensaios foram aceitáveis e condizentes com experimentos de avaliação de genótipos de milho. Os valores de CV variaram de 5,6% a 18,2%, enquanto as médias de produtividade ficaram entre 3.564 kg.ha-1 e 9.207 kg.ha-1 (Figura 3.1). De acordo com o Ministério da Agricultura Pecuária e Abastecimento – MAPA (1998), em seu documento sobre Registro Nacional de Cultivares (RNC), o valor de cultivo e uso (VCU) é o valor intrínseco de combinação das características agronômicas da cultivar com as suas propriedades de uso em atividades agrícolas, industriais, comerciais e, ou, de consumo. No Anexo V deste documento – Requisitos Mínimos para Determinação do Valor de Cultivo e 41 Uso de Milho (Zea mays), que trata dos requisitos mínimos para a determinação de VCU em milho, estabelece-se que: i) os genótipos devem ser testados em no mínimo três locais por região edafoclimática de importância para a cultura, por ano; ii) os ensaios devem ser avaliados por no mínimo dois anos e, ou, duas estações de cultivo; iii) os experimentos devem ser instalados com delineamento experimental em blocos, com pelo menos duas repetições por local, e duas fileiras por parcela; iv) os ensaios devem apresentar duas testemunhas já inscritas no RNC; e v) o valor máximo permitido para o coeficinte de variação é de 20%. Nesse contexto, todos os ensaios utilizados no presente estudo atenderam as disposições previstas para o registro nacional de cultivares (RNC). 20 18 16 14 12 CV (%) 10 8 6 4 2 0 Goianésia 02/03 Goiatuba 02/03 Inhumas 02/03 Ipameri 02/03 Morrinhos 02/03 Palmeiras 02/03 Porangatu 02/03 S.Canêdo 02/03 S.Canêdo2 02/03 C.Alegre 03/04 Goianésia 03/04 Inhumas 03/04 Ipameri 03/04 Itaberaí 03/04 Itumbiara 03/04 Morrinhos 03/04 Orizona 03/04 Porangatu 03/04 R.Verde 03/04 S.Canêdo 03/04 B.Jesus 04/05 C.Alegre 04/05 Goianésia 04/05 Goiatuba 04/05 Inhumas 04/05 Ipameri 04/05 Itaberaí 04/05 Itumbiara 04/05 M.Claros 04/05 Morrinhos 04/05 Orizona 04/05 Palmeiras 04/05 Porangatu 04/05 R.Verde 04/05 S.Canêdo 04/05 C.Alegre 05/06 Caiapônia 05/06 Goianésia 05/06 Goiatuba 05/06 Hidrolândia 05/06 Inhumas 05/06 Ipameri 05/06 Itaberaí 05/06 Orizona 05/06 Porangatu 05/06 R.Verde 05/06 S.Canêdo 05/06 coeficiente de variação experimental (%) média de produtividade do experimento kg.ha -1 9500 9000 8500 8000 7500 7000 6000 5500 5000 4500 4000 3500 -1 . 6500 Figura 3.1. Coeficientes de variação experimental (%) e médias de produtividade (kg.ha-1) dos experimentos avaliados nas safras 2002/03, 2003/04, 2004/05 e 2005/06, estimados segundo o modelo fixo. Em termos dos percentuais de genótipos selecionados, devido ao fato de que para serem selecionados os genótipos teriam que apresentar médias superiores à média das cultivares testemunhas, esses percentuais variaram, tanto entre experimentos da mesma safra, quanto entre as safras. De forma geral, na safra 2002/03, nos experimentos em que a média das testemunhas foi inferior à média do experimento, situação observada em Morrinhos, Senador Canêdo 2, Inhumas e Goiatuba, houve tendência de as abordagens com shrinkage das médias genotípicas (FA, AA e JS) resultarem em maiores percentuais de seleção, quando comparadas aos casos em que as médias das testemunhas superaram as médias experimentais, independentemente do valor de h2’ (Figura 3.2). Por outro lado, cabe ressaltar que, o uso de modelos com efeito fixo de tratamento (FF e AF) sempre promoveu, nos diferentes experimentos, algum percentual de seleção diferente de zero, kg.ha . 42 ainda que os valores de h2’ fossem baixíssimos e as médias de testemunhas e experimental fossem reduzidas. 100 90 . 8000 80 70 60 50 40 30 20 5500 10 0 Morrinhos Ipameri Palmeiras Porangatu Goianésia S.Canêdo2 Inhumas Goiatuba S.Canêdo 5000 6500 7500 . kg.ha -1 2 h ' . (%) 8500 percentual de seleção/ 7000 6000 modelo fixo mod. misto com efeito aleatório de tratamento estimador de James-Stein média do experimento mod. misto com efeito aleatório de bloco modelo aleatório média das testemunhas coeficiente de determinação genotípica (%) Figura 3.2. Percentual de genótipos selecionados por experimento, com médias superiores à das testemunhas, por modelo, médias de produtividade dos experimentos e das testemunhas e coeficiente de determinação genotípica (h2’) durante a safra 2002/03. Na safra 2003/04, nos experimentos de Porangatu, Senador Canêdo e Ipameri, em que a média experimental e das testemunhas foram altas, e os valores de h2’ ficaram acima de 43%, as diferentes abordagens testadas apresentaram os mesmos percentuais de seleção (Figura 3.3). Apenas no experimento de Itaberaí – único que exibiu média de produtividade acima da média das testemunhas – o percentual de seleção das abordagens com efeito shrinkage foi superior aos demais, ainda que o valor do seu h2’ tenha sido o menor de toda a safra (17%). Nos demais casos, em que a média das testemunhas superou a média dos experimentos, houve tendência de predominar maiores percentuais de seleção nos modelos FF e AF, mesmo em ensaios como Campo Alegre e Morrinhos, cujas médias de produtividade ficaram próximas a 4.000 kg.ha-1. Na safra 2004/05, o uso de abordagens do tipo shrinkage resultou em percentuais de seleção próximos aos exibidos pelos modelos FF e AF, nos experimentos de Morrinhos e Orizona, em que as médias das testemunhas foram inferiores à média experimental (Figura 3.4). Excetuando-se estes dois experimentos, em geral, os maiores percentuais de genótipos selecionados resultaram da aplicação dos modelos FF e AF, em ensaios com médias de testemunhas superiores às médias dos experimentos. Apenas no 43 experimento de Porangatu, em que a média experimental foi superior à média da testemunha, não houve diferença entre os percentuais de seleção das diferentes abordagens. 80 9000 8500 8000 70 60 (%) . . 2' h 7500 7000 6500 6000 percentual de seleção / 50 40 30 20 5500 5000 4500 10 0 C.Alegre Porangatu Morrinhos Itumbiara Itaberaí Goianésia Orizona R.Verde S.Canêdo Inhumas Ipameri modelo fixo mod. misto com efeito aleatório de tratamento estimador de James-Stein média do experimento mod. misto com efeito aleatório de bloco modelo aleatório média das testemunhas coeficiente de determinação genotípica (%) 4000 3500 Figura 3.3. Percentual de genótipos selecionados por experimento, com médias superiores à das testemunhas, médias de produtividade dos experimentos e das testemunhas e coeficiente de determinação genotípica (h2’), por modelo durante a safra 2003/04. Como observado nas demais safras, na maioria dos ensaios de 2005/06, os maiores percentuais de seleção de genótipos resultaram da utilização dos modelos FF e AF, sendo que nestes, a média das testemunhas superou a média experimental, repetindo a tendência das safras anteriores (Figura 3.5). No experimento de Porangatu, único em que a média experimental ficou acima da média das testemunhas, houve superioridade no percentual de seleção obtido com a aplicação das abordagens de efeito shrinkage. Apenas no experimento de Senador Canêdo, que exibiu um dos mais altos valores de h2’ na safra, não houve diferença entre os percentuais de seleção dos modelos estudados. Quando se compara a porcentagem de genótipos selecionados pelos diferentes procedimentos, em cada safra, percebe-se que, com exceção da safra 2002/03, o uso do estimador de James-Stein levou, em geral, aos menores percentuais, com proporções próximas às obtidas com os modelos FA e AA. O uso das três abordagens, todas produzindo médias shrinkage, reduziu o percentual de seleção de genótipos nos kg.ha-1 . 44 experimentos cuja média foi inferior à média das testemunhas. Por outro lado, como corroborado por Duarte (2000), quando a média geral dos genótipos sob seleção é superior 60 . 10000 9500 50 9000 8500 h2 .' 40 / 8000 7500 kg.ha-1 kg.ha-1 . 45 40 35 30 25 20 15 10 5 0 R.Verde Porangatu Ipameri Inhumas S.Canêdo Itaberaí HidrolândiaGoianésia Goiatuba C.Alegre Orizona Caiapônia mod. misto com efeito aleatório de bloco modelo aleatório média das testemunhas coeficiente de determinação genotípica (%) 5000 4500 8000 7500 7000 6500 6000 5500 modelo fixo mod. misto com efeito aleatório de tratamento estimador de James-Stein média do experimento 30 7000 6500 20 6000 5500 10 5000 4500 0 C.Alegre Itaberaí Itumbiara PorangatuM.Claros Inhumas Morrinhos Palmeiras B.Jesus S.Canêdo Ipameri Goianésia R.Verde Orizona Goiatuba . percentual de seleção (%) 4000 modelo fixo mod. misto com efeito aleatório de tratamento estimador de James-Stein média do experimento mod. misto com efeito aleatório de bloco modelo aleatório média das testemunhas coeficiente de determinação genotípica (%) Figura 3.4. Percentual de genótipos selecionados por experimento, com médias superiores à das testemunhas, médias de produtividade dos experimentos e das testemunhas e coeficiente de determinação genotípica (h2’) e, por modelo durante a safra 2004/05. 65 60 . 55 h2' . (%) 50 9500 9000 8500 percentual de seleção / 45 Figura 3.5. Percentual de genótipos selecionados por experimento, com médias superiores à das testemunhas, médias de produtividade dos experimentos e das testemunhas e coeficiente de determinação genotípica (h2’) e por modelo durante a safra 2005/06. à média das testemunhas, a adoção de estimadores shrinkage resulta em maiores percentuais de seleção de genótipos. Segundo o autor, a abordagem de tratamentos aleatórios tende a proteger populações de bom potencial (selecionar mais genótipos), contrariamente àquelas de baixo potencial (média dos genótipos sob seleção inferior a das testemunhas). Nestes casos, esses modelos tendem a descartar maior proporção dos genótipos em teste. Esse comportamento foi verificado em todas as safras avaliadas, indicando que a aplicação dessas abordagens implica em maior preservação de materiais genéticos, quando suas médias são elevadas relativamente à média das testemunhas escolhidas. Por esta razão, tais abordagens devem ser preferidas, já que o seu uso aponta para uma maior porcentagem de seleção de genótipos promissores. Vários estudiosos (Hill & Rosenberger, 1985; Stroup & Mulitze, 1991; Piepho, 1994; Resende et al., 1996; Piepho, 1998; Duarte, 2000; Smith et al., 2001; Duarte & Vencovsky, 2001; Resende, 1999; 2002; 2004; Resende & Duarte, 2007) enfatizam a preferência pelo uso de estimadores/preditores do tipo shrinkage, independentemente de os efeitos sob estudo serem assumidos como fixos por abordagens tradicionais. Comparando-se os resultados dos diferentes ensaios, pode-se concluir que, nas situações em que os valores de h2’ são altos, superiores a 70%, não são observadas diferenças nos percentuais de seleção obtidos com o uso das diferentes abordagens estatísticas. Isso ressalta a importância do conhecimento das estimativas de herdabilidade dos caracteres que se desejam avaliar, pois ao se optar pelo uso de modelos em que os efeitos dos genótipos são admitidos como fixos, em ensaios com baixa herdabilidade, aumenta-se o risco de se selecionar materiais pouco promissores. Em média, nos 47 experimentos, as porcentagens de seleção provenientes da adoção dos modelos FF e AF (com genótipos de efeito fixo) foram mais altas em relação às demais abordagens, com seleção mínima de 14,5% dos genótipos avaliados, mesmo em situações de valores bastante baixos de h2’, (Figura 3.6). Isso pode representar desperdício de recursos na condução do programa de melhoramento, com efeitos negativos na eficiência da avaliação genotípica e no tempo mínimo para a liberação de uma cultivar. 46 38 33 . 28 percentual de seleção 23 18 13 8 4 17 26 34 44 55 64 73 coeficiente de determinação genotípica (%) modelo fixo mod. misto com efeito aleatório de tratamento mod. misto com efeito aleatório de bloco modelo aleatório estimador de James-Stein Figura 3.6. Percentuais de seleção de genótipos por modelo relativamente à média das testemunhas, em função do coeficiente de determinação genotípica (h2’) nas safras 2002/03, 2003/04, 2004/05 e 2005/06. Em relação às coincidências entre os genótipos selecionados pelas diferentes abordagens, quando os experimentos foram agrupados em termos de h2’, constatou-se que as maiores coincidências resultaram do uso dos modelos FF e AF (Tabela 3.5). Isso, de certa forma, já era esperado, visto que em ambos, a estimação dos efeitos de tratamentos é feita sob a mesma suposição para estes efeitos. Para valores de h2’ superiores a 70%, houve maior equilíbrio de coincidências de seleção de genótipos entre os diversos pares de abordagens, com 100% de coincidência entre FF, AF, AA e JS. Tabela 3.5. Percentuais de coincidências de genótipos selecionados relativamente à média de cultivares testemunhas, por par de abordagens estatísticas (FF – modelo fixo, AF – modelo misto com efeito aleatório de blocos, FA – modelo misto com efeito aleatório de tratamentos, AA – modelo aleatório, e JS – estimador de James-Stein), segundo classes do coeficiente de determinação genotípica (h2’) observado em 47 experimentos varietais de milho (Goiás, 2002/03 a 2005/06). Classes 0 10 20 30 40 50 60 70 —| —| —| —| —| —| —| —| 10 20 30 40 50 60 70 80 Média h2' (%) 4 17 26 35 44 55 64 74 Número de experimentos 2 4 11 8 11 7 3 1 FF x JS 0 76 77 87 85 79 85 100 FF x AF 100 86 100 100 100 100 100 100 FF x FA 0 78 78 86 84 79 85 91 FF x AA 0 84 67 83 78 89 85 100 JS x AF 0 73 75 82 84 79 85 100 JS x FA 0 100 77 86 82 76 85 91 JS x AA 0 81 69 79 75 79 85 100 AF x FA 0 76 83 80 82 79 85 91 AF x AA 0 92 73 86 78 89 92 100 FA x AA 0 81 77 79 75 79 85 91 47 Em todos os experimentos avaliados, foi observada alteração no ordenamento das médias genotípicas, como resultado da aplicação das diferentes abordagens estatísticas, o que também corrobora constatações de outros autores (Bueno Filho, 1997; Federer & Wolfinger, 1998; Duarte, 2000; Bueno Filho & Vencovsky, 2000; Duarte & Vencovsky, 2001; Piepho & Möhring, 2006; Resende & Duarte, 2007). Dessa forma, o melhorista, ao optar por determinada abordagem em detrimento de outra, poderá descartar diferentes genótipos do programa de melhoramento. Optando-se por uma abordagem de menor eficiência, corre-se o risco de levar para o próximo ciclo de seleção genótipos com baixa probabilidade de sucesso, em razão da baixa acurácia na inferência das médias genotípicas associadas ao método escolhido. Na Figura 3.7, proveniente do experimento conduzido em Morrinhos, safra 2002/03, podem ser observadas tanto a alteração no ordenamento das médias das cultivares, como as diferenças no número de genótipos selecionados relativamente às testemunhas, nas diferentes abordagens. Nesta situação constatou-se também um forte efeito shrinkage sobre as médias genotípicas, obtidas do ajuste do modelo FA, bem como com o estimador de James-Stein, que, neste caso, converteu todas as médias genotípicas para um ponto comum (média geral). Apesar disso, o estimador JS levaria à seleção de todos os genótipos, haja vista esta média comum ser superior à média das testemunhas. Em situações, como a do experimento de Senador Canêdo (Figura 3.8), com h2’ igual a 15%, o efeito shrinkage do estimador JS e do modelo FA levaria ao descarte de todos os genótipos em teste. Neste caso, além das diferenças observadas nas quantidades de genótipos selecionados pelas abordagens avaliadas, sendo os modelos AF e FF os que mais selecionaram, houve também a alteração no ordenamento das médias genotípicas, também já reportada em outros estudos (Bueno Filho, 1997; Federer & Wolfinger, 1998; Duarte & Vencovsky, 2001; Piepho & Möhring, 2006; Resende & Duarte, 2007). 48 6250 6050 5850 5650 5450 5250 5050 4850 4650 4450 modelo fixo 6 Aira 6 ALBandeirante 6 IAC8333 6 Saracura James-Stein 6 AL25CATI 6 ARuralEgo18 6 IPR114 6 SHS3030 modelo misto efeito modelo misto efeito modelo aleatório aleatório de bloco aleatório de tratamento 6 AL30CATI 6 AL34CATI 6 BRS473 6 Emcapa202 6 PC9703 6 UFGSamambaiaóleo 6 SolManhã 6 média das testemunhas Figura 3.7. Médias dos genótipos do experimento de Morrinhos, na safra 2002/03, obtidas pelas diferentes abordagens estatísticas (modelo fixo (FF), modelo misto com efeito aleatório de blocos (AF), modelo misto com efeito aleatório de tratamentos (FA), modelo aleatório (AA) e estimador de James-Stein (JS)), comparadas com a média de duas cultivares testemunhas. 9000 8500 8000 7500 7000 6500 modelo fixo 9 Aira 9 ALBandeirante 9 IAC8333 9 Saracura James-Stein 9 AL25CATI 9 ARuralEgo18 9 IPR114 9 SHS3030 modelo misto efeito aleatório de bloco modelo misto efeito aleatório de tratamento modelo aleatório 9 AL30CATI 9 BRS473 9 PC9703 9 SolManhã 9 AL34CATI 9 Emcapa202 9 UFGSamambaiaóleo 9 média das testemunhas Figura 3.8. Médias dos genótipos do experimento de Senador Canêdo, na safra 2002/03, obtidas pelas diferentes abordagens estatísticas (modelo fixo (FF), modelo misto com efeito aleatório de blocos (AF), modelo misto com efeito aleatório de tratamentos (FA), modelo aleatório (AA) e estimador de James-Stein (JS)), comparadas com a média de duas cultivares testemunhas. 49 No caso da ocorrência de valores de h2’ nulos, como no ensaio de Rio Verde (Figura 3.9), em que a ausência de variabilidade genotípica apontada pelas abordagens JS, FA e AA levaria ao descarte de todos os genótipos em teste, os modelos FF e AF ainda selecionaram, respectivamente, seis e quatro cultivares. Isso seria inadmissível se a herdabilidade paramétrica fosse realmente nula. Entretanto, há de se admitir que, como os genótipos provêm de diferentes programas de seleção e pelas diferenças nos valores de h 2’ observadas nos demais experimentos da mesma safra, existe indicação de que talvez os ajustes de médias obtidos pelas abordagens JS, FA e AA não sejam válidos para esta situação. Tomé et al. (2002), ao compararem, por meio de simulação, diferentes abordagens estatísticas para a análise de dados em delineamento látice, observaram que os modelos FA e AA apresentam os maiores percentuais de ajustes não-válidos. Contudo, com o aumento da precisão experimental, observaram aumentos no percentual de ajustes válidos a partir do modelo FA; ou seja, aumentaram-se as estimativas de componentes de variância não nulas, o que não aconteceu com as abordagens AF e AA. Em estudo de simulação associado à presente pesquisa, as abordagens FA, AA e JS (com efeito shrinkage) apresentaram, respectivamente, 14,5%, 11,9% e 13,5% de ajustes não-válidos, quando os experimentos foram pequenos (com 15 tratamentos) e com valores de h 2’ entre 6% e 48%. Por outro lado, sob valores de h2’ entre 63% e 82%, isto é, em experimentos com variância genotípica mais elevada, não se observou mais a ocorrência dos ajustes nãoválidos nestas abordagens. Essas indicações levam a crer que, no experimento de Rio Verde, safra 2004/05 (Figura 3.9), apesar de o coeficiente de variação ter sido de 13,98%, as baixas variâncias genotípicas e, ou, de blocos levaram a problemas nas estimativas das médias pelas abordagens FA, AA e JS. Nesse contexto, tais abordagens talvez devessem ser preteridas em relação às opções FF e FA. Contudo, a partir das constatações de Tomé et al. (2002) e do estudo de simulação anteriormente mencionado, o melhorista deve lembrar-se que a abordagem FF nunca leva aos ajustes inválidos, em razão de sua natureza e não por sua capacidade de estimação de parâmetros genéticos. Assim, se a variância genotípica paramétrica realmente fosse nula naquela condição ambiental, o melhorista que optasse pelas abordagens FF e AF estaria levando à frente, em seu programa de melhoramento, genótipos de baixo potencial produtivo; isto é, com médias inferiores à média das testemunhas escolhidas. E, como já comentado, isso refletiria em perdas com recursos 50 humanos e financeiros envolvidos na experimentação e, consequentemente, na impossibilidade de lançamento de cultivares promissores ao fim desse ciclo de seleção. 9200 8700 8200 7700 7200 6700 6200 modelo fixo 35 Al25CATI 35 ALBianco 35 BRS2020 35 Cerrado 35 Ipiranga 35 PC0203 35 Saracura 35 média das testemunhas James-Stein modelo misto efeito aleatório modelo misto efeito aleatório de bloco de tratamento 35 Al34CATI 35 AssumPreto 35 BRS473 35 Emgopa501 35 PC0201 35 Piratininga 35 UFVM100 modelo aleatório 35 ALBandeirante 35 BR106 35 CATIVerde2 35 IAC8333 35 PC0202 35 UFGSamambaia 35 UFVM200 35 Al30CATI 35 AlvoradaCATI 35 BRS4150 35 Emcapa202 35 Orion 35 PC9703 35 SolManhã Figura 3.9. Médias dos genótipos do experimento de Rio Verde, na safra 2004/05, obtidas pelas diferentes abordagens estatísticas (modelo fixo (FF), modelo misto com efeito aleatório de blocos (AF), modelo misto com efeito aleatório de tratamentos (FA), modelo aleatório (AA) e estimador de James-Stein (JS)), comparadas com a média de duas cultivares testemunhas. De forma geral, observou-se forte ocorrência do efeito shrinkage nas médias genotípicas obtidas pelas abordagens AA, FA e JS, nos diferentes experimentos e safras. Esse fenômeno deixou de ser pronunciado apenas nos experimentos cujo h2’ atingiu valores próximos ou superiores a 70%. Um exemplo é o experimento de Senador Canêdo, na safra 2003/04, cujo h2’ foi de 73% (Figura 3.10). Situações como esta, em que o coeficiente h2’ é elevado e as médias estimadas ou preditas por diferentes abordagens estatísticas são idênticas ou quase isso, também encontram-se reportadas na literatura (Duarte & Vencovsky, 2001; Tomé et al., 2002) 51 9500 8500 7500 6500 5500 4500 3500 modelo fixo James-Stein modelo misto efeito aleatório de bloco modelo misto efeito aleatório de tratamento modelo aleatório 21 AL25CATI 21 ALBianco 21 BRS1010 21 CATIVerde1 21 Ipiranga 21 Piratininga 21 AL30CATI 21 AlvoradaCATI 21 BRS4150 21 CATIVerde2 21 IPR114 21 SHS3031 21 AL34CATI 21 AssumPreto 21 BRS473 21 Emcapa202 21 PC9902 21 SolManhã 21 ALBandeirante 21 BR106 21 BRSCaimbé 21 Emgopa501 21 PC9903 21 média das testemunhas Figura 3.10. Médias dos genótipos do experimento de Senador Canêdo na safra 2003/04 obtidas pelas diferentes abordagens estatísticas: modelo fixo, modelo misto com efeito aleatório de blocos, modelo misto com efeito aleatório de tratamentos, modelo aleatório estimador de James-Stein, comparadas com a média de duas testemunhas ALBandeirante e IPR114. 3.4 CONCLUSÕES i) O uso das abordagens estatísticas avaliadas, em geral, leva à seleção de diferentes percentuais de genótipos relativamente à média das testemunhas, bem como a diferenças no ordenamento dos genótipos em função das médias estimadas ou preditas por esses procedimentos. ii) A adoção de abordagens que promovem shrinkage das médias genotípicas leva à seleção de menor número de genótipos relativamente aos modelos com efeito fixo de tratamentos, nas situações em que a média das testemunhas (valor mínimo de referência para a seleção de um genótipo) é superior à média experimental. Isso reduz o número de genótipos menos produtivos nos ciclos seguintes do programa de melhoramento, ao se adotar tais abordagens. Contrariamente, nesta situação os modelos com efeito fixo de tratamentos incorrem no risco de preservar nestes ciclos elevada proporção de tratamentos genéticos pouco promissores. 52 iii) Em experimentos cuja média das testemunhas supera a média experimental, o uso dos modelos com efeito fixo de tratamentos (FF e AF), independentemente dos valores do coeficiente de determinaçao genotípica (h2’), leva à maior porcentagem de seleção de genótipos relativamente às testemunhas do que os outros métodos. Isso aumenta o risco de seleção de genótipos cujas médias estimadas carreguem forte efeito microambiental. iv) Em situações com elevados valores de h2’, as diferentes abordagens conduzem à seleção de genótipos bastante coincidentes, podendo, entretanto, implicar em diferenças no seu ordenamento. 53 4 PROPRIEDADES DE ESTIMADORES E PREDITORES DE VALORES GENOTÍPICOS EM ENSAIOS VARIETAIS DELINEADOS EM LÁTICE RESUMO Este estudo teve por objetivo a análise de propriedades de estimadores e preditores de valores genotípicos, a partir de ensaios varietais delineados em látice e sob as abordagens de modelo fixo (FF), modelos mistos com efeito aleatório de blocos (AF), ou de tratamentos (FA), modelo aleatório (AA), além do estimador shrinkage de James-Stein (JS). Foram avaliados casos resultantes da combinação de quatro tamanhos experimentais (15, 54, 105 e 450 tratamentos), com seis coeficientes de determinação genotípica – h 2’ (6%, 15%, 25%, 48%, 63% e 82%), os quais resultaram de atribuições diferenciadas para as variâncias paramétricas associadas aos efeitos de blocos e de tratamentos. Estas combinações foram simuladas utilizando-se, ainda, a distribuição normal ou a distribuição uniforme para a geração dos efeitos genotípicos (tratamentos), o que totalizou 48 casos. Para cada caso, foram simulados 1.000 experimentos, o que totalizou 48.000 ensaios em látice. Das análises de cada ensaio, avaliaram-se a acurácia seletiva, o desvio preditivo médio (erro médio de predição), o erro padrão amostral, as coincidências da seleção genotípica e o número de ajustes não-válidos, resultantes do uso das diferentes abordagens estatísticas. O modelo AA resultou em maior acurácia e nos menores valores de desvio preditivo médio e erro padrão da média, independentemente do valor de h2’, do tamanho dos experimentos e do tipo de distribuição utilizada para a geração dos efeitos de tratamentos. Já o modelo FF apresentou o pior desempenho relativo nestes quesitos, exetuando-se as situações em que a variabilidade entre os tratamentos genéticos é elevada (h2’→1,0). Quando os valores de h2’ foram baixos (6%), o modelo FA mostrou eficiência similar ao modelo AA. Sob valores de h2’ inferiores a 60%, as maiores coincidências de seleção ocorreram entre os modelos FA e AA, enquanto para valores maiores de h2’ houve maior coincidência entre as seleções resultantes dos modelos FF e FA, e do estimador JS. As abordagens com shrinkage (FA, AA e JS) das médias genotípicas apresentam percentuais médios de ajustes não-válidos, quase nunca inferiores a 5%, quando os valores de h2’ são menores que 15%; entretanto, este problema desaparece, se h2’ é igual ou maior que 48%. As constatações ratificam resultados da literatura, de que os estimadores e preditores do tipo shrinkage são mais eficientes para a seleção de genótipos em programas de melhoramento. Palavras-chave: modelo misto, modelo fixo, desvio preditivo médio, James-Stein, acurácia, shrinkage. 54 ABSTRACT PROPRIETIES OF BREEDING VALUES ESTIMATORS AND PREDICTORS IN VARIETY TRIALSDESIGNED IN LATTICE This study aimed to analyze some proprieties of estimators and predictors of breeding values from variety trials designed in lattice, under approaches such as fixed model (FF), mixed models with random effect of blocks (AF) or treatments (FA), random model (AA), as well as the James-Stein’s shrinkage estimator (JS). The evaluated cases were combination of four experimental sizes (15, 54, 105, and 450 treatments) with six (6%, 15%, 25%, 48%, 63%, and 82%) genotypic determination coefficients (h2’), which resulted of differentiated attributions to the parametric variances associated with the effects of blocks and treatments. These combinations were also simulated by using the normal distribution or uniform distribution, to generate the genotypic effects (treatments), which amounted 48 cases. For each case, 1,000 experiments were simulated, reaching the total of 48,000 trials, all in lattice design. For each trial, the selective accuracy, the mean predictive deviation (mean prediction error), the mean standard error, the coincidences involving the genotypic selection, and the number of non-valid adjustments resulting from the use of different statistical approaches were evaluated. The AA model resulted in higher accuracy and lowest values for mean prediction error and mean standard error, independently of the h2’ coefficient, of the size of the experiments, and the kind of distribution used to generate the treatment effects. On the other hand, the FF model presented the worst performance, relatively to those requirements, except for the situations where the variability among the genetic treatments was high (h2’→1,0). When the values of h2’ were low (6%), the FA model showed efficiency similar to the AA model. For h2’ values below 60%, the higher selection coincidences occurred between the FA and AA models, while, for higher h2’ values, there was a higher coincidence among the selections resulting from the FF and FA models, as well as from the JS estimator. The shrinkage approaches (FA, AA and JS) of the genotypic means presented percentages of non-valid adjustments almost never lower to 5%, when the h2’ values were lower than 15%. However, this problem disappears if h 2’ values are equal or higher than 48%. These results ratify several studies which show that the shrinkage estimators and predictors are more efficient to the selection of genotypes in genetic plant breeding programs. Key words: mixed model, fixed model, mean predictive error, James-Stein estimator, accuracy, shrinkage. 4.1 INTRODUÇÃO O sucesso dos programas de melhoramento genético de plantas e da recomendação de cultivares resulta da eficiência na seleção de materiais genéticos testados 55 em experimentos de campo, que, por sua vez, depende da adoção de delineamentos experimentais adequados e de abordagens estatísticas precisas e acuradas. Devido ao grande número de genótipos avaliados nesses programas, uma das classes de delineamento mais empregada tem sido a dos blocos incompletos, entre os quais se encontram os delineamentos em látice. Os látices, sejam balanceados ou parcialmente balanceados, permitem diferentes análises estatísticas, variando apenas a suposição de efeitos fixos ou aleatórios para os efeitos de tratamentos e, ou, de blocos. Essas análises, na realidade, referem-se tão somente a casos particulares da aplicação da teoria de modelos mistos (Littel et al., 1996). Segundo Bueno & Vencovsky (2000), no modelo fixo, também denominado modelo de análise intrablocos, todos os efeitos, à exceção do erro experimental que é uma variável aleatória, são representados por constantes. Na abordagem de modelos mistos pode ser feita a recuperação da informação interblocos, no caso dos blocos serem assumidos como aleatórios, ou a recuperação da informação intertratamentos, no caso de os efeitos de tratamentos serem admitidos como aleatórios. Ademais, no modelo aleatório todos os efeitos, à exceção da média, são assumidos como variáveis aleatórias. No caso dos modelos com tratamentos genéticos aleatórios, o BLUP (melhor preditor linear não viciado), utilizado para predizer o valor da média genotípica, apresenta efeito shrinkage; ou seja, o vetor de médias preditas é multiplicado por um escalar, que, na maioria das situações práticas, varia entre zero e um, e que funciona como fator de “encolhimento” da variabilidade entre as médias genotípicas (Duarte, 2000). Nesse caso, quanto menor for o valor desse escalar, menor será a herdabilidade do caracter avaliado e, consequentemente, menor será a dispersão dos valores estimados ou preditos, em torno da média experimental. Assim como o BLUP, o estimador de James & Stein (1961) para a média populacional também apresenta o efeito shrinkage, resultante de um fator regressor da média amostral de determinado tratamento sobre a média geral. De acordo com Resende & Duarte (2007), abordagens shrinkage eliminam os efeitos residuais de ambiente embutidos nos dados fenotípicos, pela multiplicação do valor fenotípico corrigido por uma função da herdabilidade, isto é, pelo coeficiente de determinação genética para o caráter sob seleção. Assim, nas abordagens shrinkage, ou seja, modelos mistos com efeito aleatório de tratamentos, modelo aleatório e estimador de JamesStein, o fator de “encolhimento” depende da confiabilidade que se tem nas estimativas/predições das médias genotípicas, 56 que, por sua vez, depende da herdabilidade e repetibilidade da característica que se deseja avaliar. Apesar das vantagens reportadas na literatura em favor dos estimadores e preditores shrinkage, relativamente a outros estimadores, existem problemas relacionados à ocorrência de ajustes não-válidos no caso de as estimativas de variância genotípica tenderem para zero. Tomé et al. (2002) relatam esse fato, no contexto dos ensaios em látice no melhoramento vegetal, observando que grande número desses ajustes ocorre com a aplicação dos modelos com blocos ou tratamentos aleatórios, e daqueles completamente aleatórios, sendo que os maiores percentuais de ajustes não-válidos estão relacionados aos modelos com tratamentos aleatórios. Se as possibilidades de modelagem estatística são muitas, a decisão sobre adotar um modelo em detrimento de outro, nem sempre é clara e fácil para o melhorista. Apesar da facilidade computacional corrente para a análise estatística de modelos mistos e aleatórios, a maioria dos programas de melhoramento vegetal continua tratando as análises estatísticas de seus experimentos pela abordagem da análise clássica da variância, em que os efeitos dos tratamentos genéticos e dos blocos são admitidos como fixos. Isso ocorre, tanto pelo desconhecimento das vantagens de outras abordagens, quanto pela idéia de que as diferentes modelagens estatísticas – modelo fixo, modelos mistos ou modelo aleatório – não trariam grandes diferenças no julgamento dos genótipos em teste (Duarte & Vencovsky, 2001). Nesse contexto, o estudo de experimentos simulados para a avaliação da seleção de tratamentos genéticos mostra-se bastante esclarecedor do ponto de vista teórico, pois em ambiente computacional, os parâmetros relacionados a tratamentos, blocos, repetições e erro podem ser estipulados e conhecidos. Isso permite avaliar a acurácia seletiva ( rg ˆ g ), o erro médio de predição ou o erro quadrático médio (EQM), bem como outras estatísticas associadas aos estimadores/preditores dos valores genotípicos. A acurácia refere-se à correlação entre os valores genotípicos verdadeiros dos tratamentos genéticos e seus valores estimados/preditos a partir do uso das informações constantes nos modelos matemáticos relacionados à avaliação. Já o erro médio de predição é a raiz quadrada de EQM, que se refere à média da diferença quadrática entre os valores paramétricos dos genótipos e seus valores estimados ou preditos com o uso das diferentes abordagens estatísticas. Assim, quanto maior o valor destes erros, menor é a confiabilidade nas estimativas/predições dos modelos que as produziram. 57 Ao usar a simulação para avaliação de experimentos, o estudioso deve, entretanto, se concentrar na manutenção de características próximas àquelas observadas em experimentos reais (Cruz, 2001). Devem ser mantidos, por exemplo, valores do coeficiente de variação experimental semelhantes aos obtidos em ensaios de campo. Além disso, as relações entre as variâncias de tratamentos, de blocos, de repetições e do erro experimental devem ser próximas aos valores obtidos em experimentos reais, conduzidos com a espécie e delineamento experimental similar. O objetivo deste trabalho foi avaliar algumas propriedades de estimadores e preditores de valores genotípicos associados a ensaios varietais delineados em látice. Avaliaram-se estimativas e predições derivadas das abordagens de modelo fixo, modelos mistos com efeitos de blocos ou de tratamentos assumidos como aleatórios, e modelo aleatório. Avaliou-se também a qualidade do estimador de James-Stein, por caracterizar-se como uma alternativa simples que permite ao melhorista agregar um índice de confiabilidade (fator regressor ou de shrinkage) às médias fenotípicas estimadas. Essa avaliação foi implementada com ênfase na seleção genotípica sobre uma característica quantitativa de interesse, priorizando, sobretudo, estatísticas relacionadas ao ordenamento dos genótipos em teste, como é o caso da acurácia. 4.2 MATERIAL E MÉTODOS 4.2.1 Caracterização dos ensaios simulados Foram simulados, em computador, experimentos delineados em látice de quatro diferentes tamanhos, variando-se os números de tratamentos, de blocos e de repetições (Tabela 4.1). O modelo do delineamento, utilizado para a geração dos dados experimentais foi o seguinte (Ramalho et al., 2005): Yijk = µ + ρj + βk(j) + τi + εijk (1) em que: Yijk é a observação na parcela que recebeu o tratamento i, no bloco k, dentro da repetição j; µ é a média geral do experimento; ρj é o efeito da repetição; βk(j) é o efeito do bloco k dentro da repetição j; τi é o efeito do tratamento i; e εijk é o erro experimental associado à observação Yijk. 58 Tabela 4.1. Número de tratamentos por experimento, número de blocos por repetição, número de tratamentos por bloco e número de repetições utilizados para a simulação dos diferentes casos estudados. No. tratamentos N o. de blocos por repetição N o. de tratamentos por bloco No. de repetições 15 3 5 3 54 9 6 3 105 7 15 2 450 15 30 2 Os valores paramétricos que deram suporte à geração dos dados (Y ijk) foram estabelecidos visando-se a manutenção de relações de variâncias próximas às observadas em experimentos reais de avaliação de cultivares de milho, em Goiás, incluindo-se um coeficiente de variação em torno de 15%. Assim, além da média geral ( µ = 6,67) e da variância do erro ou resíduo (σ2e = 1,0), que foram invariantes em todas as simulações, para se cobrir amplitude considerável de condições experimentais, atribuíram-se diferentes valores às variâncias de repetição (σ2r), de bloco dentro de repetição (σ2b/r) e de tratamentos ou genótipos (σ2g). Isso resultou em diferentes valores para o coeficiente de determinação genotípica (h2’), simulando-se experimentos com níveis diferenciados de variabilidade entre os tratamentos genéticos (Tabela 4.2). Os seis níveis de variabilidade genotípica (6%, 15%, 25%, 48%, 63% e 85%) combinados com os quatro tamanhos experimentais resultaram em 24 casos, os quais foram, ainda, combinados com duas condições de simulação dos efeitos genotípicos (sob distribuição normal ou uniforme). Assim, totalizaram-se 48 casos a serem simulados. Para cada caso, geraram-se, em computador, mil experimentos, divididos em dez repetições de cem experimentos, o que totalizou 48.000 ensaios em látice. Tabela 4.2. Valores de variância do erro, variância de blocos dentro de repetições, variância genética e coeficiente de determinação genotípica (h2’) utilizados para as simulações dos casos estudados. Variância da Variância do bloco Variância do erro Variância genética h2’(%) repetição dentro da repetição 1,00 1,00 1,00 1,00 1,00 1,00 0,05 0,05 0,05 1,00 1,00 1,00 0,05 0,05 0,05 1,00 1,00 1,00 0,20 1,00 5,00 0,20 1,00 5,00 15 48 82 6 25 63 Excetuando-se os efeitos genotípicos (τi), todos os demais foram gerados sob a suposição de distribuição normal de probabilidades, com médias nulas e variâncias especificadas conforme o caso (Tabela 4.2). A razão para a simulação dos efeitos de 59 tratamentos sob as duas condições decorreu da hipótese de que os modelos misto e aleatório pudessem levar vantagem sobre a abordagem tradicional de modelo fixo, simplesmente devido ao fato de os dados terem sido gerados sob a suposição de normalidade. 4.2.2 Estimação e predição de médias genotípicas Para a operacionalização das análises no SAS® (Statistical Analysis System), segundo as abordagens estatísticas objeto da avaliação, o modelo (1) foi reescrito sem particionar os efeitos de blocos em repetições (isso não introduz qualquer prejuízo ao ajuste das médias de tratamentos – objeto central do estudo). Assim, esses efeitos passaram a ser considerados como a única fonte de controle local da variação, e o modelo de análise foi o seguinte: Yij = µ + βj + τi + εij (2) em que: Yij é o valor observado do tratamento i, no bloco j; µ é a média geral do experimento; βj é o efeito do bloco j; τi é o efeito do tratamento ou genótipo i; e εij é o erro experimental associado à observação Yij. A partir deste modelo, as médias ou valores genotípicos de cada tratamento foram estimadas ou preditas segundo cada uma das cinco abordagens estatísticas a seguir: modelo fixo (FF), modelo misto com efeito de blocos assumido como aleatório (AF), modelo misto com efeito de tratamentos assumido como aleatório (FA), modelo aleatório (AA) e estimador de James-Stein (JS). As siglas utilizadas, com exceção de JS, são apresentadas conforme a notação de Santos (2001), em que “A” indica efeito aleatório e “F”, efeito fixo; e, primeiramente o efeito do bloco, depois o de tratamento, conforme a ordem dos termos no modelo (2). Além da suposição de independência entre os termos µ, βj, τi e εij no modelo (2), assumiram-se, para as respectivas abordagens e análises, as seguintes distribuições: FF – εij~N(0,σ2e); AF – βj~N(0,σ2b) e εij~N(0,σ2e); FA – τi~N(0,σ2g) e εij~N(0,σ2e); e AA – βj~N(0,σ2b), τi~N(0,σ2g) e εij~N(0,σ2e). O estimador de James-Stein (1961), conforme Efron & Morris (1977), não requer quaisquer suposições referente a efeitos fixos ou aleatórios, ou sobre distribuições das médias a serem estimadas. O modelo FF, com todos os efeitos (blocos e tratamentos), à exceção do erro experimental, admitidos como fixos, pode ainda 60 ser escrito em notação matricial como: y = Χβ + ε , sendo y o vetor de observações; X, a matriz de incidência do delineamento; β, o vetor de efeitos fixos (µ, βj e τi) desconhecidos; e ε, o vetor de erros aleatórios, com var(ε) = Iσ2 e, conseqüentemente, var(y) = V = Iσ2. O vetor de médias genotípicas é uma função paramétrica dos efeitos em β, isto é, L’β, cujo ˆ, melhor estimador linear não-viciado (BLUE) pode ser expresso como: BLUE(L’β) = L’ β sendo L’ uma matriz de coeficientes dos efeitos fixos, que produz a combinação linear dos ˆ correspondente às médias genotípicas. elementos em β Os modelos mistos e aleatório (AF, FA e AA) podem ser genericamente escritos como: y = Χβ + Zu + ε , em que y é o vetor de observações; X é a matriz de incidência dos efeitos contidos em β (apenas µ no caso do modelo AA), que corresponde ao vetor de efeitos fixos a serem estimados; Z é a matriz de incidência dos efeitos contidos em u, que é o vetor dos efeitos aleatórios a serem preditos, assumindo u~N(φ,G); e ε é o vetor de erros, assumido ε ~N(φ,R). Por conseguinte, E(y) = Xβ, e var(y) = V = ZGZ’ + R, em que, G e R são as matrizes de variâncias-covariâncias dos vetores aleatórios u e ε, respectivamente. Ademais, assumiram-se nulas as covariâncias entre vetores diferentes e, por simplificação, adotararam-se as seguintes estruturas para essas matrizes: G = Iσ2b, em AF; G = Iσ2g, em FA; G = [Iσ2b ⊕ Iσ2g] (sendo ⊕ o operador soma direta), em AA; e, ainda, R = Iσ2e em todos esses casos. A solução do sistema de equações do modelo misto de Henderson (MME) resulta no BLUE de β (vetor de efeitos fixos), obtido como solução de quadrados mínimos ˆ = Χ' V ˆ -1 Χ generalizados, dada por: β ( ) − ˆ − 1 y ; e na predição dos efeitos aleatórios por Χ' V ˆ , em que: C ˆ'V ˆ − 1 y − Xβ ˆ é uma estimativa da meio do BLUP de u, expressa por: û = C matriz de covariâncias entre os valores genotípicos (não observáveis) e os valores ˆ = G ˆ Z' , sendo V ˆ − 1 a matriz inversa de uma observáveis (dados), dada também por C ˆ foram estimados por ˆ e G estimativa da matriz V. Os componentes de variância em V máxima verossimilhança restrita (REML). O vetor de médias genotípicas, neste caso, é uma função linear que combina efeitos fixos e aleatórios, isto é: w = L’β + u, sendo L’ uma matriz de coeficientes dos efeitos fixos, com número de linhas igual ao número de tratamentos, que reproduz a função de interesse. Segundo Searle et al. (1992), para L’β estimável, o preditor de w também o é, recebendo, porém, a denominação de função ( ) 61 paramétrica predizível (Littell et al., 1996), em razão de incluir efeitos aleatórios. ˆ . No Ademais, possui propriedades de BLUP, sendo determinada por: BLUP(w) = L' βˆ + u caso do modelo AA, o vetor û é particionado de modo a considerarem-se apenas os elementos associados aos tratamentos genéticos. Isso é necessário, inclusive, para compatibilizar a operação matricial (adição) com L' βˆ . O estimador de James-Stein (JS) das médias dos tratamentos pode ser JS expresso como: Yi = k (Yi. − Y..) + Y.. , em que k é um fator regressor da média amostral de determinado genótipo sobre a média geral, determinado por: k = 1 − x F , em que F é o valor obtido do teste F de Snedecor (centrado na média geral) para fonte de variação tratamentos, segundo a análise de variância do modelo (2) assumido como fixo. Conforme recomendação de Resende & Duarte (2007), o valor x deve variar com o número de tratamentos avaliados, o que, neste caso, resultou na Tabela 4.3. Tabela 4.3. Valores de x para determinação do fator k de encolhimento (shrinkage)1 a ser utilizado na expressão do de James-Stein (1961) para a média amostral, em função do número de tratamentos envolvidos no experimento. Número de tratamentos Número de tratamentos X X 15 0,86 105 0,98 54 1 0,95 450 1,00 - k = 1 – x/F, em que F é o valor do teste de F (de Snedecor centrado na média geral) para fonte de variação tratamentos. 4.2.3 Implementação computacional Para a simulação dos experimentos foram construídas rotinas computacionais em linguagem SAS®, que são apresentadas no Apêndice A.1. Os comandos RANNOR e RANUNI foram utilizados para a geração dos efeitos de tratamentos, sob as suposições de distribuição normal e distribuição uniforme, respectivamente. Na implementação das diferentes abordagens de estimação e predição das médias genotípicas, excetuando-se a de James & Stein (1961), utilizou-se principalmente o procedimento PROC MIXED (procedure for mixed models) do SAS, com estimação dos componentes de variância por máxima verossimilhança restrita (opção default ou method = REML). O estimador de James-Stein também foi implementado no SAS, porém, utilizando-se as suas funcionalidades para tratamento de arquivos de dados. 62 4.2.4 Comparação dos diferentes estimadores e preditores Para comparar os preditores e estimadores provenientes das diferentes abordagens avaliadas, foram adotadas as seguintes estatísticas: rˆ g = i) acurácia seletiva ( rg ˆ g ) – definida como: g COV( g i g ˆi ) (s 2 2 ˆi gi g s ) . Esta estatística foi calculada ˆi ) e diretamente através da correlação linear entre as estimativas ou predições obtidas ( g seus respectivos parâmetros (gi), isto é, os valores genotípicos verdadeiros, que, neste caso, tendo sido gerados por simulação, eram conhecidos. ii) desvio preditivo médio (DPM) ou erro médio de predição – definido como a raiz quadrada do erro quadrático médio (EQM), o qual também foi determinado de forma ˆ i - gi)2; isto é, a média das diferenças quadráticas entre os valores direta por: EQM = E( g genotípicos paramétricos e suas respectivas predições ou estimativas. iii) erro padrão da média (EPM) – definido como: sYi = lineares fixo ˆ = Iσˆ 2 ), (V mistos e aleatório ˆ -1 X)- L , para os modelos L' (X' V ˆ Z' + Iσˆ 2 ); ˆ = ZG (V e e como: sYi = k2* QMtrat , para o estimador de James-Stein, em que k é o fator regressor ou de r encolhimento do estimador, QMtrat é o quadrado médio de tratamentos na análise de variância do modelo fixo (FF), e r é o número de repetições (Resende, 2007)3. iv) percentual de coincidência de genótipos selecionados entre as diferentes abordagens estatísticas, adotando-se as intensidades de seleção de 20%, 15%, 10% e 5% dos genótipos avaliados, conforme o número crescente de tratamentos avaliados, isto é, 15, 54, 105 e 450 tratamentos, respectivamente. v) percentual de ajustes não-válidos em cada abordagem estatística, isto é, a porporção dos experimentos simulados que resultaram em estimativas negativas ou em zeros da variância genotípica, de modo a impossibilitar a estimação ou predição das médias dos tratamentos. 3 RESENDE, M. D. V. de. James-Stein [mensagem pessoal]. Mensagem recebida por em 27 set. 2007. 63 Essas estatísticas foram calculadas para cada experimento simulado, tendo sido obtidas médias de rg ˆ g , DPM e EPM e seus respectivos intervalos de confiança (95%), apoiados no Teorema Limite Central (amostras de 1.000 observações ou experimentos, com z( α 2 ) = 1,96 ). A geração dos dados em dez repetições de cem experimentos, para cada caso, teve como propósito viabilizar uma análise de variância, com teste F, para comparar estatisticamente as diferentes abordagens, segundo suas médias nas referidas estatísticas de avaliação (cinco métodos e dez repetições para cada um). 4.3 RESULTADOS E DISCUSSÃO A falta de normalidade dos resíduos associados aos dados de acurácia ( rg ˆ g ), desvio preditivo médio (DPM) e erro padrão da média (EPM), dentro de cada um dos 48 casos simulados, impossibilitou a comparação estatística das abordagens avaliadas por meio da análise de variância e teste de F. Assim, tal comparação restringiu-se à avaliação de sobreposições nos intervalos de confiança (95%) da média destas estatísticas em cada método, tomados dois a dois. Considerando-se as simulações em que os efeitos de tratamentos foram gerados sob distribuição normal, houve tendência nítida de aumento da acurácia, para todas as abordagens, com a elevação do coeficiente de determinação genotípica (h2’) (Figuras 4.1 a 4.4). Entretanto, os maiores valores médios de acurácia estiveram sempre associados à aplicação do modelo aleatório – AA (Tabela 4.4). Sob os menores valores de h2’ (6%), as acurácias médias mais elevadas foram as dos modelos AA e FA, os quais não diferiram estatisticamente entre si (p>0,05). Isso revela a importância de se assumir aleatoriedade dos efeitos genotípicos, especialmente sob baixa variabilidade entre os tratamentos genéticos. Já, sob valores de h2’ acima de 15%, a superioridade do modelo AA em acurácia foi acompanhada também domodelo AF, que, na maioria dos casos, sobretudo para T ≤105 tratamentos, teve acurácia média praticamente de mesma (p>0,05) magnitude à do primeiro modelo. Por outro lado, independentemente do tamanho experimental e dos valores de h2’, o modelo fixo (FF) e o estimador de James-Stein (JS) apresentaram os menores valores de acurácia, não havendo diferenca significativa entre suas médias, em quase todos os casos (Tabela 4.4). Deve-se ressaltar, entretanto, que a abordagem JS foi 64 desenvolvida para a análise de dados provenientes de delineamentos em blocos completos e, por isso, não recupera as informações interblocos e intertratamentos, necessárias nos delineamentos em látice (blocos incompletos). A vantagem relativa do modelo AA se confirmou também em relação ao desvio preditivo médio (DPM), tendo resultado nos menores valores de erro de predição (Figuras 4.1 a 4.4). Como no caso da acurácia, para h2’ = 6%, em todos os tamanhos experimentais avaliados, esse modelo não revelou vantagem estatística (p>0,05) em relação ao modelo FA (Tabela 4.5). Ademais, para maior número de tratamentos (105 e 450) essa equivalência se estendeu até h2’ = 25%. Isso ratifica a importância já reportada de se recuperar a informação intertratamentos, isto é, admitir a aleatoriedade dos efeitos genotípicos, quando o número destes é elevado e a variabilidade entre os genótipos em teste é pequena. Em contrapartida, o modelo FF, também para essa estatística, independentemente dos tamanhos experimentais e dos valores de h2’, produziu os piores resultados (maiores erros médios de predição). Apenas no caso de menor número de tratamentos (15) e h2’≥63%, esta análise mostrou resultados equivalentes (p>0,05) aos modelos AF, FA e ao estimador JS; mas, ainda assim, com erros de predição superiores (p<0,05) ao modelo AA (Tabela 4.5). Em termos de erro padrão da média (EPM), o modelo AA também destacou-se com as menores médias, na maioria dos casos (Tabela 4.6 e Figuras 4.1 a 4.4). Quando o número de tratamentos foi maior ou igual a 54 e os valores de h2’ foram baixos (≤15%), as predições obtidas a partir da abordagem JS produziram erros padrão de menor magnitude (p>0,05) que o modelo AA (Tabela 4.6). Contudo, os EPM produzidos com a aplicação da abordagem JS aumentaram fortemente, com o crescimento do h2’, especialmente sob h2’≥63% (p>0,05). Sob baixos h2’ (≤15%), o uso dos modelo FF e AF resultou nos maiores EPM independentemente do número de tratamentos avaliados. Em síntese, para situações semelhantes às simuladas neste estudo, a adoção do modelo aleatório (AA), muito provavelmente, resulta em predições mais fidedignas das médias genotípicas, sobretudo nos casos em que houver pouca variabilidade entre os tratamentos genéticos (ex.: espécies já bastante melhoradas). Deve-se ressaltar, contudo, que as diferenças em acurácia, erro médio de predição e erro padrão da média entre as abordagens reduzem significativamente à medida que se eleva o coeficiente de determinação genotípica (Figuras 4.1 a 4.4). 65 acurácia . 2,1 1,9 1,7 acurácia / erro padrão / desvio preditivo médio 1,5 1,3 1,1 0,9 0,7 0,5 0,3 FF AF AF FF AF erro padrão desvio preditivo médio FF FF AF FA AA FA AA FA AA FA AA FA AA FF FA AA FF AF AF JS JS JS JS JS 6% 15% 25% 48% 63% 82% Figura 4.1. Acurácia, desvio preditivo médio e erro padrão as estimativas/predições em relação aos efeitos genéticos estipulados para os experimentos com 15 tratamentos e três repetições, avaliados segundo as abordagens de modelo fixo (FF), modelo misto com efeito aleatório de blocos (AF), modelo misto com efeito aleatório de tratamentos (FA), modelo aleatório (AA) e estimador de James-Stein (JS), em seis níveis (%) de coeficientes de determinação genotípica (h2’). A geração dos efeitos de tratamentos avaliados foi feita sob normalidade, independentemente do h2’. 2,2 2,0 1,8 acurácia / erro padrão / desvio preditivo médio 1,6 1,4 1,2 1,0 0,8 0,6 0,4 0,2 FA AA AA FA AA AA AA FA AA AF FA FA FA FF AF FF AF AF FF AF AF FF FF FF JS JS JS 6% 15% 25% 48% 63% 82% JS JS JS . acurácia erro padrão desvio preditivo médio Figura 4.2. Acurácia, desvio preditivo médio e erro padrão das estimativas/predições em relação aos parâmetros genéticos estipulados para os experimentos com 54 tratamentos e três repetições, avaliados segundo as abordagens de modelo fixo (FF), modelo misto com efeito aleatório de blocos (AF), modelo misto com efeito aleatório de tratamentos (FA), modelo aleatório (AA) e estimador de James-Stein (JS), em seis níveis (%) de coeficientes de determinação genotípica (h2’). A geração dos efeitos de tratamentos avaliados foi feita sob normalidade, independentemente do h2’. JS 66 2,2 2,0 1,8 acurácia / erro padrão / desvio preditivo médio 1,6 1,4 1,2 1,0 0,8 0,6 0,4 0,2 AA acurácia erro padrão desvio preditivo médio . AA AA AF AA AF FA FA FA FA AA FA AA FF AF AF AF FF AF FA FF FF FF FF JS 6% 15% 25% 48% 63% 82% Figura 4.3. Acurácia, desvio preditivo médio e erro padrão das estimativas/predições em relação aos parâmetros genéticos estipulados para os experimentos com 105 tratamentos e duas repetições, , avaliados segundo as abordagens de modelo fixo (FF), modelo misto com efeito aleatório de blocos (AF), modelo misto com efeito aleatório de tratamentos (FA), modelo aleatório (AA) e estimador de James-Stein (JS), em seis níveis (%) de coeficientes de determinação genotípica (h2’). A geração dos efeitos de tratamentos avaliados foi feita sob normalidade, independentemente do h2’. . acurácia erro padrão desvio preditivo médio 2,3 2,1 1,9 1,7 acurácia / erro padrão / desvio preditivo médio 1,5 1,3 1,1 0,9 0,7 0,5 0,3 0,1 FA AA . FA AA AA AA FA AA FA AA AF AF AF FA FA FF FF AF FF AF AF FF FF FF JS JS JS JS JS 6% 15% 25% 48% 63% 82% Figura 4.4. Acurácia, desvio preditivo médio e erro padrão das estimativas/predições em relação aos parâmetros genéticos estipulados para os experimentos com 450 tratamentos e duas repetições, avaliados segundo as abordagens de modelo fixo (FF), modelo misto com efeito aleatório de blocos (AF), modelo misto com efeito aleatório de tratamentos (FA), modelo aleatório (AA) e estimador de James-Stein (JS), em seis níveis (%) de coeficientes de determinação genotípica (h2’). A geração dos efeitos de tratamentos avaliados foi feita sob normalidade, independentemente do h2’. JS JS JS JS JS JS 67 Tabela 4.4. Valores médios (na diagonal de cada sub-matriz) de acurácia, com respectivos intervalos de confiança (95%) e significâncias das diferenças entre eles tomados dois a dois, para cinco métodos de estimação/predição de médias genotípicas (FF, AF, FA, AA e JS) 1, obtidos de 1.000 experimentos em látice, gerados por simulação em computador, sob diferentes tamanhos (número de tratamentos) e coeficientes de determinação genotíca (h2'), cujos efeitos de tratamentos foram gerados sob distribuição normal. Tratamentos 15 h2'(%) Abordagem 6 FF AF FA AA JS Li (IC) Ls (IC) 15 FF AF FA AA JS Li (IC) Ls (IC) 25 FF AF FA AA JS Li (IC) Ls (IC) 48 FF AF FA AA JS Li (IC) Ls (IC) 63 FF AF FA AA JS Li (IC) Ls (IC) 82 FF AF FA AA JS Li (IC) Ls (IC) 6 FF AF FA AA JS Li (IC) Ls (IC) 15 FF AF FA AA JS Li (IC) Ls (IC) 25 FF AF FA AA JS Li (IC) Ls (IC) 48 FF AF FA AA JS Li (IC) Ls (IC) 63 FF AF FA AA JS Li (IC) Ls (IC) 82 FF AF FA AA JS Li (IC) Ls (IC) FF 0,5218 ns * * ns 0,5093 0,5344 0,5130 * * * ns 0,5006 0,5254 0,8029 * ns * ns 0,7965 0,8094 0,7990 * ns * ns 0,7925 0,8055 0,9484 * ns * ns 0,9465 0,9503 0,9479 * ns * ns 0,9460 0,9498 0,5222 * * * ns 0,5158 0,5286 0,5542 * * * ns 0,5482 0,5601 0,8079 * ns * ns 0,8046 0,8112 0,8309 * * * ns 0,8281 0,8337 0,9507 * ns * ns 0,9498 0,9517 0,9585 * ns * ns 0,9578 0,9592 AF FA AA JS Tratamentos 105 0,5458 ns 0,5606 * ns 0,5768 ns ns * 0,5453 0,5339 0,5469 0,5638 0,5316 0,5577 0,5742 0,5898 0,5589 0,5756 * 0,5490 * * 0,6035 * ns * 0,5381 0,5641 0,5359 0,5920 0,5245 0,5871 0,5622 0,6150 0,5517 0,8191 ns 0,8091 ns * 0,8231 * ns * 0,8066 0,8131 0,8028 0,8173 0,8003 0,8251 0,8154 0,8288 0,8129 0,8454 * 0,8073 ns * 0,8482 * ns * 0,8028 0,8401 0,8011 0,8431 0,7964 0,8507 0,8135 0,8533 0,8093 0,9533 * 0,9485 ns * 0,9534 * ns * 0,9484 0,9515 0,9466 0,9517 0,9465 0,9550 0,9504 0,9552 0,9503 0,9620 * 0,9484 ns * 0,9620 * ns * 0,9479 0,9605 0,9465 0,9606 0,9460 0,9634 0,9503 0,9634 0,9498 450 0,5378 ns 0,5442 * ns 0,5515 ns * * 0,5269 0,5315 0,5380 0,5454 0,5204 0,5440 0,5503 0,5576 0,5333 0,5962 * 0,5739 ns * 0,5999 * * * 0,5580 0,5907 0,5681 0,5943 0,5520 0,6017 0,5798 0,6054 0,5641 0,8193 ns 0,8139 ns * 0,8216 * ns * 0,8079 0,8162 0,8108 0,8186 0,8046 0,8223 0,8170 0,8245 0,8112 0,8592 * 0,8371 ns * 0,8597 * * * 0,8309 0,8570 0,8345 0,8574 0,8281 0,8615 0,8397 0,8619 0,8337 0,9542 * 0,9513 ns * 0,9543 * ns * 0,9507 0,9533 0,9504 0,9535 0,9498 0,9550 0,9522 0,9552 0,9517 0,9665 * 0,9590 ns * 0,9665 * ns * 0,9585 0,9660 0,9583 0,9660 0,9578 0,9671 0,9597 0,9671 0,9592 h2'(%) Abordagem 6 FF AF FA AA JS Li (IC) Ls (IC) 15 FF AF FA AA JS Li (IC) Ls (IC) 25 FF AF FA AA JS Li (IC) Ls (IC) 48 FF AF FA AA JS Li (IC) Ls (IC) 63 FF AF FA AA JS Li (IC) Ls (IC) 82 FF AF FA AA JS Li (IC) Ls (IC) 6 FF AF FA AA JS Li (IC) Ls (IC) 15 FF AF FA AA JS Li (IC) Ls (IC) 25 FF AF FA AA JS Li (IC) Ls (IC) 48 FF AF FA AA JS Li (IC) Ls (IC) 63 FF AF FA AA JS Li (IC) Ls (IC) 82 FF AF FA AA JS Li (IC) Ls (IC) FF 0,4184 ns * * ns 0,4133 0,4235 0,4981 * * * ns 0,4935 0,5027 0,7186 ns ns * ns 0,7154 0,7218 0,7955 * ns * ns 0,7931 0,7978 0,9183 * ns * ns 0,9172 0,9194 0,9459 * ns * ns 0,9453 0,9466 0,4358 * * * * 0,4325 0,4391 0,5112 * * * ns 0,5091 0,5134 0,7346 * * * ns 0,7319 0,7372 0,8007 * * * ns 0,7996 0,8019 0,9243 * * * ns 0,9232 0,9253 0,9482 * ns * ns 0,9479 0,9486 AF FA AA JS 0,4229 ns 0,4314 ns ns 0,4326 ns ns ns 0,4226 0,4179 0,4262 0,4273 0,4172 0,4280 0,4367 0,4380 0,4280 0,5152 ns 0,5090 ns * 0,5192 * ns * 0,5012 0,5108 0,5044 0,5147 0,4964 0,5196 0,5137 0,5237 0,5059 0,7242 ns 0,7241 ns ns 0,7273 ns ns * 0,7186 0,7210 0,7209 0,7242 0,7154 0,7273 0,7272 0,7303 0,7218 0,8077 * 0,7994 ns * 0,8084 * ns * 0,7955 0,8056 0,7972 0,8062 0,7931 0,8099 0,8016 0,8105 0,7978 0,9206 ns 0,9193 ns ns 0,9213 * ns * 0,9183 0,9196 0,9183 0,9202 0,9172 0,9217 0,9204 0,9223 0,9194 0,9504 * 0,9464 ns * 0,9504 * ns * 0,9459 0,9498 0,9458 0,9498 0,9453 0,9510 0,9470 0,9510 0,9466 0,4433 * 0,4689 * ns 0,4702 * * * 0,4586 0,4403 0,4659 0,4670 0,4555 0,4464 0,4720 0,4733 0,4617 0,5237 * 0,5184 ns * 0,5250 * * * 0,5113 0,5216 0,5163 0,5229 0,5092 0,5258 0,5205 0,5271 0,5135 0,7420 * 0,7508 * * 0,7557 ns * * 0,7379 0,7397 0,7490 0,7541 0,7356 0,7443 0,7526 0,7574 0,7402 0,8101 * 0,8042 ns * 0,8107 * * * 0,8007 0,8091 0,8031 0,8097 0,7996 0,8112 0,8052 0,8118 0,8019 0,9274 ns 0,9267 * * 0,9293 * * * 0,9243 0,9265 0,9258 0,9286 0,9232 0,9283 0,9275 0,9300 0,9253 0,9513 * 0,9486 ns * 0,9514 * ns * 0,9482 0,9510 0,9483 0,9511 0,9479 0,9516 0,9489 0,9516 0,9486 54 1- FF: modelo fixo; AF: modelo misto com efeito aleatório de blocos; FA: modelo misto com efeito aleatório de tratamentos; AA: modelo aleatório; e JS: estimador de James-Stein. 68 Tabela 4.5. Valores médios (na diagonal de cada sub-matriz) do desvio preditivo médio (DPM), com respectivos intervalos de confiança (95%) e significâncias das diferenças entre eles tomados dois a dois, para cinco métodos de estimação/predição de médias genotípicas (FF, AF, FA, AA e JS)1, obtidos de 1.000 experimentos em látice, gerados por simulação em computador, sob diferentes tamanhos (número de tratamentos) e coeficientes de determinação genotíca (h2'), cujos efeitos de tratamentos foram gerados sob distribuição normal. Tratamentos h2'(%) Abordagem 15 6 FF AF FA AA JS Li (IC) Ls (IC) 15 FF AF FA AA JS Li (IC) Ls (IC) 25 FF AF FA AA JS Li (IC) Ls (IC) 48 FF AF FA AA JS Li (IC) Ls (IC) 63 FF AF FA AA JS Li (IC) Ls (IC) 82 FF AF FA AA JS Li (IC) Ls (IC) 54 6 FF AF FA AA JS Li (IC) Ls (IC) 15 FF AF FA AA JS Li (IC) Ls (IC) 25 FF AF FA AA JS Li (IC) Ls (IC) 48 FF AF FA AA JS Li (IC) Ls (IC) 63 FF AF FA AA JS Li (IC) Ls (IC) 82 FF AF FA AA JS Li (IC) Ls (IC) FF 0,6918 * * * * 0,6836 0,7000 0,6855 * * * * 0,6772 0,6937 0,7245 * * * * 0,7159 0,7331 0,7241 * * * * 0,7154 0,7327 0,8734 ns ns * ns 0,8580 0,8888 0,8882 * ns * ns 0,8716 0,9049 0,7186 * * * * 0,7138 0,7234 0,6568 * * * * 0,6526 0,6610 0,7251 * * * * 0,7201 0,7301 0,6687 * * * * 0,6643 0,6732 0,7678 * * * * 0,7612 0,7743 0,7182 * * * * 0,7116 0,7249 AF 0,6534 * * * 0,6460 0,6609 0,5805 * * * 0,5736 0,5873 0,6889 * * * 0,6806 0,6972 0,6182 * * * 0,6106 0,6257 0,8430 ns ns ns 0,8275 0,8585 0,8024 * ns * 0,7854 0,8195 0,6901 * * * 0,6856 0,6946 0,5868 * * * 0,5832 0,5904 0,6971 * * * 0,6925 0,7018 0,5980 * * * 0,5942 0,6017 0,7431 ns * ns 0,7367 0,7495 0,6549 * * * 0,6484 0,6615 FA AA JS 0,4200 ns * 0,4142 0,4258 Tratamentos h2'(%) Abordagem 105 6 FF AF FA AA JS Li (IC) Ls (IC) 15 FF AF FA AA JS Li (IC) Ls (IC) 25 FF AF FA AA JS Li (IC) Ls (IC) 48 FF AF FA AA JS Li (IC) Ls (IC) 63 FF AF FA AA JS Li (IC) Ls (IC) 82 FF AF FA AA JS Li (IC) Ls (IC) 450 6 FF AF FA AA JS Li (IC) Ls (IC) 15 FF AF FA AA JS Li (IC) Ls (IC) 25 FF AF FA AA JS Li (IC) Ls (IC) 48 FF AF FA AA JS Li (IC) Ls (IC) 63 FF AF FA AA JS Li (IC) Ls (IC) 82 FF AF FA AA JS Li (IC) Ls (IC) FF 0,9505 * * * * 0,9452 0,9557 0,7556 * * * * 0,7522 0,7590 0,9595 * * * * 0,9542 0,9648 0,7635 * * * * 0,7600 0,7671 0,9783 * * * * 0,9725 0,9842 0,7868 * * * * 0,7826 0,7911 0,9258 * * * * 0,9191 0,9326 0,7472 * * * * 0,7456 0,7488 0,9233 * * * * 0,9166 0,9299 0,7483 * * * * 0,7467 0,7500 0,9261 * * * * 0,9195 0,9326 0,7548 * * * * 0,7530 0,7566 AF 0,9362 * * * 0,9312 0,9412 0,7231 * * * 0,7199 0,7263 0,9443 * * * 0,9393 0,9494 0,7313 * * * 0,7281 0,7346 0,9632 * * * 0,9575 0,9690 0,7538 ns * ns 0,7497 0,7579 0,9040 * * * 0,8983 0,9096 0,7229 * * * 0,7214 0,7244 0,9024 * * * 0,8968 0,9081 0,7238 * * * 0,7223 0,7254 0,9056 * * * 0,9000 0,9112 0,7306 * * * 0,7289 0,7323 FA AA JS 0,4252 ns ns 0,4228 0,4277 0,4119 * 0,4065 0,4174 0,4386 0,4321 0,4451 0,4247 * 0,4222 0,4271 0,4300 0,4272 0,4327 0,4164 * * 0,4108 0,4221 0,3903 * 0,3855 0,3951 0,4334 0,4269 0,4400 0,4014 ns ns 0,3994 0,4034 0,3983 * 0,3963 0,4003 0,4053 0,4032 0,4075 0,6349 * ns 0,6265 0,6433 0,6132 * 0,6052 0,6213 0,6329 0,6247 0,6411 0,7003 ns ns 0,6968 0,7037 0,6969 * 0,6935 0,7004 0,7066 0,7031 0,7101 0,6341 * ns 0,6259 0,6423 0,5645 * 0,5573 0,5717 0,6342 0,6263 0,6422 0,6109 * ns 0,6081 0,6137 0,5984 * 0,5957 0,6010 0,6165 0,6136 0,6193 0,8530 ns ns 0,8376 0,8684 0,8258 ns 0,8104 0,8412 0,8527 0,8373 0,8680 0,8981 ns ns 0,8930 0,9031 0,8881 * 0,8830 0,8931 0,9036 0,8985 0,9088 0,8659 * ns 0,8492 0,8826 0,7900 * 0,7730 0,8071 0,8665 0,8499 0,8832 0,7469 * ns 0,7429 0,7510 0,7210 * 0,7170 0,7250 0,7498 0,7458 0,7539 0,3930 ns * 0,3903 0,3957 0,3907 * 0,3880 0,3934 0,4031 0,4001 0,4061 0,4217 ns ns 0,4200 0,4234 0,4225 ns 0,4208 0,4242 0,4214 0,4198 0,4230 0,3846 * * 0,3820 0,3873 0,3751 * 0,3726 0,3777 0,3925 0,3896 0,3953 0,3877 ns ns 0,3867 0,3886 0,3867 * 0,3857 0,3877 0,3896 0,3886 0,3905 0,5925 * * 0,5886 0,5964 0,5817 * 0,5778 0,5856 0,6008 0,5967 0,6049 0,7035 ns ns 0,6975 0,7096 0,7074 ns 0,7009 0,7139 0,7027 0,6974 0,7080 0,5582 * * 0,5546 0,5619 0,5225 * 0,5191 0,5259 0,5677 0,5640 0,5715 0,5966 * * 0,5953 0,5979 0,5879 * 0,5867 0,5892 0,6011 0,5997 0,6024 0,7350 * ns 0,7286 0,7414 0,7161 * 0,7098 0,7225 0,7385 0,7320 0,7449 0,8533 ns ns 0,8479 0,8588 0,8435 * 0,8381 0,8489 0,8617 0,8558 0,8675 0,6921 * ns 0,6855 0,6987 0,6387 * 0,6322 0,6453 0,6954 0,6888 0,7020 0,7142 * ns 0,7125 0,7159 0,6957 * 0,6940 0,6973 0,7165 0,7148 0,7182 1- FF: modelo fixo; AF: modelo misto com efeito aleatório de blocos; FA: modelo misto com efeito aleatório de tratamentos; AA: modelo aleatório; e JS: estimador de James-Stein. 69 Tabela 4.6. Valores médios (na diagonal de cada sub-matriz) do erro padrão da média amostral (EPM), com respectivos intervalos de confiança (95%) e significâncias das diferenças entre eles tomados dois a dois, para cinco métodos de estimação/predição de médias genotípicas (FF, AF, FA, AA e JS)1, obtidos de 1.000 experimentos em látice, gerados por simulação em computador, sob diferentes tamanhos (número de tratamentos) e coeficientes de determinação genotíca (h2'), cujos os efeitos de tratamentos foram gerados sob distribuição normal. Tratamentos 15 h '(%) 6 2 15 25 48 63 82 54 6 15 25 48 63 82 Abordagem FF AF FA AA JS Li (IC) Ls (IC) FF AF FA AA JS Li (IC) Ls (IC) FF AF FA AA JS Li (IC) Ls (IC) FF AF FA AA JS Li (IC) Ls (IC) FF AF FA AA JS Li (IC) Ls (IC) FF AF FA AA JS Li (IC) Ls (IC) FF AF FA AA JS Li (IC) Ls (IC) FF AF FA AA JS Li (IC) Ls (IC) FF AF FA AA JS Li (IC) Ls (IC) FF AF FA AA JS Li (IC) Ls (IC) FF AF FA AA JS Li (IC) Ls (IC) FF AF FA AA JS Li (IC) Ls (IC) FF 0,6919 * * * * 0,6844 0,6994 0,6974 * * * * 0,6898 0,7051 0,7031 * * * * 0,6958 0,7104 0,7030 * * * * 0,6951 0,7109 0,7023 * * * * 0,6948 0,7098 0,7037 * * * * 0,6958 0,7116 0,7179 * * * * 0,7141 0,7217 0,6580 * * * * 0,6548 0,6612 0,7244 * * * * 0,7205 0,7282 0,6626 * * * * 0,6595 0,6656 0,7181 * * ns * 0,7142 0,7221 0,6614 * * * * 0,6582 0,6646 AF 0,7369 * * * 0,7304 0,7434 0,5833 * * * 0,5786 0,5880 0,7415 * * * 0,7351 0,7479 0,5854 * * * 0,5804 0,5903 0,7453 * * * 0,7387 0,7518 0,5845 * * * 0,5795 0,5895 0,7325 * * * 0,7285 0,7364 0,5908 * * * 0,5882 0,5935 0,7376 * * * 0,7336 0,7415 0,5951 * * * 0,5926 0,5976 0,7320 ns * * 0,7279 0,7360 0,5934 * * * 0,5909 0,5960 FA AA JS Tratamentos 105 h '(%) 6 2 0,3937 ns * 0,3856 0,4019 0,3864 * 0,3788 0,3940 0,4290 0,4109 0,4472 15 0,3830 * * 0,3745 0,3915 0,3536 * 0,3468 0,3604 0,4112 0,3935 0,4289 25 0,5738 * * 0,5671 0,5806 0,5584 * 0,5522 0,5646 0,8464 0,8261 0,8667 48 0,5701 * * 0,5634 0,5768 0,5225 ns 0,5173 0,5276 0,5225 0,5164 0,5285 63 0,8640 * * 0,8570 0,8709 0,8372 * 0,8307 0,8438 2,1201 2,0895 2,1508 82 0,8589 * * 0,8519 0,8660 0,7802 * 0,7742 0,7863 2,0930 2,0631 2,1228 450 6 0,3686 ns * 0,3630 0,3742 0,3632 * 0,3575 0,3688 0,2968 0,2875 0,3061 15 0,3507 * * 0,3456 0,3557 0,3367 * 0,3322 0,3413 0,2945 0,2856 0,3033 25 0,5782 * * 0,5755 0,5809 0,5696 * 0,5670 0,5722 0,8272 0,8171 0,8374 48 0,5488 * * 0,5466 0,5510 0,5168 * 0,5150 0,5187 0,8507 0,8410 0,8604 63 0,7363 * * 0,7332 0,7394 0,7190 * 0,7160 0,7219 2,1253 2,1092 2,1415 82 0,6942 * * 0,6916 0,6969 0,6415 * 0,6393 0,6438 2,1489 2,1336 2,1643 Abordagem FF AF FA AA JS Li (IC) Ls (IC) FF AF FA AA JS Li (IC) Ls (IC) FF AF FA AA JS Li (IC) Ls (IC) FF AF FA AA JS Li (IC) Ls (IC) FF AF FA AA JS Li (IC) Ls (IC) FF AF FA AA JS Li (IC) Ls (IC) FF AF FA AA JS Li (IC) Ls (IC) FF AF FA AA JS Li (IC) Ls (IC) FF AF FA AA JS Li (IC) Ls (IC) FF AF FA AA JS Li (IC) Ls (IC) FF AF FA AA JS Li (IC) Ls (IC) FF AF FA AA JS Li (IC) Ls (IC) FF 0,9549 * * * * 0,9493 0,9605 0,7556 * * * * 0,7521 0,7592 0,9541 * * * * 0,9485 0,9597 0,7571 * * * * 0,7537 0,7606 0,9571 * * * * 0,9517 0,9626 0,7585 * * * * 0,7551 0,7618 1,0114 ns * * * 0,9989 1,0238 0,7536 * * * * 0,7518 0,7555 1,0045 ns * * * 0,9926 1,0163 0,7551 * * * * 0,7532 0,7569 1,0010 ns * * * 0,9896 1,0124 0,7551 * * * * 0,7533 0,7570 AF 0,9736 * * * 0,9680 0,9793 0,7228 * * * 0,7196 0,7260 0,9694 * * * 0,9638 0,9751 0,7252 * * * 0,7221 0,7283 0,9748 * * * 0,9692 0,9803 0,7269 * * * 0,7239 0,7300 1,0202 * * * 1,0075 1,0328 0,7333 * * * 0,7314 0,7351 1,0135 * * * 1,0014 1,0256 0,7349 * * * 0,7331 0,7367 1,0099 * * * 0,9983 1,0215 0,7349 * * * 0,7331 0,7368 FA AA JS 0,3953 ns * 0,3871 0,4034 0,3960 * 0,3880 0,4040 0,2446 0,2344 0,2547 0,3694 ns * 0,3637 0,3750 0,3628 * 0,3573 0,3683 0,2587 0,2501 0,2673 0,6749 ns * 0,6716 0,6781 0,6713 * 0,6681 0,6744 0,7373 0,7272 0,7474 0,5989 * * 0,5969 0,6009 0,5864 * 0,5845 0,5883 0,8144 0,8062 0,8226 0,8953 * * 0,8913 0,8993 0,8851 * 0,8812 0,8890 2,0715 2,0590 2,0841 0,7432 * * 0,7405 0,7458 0,7176 * 0,7151 0,7201 2,1152 2,1041 2,1263 0,3376 ns * 0,3299 0,3453 0,3365 * 0,3287 0,3443 0,1613 0,1533 0,1694 0,3666 * * 0,3635 0,3697 0,3594 * 0,3561 0,3627 0,2194 0,2152 0,2236 0,6330 ns ns 0,6285 0,6374 0,6268 ns 0,6218 0,6319 0,6194 0,6064 0,6324 0,5971 * * 0,5961 0,5980 0,5894 * 0,5884 0,5903 0,7974 0,7934 0,8014 0,9022 ns * 0,8950 0,9093 0,8993 * 0,8922 0,9064 1,9964 1,9862 2,0065 0,7195 * * 0,7180 0,7210 0,7041 * 0,7025 0,7056 2,1193 2,1138 2,1248 1- FF: modelo fixo; AF: modelo misto com efeito aleatório de blocos; FA: modelo misto com efeito aleatório de tratamentos; AA: modelo aleatório; e JS: estimador de James-Stein. 70 Por outro lado, deve-se destacar a necessidade de se considerar, cada vez mais, o critério de acurácia na escolha de estimadores eficientes do valor genotípico. Embora o critério da acurácia continue sendo negligenciado, sobretudo em programas de melhoramento de espécies anuais, estudos sobre métodos ideais de seleção genotípica têmdemonstrado que a acurácia é, possivelmente, o principal parâmetro a ser considerado nessa escolha (Henderson et al., 1959; Gianola & Goffinet, 1982; Ronningen & Van Vleck, 1985; Van Vleck, 1993; Resende et al., 2000; Duarte, 2000; Duarte & Vencovsky, 2001; Resende 1999, 2002, 2004; Resende & Duarte, 2007). Quando a simulação dos efeitos genotípicos foi feita sob distribuição uniforme, a comparação das médias de acurácia, DPM e EQM, obtidas com o uso das diferentes abordagens estatísticas, apresentou basicamente as mesmas características observadas quando a geração desses efeitos foi feita sob distribuição normal; isto é, de forma geral, corroboraram-se as conclusões já obtidas quanto a geracão dos efeitos genotípicos foi feita sob distribuição normal (Apêndice A.2). Ou seja, os modelos com shrinkage das médias fenotípicas revelaram vantagem relativa em acurácia e DPM. Isso demonstra que o fato de se ter simulado os efeitos de tratamentos sob distribuição normal, em primeira instância, não é necessariamente a razão que justifica a vantagem relativa demonstrada pelos modelos que tratam tais efeitos como aleatórios. Assim, pode-se especular, ainda, que, mesmo se a natureza dos efeitos dos tratamentos for fixa, possivelmente as predições dos efeitos genotípicos obtidas com o uso do modelo AA são mais acuradas e precisas. Além disso, o procedimento REML/BLUP, utilizado no modelo AA, mostrou-se robusto aos desvios de normalidade dos resíduos, como defendido por Harville (1977). Em relação às coincidências nas seleções de genótipos obtidas com a aplicação das diferentes abordagens, pôde-se observar que, independentemente do tamanho experimental, sob h2’ igual ou maior que 15%, as maiores coincidências de seleção ocorreram entre as abordagens FF e JS (Apêndice A.3). Abaixo desse valor, a seleção proveniente do modelo FF teve maior coincidência com o modelo AF. Tais constatações eram esperadas, uma vez que, na primeira situação, o estimador JS aplica um fator k – regressor da média amostral de determinado genótipo (média estimada pelo modelo FF) sobre a média geral – sendo este, dependente do valor do teste F obtido para a fonte de variação tratamentos, segundo a análise de variância do modelo FF (Resende, 2002). Em 71 relação à segunda situação, também esperada, pois, tanto no modelo FF, quanto no modelo AF, os tratamentos são admitidos com sendo de efeito fixo. Ao se comparar as seleções obtidas com o uso do modelo AF, constatou-se sua maior coincidência com a seleção proveniente do modelo AA, sobretudo quando os valores de h2’ foram iguais ou superiores a 15%. Vale lembrar, entretanto, que o uso do modelo AF, especialmente em experimentos com grande número de tratamentos, resultou em valores elevados de DPM, o que depõem contra a sua utilização. Apenas quando h2’ foi igual a 6%, houve maior coincidência de seleção entre os modelos AF e FF (Apêndice A.3), talvez porque ambos admitam os efeitos de tratamentos como fixos. Quanto às seleções obtidas com o uso do modelo FA, observou-se maior coincidência com as abordagens FF e JS, em especial para h2’ iguais ou superiores a 48%. Apesar da proximidade entre as seleções dos modelos FA e FF, sob médios e altos valores de h2’, a modelagem FF continuou mantendo altos valores de DPM, mesmo sob os valores máximos de h2’ avaliados (82%). Sob menores valores de h2’, as maiores coincidências de seleção com o modelo FA recaíram sobre a abordagem AA (Apêndice A.3). A análise dos percentuais de ajustes não-válidos nas diferentes abordagens estatísticas permitiu, primeiramente, constatar que os modelos FF e AF não apresentaram esse tipo de ajuste, devido ao efeito dos tratamentos genéticos ter, sempre, natureza fixa. Este resultado corrobora aqueles obtidos por Tomé et al. (2002). Nos experimentos com 15 tratamentos, para as abordagens com shrinkage (FA, AA e JS), foram observados ajustes não-válidos na faixa de 6% a 48% de h2’. Em média, o percentual destes ajustes foi de 25%, na classe de 6% de h2’, e de 24% na classe de 15% de h2’ (Tabela 4.7). Para as classes de 25% e 48% de h2’, a média de ajustes não-válidos das abordagens com shrinkage foi de cerca de 1,5%, e entre estas, o modelo FA apresentou percentual de ajustes não-válidos ligeiramente superior às demais abordagens. Nos experimentos com 54 e 105 tratamentos, as abordagens shrinkage apresentaram percentuais de ajustes não-válidos apenas sob h2’ iguais a 6% e 15%. As médias de ajustes não-válidos para estes coeficientes corresponderam, respectivamente, a 7% e 5% para 54 tratamentos, e 15% e 7% para 105 tratamentos (Tabela 4.7). Para experimentos com 450 tratamentos, a classe de h2’ entre 6% e 48% também apresentou ajustes não-válidos apenas para as abordagens com shrinkage. O maior percentual destes ajustes ocorreu sob h2’ de 6%, com média 40% para estas abordagens. Sob h 2’ de 15%, apenas a aplicação do modelo AA resultou em 1% de ajustes não-válidos. Quando o valor 72 do h2’ foi igual a 25%, a média de ajustes não-válidos das abordagens com shrinkage foi de 5% e, para valores de h2’ superiores, eles não mais ocorreram. Nesse contexto, vale ressaltar que, os ajustes não válidos das abordagens shrinkage para os experimentos com 450 tratamentos predominaram nos experimentos cujas magnitudes das variâncias do erro, dos blocos e das repetições foram superiores ou iguais à da variância genética, isto é, quando os valores dos h2’ foram, respectivamente 6% e 25%. Tabela 4.7. Porcentagem de ajustes não-válidos das abordagens de modelo fixo (FF), modelo misto com efeito aleatório de blocos (AF), modelo misto com efeito aleatório de tratamentos (FA), modelo aleatório (AA) e estimador de James-Stein (JS), sob distribuição normal dos efeitos de tratamentos, em função do número de tratamentos do experimento e do coeficiente de determinação genotípica (h2’). Tratamentos h2' FF AF FA AA JS Tratamentos h2' FF AF FA AA JS 15 6 0 0 27 25 24 105 6 0 0 14 15 15 15 15 0 0 26 20 26 105 15 0 0 7 7 8 15 25 0 0 3 2 2 105 25 0 0 0 0 0 15 48 0 0 3 1 1 105 48 0 0 0 0 0 15 63 0 0 0 0 0 105 63 0 0 0 0 0 15 82 0 0 0 0 0 105 82 0 0 0 0 0 54 6 0 0 7 7 7 450 6 0 0 40 42 37 54 15 0 0 6 4 6 450 15 0 0 0 1 0 54 25 0 0 0 0 0 450 25 0 0 5 7 3 54 48 0 0 0 0 0 450 48 0 0 0 0 0 54 63 0 0 0 0 0 450 63 0 0 0 0 0 54 82 0 0 0 0 0 450 82 0 0 0 0 0 Enfim, pôde-se concluir que, com o aumento de h2’ ocorre redução no percentual de ajustes não-válidos resultantes da aplicação das abordagens com shrinkage, independentemente da quantidade de tratamentos avaliada. Isso corrobora os resultados de Tomé et al. (2002), de que, sob baixa variância ambiental, com o aumento da herdabilidade nos experimentos, aumenta-se a proporção de ajustes válidos para todos os tipos de modelos mistos. 4.4 CONCLUSÕES A adoção do modelo aleatório (AA) resulta em predições mais fidedignas das médias genotípicas, sobretudo nos casos em que houver baixa variabilidade entre os tratamentos genéticos. Sob coeficientes de determinação genotípica (h2’) tão baixos quanto 6%, o modelo que mais se aproxima de AA é o de blocos fixos e tratamentos aleatórios (FA) e, sob h2’>15%, o de blocos aleatórios e tratamentos fixos (AF). i) 73 ii) As diferenças em acurácia, erro médio de predição e erro padrão da média entre as abordagens reduzem-se à medida que se eleva o coeficiente de determinação genotípica, o que torna as estimativas e predições obtidas com as diferentes abordagens cada vez mais próximas entre si. O modelo fixo (FF) apresenta o pior desempenho relativo nos quesitos avaliados, o que é revertido apenas sob variabilidade bastante elevada entre os tratamentos genéticos (h2’→1,0), situação que é pouco provável na realidade. O estimador de James-Stein (JS), embora com pequeno erro médio de predição, apresenta acurácia tão baixa quanto o modelo fixo (FF). Esse desempenho, contudo, pode ter sido influenciado pelo delineamento em estudo (látice), haja vista o estimador ter sido derivado para blocos completos casualizados (sem recuperação de informação nterblocos). As maiores coincidências de seleção genotípica, sob valores de h2’ inferiores a 60%,ocorreram entre os modelos FA e AA; caso contrário, as coincidências foram maiores entre as seleções resultantes dos modelos FF e FA, e do estimador de JamesStein. As abordagens com shrinkage das médias genotípicas (modelos FA e AA, e estimador JS) apresentam percentuais médios de ajustes não-válidos quase nunca inferiores a 5%, quando os valores de h2’ são menores que 15%. Isso pode comprometer o emprego dessas abordagens, embora o problema desapareça quando os valores de h2’ são iguais ou superiores a 48%. iii) iv) v) vi) vii) A estimação REML/BLUP associada aos modelos mistos com efeitos aleatórios de tratamentos mostra-se robusta à falta de normalidade nestes efeitos. 74 Apêndice A1. Rotina computacional SAS® utilizada para a simulação e análise de experimentos em látice (ex. látice 5 x 3), na presente pesquisa. options nodate ps=100 ls=80; %let e=100; %macro simulatt; %do exp=1 %to &e; %let m=6.67; %let ve=1; %let vb=1; %let vrep=1; %let vt=0.2; %let v=15; %let b=5; %let r=3; %let k=3 /*tamanho do bloco*/; title 'Lattice retangular 5x3'; proc plan seed=33373; factors rep=1 block=5 plot=3 / noprint; treatments trat=3 of 15 cyclic (1 2 3) 3; output out=c1; factors rep=2 block=5 plot=3 / noprint; treatments trat=3 of 15 cyclic (1 6 11) 3; output out=c2; factors rep=3 block=5 plot=3 / noprint; treatments trat=3 of 15 cyclic (1 12 14) 3; output out =c3; quit; data c2; set c2; if rep=1 then delete; run; data c3; set c3; if rep=1 then delete; if rep=2 then delete; run; data latice; set c1 c2 c3; parc=100*rep+10*block+plot; run ; proc sort; by trat rep block parc; run; data trat; do block=1 to &b by 1; do plot=1 to &k by 1; ti=0+sqrt(&vt)*RANNOR(-554785); do rep=1 to &r by 1; parc=100*rep+10*block+plot; output; end; end; end; run; data trat (keep=ti rep); set trat; run; data lat_trat; merge latice trat; run; proc sort; by rep block parc; run; data exp_branco; do rep=1 to &r by 1; erep=0+sqrt(&vrep)*RANNOR(-234578); do block=1 to &b by 1; ebl=0+sqrt(&vb)*RANNOR(-546878); do plot=1 to &k by 1; parc=100*rep+10*block+plot; err=0+sqrt(&ve)*RANNOR(-647585); ybr=&m+erep+ebl+err; output; end; end; end; run; proc sort ; by rep block parc; 75 run; data exp_final; merge exp_branco lat_trat; bloco=rep*10+block; y=ybr+ti; mi=&m+ti; output; run; data mti (keep= rep trat ti mi); set exp_final; if rep>1 then delete; run; proc sort; by trat; run; proc mixed noinfo noitprint data=exp_final; classes rep bloco trat; model y = bloco trat; estimate 'media_geral' intercept 1; lsmeans trat; ods listing exclude lsmeans; ods output lsmeans = MD_FIX; ods listing exclude estimates; ods output estimates = MD_GERAL; ods listing exclude tests3; ods output tests3 = FV; run; proc mixed noinfo noitprint data=exp_final method=type1; classes rep bloco trat; model y = ; random bloco trat; ods listing exclude type1; ods output type1 = ESP_QM; run; data ESP_QM (keep= source MS EMS); set ESP_QM; if source='bloco' then delete; run; data Valor_K (keep= EMS); set ESP_QM; if source='Residual' then delete; run; data Valor_K (keep=source Coef); set Valor_K; Coef=substr (EMS,17,6); source='trat'; run; data QMTRAT (keep=source MS rename=(MS=QM_TR)); set ESP_QM; if source='Residual' then delete; run; data QMERRO (keep= MS rename=(MS=QM_Er)); set ESP_QM; if source='trat' then delete; run; data QMERRO; set QMERRO; source='trat'; run; data QUAD_TR; merge QMTRAT QMERRO Valor_k; QMTR_r=QM_TR/Coef; QTR_SAS=(QM_TR-QM_Er)/Coef; run; data QUAD_TR (keep= QMTR_r QTR_SAS trat); set QUAD_TR; do trat=1 to &v by 1; output; end; run; 76 data MD_GERAL (keep= estimate); set MD_GERAL; run; data MD_GERAL; set MD_GERAL; MG=estimate; do trat=1 to &v by 1; output; end; run; data MD_FIX (keep= trat estimate stderr rename=(estimate=med_fix stderr=std_fix)); set MD_FIX; run; data MOD_FIXO (drop=estimate); merge MD_FIX MD_GERAL; gi_fix=med_fix - MG; run; data FV (keep= Fvalue trat); set FV; if effect='bloco' then delete; do trat=1 to &v by 1; output; end; run; data James; merge MOD_FIXO FV QUAD_TR; if Fvalue=1 then KJS=0; if Fvalue>1 then KJS=1-(0.86)/Fvalue; if Fvalue<1 then KJS=0; Med_Jam=(KJS*(med_fix - MG))+ MG; gi_Jam=Med_Jam - MG; VarJaSt=QMTR_r*(KJS*KJS); std_Jam=sqrt(VarJaSt); pev_Jam=QTR_SAS-((KJS*KJS)*QMTR_r); run; proc mixed noinfo noitprint data=exp_final; classes rep bloco trat; model y = trat; random bloco; estimate 'media_geral' intercept 1; lsmeans trat; ods listing exclude lsmeans; ods output lsmeans = BL_ALE; ods listing exclude estimates; ods output estimates = MD_GERAL; ods listing close; run; data MD_GERAL (keep= estimate); set MD_GERAL; run; data MD_GERAL; set MD_GERAL; MG=estimate; do trat=1 to &v by 1; output; end; run; data BL_ALE (keep= trat estimate stderr rename=(estimate=med_bal stderr=std_bal)); set BL_ALE; run; data BLO_ALE (drop=estimate); merge BL_ALE MD_GERAL; gi_bal=med_bal - MG; run; proc mixed noinfo noitprint data=exp_final; classes rep bloco trat; model y = bloco; random trat/solution; 77 ods listing exclude solutionr; ods output solutionr = TRA_ALE; ods listing close; run; data TRA_ALE (keep= trat estimate stderrpred rename=(estimate=gi_tal stderrpred=std_tal)); set TRA_ALE; run; proc mixed noinfo noitprint data=exp_final; classes rep bloco trat; model y = ; random bloco trat/solution; ods listing exclude solutionr; ods output solutionr = MOD_ALE; ods listing close; run; data MOD_ALE; set MOD_ALE; if effect='bloco' then delete; run; data MOD_ALE (keep= trat estimate stderrpred rename=(estimate=gi_ale stderrpred=std_ale)); set MOD_ALE; run; data saida1; merge MOD_FIXO BLO_ALE TRA_ALE MOD_ALE James; run; proc sort data=MOD_FIXO; by descending gi_fix; run; proc sort data=BLO_ALE; by descending gi_bal; run; proc sort data=TRA_ALE; by descending gi_tal; run; proc sort data=MOD_ALE; by descending gi_ale; run; proc sort data=James; by descending gi_Jam; run; data sele1 (keep= trat gi_fix); set MOD_FIXO; if _N_>0.20*&v then delete; run; data sele2 (keep= trat gi_bal); set BLO_ALE; if _N_>0.20*&v then delete; run; data sele3 (keep= trat gi_tal); set TRA_ALE; if _N_>0.20*&v then delete; run; data sele4 (keep= trat gi_ale); set MOD_ALE; if _N_>0.20*&v then delete; run; data sele5 (keep= trat gi_Jam); set James; if _N_>0.20*&v then delete; run; proc sort data=sele1; by TRAT; run; proc sort data=sele2; by TRAT; run; proc sort data=sele3; by TRAT; run; proc sort data=sele4; by TRAT; run; proc sort data=sele5; by TRAT; run; data COMP12; merge sele1 sele2; by trat; run; data COMP13; merge sele1 sele3; by trat; run; data COMP14; merge sele1 sele4; by trat; run; data COMP15; merge sele1 sele5; by trat; run; data COMP23; merge sele2 sele3; by trat; run; data COMP24; merge sele2 sele4; by trat; run; data COMP25; merge sele2 sele5; by trat; run; data COMP34; merge sele3 sele4; by trat; run; data COMP35; merge sele3 sele5; by trat; run; data COMP45; merge sele4 sele5; by trat; run; data COMP12; set COMP12; if gi_fix=. then delete; if gi_bal=. then delete; run; data COMP13; set COMP13; if gi_fix=. then delete; if gi_tal=. then delete; run; data COMP14; set COMP14; if gi_fix=. then delete; if gi_ale=. then delete; run; data COMP15; set COMP15; if gi_fix=. then delete; if gi_Jam=. then delete; run; data COMP23; set COMP23; if gi_bal=. then delete; if gi_tal=. then delete; run; data COMP24; set COMP24; if gi_bal=. then delete; if gi_ale=. then delete; run; data COMP25; set COMP25; if gi_bal=. then delete; if gi_Jam=. then delete; run; data COMP34; set COMP34; if gi_tal=. then delete; if gi_ale=. then delete; run; data COMP35; set COMP35; if gi_tal=. then delete; if gi_Jam=. then delete; run; data COMP45; set COMP45; if gi_ale=. then delete; if gi_Jam=. then delete; run; proc means mean noprint data=COMP12; output out=COINC12; run; data COINC12 (keep=trat rename=(trat=Nc12)); set COINC12; exper=&exp; if _N_>1 then delete; run; proc means mean noprint data=COMP13; output out=COINC13; run; data COINC13 (keep=trat rename=(trat=Nc13)); set COINC13; exper=&exp; if _N_>1 then delete; run; proc means mean noprint data=COMP14; output out=COINC14; run; data COINC14 (keep=trat rename=(trat=Nc14)); set COINC14; exper=&exp; if _N_>1 then delete; run; proc means mean noprint data=COMP15; output out=COINC15; run; data COINC15 (keep=trat rename=(trat=Nc15)); set COINC15; exper=&exp; if _N_>1 then delete; run; 78 proc means mean noprint data=COMP23; output out=COINC23; run; data COINC23 (keep=trat rename=(trat=Nc23)); set COINC23; exper=&exp; if _N_>1 then delete; run; proc means mean noprint data=COMP24; output out=COINC24; run; data COINC24 (keep=trat rename=(trat=Nc24)); set COINC24; exper=&exp; if _N_>1 then delete; run; proc means mean noprint data=COMP25; output out=COINC25; run; data COINC25 (keep=trat rename=(trat=Nc25)); set COINC25; exper=&exp; if _N_>1 then delete; run; proc means mean noprint data=COMP34; output out=COINC34; run; data COINC34 (keep=trat rename=(trat=Nc34)); set COINC34; exper=&exp; if _N_>1 then delete; run; proc means mean noprint data=COMP35; output out=COINC35; run; data COINC35 (keep=trat rename=(trat=Nc35)); set COINC35; exper=&exp; if _N_>1 then delete; run; proc means mean noprint data=COMP45; output out=COINC45; run; data COINC45 (keep=trat rename=(trat=Nc45)); set COINC45; exper=&exp; if _N_>1 then delete; run; data COINCID; merge COINC12 COINC13 COINC14 COINC15 COINC23 COINC24 COINC25 COINC34 COINC35 COINC45; run; data saida2 (drop= rep MG med_fix med_bal); merge saida1 mti; d_fix=gi_fix-ti; d_bal=gi_bal-ti; d_tal=gi_tal-ti; d_ale=gi_ale-ti; d_jam=gi_Jam-ti; sq_d_fix=d_fix*d_fix; sq_d_bal=d_bal*d_bal; sq_d_tal=d_tal*d_tal; sq_d_ale=d_ale*d_ale; sq_d_jam=d_Jam*d_Jam; run; proc corr data=saida2 noprint outp=correla; var gi_fix gi_bal gi_tal gi_ale gi_Jam; with ti; run; data correla (rename=(gi_fix=r_ti_gfix gi_bal=r_ti_gbal gi_tal=r_ti_gtal gi_ale=r_ti_gale gi_Jam=r_ti_Jam)); set correla; if _type_^='CORR' then delete; run; data correla (drop=_type_ _name_); set correla; exper=&exp; run; data dpredq (keep=ti std_fix std_bal std_tal std_ale std_Jam pev_Jam sq_d_fix sq_d_bal sq_d_tal sq_d_ale sq_d_Jam); set saida2; run; proc means mean noprint data=dpredq; output out=dpq_m; run; data dpred_m (drop=_type_ sq_d_fix sq_d_bal sq_d_tal sq_d_ale sq_d_Jam); set dpq_m; if _stat_^='MEAN' then delete; dpm_fix = sqrt(sq_d_fix); dpm_bal = sqrt(sq_d_bal); dpm_tal = sqrt(sq_d_tal); dpm_ale = sqrt(sq_d_ale); dpm_Jam = sqrt(sq_d_Jam); run; data dpred_m (drop=_stat_); set dpred_m; exper=&exp; run; data saida3 (rename=(_freq_=n_trat ti=med_ti));; merge correla dpred_m COINCID; run; proc append base=TODOS data=saida3; run; %end; %mend simulatt; %simulatt; 79 Apêndice A.2. Valores de acurácia, erro padrão (EPM) e desvio preditivo médio (DPM), obtidos com a aplicação de modelo fixo (FF), modelo misto com efeito aleatório de blocos (AF), modelo misto com efeito aleatório de tratamentos (FA), modelo aleatório (AA) e estimador de James-Stein (JS), em experimentos simulados, delineados em látice com diferentes números de tratamentos e coeficientes de determinação genotípica (h2’). Número de h2’ Abordagem tratamentos (%) 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 6 6 6 6 6 15 15 15 15 15 25 25 25 25 25 48 48 48 48 48 63 63 63 63 63 82 82 82 82 82 6 6 6 6 6 15 15 15 15 15 25 25 25 25 25 48 48 48 48 48 63 63 63 63 63 82 82 82 82 82 FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS Acurácia D. normal D. uniforme 0,522 0,546 0,558 0,577 0,545 0,513 0,576 0,549 0,603 0,539 0,803 0,819 0,809 0,823 0,807 0,799 0,845 0,807 0,848 0,803 0,948 0,953 0,949 0,953 0,948 0,948 0,962 0,948 0,962 0,948 0,522 0,538 0,544 0,552 0,527 0,554 0,596 0,574 0,600 0,558 0,808 0,819 0,814 0,822 0,808 0,831 0,859 0,837 0,860 0,831 0,951 0,954 0,951 0,954 0,951 0,958 0,967 0,959 0,967 0,958 0,515 0,534 0,543 0,554 0,538 0,534 0,595 0,559 0,610 0,551 0,804 0,819 0,808 0,822 0,805 0,815 0,859 0,819 0,860 0,817 0,952 0,956 0,952 0,956 0,952 0,952 0,965 0,952 0,965 0,952 0,522 0,536 0,541 0,549 0,529 0,561 0,604 0,578 0,605 0,565 0,811 0,822 0,818 0,825 0,811 0,830 0,858 0,836 0,858 0,830 0,951 0,955 0,952 0,955 0,951 0,959 0,967 0,959 0,967 0,959 Erro padrão D. normal D. uniforme 0,692 0,737 0,394 0,386 0,429 0,697 0,583 0,383 0,354 0,411 0,703 0,741 0,574 0,558 0,846 0,703 0,585 0,570 0,522 0,522 0,702 0,745 0,864 0,837 2,120 0,704 0,585 0,859 0,780 2,093 0,718 0,732 0,369 0,363 0,297 0,658 0,591 0,351 0,337 0,294 0,724 0,738 0,578 0,570 0,827 0,663 0,595 0,549 0,517 0,851 0,718 0,732 0,736 0,719 2,125 0,661 0,593 0,694 0,642 2,149 0,203 0,214 0,114 0,108 0,091 0,203 0,169 0,114 0,103 0,094 0,202 0,214 0,167 0,163 0,242 0,202 0,169 0,167 0,153 0,245 0,202 0,214 0,249 0,241 0,613 0,201 0,169 0,248 0,226 0,610 0,208 0,212 0,103 0,102 0,075 0,192 0,172 0,101 0,097 0,078 0,208 0,213 0,168 0,165 0,243 0,190 0,171 0,159 0,149 0,248 0,207 0,212 0,213 0,208 0,615 0,191 0,172 0,201 0,186 0,623 Desvio preditivo médio D. normal D. uniforme 0,692 0,653 0,443 0,412 0,439 0,685 0,580 0,416 0,390 0,433 0,724 0,689 0,635 0,613 0,633 0,724 0,618 0,634 0,564 0,634 0,873 0,843 0,853 0,826 0,853 0,888 0,802 0,866 0,790 0,867 0,719 0,690 0,393 0,391 0,403 0,657 0,587 0,385 0,375 0,392 0,725 0,697 0,593 0,582 0,601 0,669 0,598 0,558 0,523 0,568 0,768 0,743 0,735 0,716 0,738 0,718 0,655 0,692 0,639 0,695 0,301 0,294 0,255 0,254 0,258 0,299 0,279 0,254 0,249 0,257 0,540 0,536 0,530 0,527 0,530 0,541 0,530 0,532 0,525 0,532 1,133 1,131 1,132 1,130 1,132 1,142 1,137 1,141 1,137 1,141 0,304 0,299 0,251 0,251 0,252 0,294 0,281 0,250 0,249 0,251 0,542 0,539 0,528 0,527 0,529 0,537 0,530 0,526 0,523 0,527 1,136 1,135 1,135 1,133 1,135 1,135 1,131 1,133 1,131 1,134 80 Apêndice A.2. Continuação... Número de h2’ Abordagem tratamentos (%) 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 6 6 6 6 6 15 15 15 15 15 25 25 25 25 25 48 48 48 48 48 63 63 63 63 63 82 82 82 82 82 6 6 6 6 6 15 15 15 15 15 25 25 25 25 25 48 48 48 48 48 63 63 63 63 63 82 82 82 82 82 FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS Acurácia D. normal D. uniforme 0,418 0,423 0,431 0,433 0,422 0,498 0,515 0,509 0,519 0,501 0,719 0,724 0,724 0,727 0,719 0,795 0,808 0,799 0,808 0,795 0,918 0,921 0,919 0,921 0,918 0,946 0,950 0,946 0,950 0,946 0,436 0,443 0,469 0,470 0,459 0,511 0,524 0,518 0,525 0,511 0,735 0,742 0,751 0,756 0,738 0,801 0,810 0,804 0,811 0,801 0,924 0,927 0,927 0,929 0,924 0,948 0,951 0,949 0,951 0,948 0,423 0,428 0,435 0,437 0,428 0,503 0,519 0,513 0,523 0,505 0,719 0,725 0,724 0,728 0,719 0,793 0,806 0,797 0,807 0,793 0,919 0,921 0,919 0,921 0,919 0,947 0,951 0,947 0,951 0,947 0,440 0,447 0,470 0,472 0,460 0,512 0,524 0,519 0,526 0,512 0,735 0,742 0,751 0,755 0,737 0,801 0,810 0,805 0,811 0,801 0,924 0,927 0,926 0,929 0,924 0,948 0,952 0,949 0,952 0,948 Erro padrão D. normal D. uniforme 0,955 0,974 0,395 0,396 0,245 0,756 0,723 0,369 0,363 0,259 0,954 0,969 0,675 0,671 0,737 0,757 0,725 0,599 0,586 0,814 0,957 0,975 0,895 0,885 2,072 0,758 0,727 0,743 0,718 2,115 1,011 1,020 0,338 0,336 0,161 0,754 0,733 0,367 0,359 0,219 1,004 1,013 0,633 0,627 0,619 0,755 0,735 0,597 0,589 0,797 1,001 1,010 0,902 0,899 1,996 0,755 0,735 0,720 0,704 2,119 0,277 0,282 0,118 0,117 0,062 0,219 0,210 0,105 0,103 0,681 0,276 0,282 0,196 0,195 0,214 0,219 0,209 0,172 0,169 0,232 0,277 0,282 0,259 0,256 0,596 0,219 0,210 0,215 0,207 0,611 0,289 0,292 0,096 0,095 0,028 0,218 0,212 0,106 0,103 0,063 0,289 0,292 0,183 0,180 0,174 0,218 0,212 0,172 0,170 0,230 0,290 0,293 0,262 0,261 0,575 0,218 0,212 0,207 0,203 0,613 Desvio preditivo médio D. normal D. uniforme 0,950 0,936 0,425 0,425 0,430 0,756 0,723 0,402 0,398 0,405 0,960 0,944 0,700 0,697 0,707 0,764 0,731 0,611 0,598 0,616 0,978 0,963 0,898 0,888 0,904 0,787 0,754 0,747 0,721 0,750 0,926 0,904 0,422 0,423 0,421 0,747 0,723 0,388 0,387 0,390 0,923 0,902 0,704 0,707 0,703 0,748 0,724 0,597 0,588 0,601 0,926 0,906 0,853 0,844 0,862 0,755 0,731 0,714 0,696 0,717 0,355 0,352 0,255 0,255 0,256 0,313 0,306 0,252 0,252 0,253 0,573 0,571 0,541 0,540 0,541 0,545 0,541 0,529 0,527 0,529 1,148 1,147 1,142 1,142 1,143 1,143 1,141 1,141 1,139 1,141 0,347 0,343 0,255 0,255 0,254 0,311 0,306 0,250 0,250 0,250 0,567 0,564 0,540 0,541 0,540 0,545 0,542 0,529 0,528 0,529 1,149 1,147 1,144 1,143 1,144 1,139 1,137 1,137 1,136 1,137 81 Apêndice A.3. Porcentagem de coincidência de seleção entre as abordagens modelo fixo (FF), modelo misto com efeito aleatório de blocos (AF), modelo misto com efeito aleatório de tratamentos (FA), modelo aleatório (AA) e estimador de James-Stein (JS), em experimentos simulados, delienados em látice com diferentes números de tratamentos e coeficientes de determinação genotípica (h2’), e sob dois tipos de distribuição associada à geração dos efeitos dos tratamentos. Tratamentos 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 54 h2’ (%) Abordagem FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS 6 6 6 6 6 15 15 15 15 15 25 25 25 25 25 48 48 48 48 48 63 63 63 63 63 82 82 82 82 82 6 6 6 6 6 15 15 15 15 15 25 25 25 25 25 48 48 48 48 48 63 63 63 63 63 82 82 82 82 82 Distribuição normal uniforme FF FF 100 100 85 84 70 70 67 67 81 78 100 100 74 74 70 72 63 65 79 79 100 100 88 89 92 92 86 87 99 99 100 100 81 81 91 91 80 80 99 99 100 100 95 93 97 98 94 94 100 100 100 100 90 89 98 98 90 89 100 100 100 100 88 88 80 78 78 76 94 92 100 100 78 78 81 80 74 75 95 95 100 100 91 91 91 91 88 88 100 100 100 100 84 83 91 91 83 83 100 100 100 100 95 94 97 96 94 93 100 100 100 100 91 90 97 97 91 90 100 100 Distribuição normal uniforme AF AF 85 84 100 100 68 66 73 72 71 68 74 74 100 100 63 64 79 82 62 62 88 89 100 100 87 87 94 93 88 89 81 81 100 100 81 81 97 98 81 80 95 93 100 100 94 93 98 98 95 93 90 89 100 100 90 89 99 100 90 89 88 88 100 100 80 78 83 81 83 82 78 78 100 100 77 77 92 93 74 74 91 91 100 100 89 89 93 93 91 91 84 83 100 100 85 85 98 98 84 83 95 94 100 100 95 94 98 97 95 94 91 90 100 100 92 91 99 99 91 90 Distribuição normal uniforme FA FA 70 70 68 66 100 100 82 82 85 86 70 72 63 64 100 100 69 71 85 86 92 92 87 87 100 100 89 89 92 92 91 91 81 81 100 100 81 80 92 92 97 98 94 93 100 100 95 94 97 98 98 98 90 89 100 100 90 89 98 98 80 78 80 78 100 100 91 90 83 82 81 80 77 77 100 100 80 80 84 83 91 91 89 89 100 100 92 93 91 91 91 91 85 85 100 100 85 85 91 91 97 96 95 94 100 100 95 94 97 96 97 97 92 91 100 100 92 91 97 97 Distribuição normal uniforme AA AA 67 67 73 72 82 82 100 100 77 78 63 65 79 82 69 71 100 100 67 68 86 87 94 93 89 89 100 100 86 87 80 80 97 98 81 80 100 100 80 79 94 94 98 98 95 94 100 100 94 94 90 89 99 100 90 89 100 100 90 89 78 76 83 81 91 90 100 100 81 80 74 75 92 93 80 80 100 100 75 75 88 88 93 93 92 93 100 100 88 88 83 83 98 98 85 85 100 100 83 83 94 93 98 97 95 94 100 100 94 93 91 90 99 99 92 91 100 100 91 90 Distribuição normal uniforme JS JS 81 78 71 68 85 86 77 78 100 100 79 79 62 62 85 86 67 68 100 100 99 99 88 89 92 92 86 87 100 100 99 99 81 80 92 92 80 79 100 100 100 100 95 93 97 98 94 94 100 100 100 100 90 89 98 98 90 89 100 100 94 92 83 82 83 82 81 80 100 100 95 95 74 74 84 83 75 75 100 100 100 100 91 91 91 91 88 88 100 100 100 100 84 83 91 91 83 83 100 100 100 100 95 94 97 96 94 93 100 100 100 100 91 90 97 97 91 90 100 100 82 Apêndice A.3. Continuação... Tratamentos 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 105 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 450 h2’ (%) Abordagem FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS FF AF FA AA JS 6 6 6 6 6 15 15 15 15 15 25 25 25 25 25 48 48 48 48 48 63 63 63 63 63 82 82 82 82 82 6 6 6 6 6 15 15 15 15 15 25 25 25 25 25 48 48 48 48 48 63 63 63 63 63 82 82 82 82 82 Distribuição normal uniforme FF FF 100 100 90 90 75 75 74 74 87 86 100 100 84 83 80 82 77 77 93 95 100 100 91 92 90 89 88 88 100 100 100 100 88 87 92 91 87 86 100 100 100 100 95 96 96 96 94 94 100 100 100 100 94 91 98 96 93 91 100 100 100 100 91 91 53 51 50 49 65 65 100 100 83 81 86 85 80 79 100 100 100 100 93 92 85 84 82 81 97 98 100 100 88 85 92 90 87 84 100 100 100 100 96 94 96 94 94 91 100 100 100 100 94 89 97 96 93 89 100 100 Distribuição normal uniforme AF AF 90 90 100 100 75 75 77 77 79 78 84 83 100 100 80 81 89 90 78 79 91 92 100 100 89 89 92 92 91 92 88 87 100 100 89 88 97 96 88 87 95 96 100 100 94 94 97 98 95 96 94 91 100 100 94 91 99 99 94 91 91 91 100 100 53 51 52 51 59 59 83 81 100 100 85 84 93 93 83 81 93 92 100 100 85 84 84 84 91 90 88 85 100 100 89 87 97 96 88 85 96 94 100 100 95 92 96 94 96 94 94 89 100 100 94 89 99 98 94 89 Distribuição normal uniforme FA FA 75 75 75 75 100 100 92 92 84 85 81 82 80 81 100 100 86 85 86 85 90 89 89 89 100 100 94 93 90 89 92 91 89 88 100 100 90 89 92 91 96 96 94 94 100 100 96 93 96 96 98 96 94 91 100 100 94 91 98 96 53 51 53 51 100 100 94 94 87 86 86 85 85 84 100 100 87 86 86 85 85 84 85 84 100 100 93 93 87 86 92 90 89 87 100 100 90 87 92 90 96 94 95 92 100 100 96 94 96 94 97 96 94 89 100 100 94 89 97 96 Distribuição normal uniforme AA AA 74 74 77 77 92 92 100 100 82 83 77 77 89 90 86 85 100 100 81 80 88 88 92 92 94 93 100 100 88 88 87 86 97 96 90 89 100 100 87 86 94 94 97 98 96 93 100 100 94 94 93 91 99 99 94 91 100 100 93 91 50 49 52 51 94 94 100 100 85 84 80 79 93 93 87 86 100 100 81 79 82 81 84 84 93 93 100 100 85 83 87 84 97 96 90 87 100 100 87 84 94 91 96 94 96 94 100 100 94 91 93 89 99 98 94 89 100 100 93 89 Distribuição normal uniforme JS JS 87 86 79 78 84 85 82 83 100 100 93 95 78 79 86 85 81 80 100 100 100 100 91 92 90 89 88 88 100 100 100 100 88 87 92 91 87 86 100 100 100 100 95 96 96 96 94 94 100 100 100 100 94 91 98 96 93 91 100 100 65 65 59 59 87 86 85 84 100 100 100 100 83 81 86 85 81 79 100 100 97 98 91 90 87 86 85 83 100 100 100 100 88 85 92 90 87 84 100 100 100 100 96 94 96 94 94 91 100 100 100 100 94 89 97 96 93 89 100 100 83 5 ESTRATIFICAÇÃO AMBIENTAL PARA AVALIAÇÃO E RECOMENDAÇÃO DE VARIEDADES DE MILHO NO ESTADO DE GOIÁS RESUMO O objetivo deste estudo foi a identificação de estratos ambientais para a recomendação de variedades de milho e a identificação de locais-chave para a condução de ensaios de avaliação desse tipo de cultivar, em Goiás. Foram avaliados 47 experimentos, provenientes de quatro safras agrícolas, 2002/03, 2003/04, 2004/05 e 2005/06, do programa de avaliação de variedades de milho da Agência Goiana de Desenvolvimento Rural e Fundiário (AgenciaRural – Goiás). A estratificação ambiental foi constituída por meio da abordagem AMMI de genótipos vencedores, que permite, pelo estudo da interação de genótipos com ambientes (G x E), tanto a identificação dos genótipos mais adaptados a cada ambiente, quanto a formação de grupos de ambientes similares. Foram estabelecidos dois estratos ambientais, que se mostraram consistentes ao longo das safras agrícolas, com destaque para o agrupamento dos locais Ipameri, Inhumas e Senador Canêdo, estável ao longo de quatro anos. O outro estrato, estável ao longo de três anos, foi constituído pelos locais Porangatu e Orizona. Com os agrupamentos obtidos, torna-se possível a redução de, pelo menos, 16% dos locais de teste atualmente utilizados e/ou, a sua substituição por outros pontos de teste, para se aumentar a eficiência da avaliação desse tipo de cultivar, nessa região. A variedade ALBandeirante destacou-se como sendo de alto potencial produtivo e de grande adaptabilidade à maioria das condições de cultivo do milho no Estado de Goiás. Palavras-chave: análise AMMI, genótipos vencedores, interação GxE, variedades, adaptabilidade, zoneamento, mega-ambiente. 84 ABSTRACT ENVIRONMENTAL STRATIFICATION FOR EVALUATION AND RECOMMENDATION OF MAIZE VARIETIES IN GOIÁS STATE, BRAZIL The objective of this study was the identification of environmental strata to the recommendation of maize varieties and the identification of key locations for the evaluation trials of these cultivars in the State of Goiás. Forty-seven trials from the evaluation of maize varieties program, carried out by the Agência Goiana de Desenvolvimento Rural e Fundiário (AgenciaRural – Goiás), over four growing seasons (2002/03, 2003/04, 2004/05 and 2005/06), were evaluated. The environmental stratification was set by using the winner genotypes AMMI approach, which allows, due to the study of the genotype by environment interactions (GxE), the identification of the genotypes which are more adapted to each environment, as well as the constitution of location groups that belong to similar environments. Two environmental strata that showed to be consistent throughout the growing seasons were established, with prominence for the group formed by the locations Ipameri, Inhumas and Senador Canêdo, stable along the four years. The other strata, stable throughout three years, was constituted by Porangatu and Orizona. From these clustering it is possible to reduce, at least, 16% of the test locations currently used, and/or their replacement by other test locations, aiming to increase the efficiency of the cultivar evaluation in that region. The ALBandeirante variety outstands by showing high yield potential and great adaptability to most the maize crop conditions in Goiás State. Key words: AMMI analysis, winner genotypes, GxE interaction, varieties, adaptability, zoning, mega-environment. 5.1 INTRODUÇÃO As redes de avaliação de cultivares são partes imprescindíveis nos programas de melhoramento de plantas. Com sua realização, pode ser estudado o comportamento dos 85 genótipos desenvolvidos numa ampla faixa de condições ambientais, objetivando identificar os materiais genéticos mais promissores para as diversas condições avaliadas. Isso acontece graças à possibilidade de analisar a interação dos genótipos com os ambientes (GxE) que, ao ser identificada, pode ser revertida em favor da maximização das produtividades da cultura. Dessa forma, o melhoramento pode voltar-se para a exploração de genótipos de ampla adaptabilidade, oferecendo ao setor produtivo cultivares que se sobressaiam em ampla faixa ambiental, e, ou, cultivares adaptadas a condições específicas, que podem ser adversas ou extremamente favoráveis. O programa milho da Agência Goiana de Desenvolvimento Rural e Fundiário (AgenciaRural – Goiás), tem avaliado cultivares comerciais e pré-comerciais, em parceria com empresas privadas e instituições de ensino e pesquisa de todo o Brasil. Sua rede de ensaios cobre usualmente uma faixa superior a dez ambientes por safra, buscando-se avaliar locais que sejam divergentes e tenham aptidão para a produção de milho. A estratificação de uma região, ou seja, a sua subdivisão em zonas relativamente homogêneas (estratos), permite, além da identificação e recomendação de genótipos superiores em cada estrato, a eliminação de locais de teste redundantes na rede de ensaios. Com efeito, o programa de melhoramento passa a ter uma melhor alocação de recursos materiais e técnicos, e maior possibilidade de sucesso na identificação dos genótipos, pela utilização de locais mais divergentes. Com a economia de pontos de teste, o programa pode investir no aumento no número de genótipos a serem avaliados, ou, na inclusão de novos locais de teste que podem trazer mais informações à avaliação da interação GxE. Por mais que o conhecimento e a utilização de informações sobre fatores ambientais associados à produção vegetal sejam importantes, Gauch (1992) afirma que as avaliações de similaridade ambiental com base nos efeitos da interação GxE são mais confiáveis que aquelas baseadas apenas nestes fatores, sem considerar-se os seus impactos sobre a interação GxE. Entre os métodos utilizados para este fim, o uso da “abordagem dos genótipos vencedores”, descrita em Gauch (1992) e Gauch & Zobel (1997), tem permitido a construção de estratos ambientais estáveis ao longo dos anos, para diferentes culturas e regiões (Ebdon & Gauch, 2002, Pacheco, 2004, Maranha, 2005). O objetivo deste trabalho foi realizar um estudo de estratificação ambiental para a cultura de milho em Goiás, baseado na abordagem dos genótipos vencedores 86 associada à análise AMMI (additive main effects and multiplicative interaction), buscandose a indicação de zonas agronômicas (mega-ambientes) para a recomendação de variedades de milho para o Estado de Goiás. 5.2 MATERIAL E MÉTODOS 5.2.1 Caracterização dos experimentos Foram utilizados dados de produtividade de grãos (kg.ha-1) provenientes de 47 experimentos da rede de ensaios regionais de avaliação de variedades de milho, conduzidos pela AgenciaRural – Goiás, em parceria com a Fundação de Desenvolvimento e Assistência Técnica e Extensão Rural de Goiás (Fundater). Os ensaios foram conduzidos durante quatro safras de verão, 2002/03, 2003/04, 2004/05 e 2005/06 (Tabelas 5.1 e 5.2), totalizando 19 locais. Ao longo de todo o período foram avaliados 41 genótipos, incluindo variedades de polinização aberta, principalmente, e alguns híbridos experimentais e comerciais (Tabela 5.3). Nos experimentos foi utilizado o delineamento em látice, com as seguintes variações: látice 5 x 3, com 15 tratamentos, em 2002/03; látice 6 x 4, com 24 tratamentos, em 2003/04; látice 7 x 4, com 28 tratamentos, em 2004/05; e látice 6 x 3, com 18 tratamentos, em 2005/06. Os tratamentos (variedades e híbridos) variaram de um ano para outro, como resultado da substituição natural de genótipos em programas de melhoramento genético de plantas. Cada parcela consistiu de duas linhas de plantas, com variações de um experimento para outro, de 4,0 m a 5,0 m de comprimento e espaçamentos de 0,4 m a 1,0 m nas entrelinhas. Por esse motivo, os dados de produção por parcela foram ajustados por análise de covariância, para uma população inicial de 60 mil plantas por hectare, conforme preconizam Vencovsky & Barriga (1992). 87 Tabela 5.1. Ambientes, coordenadas geográficas e datas de plantio dos ensaios de competição de variedades de milho, nas safras 2002/03 e 2003/04, em Goiás. Ambientes Latitude Sul 1 Longitude Altitude Oeste 1 Safra 2002/03 (m) Data de Plantio Safra 2003/04 Data de Plantio Campo Alegre Goianésia Goiatuba Inhumas Ipameri Itaberaí Itumbiara Morrinhos Orizona Palmeiras Porangatu Rio Verde Senador Canêdo Senador Canêdo2 1 17º41’15” 47º48’55” 15º18’45” 49º03’45” 18º03’45” 49º18’45” 16º18’45” 49º26’15” 17º41’15” 48º11’15” 28” 16º03’45” 49º48’45” 18º26’15” 49º11’15” 17º41’15” 49º03’45” 17º03’45” 48º18’45” 16º48’45” 49º56’15” 13º26’15” 49º11’15” 17º48’45” 50º 56’15” 16º41’15” 49º03’45” 16º41’15” 49º03’45” 920 670 580 800 800 640 420 830 910 560 620 745 741 741 x x x x x x x x x 26/11/2002 7/12/2002 13/11/2002 27/11/2002 8/11/2002 20/11/2002 7/11/2002 29/11/2002 x x x x x x x x x x x - 22/11/2003 12/11/2003 10/11/2003 10/11/2003 1/12/2003 2/12/2003 5/11/2003 31/10/2003 18/11/2003 14/11/2003 4/11/2003 - Fonte: http://www.cdbrasil.cnpm.embrapa.br/go/. (Coordenadas referentes aos pontos centrais das imagens, acesso em: 01/12/2006). Tabela 5.2. Ambientes, coordenadas geográficas e datas de plantio dos ensaios de competição de variedades de milho, nas safras 2004/05 e 2005/06, em Goiás. Sul1 Oeste1 18º11’15” 49º41’15” Bom Jesus 16º56’15” 51º48’45” Caiapônia 17º41’15” 47º48’55” Campo Alegre 15º18’45” 49º03’45” Goianésia 18º03’45” 49º18’45” Goiatuba 16º56’15” 49º11’15” Hidrolândia 16º18’45” 49º26’15” Inhumas 17º41’15” 48º11’15” Ipameri 28” 16º03’45” 49º48’45” Itaberaí 18º26’15” 49º11’15” Itumbiara 16º03’45” 51º26’15” Montes Claros 17º41’15” 49º03’45” Morrinhos 17º03’45” 48º18’45” Orizona 16º48’45” 49º56’15” Palmeiras 13º26’15” 49º11’15” Porangatu 17º48’45” 50º 56’15” Rio Verde Senador Canêdo 16º41’15” 49º03’45” 1 Ambientes Latitude Longitude Altitude (m) 619 750 950 670 600 775 800 800 640 420 472 771 910 560 620 836 741 Safra 2004/05 x x x x x x x x x x x x x x x Data de Plantio 5/11/2004 25/11/04 9/12/2004 20/11/2004 26/11/2004 2/12/2004 10/11/2004 15/11/2004 9/11/2004 3/12/2004 30/10/2004 29/10/2004 11/11/2004 12/11/2004 04/11/04 Safra 2005/06 x x x x x x x x x x x x Data de Plantio 11/11/2005 05/11/2005 25/11/2005 14/11/2005 10/11/2005 08/11/2005 25/11/2005 16/11/2005 04/11/2005 28/12/2005 25/11/2005 03/12/2005 Fonte: http://www.cdbrasil.cnpm.embrapa.br/go/. (Coordenadas referentes aos pontos centrais das imagens, acesso em: 01/12/2006). 88 Tabela 5.3. Genótipos testados nos ensaios da rede de avaliação de variedades de milho da Agência Goiana de Desenvolvimento Rural e Fundiário (AgenciaRural – Goiás), empresa produtora e anos agrícolas em que foram avaliados. Genótipo Airã AL200205 AL25 AL30 AL34 AlBandeirante AlBianco Alvorada AREgo18 AsPreto BR106 BRS1010 BRS2020 BRS4150 BRS473 BRSCaimbé Cativerde1 Cativerde2 Cerrado Emca202 Emgopa501 1 Tipo1 V V V V V V V V V V V HS HD V V V V V V V V Empresa Produtora Cegran/IAC Cati Cati Cati Cati AgenciaRural Cati Cati AgenciaRural Embrapa AgenciaRural Embrapa Embrapa Embrapa Embrapa Embrapa Cati Cati Embrapa Emcapa AgenciaRural 2002/ 2003/ 2004/ 2005/ 03 x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x 2 04 2 05 2 06 2 Genótipo IAC8333 Ipiranga IPR114 IPV7352 Orion PC0201 PC0202 PC0203 PC9703 PC9902 PC9903 Piratininga Samambóleo Samambaia Saracura SHS3030 SHS3031 Sol da manhã UFVM100 UFVM200 - Tipo HV V V V V V V V V V V V V V V V V V V - Empresa Produtora IAC Cati Iapar Iapar 2002/ 2003/ 2004/ 2005/ 032 x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x 042 052 x x x x x 062 HM Phd Sementes Iapar Iapar Iapar Iapar Iapar Iapar Cati UFG UFG Embrapa S. Helena S. Helena Embrapa UFV UFV - V, variedade; HS, híbrido simples; HD, híbrido duplo; HM, híbrido duplo modificado; e HV, híbrido intervarietal. 2 A presença do “x” nas colunas indica a inclusão do genótipo na avaliação da referida safra. 5.2.2 Análises estatísticas para obtenção das médias genotípicas Para a obtenção das médias genotípicas nas análises individuais dos experimentos, foi adotado o seguinte modelo em delineamento em blocos incompletos – látice: Yij = µ + βj + τi + εij (1) em que: Yijk é o valor observado do tratamento i, no bloco j; µ é a média geral do experimento; τi é o efeito do tratamento; βj é o efeito do bloco (reunindo o efeito de bloco dentro da repetição do látice); e; εijk é o erro experimental associado à observação Yij. O modelo foi admitido como aleatório em razão de estudo prévio, que resultou em maior acurácia e menor erro quadrático médio para as predições de valor genotípico obtidas por essa abordagem analítica. 89 A homogeneidade de variâncias entre os experimentos foi avaliada, dentro de cada safra, pelo critério de Pimentel Gomes (1990), isto é, uma razão entre a maior e a menor variância do erro inferior a sete. Realizaram-se, então, as análises conjuntas de variância, por safra, de acordo com o modelo a seguir, também admitido como aleatório: Yijk = µ + αk + βj(k) + τi + (τα)ik + εijk (2) em que: Yijk é a média do tratamento i no bloco j, dentro do local k; µ é a média geral; αk é o efeito do local k; βj(k) é o efeito do bloco j (reunindo o efeito da repetição do látice), dentro do local k; τi é o efeito do tratamento i; (τα)ij é o efeito da interação do tratamento i com o local k; e εijk é erro experimental associado à observação Yijk. As predições das médias das cultivares foram executadas por meio do procedimento PROC MIXED (procedure for mixed models) do SAS® (Statistical Analysis System), utilizando-se o método REML (máxima verossimilhança restrita) para a estimação dos componentes de variância associados aos modelos. As rotinas para a execução das análises individuais e conjuntas são listadas a seguir (comandos SAS, em letras maiúsculas, e atribuições do usuário em minúsculas): i) para as análises individuais: PROC MIXED DATA = tese; CLASSES experi safra local cult bloco; MODEL rendgrao = ; RANDOM bloco cult / SOLUTION; ODS LISTING EXCLUDE SOLUTIONR; ODS OUTPUT SOLUTIONR = aleato; BY experi; RUN; ii) para análise conjunta (por safra): PROC MIXED DATA= tese; CLASSES experi safra local cult bloco; MODEL rendgrao = ; RANDOM local bloco(local) local*cult cult/SOLUTION; BY safra; RUN; De posse das médias genotípicas preditas, pela abordagem de modelo aleatório, para os diferentes ensaios e dos respectivos quadrados médios residuais para cada safra, foram construídas matrizes com as médias dos genótipos por ambiente, para a realização da análise de interação de genótipos com ambientes (GxE). Esta, porém, foi implementada sob uma abordagem de modelo fixo. 90 5.2.3 Análise da interação GxE e estratificação ambiental A análise de interação GxE foi desenvolvida segundo o modelo AMMI (additive main effects and multiplicative interaction ), cujas aplicações nesse tipo de análise foram introduzidas por Kempton (1984) e Zobel et al. (1988). O modelo é assim descrito detalhadamente por Duarte & Vencovsky (1999): Yij = μ + gi + ej + [ ∑ λ k γ ik α jk + ρ ij ] + εij k= 1 n em que: Yij é a resposta média do genótipo i (i = 1, 2, ..., g) no ambiente j (j = 1, 2, ..., e); μ é uma constante comum às respostas (a média geral dos experimentos); gi é o efeito do genótipo i; ej é o efeito do local j; λk é o k-ésimo valor singular da matriz de interações GA, definida como GA(gxe)= (ge) ij , sendo (ge) ij a clássica estimativa de quadrados mínimos do termo (ge)ij, dada por (ge) ij = Yij − Yi. − Y. j + Y.. (o valor λk, com k = 1, 2, ..., p, e “p” sendo o posto da matriz GA, é expresso na mesma unidade de Yij e relaciona-se a uma 2 proporção da soma de quadrados SQGxE = ∑ (ge) ij , que é particionada em “n” termos de i, j ∧ ∧ ∧ ∧ valores decrescentes, com n < p); γik é um efeito adimensional, o i-ésimo elemento do autovetor de GAxGA’ associado a λk, que representa o peso do genótipo i para as suas interações; αjk é um efeito adimensional, o j-ésimo elemento do autovetor de GA’xGA associado a λk, que representa o peso do ambiente j para as suas interações; e εij é o erro experimental médio, assumido independente, com distribuição normal, média zero e variância comum. Neste modelo, o termo (ge)ij, referido tradicionalmente como a interação do genótipo i com o ambiente j, é modelado como ( ge) ij = ∑ n k= 1 λ k γ ijα jk + ρij , sendo a primeira parte denominada padrão, isto é, a interação GxE propriamente dita, e a segunda, ρij, o ruído presente nos desvios dos ajustes dos efeitos principais gi e ej. O modelo é ajustado por ANOVA (efeitos principais) e por análise de componentes principais – ACP (termos multiplicativos da interação). Para estimar os parâmetros, foi utilizada a rotina SAS® desenvolvida por Duarte & Vencovsky (1999). 91 Em razão da falta das predições de média (Yij) das cultivares ALBandeirante e BRS473, respectivamente, em Montes Claros, safra 2004/05, e em Porangatu, safra 2005/06, e pelo fato de a análise AMMI mais difundida não admitir dados perdidos na matriz de médias gxe, tais médias foram estimadas, dentro de cada safra, por: Yij = Υi. + Υ.j − Υ.. em que: Υi. é a média do genótipo i sobre todos os locais; Υ.j é a média do local j sobre todos os genótipos; e Υ .. é a média geral dos experimentos. A estratificação dos ambientes foi estabelecida por meio da abordagem de genótipos vencedores, conforme preconizam Ebdon & Gauch (2002). Define-se um genótipo vencedor como aquele que alcança a mais alta produtividade em um dado ambiente (Gauch, 1992; Gauch & Zobel, 1997). Pacheco (2004) descreve o método em detalhes, partindo da adoção do modelo AMMI1, isto é o modelo AMMI com apenas o primeiro termo multiplicativo associado ao padrão da interação GxE. As estimativas ~ AMMI1 da produtividade de cada genótipo em cada ambiente ( Yij ) são obtidas por meio da equação: ~ Yij = Yi. + (IPCA1i)(IPCA1j) em que: Yi. é a média do genótipo i sobre todos os ambientes; IPCA1i é o escore do genótipo i no primeiro eixo principal de interação (IPCA1); e IPCA1j é o escore do ambiente j neste mesmo eixo de interação (IPCA1). ~ Dessa forma, a produtividade de cada genótipo em cada ambiente ( Yij ) pode ser representada como uma função linear simples do escore ambiental (IPCA1j), isto é, uma equação da reta com intercepto Yi . e inclinação igual ao escore genotípico de interação (IPCA1i). O ponto de cruzamento entre duas dessas retas, referentes a dois genótipos vencedores, define, portanto, a transição adaptativa dos dois genótipos; isto é, dois estratos ambientais de adaptação produtiva. Esses genótipos apresentam adaptação específica ao estrato que o elege como vencedor e, ao mesmo tempo, estabilidade no sentido agronômico para as localidades que compõem esse estrato. Assim, um estrato se caracteriza como um mega-ambiente, ou conjunto de locais, que apresenta um vencedor comum. O ponto de cruzamento equivale também ao escore de ambiente em que a ~ diferença entre as estimativas Yij dos dois genótipos vencedores é igual à zero (Pacheco, 92 2004). A execução dessas análises foi implementada em planilhas eletrônicas construídas no aplicativo Microsoft Excel®, que também foi utilizado para a geração dos respectivos gráficos. Devido à existência de híbridos simples e duplos entre os genótipos avaliados, nos estratos cuja formação foi determinada por um destes genótipos, a recomendação das variedades, e também a estratificação, foram feitas baseando-se no comportamento da primeira variedade vencedora, após a exclusão de tais híbridos. Issso pode ser feito graças a possibilidade de remoção de vencedores absolutos, o que permite avaliar adaptações específicas dos demais materiais sob teste. 5.3 RESULTADOS E DISCUSSÃO De forma geral, as estimativas do coeficiente de variação experimental (CV) e das médias de produtividade de grãos, nos 47 ensaios considerados neste estudo, foram aceitáveis e condizentes com experimentos de avaliação de cultivares, isto é, com os requisitos dos ensaios de VCU (valor de cultivo e uso) para a cultura do milho. Os valores de CV variaram entre 5,6% e 18,2%, enquanto as médias de produtividade ficaram entre 3.564 kg.ha-1 e 9.207 kg.ha-1 (Figura 5.1). 20 18 16 14 12 CV (%) 10 8 6 4 2 0 Goianésia 02/03 Goiatuba 02/03 Inhumas 02/03 Ipameri 02/03 Morrinhos 02/03 Palmeiras 02/03 Porangatu 02/03 S.Canêdo 02/03 S.Canêdo2 02/03 C.Alegre 03/04 Goianésia 03/04 Inhumas 03/04 Ipameri 03/04 Itaberaí 03/04 Itumbiara 03/04 Morrinhos 03/04 Orizona 03/04 Porangatu 03/04 R.Verde 03/04 S.Canêdo 03/04 B.Jesus 04/05 C.Alegre 04/05 Goianésia 04/05 Goiatuba 04/05 Inhumas 04/05 Ipameri 04/05 Itaberaí 04/05 Itumbiara 04/05 M.Claros 04/05 Morrinhos 04/05 Orizona 04/05 Palmeiras 04/05 Porangatu 04/05 R.Verde 04/05 S.Canêdo 04/05 C.Alegre 05/06 Caiapônia 05/06 Goianésia 05/06 Goiatuba 05/06 Hidrolândia 05/06 Inhumas 05/06 Ipameri 05/06 Itaberaí 05/06 Orizona 05/06 Porangatu 05/06 R.Verde 05/06 S.Canêdo 05/06 coeficiente de variação experimental (%) média de produtividade do experimento kg.ha -1 9500 9000 8500 8000 7500 7000 6000 5500 5000 4500 4000 3500 -1 . 6500 Figura 5.1. Coeficientes de variação experimental (%) e médias de produtividade (kg.ha-1) dos experimentos de avaliação de variedades de milho, em Goiás (safras 2002/03, 2003/04, 2004/05 e 2005/06). kg.ha . 93 De acordo com a Portaria nº 85, de 05/05/1998 (Anexo V), do Ministério da Agricultura Pecuária e Abastecimento - MAPA (Brasil, 1998), VCU é o valor intrínseco de combinação das características agronômicas da cultivar com as suas propriedades de uso em atividades agrícolas, industriais, comerciais e, ou, de consumo. Em seu Anexo V, que trata dos requisitos mínimos para a determinação do VCU em milho e inscrição no Registro Nacional de Cultivares (RNC), entre outras características, estabelece-se que: i) os genótipos devem ser testados em, no mínimo, três locais por região edafoclimática de importância para a cultura, por ano; ii) os ensaios devem ser avaliados por no mínimo dois anos e, ou, em duas estações de cultivo; iii) os experimentos devem ser instalados com delineamento experimental em blocos, com, pelo menos, duas repetições por local e duas fileiras por parcela; iv) os ensaios devem apresentar duas testemunhas já inscritas no RNC; e v) o valor máximo permitido para o coeficinte de variação (CV) é de 20%. Nesse contexto, todos os ensaios utilizados no presente estudo atenderam as disposições estabelecidas nesta Portaria Ministerial. Em relação à significância das interações entre cultivares e ambientes foram obtidos os seguintes p-valores: 0,2334 em 2002/03; 0,016 em 2003/04; <0,001 em 2004/05; e 0,0091 em 2005/06. Apesar de não ter sido constatada a significância da interação GxE, na safra 2002/03, as médias preditas de cultivares nos ambientes daquele ano agrícola também foram submetidas à análise AMMI, já que, segundo Gauch & Zobel (1996), um estudo pormenorizado da fonte de variação GxE é justificável mesmo em situações em que o teste de F não aponte significância para o quadrado médio da interação GxE. Isso porque, mesmo nestes casos, em geral, a análise AMMI possibilita a eliminação de um ruído adicional, o que melhora as predições das respostas fenotípicas dos genótipos. Para a estratificação ambiental na safra 2002/03 foram identificados, inicialmente, três genótipos vencedores: AL30Cati, IAC8333 e ALBandeirante (Tabela 5.4). Entretanto, para a construção dos estratos, foi utilizado o critério da eliminação de vencedores menores, que levou à exclusão do genótipo AL30Cati, que venceu somente no ambiente Senador Canedo2 (Figura 5.2a). Neste local, o AL30Cati superou em 217 kg.ha-1 a média de produtividade do segundo colocado, o genótipo IAC8333, que venceu em outros cinco locais. O genótipo IAC8333, embora não seja uma variedade de polinização aberta, foi mantido como vencedor para a constituição de um estrato ambiental por tratar-se de um híbrido intervarietal. Neste caso, espera-se que o seu comportamento não desvie muito daquele esperado para as variedades, como é esperado no caso dos híbridos de linhagens. 94 Enfim, a adoção do critério de exclusão do vencedor menor (com vitória em apenas um local), AL30Cati, possibilitou a formação de um estrato mais amplo, sem grandes prejuízos à produtividade esperada para esse mega-ambiente. Sendo assim, dois genótipos foram mantidos como vencedores, para a construção dos estratos, nesta safra. A cultivar IAC 8333, que determinou a formação de um estrato composto pelos locais Senador Canedo2, Ipameri, Goiatuba, Inhumas, Morrinhos e Senador Canedo; e a variedade ALBandeirante, que determinou o estrato constituído pelos locais Goianésia, Porangatu e Palmeiras (Figura 5.2a). Tabela 5.4. Matriz de médias (kg.ha-1) de genótipos x ambientes, estimadas pelo modelo AMMI1 (ensaios varietais de milho, AgenciaRural – Goiás, safra 2002/03). Safra 2002/03 Airã AL25 AL30 AL34 ALBandeirante AREgo18 BRS473 Emcapa202 IAC8333 IPR114 PC9703 Samambóleo Saracura SHS3030 Sol da manhã Goianésia Goiatuba Inhumas Ipameri Morrinhos Palmeiras Porangatu S. Canêdo S.Canêdo2 6684 7572 7474 5710 5388 6241 6272 8098 6514 6852 7866 7747 6008 5657 6321 6435 8356 6895 6581 7755 7608 5901 5515 5940 6156 8198 6893 6734 7697 7587 5837 5499 6238 6318 8202 6692 7089 7571 7544 5698 5468 6926 6695 8216 6234 5763 7381 7157 5539 5053 4815 5319 7695 6825 6279 7199 7096 5338 5009 5814 5866 7717 6164 6068 7566 7363 5721 5262 5203 5629 7916 6929 6908 7885 7772 6025 5683 6404 6493 8386 6888 6366 7319 7210 5459 5122 5877 5951 7827 6306 6362 7722 7543 5873 5445 5593 5929 8111 6988 6369 7581 7428 5728 5333 5703 5943 8014 6746 6370 7486 7349 5630 5257 5769 5948 7946 6585 6772 7634 7541 5771 5455 6347 6362 8168 6558 5687 7251 7037 5408 4934 4776 5245 7582 6659 Na safra 2003/04, foi observada a formação de um estrato ambiental único, que teve como genótipo vencedor a cultivar BRS1010, que foi a mais produtiva em todos os locais (Tabela 5.5). Tal cultivar também não é uma variedade, mas um híbrido simples, e, assim, foi desconsiderada para o propósito da estratificação ambiental buscada neste estudo. Com a exclusão deste híbrido, a variedade ALBandeirante revelou-se, então, como o genótipo vencedor em todos os locais (Figura 5.2b). Essa superioridade no seu comportamento produtivo impediu, portanto, a formação de zonas específicas naquele ano agrícola, implicando na eleição desta variedade como a mais adaptada a todos os locais avaliados nessa safra: Itumbiara, Itaberaí, Goianésia, Campo Alegre, Porangatu, Rio Verde, Inhumas, Ipameri, Orizona, Morrinhos e Senador Canedo. Vale ressaltar que a estratificação resultante desta abordagem pode decorrer, principalmente, do comportamento altamente adaptado do genótipo venceder e, não necessariamente, das 95 similaridades edafo-climáticas entre os locais agrupados. De qualquer modo, no que tange à recomendação deste genótipo, a confiabilidade da estratificação não fica comprometida. 7500 (a) Safra 2002/03 AL30CAT IAC8333 ALBandeirante 7250 Palmeiras S. Canêdo2 Ipameri Goiatuba Inhumas Morrinhos Goianésia S. Canêdo Porangatu 7000 6750 kg.ha 6500 6250 6000 5750 -30 -20 -10 0 IPCA1j 10 20 30 40 -1 8250 AL Bandeirante BRSCaimbé Piratininga BRS1010 (b) Safra 2003/04 8000 7750 7500 . Senador Canêdo 7250 kg.ha -1 7000 Morrinhos Rio Verde Goianésia Campo Alegre Porangatu 6750 Ipameri Inhumas Orizona 6500 Itaberaí Itumbiara 6250 6000 -30 -20 -10 0 10 IPCA1j 20 30 40 50 96 Figura 5.2. Respostas genotípicas de produtividade dos genótipos vencedores, em 2002/03 (a) e 2004/04 (b), em função dos escores ambientais estimados pelo modelo AMMI1 (IPCA1j). Cada genótipo vencedor (potencial cultivar de adaptação específica) determina um estrato de ambientes. A linha vertical pontilhada identifica a transição entre dois estratos e corresponde ao cruzamento entre as linhas de regressão dos genótipos vencedores. Neste sentido, deve-se informar que esta abordagem comporta também a exclusão de vencedores absolutos, buscando sempre alguma subdivisão da população de ambientes. No presente caso, entretanto, essa estratégia não foi adotada, pois implicaria na separação de locais consitentemente reunidos nos demais anos (ex. Senador Canedo, Inhumas e Ipameri) e, também, nesta safra, desde que se leve em conta o genótipo vencedor absoluto ALBandeirante. Tabela 5.5. Matriz de médias (kg.ha-1) de genótipos x ambientes, estimadas pelo modelo AMMI1 (ensaios varietais de milho, AgenciaRural – Goiás, safra 2003/04). Safra 2003/04 AL25 AL30 AL34 ALBandeirante ALBianco Alvorada Assum Preto BR106 BRS1010 BRS4150 BRS473 BRSCaimbé Cativerde1 Cativerde2 Emcapa202 Emgopa501 Ipiranga IPR114 PC9902 PC9903 Piratininga SHS3031 Sol da manhã C. Alegre Goianésia Inhumas Ipameri 3799 6544 7443 8414 3950 6680 7676 8654 3934 6664 7656 8633 4039 6754 7841 8826 3449 6179 7171 8149 3495 6236 7159 8132 2747 5589 5874 6800 3295 6039 6947 7918 4357 7046 8297 9294 3287 6035 6912 7882 3286 6051 6821 7783 3945 6672 7688 8668 3432 6162 7158 8137 3559 6255 7466 8460 3481 6259 6946 7902 3265 6000 6960 7936 3571 6296 7322 8302 3598 6364 7130 8091 3500 6239 7175 8148 3381 6110 7114 8093 3812 6519 7658 8647 3623 6363 7292 8266 3098 5885 6517 7468 Itaberaí 6173 6262 6249 6292 5763 5853 5516 5663 6504 5675 5743 6244 5743 5733 5991 5600 5864 6058 5850 5688 6032 5977 5643 Itumbiara Morrinhos Orizona 5810 5549 6858 5852 5832 7143 5841 5809 7121 5839 6044 7357 5355 5325 6636 5478 5278 6588 5448 3664 4964 5296 5057 6367 5972 6585 7900 5323 5007 6316 5442 4860 6168 5825 5855 7167 5333 5315 6627 5220 5733 7047 5730 4943 6250 5208 5098 6408 5440 5494 6805 5759 5167 6474 5469 5300 6610 5274 5274 6586 5553 5889 7202 5600 5414 6724 5408 4486 5791 Porangatu Rio Verde S. Canêdo 4325 6890 7313 4503 7108 7836 4486 7088 7801 4618 7259 8271 4001 6604 7318 4028 6603 7103 3099 5416 3923 3823 6392 6845 4982 7690 9214 3806 6362 6718 3775 6288 6308 4505 7117 7908 3986 6590 7321 4173 6864 8263 3947 6426 6189 3808 6398 7012 4133 6749 7570 4086 6597 6604 4036 6616 7155 3937 6545 7297 4406 7068 8244 4157 6735 7254 3548 6005 5596 Na safra 2004/05, os genótipos Cerrado, Orion e AL34Cati foram os vencedores principais (Tabela 5.6 e Figura 5.3a). Entretanto, esse último genótipo foi excluído pelo critério dos vencedores menores (vitória apenas em Goiatuba). Tal exclusão implica em perda ínfima no local Goiatuba, estimada de apenas 25 kg.ha-1, que passa, então, ter a cultivar Orion como genótipo vencedor. Esta substituição culminou na formação de dois estratos ambientais naquela safra, o que resulta em maior praticidade operacional na recomendação e liberação de cultivares. Dessa forma, o comportamento da cultivar Orion levou à formação de um primeiro estrato reunindo os locais: Bom Jesus, 97 Itumbiara, Montes Claros e Goiatuba (Figura 5.3a). O outro estrato, determinado pelas vitórias do genótipo Cerrado, fica constituído pelos locais: Orizona, Porangatu, Rio Verde, Ipameri, Goianésia, Morrinhos, Palmeiras, Senador Canêdo, Campo Alegre, Itaberaí e Inhumas. Tabela 5.6. Matriz de médias (kg.ha-1) de genótipos x ambientes, estimadas pelo modelo AMMI1 (ensaios varietais de milho, AgenciaRural – Goiás, safra 2004/05). Safra 2004/05 AL25 AL30 AL34 ALBandeirante ALBianco Alvorada Assum Preto BR106 BRS2020 BRS4150 BRS473 Cativerde2 Cerrado Emcapa202 Emgopa501 IAC8333 Ipiranga Orion PC201 PC202 PC203 PC9703 Piratininga Sambaia Saracura Sol da Manhã UFVM100 UFVM200 B.Jesus 6535 6728 6799 6858 6553 6782 5763 6527 6828 6309 6285 6684 7068 6609 6470 6733 6659 6961 6724 6681 6632 6573 6924 6451 6023 5876 6647 6305 C.Alegre GoianésiaGoiatuba Inhumas 4151 7699 9171 5973 4343 7892 9364 6166 4414 7963 9435 6236 4474 8022 9495 6296 4168 7717 9189 5991 4397 7945 9418 6219 3378 6927 8399 5200 4142 7691 9163 5964 4443 7992 9464 6265 3925 7473 8945 5747 3901 7449 8922 5723 4300 7848 9320 6122 4684 8232 9704 6506 4225 7773 9245 6047 4085 7633 9106 5907 4348 7897 9369 6170 4274 7822 9295 6096 4576 8125 9597 6399 4340 7888 9360 6162 4296 7845 9317 6119 4248 7796 9268 6070 4188 7737 9209 6011 4539 8088 9560 6362 4066 7615 9087 5889 3639 7187 8659 5461 3492 7040 8512 5314 4262 7811 9283 6084 3920 7468 8941 5742 Ipameri 7525 7718 7789 7848 7543 7771 6753 7517 7818 7299 7275 7674 8058 7599 7459 7723 7648 7951 7714 7671 7622 7563 7914 7441 7013 6866 7637 7294 Itaberaí 4217 4410 4481 4541 4235 4464 3445 4209 4510 3991 3968 4366 4750 4292 4152 4415 4341 4643 4406 4363 4314 4255 4606 4133 3705 3558 4329 3987 Itumbiara M. Claros Morrinhos 4917 5402 6325 5110 5595 6518 5181 5666 6589 5241 5725 6649 4935 5420 6343 5164 5649 6572 4145 4630 5553 4909 5394 6317 5210 5695 6618 4691 5176 6099 4668 5152 6076 5066 5551 6474 5450 5935 6858 4991 5476 6400 4852 5337 6260 5115 5600 6523 5041 5526 6449 5343 5828 6751 5106 5591 6514 5063 5548 6471 5014 5499 6422 4955 5440 6363 5306 5791 6714 4833 5318 6241 4405 4890 5813 4258 4743 5666 5029 5514 6437 4687 5171 6095 Orizona 7926 8119 8190 8250 7944 8173 7154 7918 8219 7700 7677 8075 8459 8000 7861 8124 8050 8352 8115 8072 8023 7964 8315 7842 7414 7267 8038 7696 Palmeiras Porangatu Rio Verde S. Canêdo 6380 5298 7898 7034 6573 5491 8091 7227 6643 5562 8162 7298 6703 5622 8222 7357 6398 5316 7916 7052 6626 5545 8145 7281 5607 4526 7126 6262 6371 5290 7890 7026 6672 5591 8191 7327 6154 5072 7672 6808 6130 5049 7649 6784 6529 5447 8047 7183 6913 5831 8431 7567 6454 5373 7972 7108 6314 5233 7833 6969 6577 5496 8096 7232 6503 5422 8022 7158 6806 5724 8324 7460 6569 5487 8087 7223 6526 5444 8044 7180 6477 5395 7995 7131 6418 5336 7936 7072 6769 5687 8287 7423 6296 5214 7814 6950 5868 4786 7386 6522 5721 4639 7239 6375 6491 5410 8010 7146 6149 5068 7668 6804 Na safra 2005/06, a escolha dos genótipos vencedores recaiu sobre os materiais Piratininga, ALBandeirante e IPR114 (Tabela 5.7 e Figura 5.3b). Destes, o último, que venceu somente em Campo Alegre, foi excluído pelo critério dos vencedores menores. Num primeiro momento, esta exclusão implicaria na eleição de outro vencedor, o genótipo IPV 7352, que, porém, venceria também apenas nesse local, demonstrando-se, portanto, tratar-se de outro vencedor menor a ser excluído. A perda máxima associada à exclusão desses vencedores menores, com suas substituições pela variedade ALBandeirante, o genótipo vencedor seguinte, foi pequena, não ultrapassando 87 kg.ha-1. A variedade Piratininga se manteve como a mais produtiva nos locais Goiatuba, Orizona, Caiapônia e Porangatu, determinando, assim, um primeiro estrato. Já a variedade ALBandeirante determinou a formação de um estrato ambiental maior, constituído pelos locais: Campo Alegre, Goianésia, Hidrolândia, Inhumas, Ipameri, Itaberaí, Rio Verde e Senador Canêdo. Uma vantagem considerável da estratificação ambiental segundo a abordagem de genótipos vencedores, sobretudo em associação à análise AMMI, é a informação integrada da recomendação de genótipos para cada estrato estabelecido (Pacheco, 2004). 98 Assim, dispensam-se estudos adicionais sobre estabilidade e adaptabilidade fenotípica, haja vista que, não havendo interação GxE cruzada dentro dos estratos, a indicação do genótipo mais adaptado à região representada por um estrato ambiental é imediata e incide, logicamente, sobre o seu genótipo vencedor. No presente estudo, como parte dos genótipos foi substituída com o passar dos anos e outros tratavam-se de híbridos, como o caso de Orion (híbrido duplo modificado) e IAC8333 (híbrido intervarietal), ou de materiais pré-comerciais como a variedade Cerrado (vencedora em 2004/05), a recomendação de genótipos segundo a adaptabilidade produtiva foi centrada na identificação das variedades vencedoras na última safra avaliada. De qualquer modo, deve ser ressaltado que, dos sete estratos constituídos ao longo das quatro safras, três foram estabelecidos com base no comportamento vencedor do genótipo ALBandeirante. Essa constatação evidencia a ampla adaptação desta variedade às condições de cultivo do milho no Estado de Goiás. Tabela 5.7. Matriz de médias (kg.ha-1) de genótipos x ambientes, estimadas pelo modelo AMMI1 (ensaios varietais de milho, AgenciaRural – Goiás, safra 2005/06). Safra 2005/06 AL200205 AL34 ALBandeirante ALBianco Alvorada Assum Preto BR106 BRS4150 BRS473 Ipiranga IPR114 IPV7352 PC0201 Piratininga Samambaia Sol da manhã UFVM100 UFVM200 C. Alegre Caiapônia GoianésiaGoiatubaHidrolândia Inhumas 7153 8663 7112 7283 7049 5299 7602 8371 7079 6880 7038 5361 7960 8701 7419 7207 7379 5704 7120 8367 6907 6947 6852 5129 6749 8365 6777 7001 6710 4951 5514 7769 5957 6499 5871 4050 7427 8505 7105 7061 7055 5347 5206 7326 5562 6036 5480 3671 4643 8139 5894 7054 5770 3828 7605 8526 7181 7058 7135 5443 8047 8183 7112 6598 7090 5475 7978 8518 7305 6993 7272 5617 7455 8510 7117 7062 7068 5363 7733 8734 7361 7278 7313 5613 6886 8187 6709 6776 6652 4923 6932 7957 6575 6504 6526 4824 6948 8496 6932 7122 6867 5114 5726 8376 6426 7165 6328 4469 Ipameri 5226 5050 5385 4971 4911 4214 5136 3793 4389 5182 4962 5233 5144 5377 4783 4596 5053 4759 Itaberaí 6348 6271 6609 6128 6020 5238 6316 4834 5249 6382 6266 6484 6327 6567 5933 5782 6170 5731 Orizona 8457 8149 8478 8155 8162 7579 8290 7133 7977 8307 7947 8290 8294 8517 7977 7740 8291 8195 Porangatu Rio Verde S. Canêdo 5170 5120 5381 4959 4927 5639 5293 5261 5990 4902 4858 5280 4860 4807 5004 4193 4125 3933 5060 5020 5544 3765 3700 3591 4427 4328 3381 5098 5062 5682 4841 4825 5922 5131 5105 5957 5066 5027 5566 5297 5259 5830 4717 4672 5061 4517 4478 5035 4999 4947 5186 4757 4679 4247 Considerando-se tão somente a última safra (2005/06), essa recomendação se confirma, remetendo-se à indicação da variedade ALBandeirante para os locais: Rio Verde, Ipameri, Itaberaí, Goianésia, Hidrolândia, Inhumas, Senador Canêdo e Campo Alegre de Goiás (Figura 5.3b). Ademais, como o local Morrinhos reuniu-se por dois anos a um agrupamento pertencente ao estrato anteriormente descrito, a recomendação de cultivo da variedade ALBandeirante, também neste local, parece parcimoniosa, ainda que esse ambiente não tenha sido avaliado na safra 2005/06. Já a variedade Piratininga é indicada para cultivo nos locais do outro estrato (Goiatuba, Orizona, Caiapônia e Porangatu), em razão de ter se mostrado a mais produtiva e, portanto, mais adaptada às condições 99 ambientais representadas por este estrato (Figura 5.3b). Por outro lado, a extensão da recomendação da variedade ALBandeirante, também para este estrato, implicaria em perdas de produtividade relativamente pequenas, isto é, 72 kg.ha-1 em Goiatuba, 39 kg.ha-1 7750 Cerrado Orion Al34CAT (a) Safra 2004/05 Goiatuba 7500 7250 Porangatu . Morrinhos . S. Canêdo . C. Alegre . Itaberaí . B. Jesus . . Itumbiara Inhumas . Montes Claros Orizona Ipameri Goianésia . 7000 . 6750 6500 6250 -20 -10 0 10 IPCA1j 20 30 40 50 Palmeiras . kg.ha-1 Rio Verde Piratininga 7300 ALBandeirante IPV_7352 IPR114 (b) Safra 2005/06 Campo Alegre S. Canêdo Goianésia . Hidrolândia . Inhumas Caiapônia 6800 kg.ha-1 Orizona Goiatuba Porangatu 6300 5800 -30 -20 -10 0 IPCA1j 10 20 30 40 Rio Verde . Ipameri . Itaberaí . . 100 Figura 5.3. Respostas genotípicas de produtividade dos genótipos vencedores, em 2004/05(a) e 2005/06(b), em função dos escores ambientais estimados pelo modelo AMMI1 (IPCA1j). Cada genótipo vencedor (potencial cultivar de adaptação específica) determina um estrato de ambientes. As linhas verticais pontilhadas identificam a transição entre dois estratos e correspondem ao cruzamento entre as linhas de regressão dos genótipos vencedores. em Orizona, 33 kg.ha-1 em Caiapônia e apenas 4 kg.ha-1 em Porangatu (Figura 5.3). Tais recomendações, contudo, devem levar em consideração, ainda, os custos e a disponibilidade de sementes de ambas variedades. Ao se comparar os estratos ambientais (mega-ambientes) formados ao longo das quatro safras avaliadas (Tabela 5.8), pôde-se constatar a formação de, pelo menos, dois agrupamentos estáveis ao longo do período. No primeiro deles, os locais que se agruparam de maneira mais consistente foram Ipameri, Inhumas e Senador Canêdo, que se mantiveram reunidos em estratos ambientais comuns nas quatro safras agrícolas. A esse grupo se juntaram, ainda, por três anos, os locais Morrinhos, nas safras 2002/03, 2003/04 e 2004/05, e Itaberaí, Campo Alegre e Rio Verde, nas safras 2003/04, 2004/05 e 2005/06. O outro grupo consistente de locais foi constituído por Porangatu e Orizona, que se agruparam em estratos comuns em todas as safras em que ambos foram avaliados. Tabela 5.8 Estratos ambientais formados nas diferentes safras agrícolas, como resultado da aplicação da abordagem de genótipos vencedores associada à análise AMMI, e estratos de locais consistentes ao longo de quatro (em negrito e sublinhado) ou três (em itálico e sublinhado) safras agrícolas. Safra 2002/03 Safra 2003/04 Safra 2004/05 Safra 2005/06 Estrato Locais Estrato Locais Estrato Locais Estrato Locais 1 1 1 1 1 1 2 2 2 Senador Canêdo 2 Ipameri Goiatuba Inhumas Morrinhos Senador Canêdo Goianésia Porangatu Palmeiras 1 1 1 1 1 1 1 1 1 1 1 Itumbiara Itaberaí Goianésia Campo Alegre Porangatu Rio Verde Inhumas Ipameri Morrinhos Orizona Senador Canêdo 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 Orizona Porangatu Rio Verde Ipameri Goianésia Morrinhos Palmeiras Senador Canêdo Campo Alegre Itaberaí Inhumas Bom Jesus Itumbiara Montes Claros Goiatuba 1 1 1 1 2 2 2 2 2 2 2 2 Goiatuba Orizona Caiapônia Porangatu Rio Verde Ipameri Itaberaí Goianésia Hidrolândia Inhumas Senador Canêdo Campo Alegre - Outros locais mostraram-se instáveis, ora agrupando-se a um dos estratos ambientais mais consistentes, ora ao outro destes estratos. Este é o caso, por exemplo, do 101 local Goianésia, que se manteve reunido ao local Porangatu, nas três primeiras safras, mas não revelou a mesma similaridade no último ano (Tabela 5.8). Paradoxalmente, embora mostrou-se dissimilar do grupo formado pelos locais Ipameri, Inhumas e Senador Canedo, no primeiro ano (2002/03), reuniu-se com estes nos outros três anos avaliados. Tendência semelhante foi observada com a localidade Palmeiras, embora este local tenha sido avaliado em apenas duas safras. O local Goiatuba também revelou instabilidade em relação aos dois estratos mais consistentes, provavelmente devido ao fato de que, embora em um mesmo município, houve diferença em termos de altitude – de uma safra para outra – da ordem de 300 m, o que parece ter tornado suas características ambientais pertencentes à outra zona agro-ecológica sob diferentes altitudes. Essa hipótese pode ser reforçada pelo agrupamento deste local com Itumbiara e Bom Jesus, em 2004/05, que são locais geograficamente próximos entre si e ao primeiro, e de altitudes médias relativamente menores. Sobre os demais locais (Senador Canedo 2, Montes Claros, Caiapônia e Hidrolândia) não se evidenciaram comportamentos regulares que justificassem quaisquer inferências acerca de suas tendências agro-ecológicas, também porque neste estudo foram avaliados em apenas um ano agrícola. Conforme defendido por Pacheco (2004), pela estabilidade de alguns agrupamentos de locais ao longo dos anos, mesmo sob a utilização de diferentes genótipos, os estratos ambientais assim identificados têm caráter preditivo. Isso significa que tais estratos podem ser utilizados, com relativa segurança, tanto para a recomendação de cultivares – com a eleição da mesma cultivar para os diferentes locais de cada estrato, quanto para a exclusão ou substituição de locais de teste por outros pontos que possam ampliar e melhorar a avaliação da interação GxE. Em relação à escolha de locais prioritários de teste, no caso do estrato ambiental formado por Ipameri, Inhumas e Senador Canedo, consistente por quatro anos, incluindose ou não, os locais Morrinhos, Itaberaí, Campo Alegre e Rio Verde, que a eles se reuniu em três das quatro safras, poderia manter-se apenas o local Senador Canêdo, que, além de localizar-se numa região central do Estado de Goiás, possui estação experimental da AgenciaRural, relativamente bem estruturada. Do estrato formado por Porangatu e Orizona, poderia manter-se apenas Porangatu como o local de teste. Isso porque além de situar-se mais ao norte do Estado, também possui uma estação experimental da AgenciaRural. Isso representaria uma redução de 16,7% nos locais de teste (de 18 para 15 locais), ou até 38,9% (de 18 para 11 locais), no caso de se incluir os outros quatro locais ao 102 primeiro dos estratos consistentes, com impactos diretos no custo de implantação e condução da rede de ensaios. Com essas eliminações seria possível, ainda, a substituição de locais atualmente participantes da rede de ensaios, por outros que melhor representariam a região alvo da recomendação de cultivares, de modo a aumentar a eficiência de avaliação da interação GxE no âmbito do programa de melhoramento. Contudo, é recomendável e necessária a continuidade desses estudos, com maior número de safras, visando-se a consolidação dos resultados aqui identificados e apresentados. 5.4 CONCLUSÕES i) O uso da abordagem de genótipos vencedores permitiu a identificação de dois estratos ambientais estáveis ao longo das safras agrícolas avaliadas. O primeiro, consistente ao longo de quatro anos, é formado pelos locais Ipameri, Inhumas e Senador Canêdo, ao qual se podem, agregar os locais Morrinhos, Campo Alegre e Rio Verde, ainda com consistência de três anos. O outro estrato revelou-se estável ao longo dos três anos em que os seus locais foram avaliados, sendo constituído pelos locais Porangatu e Orizona. ii) A eliminação de locais similares, pertencentes ao mesmo estrato ambiental, pode resultar numa economia mínima de 16,7%, em termos do número de pontos para a instalação e condução dos ensaios de avaliação de variedades de milho em Goiás. Essa economia pode ser revertida na substituição de pontos de teste com características ambientais redundantes, por outros de maior representatividade na região alvo da recomendação de cultivares, melhorando a eficiência da avaliação das interações GxE e, conseqüentemente, do programa de melhoramento. iii) A variedade ALBandeirante apresenta alto potencial produtivo e grande adaptabilidade às condições de cultivo do milho no Estado de Goiás, podendo ser recomendada, sem grande risco, para toda a amplitude de condições ambientais amostrada pelos ensaios. 103 6 CONCLUSÕES GERAIS As principais conclusões obtidas foram: i) as abordagens de modelo fixo (FF), modelo misto com efeito aleatório de blocos (AF), modelo misto com efeito aleatório de tratamentos (FA), modelo aleatório (AA) e estimador de James-Stein (JS) levam, tanto à seleção de genótipos distintos, quanto à diferenças no ordenamento das médias genotípicas; ii) a adoção de abordagens estatísticas que promovem shrinkage (FA, AA e JS) das médias genotípicas resultam na seleção de menor número de genótipos, especialmente quando a média da testemunha, ou do valor referencial para a seleção genotípica, é superior à média experimental, o que reduz a permanência de genótipos pouco produtivos nos próximos ciclos do programa de melhoramento genético; iii) o uso dos modelos FF e AF, cujos efeitos de tratamentos são admitidos como fixos, leva a um maior percentual de seleção de genótipos, sobretudo nos experimentos cuja média das testemunhas supera a média experimental, incorrendo no risco de manter elevada proporção de tratamentos genéticos pouco promissores nos próximos ciclos de seleção do programa; iv) entre as abordagens estatísticas shrinkage avaliadas, o modelo AA deve ser preferido para a seleção de genótipos, em razão de sua melhor capacidade de predição dos efeitos genotípicos paramétricos (maior acurácia e menor desvio preditivo médio), independentemente de esses efeitos terem distribuição normal ou uniforme; v) o modelo FF demonstra o pior desempenho relativo, excetuando-se as situações em que a variabilidade entre os tratamentos genéticos é elevada (h2’→1,0); vi) sob baixos valores de h2’ (6%), o modelo FA apresenta eficiência similar ao modelo AA; vii) em situações com elevados valores de h2’, as diferentes abordagens conduzem à seleção de genótipos bastante coincidentes, podendo, entretanto, implicar em diferenças no seu ordenamento; vii) dois estratos ambientais estabelecidos mostraram-se consistentes, ao longo dos anos, mesmo alterando-se os genótipos testados de uma safra agrícola para a outra: Ipameri, Inhumas e Senador Canêdo, (estável em quatro anos), e Porangatu e Orizona (estável em três anos); viii) com os agrupamentos obtidos é possível reduzir, pelo menos 16%, o número de locais de teste atualmente utilizados e, ou, efetuar a substituição de locais redundantes por outros 104 pontos de teste que melhor representem a região alvo da recomendação, de modo a aumentar a eficiência da avaliação da interação GxE, no âmbito do programa de melhoramento; ix) a variedade ALBandeirante apresenta alto potencial produtivo e grande adaptabilidade às condições de cultivo do milho no Estado de Goiás. 105 7 REFERÊNCIAS ABOU-EL-FITTOUTH, H. A.; RAWLINGS, J. O.; MILLER, P. A. Classification of environments to control genotype by environment interactions with applications to cotton. Crop Science, Madison, v. 9, n. 2, p. 135-140, 1969. ALLARD, R. W.; BRADSHAW, A. D. Implications of genotypes-environmental interactions in applied plant breeding. Crop Science , Madison, v. 4, n. 5, p. 503-508, sept./oct. 1964. ANNICCHIARICO, P. Genotype x environment interactions – Challenges and opportunities for plant breeding and cultivar recommendations. FAO Plant production and protection. Food and Agriculture Organization of the United Nations. 2002. (Paper 174.) AVELAR, F. M.; CARVALHO, S. P.; RIBEIRO, P. H. E.; RAMALHO, M. A. P. Interação cultivares de milho x época de semeadura para produção de grãos e silagem. Brazilian Journal of Genetics, Caxambú, v. 19, n. 3. p. 218, sep. 1996. BANDEL, G. Genética In: PATERNIANI, E.; VIEGAS, G. P. (Eds.). Melhoramento e produção do milho. Campinas: Fundação Cargill, 1987. p. 111-133. BEARZOTI, E. Emprego de marcadores em modelos mistos. Disponível em: . Acesso em: 26 dez. 2005. BECKER, H. C. Correlations among some statistical measures of phenotypic stability. Euphytica, Dordrecht, v. 30, n. 3, p. 835-840, 1981. BECKER, H. C.; LÉON, J. Stability analysis in plant breeding. Plant Breeding, Berlin, v. 101, n. 1, p. 1-23, apr. 1988. BOOTE, K. J.; JONES, W. J.; PICKERING, N. B. Potential uses and limitations of crop models. Agronomy Journal, Stanford, v. 88, n. 5, p. 704-716, 1996. BORÉM, A. Melhoramento de plantas. Viçosa: UFV, 1997. 547 p. BRASIL, E. M. Comparação de métodos de controle da interação genótipo x ambiente em milho (Zea mays L.). 1990. 214 f. Dissertação (Mestrado em Agronomia)–Escola de Agronomia, Universidade Federal de Goiás, Goiânia, 1990. BUENO FILHO, J. S. de S. Modelos mistos na predição de valores genéticos aditivos em testes de progênies florestais. Piracicaba, 1997. 118 f. Tese (Doutorado em 106 Genética)–Escola Superior de Agricultura Luiz de Queiroz, Universidade de São Paulo, Piracicaba, 1997. BUENO FILHO, J. S.; VENCOVSKY, R. Alternativas de ensaios em látice no melhoramento vegetal. Pesquisa Agropecuária Brasileira, Brasília, v. 35, n. 2, p. 259269, fev. 2000. BULMER, M. G. The mathematical theory of quantitative genetics. Oxford: Claredon Press, 1980. 254 p. COCHRAN, W. G.; COX, G. M. Diseños experimentales. 3. ed. Mexico: Trillas, 1976, 661 p. CROSSA, J. Statistical Analyses of multilocation trials. Advances in Agronomy, New York, v.44, p. 55-85, 1990. CRUZ, C. D. A informática no melhoramento genético. In: NASS, L. L. et al. (Eds). Recursos Genéticos e Melhoramento de Plantas. Rondonópolis: Fundação-MT, 2001. p. 1086-1118. CRUZ, C. D.; REGAZZI, A. J. Modelos biométricos aplicados ao melhoramento genético. Viçosa: UFV, 1997. 390 p. DUARTE, J. B. Especificação do modelo de análise estatística de dados quantitativos e suas implicações na seleção de genótipos em plantas. Disponível em: http://www.gauss.ufla.br/congresso/11seagro/conteudo/ sessoes_tematicas.html . Acesso em: 01 nov. 2006. DUARTE, J. B. Sobre o emprego e a análise estatística do delineamento em blocos aumentados no melhoramento genético vegetal. 2000, 293 f. Tese (Doutorado em Agronomia: Genética e Melhoramento de Plantas)–Escola Superior de Agricultura Luiz de Queiroz, Universidade de São Paulo, Piracicaba, 2000. DUARTE, J. B., VENCOVSKY, R. Interação genótipos x ambientes: uma introdução à análise “AMMI”. Ribeirão Preto: Sociedade Brasileira de Genética, 1999. 60 p. (Série Monografias, 9). DUARTE, J. B.; VENCOVSKY, R. Estimação e predição por modelo linear misto com ênfase na ordenação de médias de tratamentos genéticos. Scientia Agricola, Piracicaba, v. 58, n. 1, p. 109-117, 2001. DUARTE, J. B.; ZIMMERMANN, M. J. de O. Selection of locations for common bean (Phaseolus vulgaris L.) germplasm evaluation. Revista Brasileira de Genética, Ribeirão Preto, v. 14, n. 3, p. 765-770, 1991. DUDLEY, J. W.; MOLL, R. H. Interpretation and use of estimation of heritability and genetic variances in plant breeding. Crop Science, Madison, v. 2, n. 3, p. 257-262, 1969. 107 EBDON, J. S; GAUCH, H. G. Additive Main Effect and Multiplicative Interaction Analysis of National Turfgrass Performance Trials: II. Cultivar Recommendations. Crop Science, Madison, v. 42, n. 2, p. 497-506, 2002. EBERHART, S. A.; RUSSELL, W. A. Stability parameters for comparing varieties. Crop Science, Madison, v. 6, n. 1, p. 36-40, 1966. ECKHARDT, R. Stan Ulam, John von Neumann, and the Monte Carlo method. Los Alamos Science, Washington, v. 15, Special Issue, p. 131-137, 1987. EFRON, B.; C. MORRIS. Stein’s paradox in statistics. Scientific American, New York, v. 236, n. 5, p. 119-127, 1977. FALCONER, D. S. Introdução a genética quantitativa. Viçosa: Imprensa Universitária, 1987. 279 p. FAO - Food and Agricultural Organization. Disponível em: Acesso em: 08 jul. 2006 FEDERER, W. T.; WOLFINGER, R. D. SAS code for recovering intereffect information in experiments with incomplete block and lattice rectangle designs. Agronomy Journal, Stanford, v. 90, n. 4, p. 545-551, 1998. FEDERER, W.T. Recovery of interblock, intergradient, and intervarietal information in incomplete block and lattice rectangle designed experiments. Biometrics, Washington, v. 54, n. 2, p. 471-481, 1998. FEDERER, W.T. SAS Proc GLM and Proc Mixed for recovering inter-effect information. Tech. Rep. Biometrics Unit, Cornell Univ.: Ithaca, 1996, 8 p. (BU-1330-M). FERREIRA, D. F. Uso de simulação no melhoramento. In: NASS, L. L.; VALOIS, A. C. C.; MELO, I. S. de; VALADARES-INGLIS, M. C. (Ed). Recursos genéticos e melhoramento de plantas. Rondonópolis: Fundação-MT, 2001. p. 1119-1141. FOX, P. N.; CROSSA, J.; ROMAGOSA, I. Multi-enviromenmental testing and genotype x environment interaction. In: KEMPTON, R. A.; FOX, P. N. Statistical methods for plant variety evaluation. London: Chapman & Hall, 1997. cap. 8, p. 117-138. GAUCH Jr., H. G. Statistical Analysis of regional Yeld trials: AMMI analysis of factorial designs. New York: Elsevier Science Publishers, 1992. 278 p. GAUCH Jr., H. G.; ZOBEL, R. W. AMMI analysis of yeld trials. In: Kang, M.S.; GAUCH, H.G. (Ed.) Genotype by enviroment interaction. Boca Raton: CRC Press, 1996. cap. 4, p. 85-122. GAUCH Jr., H. G.; ZOBEL, R. W. Identifying Mega-Environments and Targeting Genotypes. Crop Science, Madison, v. 37, n. 2, p. 311-326, 1997. GAUCH, Jr., H. G. Model selection and validation for yield trials with interaction. Biometrics, Washington, v. 44, n. 3, p. 705-715, 1988. 108 GAUCH, Jr., H.G. Full and reduced models for yields trials. Theoretical and Applied Genetics, Berlin, v. 80, p. 153-160, 1990. GHADERI, A.; EVERSON, E. H.; CRESS, C. E. Class ification of environments and genotypes in wheat. Crop Science, Madison, v. 20, n. 2, p. 707-710, 1980. GIANOLA, D.; GOFFINET, B. Sire evaluation with best linear unbiased predictors. Biometrics, Washington, v. 38, n. 4, p. 1085-1088, dec. 1982. HARVILLE, D.A. Maximum likelihood approaches to variance component estimationand to related problems. Journal of the American Statistics Association, Washington, v. 72, p.320-328, 1977. HENDERSON, C. R. Aplications of linear models in animal breeding. University of Guelph: Guelph, 1984. 462 p. HENDERSON, C. R.; KEMPTHORNE, O.; SEARLE, S. R.; VON KROSIGH , C. M. The estimation of environmental and genetic trends from records subject to culling. Biometrics, Washington, v.15, p.192, sept. 1959. HILL, R.R. & J.L. ROSENBERGER. Methods for combining data from germplasm evaluation trials. Crop Science, Madison, v. 25, p. 467-470, 1985. HORNER, T. W.; FREY, K. J., Methods of determining natural areas for Oat varietal recommendations. Agronomy Journal, Stanford, v. 49, n. 2, p. 313-315, 1957. IBGE. Lista de produtos da agropecuária e pesca. Disponível em: . Acesso em: 02 jan. 2008. JAMES, W.; STEIN, C. Estimation with quadratic loss. In: SYMPOSIUM ON MATHEMATICAL STATISTICS AND PROBABILITY, 4., 1961, Berkeley. Proceedings… Berkeley: University of Berkeley, 1961. p. 361-379 . JONES, W. J.; MISHOE, J. W.; BOOTE, K. J. Introduction to simulation and modelling.Gainesville: ASPAC – Food & fertilizer Technology Center, 1987. 19 p. (Technical Bulletin n. 100) KEMPTON, R.A. The use of biplots in interpreting variety by environmet interactions. Journal of Agricultural Science, Cambridge, v.103, n. 1, p.123-135, 1984. LIANG, G. H.; HEYNE, E. G. ; WALTER, T. L. Estimates of variety x environment interactions in yield testes of three small grains and their significance on the breeding program. Crop Science, Madison, v. 6, n. 1, p. 135-139, 1966. LITTELL, R.; MILLIKEN, G.A.; STROUP, W.W.; WOLFINGER, R. SAS System for Mixed Models. Cary: SAS Institute, 1996. 633 p. MAPA. Requisitos Mínimos para Determinação do Valor de Cultivo e Uso de Milho (Zea mays) para Inscrição no Registro Nacional de Cultivares – RNC. Portaria nº 85, 109 de 05/05/98. Disponível em: . Acesso em: 02 jan. 2008. MARANHA, F. G. C. B. Estratificação ambiental para avaliação de genótipos de algodoeiro no Estado do Mato Grosso. 2005. 63 f. Tese (Doutorado em Agronomia) – Escola Superior de Agronomia Luiz de Queiroz, Universidade de São Paulo, Piracicaba, 2005. MARIOTTI, J. A.; OYARZABAL, E. S.; OSA, J. M.; BULACIO, A N. R.; ALMADA, G. H. Analisis de estabilidad y adaptabilidad de genótipos de cana de azucar. I. Interacciones dentro de um localidad experimental. Revista Agronomica del Noroeste Argentino, Tuculman, v. 13, n. 14, p. 105-127, jan. 1976. MAY, K. W.; KOZUB, G. C. Genotpe x environmental interactions for two-row barley grain yield and implications for selection of test locations. Canadian Journal of Plant Science, Ottawa, v. 75, n. 2, p. 571-575, 1995. McCAIN, F. S.; SCHULTZ, E. F. A Method of determining areas for corn varietal recommendations. Agronomy Journal, Stanford, v. 51, n. 8, p. 476-478, 1959. MILLER, P. A.; WILLIANS, J. C.; ROBSON, H. F. Variety x environment interactions in cotton variety tests and their implications on testing methods. Agronomy Journal, Stanford, v. 51, n. 3, p. 132-134, 1959. MILLIGAN, S. B. Test sit within and among stages of a sugarcane breeding program. Crop Science, Madison, v. 34, n. 2, p. 1184-1190, 1994. MILLIKEN, G. A.; JOHNSON, D. E. Analysis of messy data. New York: Chapman & Hall, v. 1, 1992. 473 p. MUNDEL, H. H.; ENTZ, T.; BRAUN, J. P.; KIEHN, F. A. Selection of locations for safflower cultivar trials on the Canadian prairies by using AMMI procedure. Canadian Journal of Plant Science, Harrow, v. 75, n. 2, p.767-774, 1995. MURRAY, J. C.; VERHALEN, L. M. Genotype by environment interaction study by cotton in Oklahoma. Crop Science, Madison, v. 10, n. 2, p. 197-199, 1970. NUNES, R. de P. Métodos para a pesquisa agronômica. Fortaleza: UFC/Centro de Ciências Agrárias, 1998. 564 p. OLIVEIRA, A. B.; DUARTE, J. B.; PINHEIRO, J. B. Emprego da análise AMMI na avaliação da estabilidade produtiva em soja. Pesquisa Agropecuária Brasileira Brasília, v. 38, n. 3, p. 357-364, mar. 2003. PACHECO, R. M. Estratificação de ambientes em cerrados do Brasil Central para fins de seleção e recomendação de cultivares de soja. 2004. 170 f. Tese (Doutorado em Agronomia) – Escola de Agronomia e Engenharia de Alimentos, Universidade Federal de Goiás, Goiânia, 2004. 110 PERRIN, R. K. Ethanol and Food Prices: Preliminary Assessment. Faculty Publications: Agricultural Economics. University of Nebraska, Lincoln, 2008. Disponível em: < http://digitalcommons.unl.edu/ageconfacpub/49>. Acesso em: 30 mai. 2008. PIEPHO, H.P. Best linear unbiased prediction (BLUP) for regional yield trials: a comparison to additive main effects and multiplicative interaction (AMMI) analysis. Theoretical and Applied Genetics, Berlin, v. 89, n. 5, p. 647-654, 1994. PIEPHO, H.P. Empirical best linear unbiased prediction in cultivar trials using factor analytic variance covariance structures. Theoretical and Applied Genetics, Berlin, v. 97, n. 1-2, p. 195-201, 1998. PIEPHO, H.P.; MÖHRING, J. Selection in Cultivar Trials – Is It Ignorable? Crop Science, Madison, v. 46, n. 1, p. 192-201, jan-feb, 2006. PIMENTEL GOMES, F. Curso de estatística experimental. 8. ed. São Paulo: Nobel, 1990. 450 p. PINAZZA, L. A. Perspectivas da cultura do milho e do sorgo no Brasil. In: Bull, L.T.; Cantarella, H. (Ed.). Cultura do milho: fatores que afetam a produtividade. Piracicaba: Potafós, 1993. cap. 1, p. 1-10. RAMALHO, M. A. P.; FERREIRA, D. F.; OLIVEIRA, A. C. de A experimentação em genética e melhoramento de plantas. Lavras: UFLA, 2005. 322 p. RAMALHO, M. A. P.; SANTOS, J. B.; PINTO, C. A. B. P. Genética na Agropecuária. São Paulo: Globo, 1990. 359 p. RAMALHO, M. A. P.; SANTOS, J. B.; ZIMMERMANN, M. J. Genética quantitativa em plantas autógamas: aplicações ao melhoramento do feijoeiro. Goiânia: UFG, 1993. 271 p. RESENDE, M. D. V. de, SIMEÃO, R. M.; FERNANDES, J.S.C. Blup individual com medidas repetidas aplicado ao melhoramento de espécies perenes. Ciência e Agrotecnologia., Lavras, v. 24, n. 4, p. 986-997, out./dez., 2000. RESENDE, M. D. V. de. Genética biométrica e estatística no melhoramento de plantas perenes. Brasília: Embrapa Informação Tecnológica; Colombo: Embrapa Florestas, 2002. 975 p. RESENDE, M. D. V. de. Métodos estatísticos ótimos na análise de experimentos de campo. Colombo: Embrapa Florestas, 2004. 57 p. RESENDE, M. D. V. de. Predição de valores genéticos, componentes de variância, delineamentos de cruzamento e estrutura de populações no melhoramento florestal . 1999, 434 f. Tese (Doutorado em Genética), Universidade Federal do Paraná, Curitiba. 1999. RESENDE, M. D. V. de.; STURION, J. A.; MENDES, S. Genética e melhoramento da erva-mate (Ilex paraguariensis St. Hil.). Curitiba: EMBRAPA-CNPF, 1995. 33 p. (Embrapa Florestas. Documentos, 25). 111 RESENDE, M. D. V. de; DUARTE, J. B. Precisão e controle de qualidade em experimentos de avaliação de cultivares. Pesquisa Agropecuária Tropical, Goiânia, v. 37, n. 3, p. 182-194, set. 2007. RESENDE, M. D. V. de; PRATES, D. F.; JESUS, A.; YAMADA, C. K. Estimação de componentes de variância e predição de valores genéticos pelo método da máxima verossimilhança restrita (REML) e melhor predição linear não viciada (BLUP) em Pinus. Colombo: Embrapa Florestas, 1996. v. 32/33, p. 18-45. (Boletim de Pesquisa Florestal) RIBEIRO, P. H. E.; SANTOS, M. X. dos.; RAMALHO, M. A. P. Interação cultivares de milho x épocas de semeadura em diferentes ambientes do Estado de Minas Gerais. Revista Ceres, Viçosa, v. 46, n. 267, p. 531-542, 1999. ROBINSON, G. K. That BLUP is a good thing: the estimation of randon effects. Statistical Science, v. 6, n. 1, p. 15 – 51, 1991. RODRÍGUES, L. F.; BERMÚDEZ, L. T. C. Usos y aplicaciones de la simulación en la investigación agropecuaria. Agronomia Colombiana, Bogotá, p. 198-204, 1995. RONNINGEN, K.; VAN VLECK, L.D. Selection index theory with practical applications. In: CHAPMAN, A.B. (ed.). World animal science A4: general and quantitative genetics. Oxford: Elsevier Science, 1985. p.187-225. SAMPAIO, I. B. M.; SILVA, J. Zoneamento varietal na região sul do Brasil. In: REUNIAO BRASILEIRA DE MILHO, 9., 1972, Recife. Anais… Recife: Sudene, 1972, p. 113-118. SANTOS, A. H. Teoria de modelos mistos aplicada ao delineamento em blocos aumentados. Lavres, UFLA, 2001. 138 f. Dissertação (Mestrado em Estatística e Experimentação Agropecuária) Universidade Federal de Lavras, Lavras. SAUVANT, D. Analyse systémique et modélisation: introduction. Cours Supérieur d'Alimentation des Animaux Domestiques. Paris: INAPG-DSA, 1999. 9 p. SEARLE, S. R.; CASELLA, G.; MCCULLOCH, C. E. Variance components. New York: J. Wiley, 1992. 528 p. SILVA Jr., W. C. e Comparação de métodos estatísticos para estudo da Adaptabilidade e estabilidade fenotípica. Goiânia, UFG, 2004. 99 f. Dissertação (Mestrado em Agronomia), Faculdade de Agronomia e Engenharia de Alimentos, Universidade Federal de Goiás, Goiânia. SIMULATION MODULE. Lessons and background. STARS – Students, teachers and resources in the sciences. University of South Florida. Disponível em: . Acesso em: 15 jan. 2008. SMITH, A.; CULLIS, B.; GILMOUR, A. The analysis of crop variety evaluation data in Australia. Australian & New Zealand Journal of Statistics, Melbourne, v. 43, n. 2, p. 129-145, 2001. 112 SPEDDING, C. R. W. General aspects of modelling and its application in livestock production. In: KORVER, S., VAN ARENDOK, J.A.M. (Eds). Modelling of livestock production systems. London : Kluwer Academic, 1988. p. 3-13. STEEL, R. G. D.; TORRIE, J. H. Principles and Procedures of Statistics: a biometrical approach. 3. ed. New York: McGraw Hill, 1996. 672 p. STEIN, C. Inadmissibility of the usual estimator for the mean of a multivariate normal distribution. In: SYMPOSIUM ON MATHEMATICAL STATISTICS AND PROBABILITY, 3., 1955, Berkeley. Proceedings… Berkeley: University of Berkeley, 1955. p. 197-206, vol. 1. STROUP, W. W.; MULITZE, D.K. Nearest neighbour adjusted best linear unbiased prediction. American Statistician, Washington, v. 45, p. 194-200, 1991. TAVARES, C. E. C. Análise Prospectiva do mercado de milho: safra 2004/05. Disponível em: . Acesso em: 22 dez. 2005. TOMÉ, M. A.; BUENO FILHO, J. S. de S.; FERREIRA, D. F. Blocos fixos ou aleatórios? O caso dos ensaios em látice no melhoramento vegetal. Ciência e Agrotecnologia, Lavras, v. 26, n. 3, p. 576 - 584, mai./jun., 2002. VAN VLECK, L . D.; POLLAK, E. J.; OLTENACU, E. A. B. Genetics for the animal sciences. New York: W. H. Freeman, 1987, 391 p. VAN VLECK, L.D. Selection index and introduction to mixed model methods. Boca Raton: CRC Press, 1993. 512 p. VENCOVSKY, R. ; BARRIGA, P. Genética biométrica no fitomelhoramento. Ribeirão Preto: Sociedade Brasileira de Genética, 1992. 496 p. VENCOVSKY, R. Herança quantitativa. In: PATERNIANI, E.; VIEGAS, G. P. (Ed.). Melhoramento e produção de milho. 2. ed. Campinas: Fundação Cargill, 1987. p. 137214. VENCOVSKY, R.; CRUZ, C. D.; SILVA, A. C. Uma avaliação do potencial de diferentes locais para a discriminação genotípica entre cultivares de milho. Revista Brasileira de Genética, Ribeirão Preto, v. 13, n. 2, p. 323-334, 1990. VERMA, M. M.; CHAHAL, G. S.; MURTY, B. R. Limitations of conventional regression analysis: a proponed modification. Theoretical Applied Genetics, Berlin, v. 53, n. 2, p. 89-91, 1978. WOLFINGER, R.D., FEDERER W.T.; CORDERO-BRANA, O. 1997. Recovering information in augmented designs, using SAS Proc GLM and Proc Mixed. Agronomy Journal, Stanford, v. 89, p. 856-859, 1997. YATES, F. A. A new method of arranging variety trials involving a large number of varieties. Journal of Agricultural Science, Cambridge, v. 26, n. 3, p. 424-445, 1936. 113 ZOBEL, R. W.; WRIGHT, M. J..; GAUCH, H. G. Statistical analysis of a yield trial. Agronomy Journal, Stanford, v. 80, n. 3, p. 388-393. 1988.