Caracterização da região Bru1 no genoma da cultivar RB867515 (Saccharum spp.) utilizando sequenciamento de nova geração

dc.contributor.advisor1Coelho, Alexandre Siqueira Guedes
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/0840926305216925por
dc.contributor.referee1Coelho, Alexandre Siqueira Guedes
dc.contributor.referee2Novaes, Evandro
dc.contributor.referee3Carneiro, Monalisa Sampaio
dc.creatorSouza, Isabela Pavanelli de
dc.creator.Latteshttp://lattes.cnpq.br/8116375357975926por
dc.date.accessioned2017-04-18T14:13:10Z
dc.date.issued2014-09-25
dc.description.abstractSugarcane is known as one of the most important crops of the word for its sub products utilization. Four countries, led by Brazil, supply the sugar international trade. Ethanol is other important sugarcane sub product, recognized as an alternative product to sugar, and had great demand in Brazilian trade, for its utilization as non-fossil fuel. The sugarcane genome is one of the most complex among crops, with 10 Gb. Its complete genome is not available, but the recent innovations in genomics tools open up new possibilities for the investigations about the sugarcane’s genome. We did a genome assembly and annotation of a Brazilian sugarcane cultivar (RB867515) genome region, correspondent to eight R570 homologous sequences already published. We use high qualities paired-ends libraries produced by Illumina HiSeq 2000 sequencing platform. The reads were aligned against eight R570 BACs (Bacterial Artificial Chromosome) sequences stored in NCBI using Bowtie2. We used MaSuRCA to assemble the aligned reads de novo, and the consensus sequences were obtained with SAMtools mpileup option. The transposable elements were identified using RepeatMasker and the gene regions were annotated with Blastx against the GenBank non-redundant protein database. After that, the consensus sequences were aligned with the matching reference (R570) using ClustalW in Mega software, to look for the percentage of mismatches and conserved sites between them. We obtained the number of scaffolds bigger than 1 kb ranging from 607 to 2,884, and the longest scaffold had near 21 kb. The consensus sequence length ranged from 81 to 142 kb, and the recovery rate relative to the reference ranged from 82% to 97%. The sequences amounted 1 Mb of RB867515 cultivar genome. We identified 5,145 repeated elements, which 4,662 were microsatellite and 460 were transposable elements, amounted 225 kb of repeated sequences. Among the mobile elements, the retrotransposons comprises 15% of nucleotide composition, ranging from 8% to 29% among BACs. The 134 genes identified on the eight BAC consensus sequences comprised a total of 243 kb, resulting in a density of one gene per 7.2 kb. The average number of genes per BAC was 16, with an average gene length of 1,841 bp. The percentage of mismatches between the RB867515 and R570 BACs ranged from 0.27% to 1.32%. The sugarcane BACs correspond to homeologous genomic regions, with this alignment we can suggest high divergence inside an homeologous group.eng
dc.description.provenanceSubmitted by Luciana Ferreira (lucgeral@gmail.com) on 2017-04-18T14:12:04Z No. of bitstreams: 2 Dissertação - Isabela Pavanelli de Souza - 2014.pdf: 8334281 bytes, checksum: 3dab37e35c18875483625a1b3a46036d (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)eng
dc.description.provenanceApproved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2017-04-18T14:13:10Z (GMT) No. of bitstreams: 2 Dissertação - Isabela Pavanelli de Souza - 2014.pdf: 8334281 bytes, checksum: 3dab37e35c18875483625a1b3a46036d (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)eng
dc.description.provenanceMade available in DSpace on 2017-04-18T14:13:10Z (GMT). No. of bitstreams: 2 Dissertação - Isabela Pavanelli de Souza - 2014.pdf: 8334281 bytes, checksum: 3dab37e35c18875483625a1b3a46036d (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2014-09-25eng
dc.description.resumoA cana-de-açúcar é reconhecida como uma das mais importante culturas do mundo, pela utilização dos seus subprodutos. O genoma da cana-de-açúcar é um dos mais complexos entre as plantas cultivadas, com aproximadamente 10 Gb. Seu genoma completo ainda não foi sequenciado, mas o surgimento e a popularização de novas ferramentas de análise genômica possibilitaram estudos refinados sobre essa cultura. Com o grande volume de informações que é possível gerar, a demanda atual é a produção ferramentas eficientes para o processamento dos dados. Foi realizado um assembly e anotação de uma região do genoma da cultivar RB867515 correspondente às sequências de 8 BACs da cultivar R570. As regiões correspondentes foram obtidas por alinhamento usando Bowtie2 com reads de bibliotecas paired-ends produzidos por sequenciador automático de nova geração e montados de novo utilizando MaSuRCA. Os scaffolds foram alinhados às sequência de referência usando BWA-SW, e as sequências consenso foram obtidas pela opção mplieup do SAMtools. Reads de cDNA de cinco tecidos vegetais, provenientes de 30 genótipos de cana-de-açúcar obtidos pela estratégia RNA-seq, foram mapeados nas sequências consenso a fim de identificar as regiões gênicas, que foram anotadas utilizando Blastx contra o banco de proteínas não redundante no GenBank. As regiões repetitivas foram determinadas pelo RepeatMasker e os microssatélites pelo IMEX. Para a comparação entre as sequências das duas cultivares, foi realizado uma alinhamento das sequências correspondentes nos dois genomas utilizando ClustalW no software Mega. O assembly das oito regiões, gerou de 607 à 2884 scaffolds maiores que 1 kb, com o maior scaffold chegando a 21 kb. As sequências consenso variam de 81 a 142 kb de tamanho, representando uma taxa de recuperação em relação à referência de 82% a 97%. O tamanho total das sequências montadas somou quase 1 Mb do genoma da cultivar de cana-deaçúcar. Em relação à anotação, foram identificados 5145 elementos genéticos repetitivos, em que 4662 são microssatélites e 460 são transposons, totalizando 225 kb em sequências repetidas ao longo dos BACs. Dentro do grupo dos elementos genéticos móveis os retrotransposons são maioria, com 15% da composição nucleotídica, variando de 8% a 29% entre os BACs. Foram identificados 134 genes nas oito sequências de cana-de-açúcar analisadas, totalizando 243 kb. O número de genes por BAC variou de 11 a 26, com uma média de 16 genes por BAC. Os genes encontrados apresentaram tamanho médio de 1841 pb, variando de 443 (BAC1) à 6316 pb (BAC3). A densidade de genes média foi de 1 gene por 7,2 kb. A porcentagem de mismatches entres as sequências dos BACs de RB867515 variou de 0,27% a 1,32%. Os BACs de cana-deaçúcar correspondem a regiões genômicas homeólogas, com o alinhamento realizado com as duas cultivares pode-se sugerir que existe alta divergência dentro do grupo de homeologia.por
dc.description.sponsorshipFinanciadora de Estudos e Projetos- Fineppor
dc.description.sponsorshipOutropor
dc.formatapplication/pdf*
dc.identifier.citationSOUZA, I. P. Caracterização da região Bru1 no genoma da cultivar RB867515 (Saccharum spp.) utilizando sequenciamento de nova geração. 2014. 96 f. Dissertação (Mestrado em Genética e Melhoramento de Plantas) - Universidade Federal de Goiás, Goiânia, 2014.por
dc.identifier.urihttp://repositorio.bc.ufg.br/tede/handle/tede/7166
dc.languageporpor
dc.publisherUniversidade Federal de Goiáspor
dc.publisher.countryBrasilpor
dc.publisher.departmentEscola de Agronomia e Engenharia de Alimentos - EAEA (RG)por
dc.publisher.initialsUFGpor
dc.publisher.programPrograma de Pós-graduação em Genética e Melhoramento de Plantas (EAEA)por
dc.rightsAcesso Abertopor
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectCana-de-açúcarpor
dc.subjectGenômicapor
dc.subjectBioinformáticapor
dc.subjectGenome assemblyeng
dc.subjectSaccharum sppeng
dc.subjectIllumina readseng
dc.subject.cnpqGENETICA::GENETICA VEGETALpor
dc.titleCaracterização da região Bru1 no genoma da cultivar RB867515 (Saccharum spp.) utilizando sequenciamento de nova geraçãopor
dc.title.alternativeCharacterization of Bru1 region of sugarcane cultivar RB867515 using next generation sequencingeng
dc.typeDissertaçãopor

Arquivos

Pacote Original
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
Dissertação - Isabela Pavanelli de Souza - 2014.pdf
Tamanho:
7.95 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
2.11 KB
Formato:
Item-specific license agreed upon to submission
Descrição: