Tamanho, montagem de novo e anotação do genoma de Dipteryx alata (Leguminosae)

dc.contributor.advisor1Telles, Mariana Pires de Campos
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/4648436798023532por
dc.contributor.referee1Telles, Mariana Pires de Campos
dc.contributor.referee1Latteshttp://lattes.cnpq.br/4648436798023532por
dc.contributor.referee2Borba, Tereza
dc.contributor.referee3Almeida, Luciane
dc.contributor.referee4Novaes, Evandro
dc.contributor.referee5Soares, Thannya Nascimento
dc.creatorTaquary, Adriana Maria Antunes
dc.creator.Latteshttp://lattes.cnpq.br/8869318023800691por
dc.date.accessioned2017-05-10T13:22:31Z
dc.date.issued2017-04-24
dc.description.abstractIn recent years there has been a rapid increase in the availability and quality of sequencing data and with this an explosion of projects of sequencing of the genomes of plants occurred. In this scenario, genomic analyzes have been characterized as efficient to generate genetic information on a large scale, including for non-model species. Dipteryx alata is a non-model tree species endemic to the Cerrado biome belonging to the Leguminosae family. The objectives of this work were to estimate the number of chromosomes and the size of the genome of D. alata, and also assemble and annotate sequences of the genomes organelles and nuclear of the species using Illumina sequencing data. The size of the genome of D. alata was estimated as 1C = 0.825 pg, which corresponds to a haploid genome of 807.2 MB with 2n = 16 chromosomes. Were assembled 275,709 nuclear genomic sequences with N50 equal to 1598, which corresponds to 355MB and 44% of the whole genome. In the nuclear sequences, 21,981 microsatellite regions were annotated, of which 49.3% had dinucleotide motifs, 42.7% trinucleotide motifs and 4% tetranucleotide motifs. Transposable elements (TEs) were found in 39.29% of the sequences analyzed, corresponding to 421,701 TEs. LTR retrotransposons (gypsy and copy) were the most abundant TEs in nuclear sequences. Were annotated 1,431 RNA genes non-translated into proteins, being 176 rRNAs, 189 tRNAs, 477 snRNAs, 8 snoRNAs, 466 miRNAs and 115 lncRNAs. Were annotated also 62,200 protein coding genes with an average size of 1,156 bp. The estimated number of mRNAs transcribed by the set of annotated nuclear genes was 160,450, of which 131,228 showed significant similarity with known sequences and 84,793 were classified functionally in the Gene Ontology terms. A total of 736,787 SNPs and 90,803 InDels were discovered in the nuclear sequences. A mean of 1 SNP was identified for each 189 bp of the genome and the ratio between the transition (Ts) and transversion (Tv) mutations was 1.58. A percentage of 46.5% of the SNPs occurs in the genic context and the effects of the SNPs were annotated mainly in exons and intergenic regions. Were assembled 110 KB of chloroplastid sequences with N50 of 2,384 bp and 327 KB of mitochondrial sequences with N50 of 1,784 bp. Were annotated genes of 3 rRNA, 13 tRNA, 6 miRNA and 20 lncRNA for the chloroplast and genes of 4 rRNA, 26 tRNA, 7 miRNA and 54 lncRNA for the mitochondria. For the chloroplast were predicted 20 protein coding genes with a mean size of 2,374 bp and for mitochondria were predicted 176 genes with a mean size of 1,279 bp. The estimated number of mRNAs transcribed by this gene set was 63 and 525 for chloroplast and mitochondria respectively. Were annotated 39 microsatellite regions and 4 TEs in the chloroplastid sequences and 158 microsatellite regions and 26 TEs in the mitochondrial sequences. This work, which can be considered one of the first genomic studies for Cerrado species, represents a great advance in the knowledge on the structure and organization of the D. alata genome. The obtained results open the way for further genetic and genomic investigation for the species.eng
dc.description.provenanceSubmitted by JÚLIO HEBER SILVA (julioheber@yahoo.com.br) on 2017-05-09T19:16:43Z No. of bitstreams: 2 Tese - Adriana Maria Antunes Taquary - 2017.pdf: 3216713 bytes, checksum: caeaa4ba73b31eadb6f74040c4bb9b92 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)eng
dc.description.provenanceApproved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2017-05-10T13:22:31Z (GMT) No. of bitstreams: 2 Tese - Adriana Maria Antunes Taquary - 2017.pdf: 3216713 bytes, checksum: caeaa4ba73b31eadb6f74040c4bb9b92 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)eng
dc.description.provenanceMade available in DSpace on 2017-05-10T13:22:31Z (GMT). No. of bitstreams: 2 Tese - Adriana Maria Antunes Taquary - 2017.pdf: 3216713 bytes, checksum: caeaa4ba73b31eadb6f74040c4bb9b92 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2017-04-24eng
dc.description.resumoNos últimos anos houve um rápido aumento na disponibilidade e qualidade dos dados de sequenciamento e com isso ocorreu uma explosão de projetos de sequenciamento dos genomas de plantas. Nesse cenário, as análises genômicas vêm sendo caracterizadas como eficientes para gerar informações genéticas em larga escala, inclusive para espécies não modelos. Dipteryx alata é uma espécie de árvore não modelo endêmica do bioma Cerrado pertencente à família Leguminosae. Os objetivos deste trabalho foram estimar o número de cromossomos e o tamanho do genoma de D. alata, e também montar e anotar sequências dos genomas organelares e nuclear da espécie usando dados de sequenciamento Illumina. O tamanho do genoma de D. alata foi estimado como 1C = 0.825 pg, o que corresponde a um genoma haplóide de 807.2 MB com 2n=16 cromossomos. Foram montadas 275.709 sequências genômicas nucleares com N50 igual a 1598, o que corresponde a 355MB e 44% do genoma inteiro. Nas sequências nucleares foram anotados 21.981 regiões microssatélites, das quais 49,3% possuem motivos dinucleotídeos, 42,7% trinucleotídeo e 4% tetranucleotídeo. Elementos transponíveis (TEs) foram encontrados em 39,29% das sequências analisadas, o que corresponde a 421.701 TEs. Os retrotransposons LTR (gypsy e copia) foram os TEs mais abundantes nas sequências nucleares. Foram anotados 1.431 genes de RNAs não traduzidos em proteínas, sendo 176 rRNAs, 189 tRNAs, 477 snRNAs, 8 snoRNAs, 466 miRNAs e 115 lncRNAs. Foram anotados também 62.200 genes codificadores de proteínas com tamanho médio de 1.156 pb. O número estimado de mRNAs transcritos pelo conjunto de genes nucleares anotados foi igual a 160.450, dos quais 131.228 apresentaram similaridade significativa com sequências já conhecidas e 84.793 foram classificadas funcionalmente nos termos do Gene Ontology. Um total de 736.787 SNPs e 90.803 InDels foram descobertos nas sequências nucleares. Foi identificada uma média de 1 SNP a cada 189 pb do genoma e a razão entre as mutações de transição (Ts) e transversão (Tv) foi de 1,58. Uma porcentagem de 46,5% dos SNPs ocorreu em contexto gênico e os efeitos dos SNPs foram anotados principalmente em éxons e regiões intergênicas. Foram montados 110 KB de sequências cloroplastidiais com N50 de 2.384 pb e 327 KB de sequências mitocondriais com N50 de 1.784 pb. Foram anotados genes de 3 rRNA, 13 tRNA, 6 miRNA e 20 lncRNA para o cloroplasto e genes de 4 rRNA, 26 tRNA, 7 miRNA e 54 lncRNA para a mitocôndria. Para o cloroplasto foram preditos 20 genes codificantes de proteínas com tamanho médio de 2.374 pb e para a mitocôndria foram preditos 176 genes com tamanho médio de 1.279 pb. O número estimado de mRNAs transcritos por esse conjunto de genes foi igual a 63 e 525 para cloroplasto e mitocôndria, respectivamente. Foram anotados também 39 regiões microssatélites e 4 TEs nas sequências cloroplastidiais e 158 regiões microssatélites e 26 TEs nas sequências mitocondriais. Este trabalho, que pode ser considerado um dos primeiros estudos genômicos para espécies do Cerrado, representa um grande avanço nos conhecimentos sobre a estrutura e a organização do genoma de D. alata. Os resultados obtidos abrem caminho para novas investigações genéticas e genômicas para a espécie.por
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESpor
dc.description.sponsorshipFundação de Amparo à Pesquisa do Estado de Goiás - FAPEGpor
dc.description.sponsorshipConselho Nacional de Pesquisa e Desenvolvimento Científico e Tecnológico - CNPqpor
dc.formatapplication/pdf*
dc.identifier.citationTAQUARY, A. M. A. Tamanho, montagem de novo e anotação do genoma de Dipteryx alata (Leguminosae). 2017. 137 f. Tese (Doutorado em Genética e Biologia Molecular) - Universidade Federal de Goiás, Goiânia, 2017.por
dc.identifier.urihttp://repositorio.bc.ufg.br/tede/handle/tede/7297
dc.languageporpor
dc.publisherUniversidade Federal de Goiáspor
dc.publisher.countryBrasilpor
dc.publisher.departmentInstituto de Ciências Biológicas - ICB (RG)por
dc.publisher.initialsUFGpor
dc.publisher.programPrograma de Pós-graduação em Genética e Biologia Molecularpor
dc.rightsAcesso Abertopor
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectNúmero cromossômicopor
dc.subjectTamanho genômicopor
dc.subjectElementos repetitivospor
dc.subjectGenespor
dc.subjectPolimorfismos de nucleotídeo únicopor
dc.subjectChromosome numbereng
dc.subjectGenomic sizeeng
dc.subjectRepetitive elementseng
dc.subjectGeneseng
dc.subjectSingle nucleotide polymorphismseng
dc.subject.cnpqGENETICA::GENETICA VEGETALpor
dc.titleTamanho, montagem de novo e anotação do genoma de Dipteryx alata (Leguminosae)por
dc.title.alternativeSize, de novo assembly and annotation of the genome of Dipteryx alata (Leguminosae)eng
dc.typeTesepor

Arquivos

Pacote Original
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
Tese - Adriana Maria Antunes Taquary - 2017.pdf
Tamanho:
3.07 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
2.11 KB
Formato:
Item-specific license agreed upon to submission
Descrição: