Inflação de zeros nas notas da redação do ENEM: comparação entre o modelo beta inflacionado em zero e o modelo de barreira
| dc.contributor.advisor1 | Andrade, Ana Carolina do Couto | |
| dc.contributor.referee1 | Andrade, Ana Carolina do Couto | |
| dc.contributor.referee1 | Silva, Tatiane Ferreira do Nascimento Melo da | |
| dc.contributor.referee1 | Tojeiro, Cynthia Arantes Vieira | |
| dc.creator | Lima, João Marcos Ribeiro | |
| dc.date.accessioned | 2026-01-28T11:24:22Z | |
| dc.date.available | 2026-01-28T11:24:22Z | |
| dc.date.issued | 2025-11-25 | |
| dc.description.abstract | The essay score of the National High School Exam (ENEM), bounded to the interval [0, 1000], presents a considerable proportion of zero scores, a phenomenon known as zero inflation. This structural characteristic of the data requires the use of specialized statistical models capable of handling the hybrid nature of the distribution, which consists of a point mass at zero and a continuous component. The primary objective of this work is to identify the factors impacting the distribution of essay scores for students from public and private schools. As a secondary objective, of a methodological nature, this study seeks to compare the adequacy and robustness of two modeling strategies: the Zero-Inflated Beta model (BEINF0) and the Hurdle Model. For this purpose, ENEM microdata made available by the Anísio Teixeira National Institute of Educational Studies and Research (INEP) were utilized. The analysis was conducted on two distinct populations: one restricted to Goiânia (2023) and a broader one covering the state of Goiás (2021-2023). The models were implemented within the GAMLSS framework in the R statistical software, where the Hurdle Model was specified with a binary component (Logistic) and a continuous intensity component (modeled with the Box-Cox t distribution). Descriptive analysis results indicate significant disparities in performance and socioeconomic profiles between students from public and private schools. Although both modeling approaches identified objective scores and socioeconomic variables as relevant predictors, diagnostic analysis (such as worm plots and residual statistics) demonstrated that the Hurdle Model, despite remaining inadequacies, is methodologically more robust and conceptually more aligned with the exam's evaluation structure. Both models struggled to capture the shape of the data distribution, although the hurdle approach showed superior performance. | |
| dc.description.resumo | A nota da Redação do Exame Nacional do Ensino Médio (ENEM), limitada ao intervalo [0, 1000], apresenta uma proporção considerável de notas zero, um fenômeno conhecido como inflação de zeros. Essa característica estrutural dos dados demanda o uso de modelos estatísticos especializados, capazes de lidar com a natureza híbrida da distribuição, que é composta por uma massa pontual em zero e uma componente contínua. O objetivo primário deste trabalho é identificar os fatores que impactam a distribuição das notas da redação para estudantes de escolas públicas e privadas. Como objetivo secundário, de caráter metodológico, busca-se comparar a adequação e a robustez de duas estratégias de modelagem: o modelo Beta Inflacionado em Zero (BEINF0) e o Modelo de Barreira (Hurdle). Para isso, utilizou-se os microdados do ENEM, disponibilizados pelo Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP) . A análise foi conduzida em duas populações distintas: uma restrita a Goiânia (2023) e outra ampla, cobrindo o estado de Goiás (2021-2023). Os modelos foram implementados no framework GAMLSS no software estatístico R, onde o Modelo de Barreira foi especificado com um componente binário (Logístico) e um componente de intensidade contínuo (modelado com a distribuição Box-Cox t). Os resultados da análise descritiva indicam disparidades significativas de desempenho e perfil socioeconômico entre alunos de escolas públicas e privadas. Embora ambas as abordagens de modelagem tenham identificado as notas objetivas e variáveis socioeconômicas como preditores relevantes, a análise de diagnóstico (como worm plots e estatísticas de resíduos) demonstrou que o Modelo de Barreira, embora ainda haja inadequações, é metodologicamente mais robusto e conceitualmente mais alinhado à estrutura de avaliação da prova. Ambos os modelos apresentaram dificuldades em capturar a forma da distribuição dos dados, apesar de a abordagem de barreira ter se destacado mais. | |
| dc.identifier.citation | LIMA, João Marcos Ribeiro. Inflação de zeros nas notas da redação do ENEM: comparação entre o modelo beta inflacionado em zero e o modelo de barreira. 2025. 75 f. Trabalho de Conclusão de Curso (Bacharelado em Estatística) – Instituto de Matemática e Estatística, Universidade Federal de Goiás, Goiânia, 2025. | |
| dc.identifier.uri | https://repositorio.bc.ufg.br//handle/ri/29518 | |
| dc.language.iso | por | |
| dc.publisher | Universidade Federal de Goiás | |
| dc.publisher.country | Brasil | |
| dc.publisher.course | Estatística (RMG) | |
| dc.publisher.department | Instituto de Matemática e Estatística - IME (RMG) | |
| dc.publisher.initials | UFG | |
| dc.rights | Acesso Aberto | |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
| dc.subject | ENEM | |
| dc.subject | Gamlss | |
| dc.subject | Inflação em zeros | |
| dc.subject | Modelo de barreira | |
| dc.subject | ENEM | |
| dc.subject | Gamlss | |
| dc.subject | Zero inflation | |
| dc.subject | Hurdle model | |
| dc.title | Inflação de zeros nas notas da redação do ENEM: comparação entre o modelo beta inflacionado em zero e o modelo de barreira | |
| dc.title.alternative | Zero inflation in ENEM essay scores: a comparison between the zero-inflated beta model and the hurdle model | |
| dc.type | Trabalho de conclusão de curso de graduação (TCCG) |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- TCCG - Estatística - João Marcos Ribeiro Lima - 2025.pdf
- Tamanho:
- 60.38 MB
- Formato:
- Adobe Portable Document Format
Licença do Pacote
1 - 1 de 1
Carregando...
- Nome:
- license.txt
- Tamanho:
- 1.71 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição: