2021-11-182021-11-182021-08-04VASCONCELOS, M. M. Alocação de recursos em sistemas Internet das Coisas utilizando aprendizagem por reforço. 2021. 55 f. Dissertação (Mestrado em Engenharia Elétrica e da Computação) - Universidade Federal de Goiás, Goiânia, 2021.http://repositorio.bc.ufg.br/tede/handle/tede/11751This paper proposes a utilization of a reinforcement learning (RL) algorithm to control the packet transmission of multiple devices of a Cognitive Internet of Things (IoT) wireless communication system. The proposed approach consists of adopting a Markov chain to model the states of the communication system and its transitions, providing the required parameters to determine actions to the system using a Q-Learning algorithm. This paper also presents a performance evaluation of the developed algorithm in comparison to some scheduling algorithms in terms of: utility function, flow rate, buffer occupancy, packet loss rate, etc.Attribution-NonCommercial-NoDerivatives 4.0 InternationalAprendizagem por reforçoCadeia de MarkovEscalonamentoInternet das Coisas (IdC)Internet of Things (IoT)Markov chainReinforcement learningSchedulingCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::MATEMATICA DA COMPUTACAOAlocação de recursos em sistemas Internet das Coisas utilizando aprendizagem por reforçoResource allocation in Internet of Things systems using reinforcement learningDissertação