Publication
Uma proposta de data mining para análise de dados referentes aos incêndios florestais ocorridos em Portugal
datacite.subject.fos | Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática | pt_PT |
dc.contributor.advisor | Soares, Christophe | |
dc.contributor.advisor | Torres, José | |
dc.contributor.author | Almeida Júnior, Paulo César de | |
dc.date.accessioned | 2024-07-09T14:02:51Z | |
dc.date.available | 2024-07-09T14:02:51Z | |
dc.date.issued | 2024-06-13 | |
dc.description.abstract | Incêndios florestais representam um desafio mundial expressivo, exigindo uma compreensão aprofundada de seus fatores desencadeantes para uma gestão eficaz. Este estudo aborda a necessidade de prevenção, detecção e supressão de incêndios, bem como a consideração das interações ecológicas envolvidas. A mineração de dados de incidentes históricos de incêndios florestais revela-se crucial para a previsão e a compreensão desses eventos. Sendo assim a pesquisa se concentra na construção de modelos preditivos, baseados em algoritmos de aprendizado de máquina, um modelo de aprendizagem supervisionada, que relaciona variáveis independentes (como datas de ocorrências, localidades, duração, índices de severidade meteorológica e de perigo de incêndios e causas) com uma variável dependente (a classe de área ardida). Dois pontos fundamentais são abordados: uma análise exploratória de dados de incêndios ocorridos em Portugal entre 2011 e 2022 e a criação de um modelo preditivo para classificar a faixa de área ardida em registros históricos do conjunto de dados. Os resultados revelaram insights significativos. Visto que a análise exploratória dos dados forneceu uma visão abrangente dos incêndios, identificando áreas suscetíveis e destacando o impacto da ação humana na ampliação desses incidentes. Os fatores meteorológicos, representados pelos índices de severidade meteorológica e risco de incêndio, demonstram uma associação direta com o aumento das ocorrências. A pesquisa superou desafios iniciais, como o desbalanceamento de classes, por meio do método Synthetic Minority Oversampling Technique (SMOTE), resultando em modelos de alta qualidade. O Random Forest, após o balanceamento das classes, emergiu como uma abordagem promissora, obtendo métricas de desempenho notáveis, incluindo uma accuracy de 96% e valores de F1-score consistentemente acima de 87%. As várias análises e dados estatísticos gerados por esta pesquisa contribuem para a compreensão e a prevenção de incêndios florestais, com implicações práticas na gestão desses eventos. A capacidade de predição aprimorada e a identificação de fatores-chave oferecem uma base sólida para estratégias de prevenção e resposta mais eficazes. | pt_PT |
dc.description.abstract | Forest fires represent a significant global challenge, demanding an in-depth understanding of their triggering factors for effective management. This study addresses the need for fire prevention, detection, and suppression, taking into consideration the involved ecological interactions. Data mining of historical forest fire incidents proves to be crucial for predicting and comprehending these events. Therefore, the research focuses on building predictive models, based on machine learning algorithms, a supervised learning model, that relate independent variables (such as occurrence dates, locations, duration, meteorological severity indices, fire danger indices, and causes) to a dependent variable (the burned area class). Two key points are addressed: an exploratory data analysis of fire incidents that occurred in Portugal between 2011 and 2022 and the creation of a predictive model to classify the burned area range in historical records from the dataset. The results have revealed significant insights. As the exploratory data analysis provided a comprehensive view of fires, identifying susceptible areas and highlighting the impact of human actions in amplifying these incidents. Meteorological factors, represented by meteorological severity and fire risk indices, demonstrate a direct association with the increase in occurrences. The research has overcome initial challenges, such as class imbalance, through the Synthetic Minority Oversampling Technique (SMOTE) method, resulting in high-quality models. Random Forest, after class balancing, emerged as a promising approach, achieving notable performance metrics, including an accuracy of 96% and consistently F1-scores above 87%. The various analyses and statistical data generated by this research contribute to the understanding and prevention of forest fires, with practical implications in the management of these events. Enhanced prediction capability and the identification of key factors provide a solid foundation for more effective prevention and response strategies. | pt_PT |
dc.description.version | N/A | pt_PT |
dc.identifier.tid | 203659139 | |
dc.identifier.uri | http://hdl.handle.net/10284/13097 | |
dc.language.iso | por | pt_PT |
dc.publisher | [s.n.] | pt_PT |
dc.subject | Incêndios florestais | pt_PT |
dc.subject | Prevenção | pt_PT |
dc.subject | Modelos preditivos | pt_PT |
dc.subject | Algoritmos de aprendizado de máquina | pt_PT |
dc.subject | Forest fires | pt_PT |
dc.subject | Prevention | pt_PT |
dc.subject | Predictive models | pt_PT |
dc.subject | Machine learning algorithms | pt_PT |
dc.title | Uma proposta de data mining para análise de dados referentes aos incêndios florestais ocorridos em Portugal | pt_PT |
dc.type | master thesis | |
dspace.entity.type | Publication | |
rcaap.rights | openAccess | pt_PT |
rcaap.type | masterThesis | pt_PT |
thesis.degree.name | Mestrado em Engenharia Informática, ramo de Sistemas de Informação e Multimédia | pt_PT |