Repository logo
 
Publication

Uma proposta de data mining para análise de dados referentes aos incêndios florestais ocorridos em Portugal

datacite.subject.fosEngenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informáticapt_PT
dc.contributor.advisorSoares, Christophe
dc.contributor.advisorTorres, José
dc.contributor.authorAlmeida Júnior, Paulo César de
dc.date.accessioned2024-07-09T14:02:51Z
dc.date.available2024-07-09T14:02:51Z
dc.date.issued2024-06-13
dc.description.abstractIncêndios florestais representam um desafio mundial expressivo, exigindo uma compreensão aprofundada de seus fatores desencadeantes para uma gestão eficaz. Este estudo aborda a necessidade de prevenção, detecção e supressão de incêndios, bem como a consideração das interações ecológicas envolvidas. A mineração de dados de incidentes históricos de incêndios florestais revela-se crucial para a previsão e a compreensão desses eventos. Sendo assim a pesquisa se concentra na construção de modelos preditivos, baseados em algoritmos de aprendizado de máquina, um modelo de aprendizagem supervisionada, que relaciona variáveis independentes (como datas de ocorrências, localidades, duração, índices de severidade meteorológica e de perigo de incêndios e causas) com uma variável dependente (a classe de área ardida). Dois pontos fundamentais são abordados: uma análise exploratória de dados de incêndios ocorridos em Portugal entre 2011 e 2022 e a criação de um modelo preditivo para classificar a faixa de área ardida em registros históricos do conjunto de dados. Os resultados revelaram insights significativos. Visto que a análise exploratória dos dados forneceu uma visão abrangente dos incêndios, identificando áreas suscetíveis e destacando o impacto da ação humana na ampliação desses incidentes. Os fatores meteorológicos, representados pelos índices de severidade meteorológica e risco de incêndio, demonstram uma associação direta com o aumento das ocorrências. A pesquisa superou desafios iniciais, como o desbalanceamento de classes, por meio do método Synthetic Minority Oversampling Technique (SMOTE), resultando em modelos de alta qualidade. O Random Forest, após o balanceamento das classes, emergiu como uma abordagem promissora, obtendo métricas de desempenho notáveis, incluindo uma accuracy de 96% e valores de F1-score consistentemente acima de 87%. As várias análises e dados estatísticos gerados por esta pesquisa contribuem para a compreensão e a prevenção de incêndios florestais, com implicações práticas na gestão desses eventos. A capacidade de predição aprimorada e a identificação de fatores-chave oferecem uma base sólida para estratégias de prevenção e resposta mais eficazes.pt_PT
dc.description.abstractForest fires represent a significant global challenge, demanding an in-depth understanding of their triggering factors for effective management. This study addresses the need for fire prevention, detection, and suppression, taking into consideration the involved ecological interactions. Data mining of historical forest fire incidents proves to be crucial for predicting and comprehending these events. Therefore, the research focuses on building predictive models, based on machine learning algorithms, a supervised learning model, that relate independent variables (such as occurrence dates, locations, duration, meteorological severity indices, fire danger indices, and causes) to a dependent variable (the burned area class). Two key points are addressed: an exploratory data analysis of fire incidents that occurred in Portugal between 2011 and 2022 and the creation of a predictive model to classify the burned area range in historical records from the dataset. The results have revealed significant insights. As the exploratory data analysis provided a comprehensive view of fires, identifying susceptible areas and highlighting the impact of human actions in amplifying these incidents. Meteorological factors, represented by meteorological severity and fire risk indices, demonstrate a direct association with the increase in occurrences. The research has overcome initial challenges, such as class imbalance, through the Synthetic Minority Oversampling Technique (SMOTE) method, resulting in high-quality models. Random Forest, after class balancing, emerged as a promising approach, achieving notable performance metrics, including an accuracy of 96% and consistently F1-scores above 87%. The various analyses and statistical data generated by this research contribute to the understanding and prevention of forest fires, with practical implications in the management of these events. Enhanced prediction capability and the identification of key factors provide a solid foundation for more effective prevention and response strategies.pt_PT
dc.description.versionN/Apt_PT
dc.identifier.tid203659139
dc.identifier.urihttp://hdl.handle.net/10284/13097
dc.language.isoporpt_PT
dc.publisher[s.n.]pt_PT
dc.subjectIncêndios florestaispt_PT
dc.subjectPrevençãopt_PT
dc.subjectModelos preditivospt_PT
dc.subjectAlgoritmos de aprendizado de máquinapt_PT
dc.subjectForest firespt_PT
dc.subjectPreventionpt_PT
dc.subjectPredictive modelspt_PT
dc.subjectMachine learning algorithmspt_PT
dc.titleUma proposta de data mining para análise de dados referentes aos incêndios florestais ocorridos em Portugalpt_PT
dc.typemaster thesis
dspace.entity.typePublication
rcaap.rightsopenAccesspt_PT
rcaap.typemasterThesispt_PT
thesis.degree.nameMestrado em Engenharia Informática, ramo de Sistemas de Informação e Multimédiapt_PT

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
DM_36089.pdf
Size:
3.22 MB
Format:
Adobe Portable Document Format
Description:
36089
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: