Uma proposta de data mining para análise de dados referentes aos incêndios florestais ocorridos em Portugal

Almeida Júnior, Paulo César de

Publication

Uma proposta de data mining para análise de dados referentes aos incêndios florestais ocorridos em Portugal

2024-06-13Master thesis

datacite.subject.fos	Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática	pt_PT
dc.contributor.advisor	Soares, Christophe
dc.contributor.advisor	Torres, José
dc.contributor.author	Almeida Júnior, Paulo César de
dc.date.accessioned	2024-07-09T14:02:51Z
dc.date.available	2024-07-09T14:02:51Z
dc.date.issued	2024-06-13
dc.description.abstract	Incêndios florestais representam um desafio mundial expressivo, exigindo uma compreensão aprofundada de seus fatores desencadeantes para uma gestão eficaz. Este estudo aborda a necessidade de prevenção, detecção e supressão de incêndios, bem como a consideração das interações ecológicas envolvidas. A mineração de dados de incidentes históricos de incêndios florestais revela-se crucial para a previsão e a compreensão desses eventos. Sendo assim a pesquisa se concentra na construção de modelos preditivos, baseados em algoritmos de aprendizado de máquina, um modelo de aprendizagem supervisionada, que relaciona variáveis independentes (como datas de ocorrências, localidades, duração, índices de severidade meteorológica e de perigo de incêndios e causas) com uma variável dependente (a classe de área ardida). Dois pontos fundamentais são abordados: uma análise exploratória de dados de incêndios ocorridos em Portugal entre 2011 e 2022 e a criação de um modelo preditivo para classificar a faixa de área ardida em registros históricos do conjunto de dados. Os resultados revelaram insights significativos. Visto que a análise exploratória dos dados forneceu uma visão abrangente dos incêndios, identificando áreas suscetíveis e destacando o impacto da ação humana na ampliação desses incidentes. Os fatores meteorológicos, representados pelos índices de severidade meteorológica e risco de incêndio, demonstram uma associação direta com o aumento das ocorrências. A pesquisa superou desafios iniciais, como o desbalanceamento de classes, por meio do método Synthetic Minority Oversampling Technique (SMOTE), resultando em modelos de alta qualidade. O Random Forest, após o balanceamento das classes, emergiu como uma abordagem promissora, obtendo métricas de desempenho notáveis, incluindo uma accuracy de 96% e valores de F1-score consistentemente acima de 87%. As várias análises e dados estatísticos gerados por esta pesquisa contribuem para a compreensão e a prevenção de incêndios florestais, com implicações práticas na gestão desses eventos. A capacidade de predição aprimorada e a identificação de fatores-chave oferecem uma base sólida para estratégias de prevenção e resposta mais eficazes.	pt_PT
dc.description.abstract	Forest fires represent a significant global challenge, demanding an in-depth understanding of their triggering factors for effective management. This study addresses the need for fire prevention, detection, and suppression, taking into consideration the involved ecological interactions. Data mining of historical forest fire incidents proves to be crucial for predicting and comprehending these events. Therefore, the research focuses on building predictive models, based on machine learning algorithms, a supervised learning model, that relate independent variables (such as occurrence dates, locations, duration, meteorological severity indices, fire danger indices, and causes) to a dependent variable (the burned area class). Two key points are addressed: an exploratory data analysis of fire incidents that occurred in Portugal between 2011 and 2022 and the creation of a predictive model to classify the burned area range in historical records from the dataset. The results have revealed significant insights. As the exploratory data analysis provided a comprehensive view of fires, identifying susceptible areas and highlighting the impact of human actions in amplifying these incidents. Meteorological factors, represented by meteorological severity and fire risk indices, demonstrate a direct association with the increase in occurrences. The research has overcome initial challenges, such as class imbalance, through the Synthetic Minority Oversampling Technique (SMOTE) method, resulting in high-quality models. Random Forest, after class balancing, emerged as a promising approach, achieving notable performance metrics, including an accuracy of 96% and consistently F1-scores above 87%. The various analyses and statistical data generated by this research contribute to the understanding and prevention of forest fires, with practical implications in the management of these events. Enhanced prediction capability and the identification of key factors provide a solid foundation for more effective prevention and response strategies.	pt_PT
dc.description.version	N/A	pt_PT
dc.identifier.tid	203659139
dc.identifier.uri	http://hdl.handle.net/10284/13097
dc.language.iso	por	pt_PT
dc.publisher	[s.n.]	pt_PT
dc.subject	Incêndios florestais	pt_PT
dc.subject	Prevenção	pt_PT
dc.subject	Modelos preditivos	pt_PT
dc.subject	Algoritmos de aprendizado de máquina	pt_PT
dc.subject	Forest fires	pt_PT
dc.subject	Prevention	pt_PT
dc.subject	Predictive models	pt_PT
dc.subject	Machine learning algorithms	pt_PT
dc.title	Uma proposta de data mining para análise de dados referentes aos incêndios florestais ocorridos em Portugal	pt_PT
dc.type	master thesis
dspace.entity.type	Publication
rcaap.rights	openAccess	pt_PT
rcaap.type	masterThesis	pt_PT
thesis.degree.name	Mestrado em Engenharia Informática, ramo de Sistemas de Informação e Multimédia	pt_PT

Files

Original bundle

Now showing 1 - 1 of 1

Name:: DM_36089.pdf
Size:: 3.22 MB
Format:: Adobe Portable Document Format
Description:: 36089

Download

License bundle

Now showing 1 - 1 of 1

Name:: license.txt
Size:: 1.71 KB
Format:: Item-specific license agreed upon to submission
Description:

Download

Collections

FCT (DCEA) - Mestrado em Engenharia Informática