Publication
Framework modular de RAG plug-and-play para chatbots empresariais em hardware com recursos limitados
| datacite.subject.fos | Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática | |
| dc.contributor.advisor | Soares, Christophe | |
| dc.contributor.advisor | Moreira, Rui | |
| dc.contributor.author | Moutinho, Nuno Ricardo Moreira | |
| dc.date.accessioned | 2025-10-13T11:00:45Z | |
| dc.date.available | 2025-10-13T11:00:45Z | |
| dc.date.issued | 2025-10-03 | |
| dc.description.abstract | Com o crescente interesse por sistemas baseados em modelos de linguagem de grande escala, muitas empresas procuram incorporar soluções de chatbots inteligentes para apoio interno e resposta a clientes. No entanto, as abordagens mais avançadas, como o Retrieval-Augmented Generation, continuam inacessíveis para pequenas e médias empresas (PMEs) devido aos elevados requisitos computacionais, dependência de infraestrutura em cloud e complexidade de configuração. Esta dissertação propõe uma solução modular e plug-and-play que permite a qualquer organização instalar e executar localmente um sistema RAG em hardware modesto, com ou sem GPU. A arquitetura desenvolvida suporta ingestão de documentos em múltiplos formatos, recuperação híbrida (densa e esparsa) e geração de respostas com modelos LLM quantizados, utilizando bibliotecas como llama.cpp, FAISS e SQLite FTS5. Um processo automático de benchmarking permite adaptar o sistema ao hardware disponível, sugerindo configurações ideais de forma transparente para o utilizador. A solução inclui ainda um mecanismo de mitigação de alucinações, com pontuação de confiança, citações e recusa de resposta sempre que necessário. Os testes realizados demonstram que a aplicação é capaz de funcionar com eficácia em dispositivos com apenas CPU, oferecendo tempos de resposta inferiores a 9 segundos e elevada precisão em respostas fundamentadas. Os resultados obtidos validam a viabilidade de democratizar o acesso a sistemas RAG personalizados, seguros e eficientes, especialmente em contextos empresariais com restrições orçamentais e requisitos de privacidade. | por |
| dc.description.abstract | ||
| dc.identifier.tid | 204039843 | |
| dc.identifier.uri | http://hdl.handle.net/10284/14656 | |
| dc.language.iso | por | |
| dc.rights.uri | http://creativecommons.org/licenses/by/4.0/ | |
| dc.title | Framework modular de RAG plug-and-play para chatbots empresariais em hardware com recursos limitados | por |
| dc.type | master thesis | |
| dspace.entity.type | Publication | |
| thesis.degree.name | Mestrado em Engenharia Informática, ramo de Computação Móvel |
Files
Original bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- DM_41781.pdf
- Size:
- 2.6 MB
- Format:
- Adobe Portable Document Format
- Description:
- Dissertação de mestrado_41781
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 4.03 KB
- Format:
- Item-specific license agreed upon to submission
- Description:
