Métodos de aprendizagem de máquina aplicados à ciência do petróleo

dc.contributor.advisor-co1Ferreira, Rafael de Queiroz
dc.contributor.advisor-co1IDhttps://orcid.org/0000-0002-5190-8508
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/5053247764430323
dc.contributor.advisor1Filgueiras, Paulo Roberto
dc.contributor.advisor1IDhttps://orcid.org/0000-0003-2617-1601
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/1907915547207861
dc.contributor.authorBarboza, Maria Carolina da Vitória Alvarenga
dc.contributor.authorIDhttps://orcid.org/0009-0007-7744-4434
dc.contributor.authorLatteshttp://lattes.cnpq.br/6535362149640541
dc.contributor.referee1Oliveira, Emanuele Catarina da Silva
dc.contributor.referee1IDhttps://orcid.org/0000-0003-0699-6104
dc.contributor.referee1Latteshttp://lattes.cnpq.br/1715851915787164
dc.contributor.referee2Souza, Murilo de Oliveira
dc.contributor.referee2IDhttps://orcid.org/0000-0002-5299-564X
dc.contributor.referee2Latteshttp://lattes.cnpq.br/1832643912229312
dc.date.accessioned2025-11-28T20:45:42Z
dc.date.available2025-11-28T20:45:42Z
dc.date.issued2025-03-17
dc.description.abstractThis study aims to present a new machine learning approach to classify crude oil samples based on their physicochemical properties, such as sulfur (S) concentration, total acid number (TAN), and API gravity (American Petroleum Institute). Crude oil is a complex mixture predominantly composed of carbon and hydrogen substances, along with heteroatomic elements such as nitrogen, oxygen, and sulfur. This complexity makes precise analysis essential, especially to avoid problems throughout the production chain. Proposed method seeks to overcome the limitations of traditional techniques, which are often time-consuming, require large sample volumes, and use excessive solvents. As a promising alternative, spectroscopic techniques have been employed for crude oil characterization, and machine learning methods have demonstrated high efficiency in analyzing complex mixtures. These methods offer faster and more accurate exploration of chemical variability compared to conventional approaches. This study, 196 crude oil samples, varying in sulfur content, TAN, and API gravity, were analyzed. The use of SVM (Support Vector Machine) ensembles was explored as a powerful approach to improve classification performance by reducing the variability of individual models, increasing robustness against overfitting, and enabling better generalization than a single model. To evaluate performance, criteria such as sensitivity, specificity, error rate, Matthews correlation coefficient, and accuracy were used, comparing SVM ensemble models with PLS-DA and standard SVM. The results demonstrated that the combination of NIR spectroscopy (Near Infrared Spectroscopy) with SVM ensemble models is an efficient and reliable method for the simultaneous qualification of sulfur content, TAN, and API gravity in crude oils. This is because SVM ensembles tend to perform better, reducing overfitting. Moreover, they create more robust models, reduce variance, and increase model stability.
dc.description.resumoEste estudo tem como objetivo apresentar uma nova abordagem de aprendizado de máquina para classificar amostras de petróleo bruto com base em suas propriedades físico-químicas, como concentração de enxofre (S), número de acidez total (NAT) e densidade API (Americam Petroleum Institute). O petróleo bruto é uma mistura complexa, composta predominantemente por substâncias de carbono e hidrogênio, além de elementos heteroatômicos, como nitrogênio, oxigênio e enxofre. Essa complexidade torna essencial uma análise precisa, especialmente para evitar problemas ao longo da cadeia de produção. O método proposto busca superar as limitações das técnicas tradicionais, que frequentemente são demoradas, consomem grandes volumes de amostras e utilizam solventes em excesso. Como alternativa promissora, técnicas espectroscópicas têm sido utilizadas para a caracterização de petróleo, e métodos de aprendizado de máquina têm demonstrado alta eficiência na análise de misturas complexas. Esses métodos oferecem uma exploração mais rápida e precisa da variabilidade química em comparação com abordagens convencionais. Neste estudo, 196 amostras de petróleo bruto, variando em teor de enxofre, NAT e densidade API, foram analisadas. O uso de SVM ensemble (Support Vector Machines) foi explorado como uma abordagem poderosa para melhorar o desempenho da classificação, reduzindo a variabilidade dos modelos individuais, aumentando a robustez contra o overfitting e permitindo um desempenho preditivo mais confiável do que o de um modelo único. Para avaliar o desempenho, foram utilizados critérios como sensibilidade, especificidade, taxa de erro, coeficiente de correlação de Matthews e precisão, comparando os modelos SVM ensemble com PLS-DA e SVM. Os resultados demonstraram que a combinação de espectroscopia NIR (Espectroscopia do Infravermelho Próximo) com modelos de SVM ensemble é um método eficiente e confiável para a classificação simultânea de teor de enxofre, NAT e densidade API em petróleos brutos. Isso ocorre porque o SVM ensemble tende a apresentar melhor desempenho preditivo, reduzindo o overfitting. Além disso, ele cria modelos mais robustos, reduz a variância e aumenta a estabilidade do modelo.
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
dc.formatText
dc.identifier.urihttp://repositorio.ufes.br/handle/10/20655
dc.languagepor
dc.publisherUniversidade Federal do Espírito Santo
dc.publisher.countryBR
dc.publisher.courseMestrado em Química
dc.publisher.departmentCentro de Ciências Exatas
dc.publisher.initialsUFES
dc.publisher.programPrograma de Pós-Graduação em Química
dc.rightsopen access
dc.subjectSVM ensemble
dc.subjectPetróleo
dc.subjectNIR
dc.subject.cnpqQuímica
dc.titleMétodos de aprendizagem de máquina aplicados à ciência do petróleo
dc.title.alternativeMachine learning methods applied to petroleum science and biofuels
dc.typemasterThesis
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
MariaCarolinadaVitóriaAlvarengaBarboza-2025-Dissertacao.pdf
Tamanho:
6.7 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descrição: