Métodos de aprendizagem de máquina em química analítica: Floresta Randômica aplicada na avaliação de petróleo

dc.contributor.advisor1Filgueiras, Paulo Roberto
dc.contributor.advisor1IDhttps://orcid.org/0000000326171601
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/1907915547207861
dc.contributor.authorLovatti, Betina Pires Oliveira
dc.contributor.authorIDhttps://orcid.org/0000-0002-7401-2739
dc.contributor.authorLatteshttp://lattes.cnpq.br/8227109432707028
dc.contributor.referee1Almeida, Mariana Ramos de
dc.contributor.referee1IDhttps://orcid.org/0000-0002-2612-068X
dc.contributor.referee1Latteshttp://lattes.cnpq.br/6690913086860156
dc.contributor.referee2Romao, Wanderson
dc.contributor.referee2IDhttps://orcid.org/0000000222546683
dc.contributor.referee2Latteshttp://lattes.cnpq.br/9121022613112821
dc.contributor.referee3Oliveira, Emanuele Catarina da Silva
dc.contributor.referee3IDhttps://orcid.org/
dc.contributor.referee3Latteshttp://lattes.cnpq.br/1715851915787164
dc.contributor.referee4Cunha Neto, Alvaro
dc.contributor.referee4IDhttps://orcid.org/0000-0002-1814-6214
dc.contributor.referee4Latteshttp://lattes.cnpq.br/7448379486432052
dc.date.accessioned2024-05-29T22:11:22Z
dc.date.available2024-05-29T22:11:22Z
dc.date.issued2019-11-29
dc.description.abstractTechnological development has driven chemical laboratories with instruments capable of extracting more information from samples. This has especially affected the area of Analytical Chemistry. The use of multivariate statistical methods, which is part of a growing area of Analytical Chemistry, called Chemometrics, helps to explore the full potential of these new instruments. At the forefront of Chemometrics is the new machine learning method: Random Forest (RF). This method has its applications aimed at modeling complex matrices such as petroleum. The complexity of oil is due to the wide variation in the composition of its constituents, which gives it distinct physicochemical properties. These compositional variations can be observed by spectroscopic techniques such as Mid Infrared (MIR) spectroscopy, Hydrogen Nuclear Magnetic Resonance (1H NMR) and Carbon (13C NMR) that have the potential to extract information at the molecular level of petroleum. Through the application of chemometric methods, this chemical information can be related to the physicochemical properties of petroleum. Thus, the present work aims to classify petroleum samples using spectroscopic techniques associated with machine learning methods, as well as, to explore the potentiality of the RF when combined with variable selection methods, and to identify in this algorithm variables that most contribute for the classification of oil samples. The results showed that RF was able to discriminate petroleum samples according to the Maximum Pour Point (PFM) from 1H and 13C NMR data. Besides, was possible to identify the variables that most contributed to the modeling, in which a balance between aromatic and saturated compounds was observed. In a second application, RF was efficient in discriminating 1H and 13C NMR spectra in relation to the total acidy number (TAN) of oil, especially when associated with the Principal Component Analysis (PCA) and Fisher's Discriminant (FD). The identification of the most important variables for discrimination showed a subtly greater contribution from the aromatic region. In the third application, the pattern recognition methods: PCA and k-Nearest Neighbors were efficient to identify oil profiles from MIR data. This process provides information on the chemical similarity of oils without the need for complete oil characterization
dc.description.resumoO desenvolvimento tecnológico impulsionou os laboratórios químicos com instrumentos capazes de extrair cada vez mais informações das amostras. Isto afetou especialmente a área de Química Analítica. A utilização de métodos de estatística multivariada, a qual está inserida dentro de uma crescente área da Química Analítica, denominada Quimiometria, auxilia a exploração de toda a potencialidade destes novos instrumentos. Na vanguarda da Quimiometria está o novo método de aprendizagem de máquina: Floresta Randômica (RF). Este método tem suas aplicações voltadas à modelagem de matrizes complexas tal como o petróleo. A complexidade do petróleo é devida à grande variação na composição de seus constituintes, o que lhe confere propriedades físico-químicas distintas. Essas variações composicionais podem ser observadas por meio de técnicas espectroscópicas tais como: espectroscopia na região do Infravermelho Médio (MIR), Ressonância Magnética Nuclear de Hidrogênio (RMN de 1H) e Carbono (RMN de 13C) que possuem potencialidade de extrair informações a nível molecular do petróleo. Através da aplicação de métodos quimiométricos essas informações químicas podem ser relacionadas a propriedades físico-químicas do petróleo. Assim, o presente trabalho visa a classificação de amostras petróleo utilizando técnicas espectroscópicas associada a métodos de aprendizagem de máquina, assim como, explorar a potencialidade da técnica de RF quando combinada a métodos de seleção de variáveis, além de identificar nesse algoritmo variáveis que mais contribuem para a classificação das amostras de petróleo. Os resultados mostraram que a RF foi capaz de discriminar amostras de petróleo quanto ao Ponto de Fluidez Máximo (PFM) a partir de dados de RMN de 1H e 13C. Ademais, foi possível identificar as variáveis de maior contribuição na modelagem, no qual foi observado um equilíbrio entre compostos aromáticos e saturados. Numa segunda aplicação, RF foi eficiente em discriminar espectros de RMN de 1H e 13C em relação ao Número de Acidez Total (NAT) de petróleo, especialmente, quando associada aos métodos: Análise de Componentes Principais (PCA) e Discriminante de Fisher (FD). A identificação das variáveis mais importantes para discriminação mostrou uma contribuição sutilmente maior da região de aromáticos. Na terceira aplicação, os métodos de reconhecimento de padrões: PCA e k-Vizinhos mais Próximos foram eficientes para identificar perfis de petróleo a partir de dados de MIR, possibilitando obter informações sobre similaridade química de óleos sem a necessidade de uma caracterização completa do óleo.
dc.description.sponsorshipFundação de Amparo à Pesquisa do Espírito Santo (FAPES)
dc.formatText
dc.identifier.urihttp://repositorio.ufes.br/handle/10/13480
dc.languagepor
dc.publisherUniversidade Federal do Espírito Santo
dc.publisher.countryBR
dc.publisher.courseDoutorado em Química
dc.publisher.departmentCentro de Ciências Exatas
dc.publisher.initialsUFES
dc.publisher.programPrograma de Pós-Graduação em Química
dc.rightsopen access
dc.subjectAprendizagem de máquina
dc.subjectFloresta Randômica
dc.subjectPetróleo
dc.subjectRedução
dc.subjectMachine learning method
dc.subjectRandom Forest
dc.subjectCrude Oil
dc.subjectReduction of variables
dc.subjectNMR
dc.subject.br-rjbnsubject.br-rjbn
dc.subject.cnpqQuímica
dc.titleMétodos de aprendizagem de máquina em química analítica: Floresta Randômica aplicada na avaliação de petróleo
dc.title.alternativeMachine learning methods in analytical chemistry: Random Forest applied in crude oil evaluation
dc.typedoctoralThesis
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
BetinaPiresOliveiraLovatti-2019-tese.pdf
Tamanho:
3.91 MB
Formato:
Adobe Portable Document Format
Descrição: