Métodos de aprendizagem de máquina em química analítica: Floresta Randômica aplicada na avaliação de petróleo
dc.contributor.advisor1 | Filgueiras, Paulo Roberto | |
dc.contributor.advisor1ID | https://orcid.org/0000000326171601 | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/1907915547207861 | |
dc.contributor.author | Lovatti, Betina Pires Oliveira | |
dc.contributor.authorID | https://orcid.org/0000-0002-7401-2739 | |
dc.contributor.authorLattes | http://lattes.cnpq.br/8227109432707028 | |
dc.contributor.referee1 | Almeida, Mariana Ramos de | |
dc.contributor.referee1ID | https://orcid.org/0000-0002-2612-068X | |
dc.contributor.referee1Lattes | http://lattes.cnpq.br/6690913086860156 | |
dc.contributor.referee2 | Romao, Wanderson | |
dc.contributor.referee2ID | https://orcid.org/0000000222546683 | |
dc.contributor.referee2Lattes | http://lattes.cnpq.br/9121022613112821 | |
dc.contributor.referee3 | Oliveira, Emanuele Catarina da Silva | |
dc.contributor.referee3ID | https://orcid.org/ | |
dc.contributor.referee3Lattes | http://lattes.cnpq.br/1715851915787164 | |
dc.contributor.referee4 | Cunha Neto, Alvaro | |
dc.contributor.referee4ID | https://orcid.org/0000-0002-1814-6214 | |
dc.contributor.referee4Lattes | http://lattes.cnpq.br/7448379486432052 | |
dc.date.accessioned | 2024-05-29T22:11:22Z | |
dc.date.available | 2024-05-29T22:11:22Z | |
dc.date.issued | 2019-11-29 | |
dc.description.abstract | Technological development has driven chemical laboratories with instruments capable of extracting more information from samples. This has especially affected the area of Analytical Chemistry. The use of multivariate statistical methods, which is part of a growing area of Analytical Chemistry, called Chemometrics, helps to explore the full potential of these new instruments. At the forefront of Chemometrics is the new machine learning method: Random Forest (RF). This method has its applications aimed at modeling complex matrices such as petroleum. The complexity of oil is due to the wide variation in the composition of its constituents, which gives it distinct physicochemical properties. These compositional variations can be observed by spectroscopic techniques such as Mid Infrared (MIR) spectroscopy, Hydrogen Nuclear Magnetic Resonance (1H NMR) and Carbon (13C NMR) that have the potential to extract information at the molecular level of petroleum. Through the application of chemometric methods, this chemical information can be related to the physicochemical properties of petroleum. Thus, the present work aims to classify petroleum samples using spectroscopic techniques associated with machine learning methods, as well as, to explore the potentiality of the RF when combined with variable selection methods, and to identify in this algorithm variables that most contribute for the classification of oil samples. The results showed that RF was able to discriminate petroleum samples according to the Maximum Pour Point (PFM) from 1H and 13C NMR data. Besides, was possible to identify the variables that most contributed to the modeling, in which a balance between aromatic and saturated compounds was observed. In a second application, RF was efficient in discriminating 1H and 13C NMR spectra in relation to the total acidy number (TAN) of oil, especially when associated with the Principal Component Analysis (PCA) and Fisher's Discriminant (FD). The identification of the most important variables for discrimination showed a subtly greater contribution from the aromatic region. In the third application, the pattern recognition methods: PCA and k-Nearest Neighbors were efficient to identify oil profiles from MIR data. This process provides information on the chemical similarity of oils without the need for complete oil characterization | |
dc.description.resumo | O desenvolvimento tecnológico impulsionou os laboratórios químicos com instrumentos capazes de extrair cada vez mais informações das amostras. Isto afetou especialmente a área de Química Analítica. A utilização de métodos de estatística multivariada, a qual está inserida dentro de uma crescente área da Química Analítica, denominada Quimiometria, auxilia a exploração de toda a potencialidade destes novos instrumentos. Na vanguarda da Quimiometria está o novo método de aprendizagem de máquina: Floresta Randômica (RF). Este método tem suas aplicações voltadas à modelagem de matrizes complexas tal como o petróleo. A complexidade do petróleo é devida à grande variação na composição de seus constituintes, o que lhe confere propriedades físico-químicas distintas. Essas variações composicionais podem ser observadas por meio de técnicas espectroscópicas tais como: espectroscopia na região do Infravermelho Médio (MIR), Ressonância Magnética Nuclear de Hidrogênio (RMN de 1H) e Carbono (RMN de 13C) que possuem potencialidade de extrair informações a nível molecular do petróleo. Através da aplicação de métodos quimiométricos essas informações químicas podem ser relacionadas a propriedades físico-químicas do petróleo. Assim, o presente trabalho visa a classificação de amostras petróleo utilizando técnicas espectroscópicas associada a métodos de aprendizagem de máquina, assim como, explorar a potencialidade da técnica de RF quando combinada a métodos de seleção de variáveis, além de identificar nesse algoritmo variáveis que mais contribuem para a classificação das amostras de petróleo. Os resultados mostraram que a RF foi capaz de discriminar amostras de petróleo quanto ao Ponto de Fluidez Máximo (PFM) a partir de dados de RMN de 1H e 13C. Ademais, foi possível identificar as variáveis de maior contribuição na modelagem, no qual foi observado um equilíbrio entre compostos aromáticos e saturados. Numa segunda aplicação, RF foi eficiente em discriminar espectros de RMN de 1H e 13C em relação ao Número de Acidez Total (NAT) de petróleo, especialmente, quando associada aos métodos: Análise de Componentes Principais (PCA) e Discriminante de Fisher (FD). A identificação das variáveis mais importantes para discriminação mostrou uma contribuição sutilmente maior da região de aromáticos. Na terceira aplicação, os métodos de reconhecimento de padrões: PCA e k-Vizinhos mais Próximos foram eficientes para identificar perfis de petróleo a partir de dados de MIR, possibilitando obter informações sobre similaridade química de óleos sem a necessidade de uma caracterização completa do óleo. | |
dc.description.sponsorship | Fundação de Amparo à Pesquisa do Espírito Santo (FAPES) | |
dc.format | Text | |
dc.identifier.uri | http://repositorio.ufes.br/handle/10/13480 | |
dc.language | por | |
dc.publisher | Universidade Federal do Espírito Santo | |
dc.publisher.country | BR | |
dc.publisher.course | Doutorado em Química | |
dc.publisher.department | Centro de Ciências Exatas | |
dc.publisher.initials | UFES | |
dc.publisher.program | Programa de Pós-Graduação em Química | |
dc.rights | open access | |
dc.subject | Aprendizagem de máquina | |
dc.subject | Floresta Randômica | |
dc.subject | Petróleo | |
dc.subject | Redução | |
dc.subject | Machine learning method | |
dc.subject | Random Forest | |
dc.subject | Crude Oil | |
dc.subject | Reduction of variables | |
dc.subject | NMR | |
dc.subject.br-rjbn | subject.br-rjbn | |
dc.subject.cnpq | Química | |
dc.title | Métodos de aprendizagem de máquina em química analítica: Floresta Randômica aplicada na avaliação de petróleo | |
dc.title.alternative | Machine learning methods in analytical chemistry: Random Forest applied in crude oil evaluation | |
dc.type | doctoralThesis |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- BetinaPiresOliveiraLovatti-2019-tese.pdf
- Tamanho:
- 3.91 MB
- Formato:
- Adobe Portable Document Format
- Descrição: