Última alteração: 2021-10-15
Resumo
Modelagens de Machine Learning tem sido ferramentas muito utilizadas na atualidade, sendo técnicas poderosas implementadas em diversos processos. A aplicação de Machine Learning em bioprocessos gera grande interesse por demonstrar ser um recurso com alta capacidade de auxiliar na solução de problemas e dinamizar processos. O presente trabalho buscou avaliar modelagens com 3 diferentes algoritmos (Arvore de Decisão, Floresta Randômica e Rede Neural Artificial), construídos em linguagem Python com utilização da biblioteca Keras, para predição de biohidrogênio por microorganismos. Os dados foram obtidos a partir de 3 diferentes consórcios de microorganismos: Esg (efluente industrial), Lod (lodo de efluentes domésticos) e Vac (resíduos bovinos), variando em quatro parâmetros (temperatura, pH, % de inóculo e razão C:N do meio), usados como entradas dos modelos. Foram configuradas um total de 48 modelagens diferentes, variando a porcentagem de dados para teste e validação dos modelos, e o desempenho destes foi avaliado tendo como métrica o Erro Médio Quadrático (MSE) e o Erro Médio Absoluto (MAE) para avaliação de dois modelos particulares. Os 3 melhores modelos obtidos neste trabalho utilizaram 25% dos dados para teste. Uma modelagem de Rede Neural Artificial com 2 camadas ocultas e 30 neurônios em cada, resultou em um MSE de 0.010325965782825125, representando uma das melhores modelagens utilizando esse algoritmo. O modelo que apresentou o menor MSE em 0.0089510659636024, foi construído utilizando uma modelagem de Floresta Randômica, porém, seu desempenho pôde ser comparado com outro modelo de Arvore de Decisão que, apesar de resultar em um MSE em 0.014268128095238097, conseguiu prever com precisão a maior quantidade de dados e resultar em um menor MAE. Os resultados obtidos neste trabalho mostraram que a utilização de modelagens de Machine Learning é muito promissora na implementação desse tipo de bioprocesso e podem ser aprimoradas com melhor treinamento e estudo de variação de parâmetros dos modelos.