Portal de Eventos Científicos da UTFPR (EVIN), XXVI Seminário de Iniciação Científica e Tecnológica da UTFPR

Tamanho da fonte: 
Classificação de sequências biológicas usando Máxima Entropia
Murilo Montanini Breve, Fabrício Martins Lopes

Última alteração: 2021-10-18

Resumo


Nas últimas décadas, a quantidade de genes de RNAs sequenciados vêm aumentando drasticamente, as novas tecnologias de sequenciamento estão gerando milhares de RNAs não codificantes, cuja função e significado ainda não são completamente entendidos. Diante disto, um importante desafio é a necessidade de distinguir mRNAs, lncRNAs e sncRNAs de forma assertiva. A correta identificação dessas transcrições favorece a compreensão da expressão e da regulação da informação genética. Por outro lado, a utilização da Máxima Entropia foi aplicada com sucesso em muitos problemas do mundo real em diferentes contextos. Portanto, este trabalho apresenta uma metodologia eficiente e eficaz baseada na Máxima Entropia e na utilização de características extraídas de grafos para classificação de sequências de mRNA e ncRNA. Considerando dois conjuntos de dados, experimentos foram realizados para avaliar o método proposto em comparação a métodos importantes na literatura como CPC2, PLEK e BASiNET. Os resultados indicaram a adequação da metodologia proposta, alcançando acurácias superiores aos trabalhos CPC2 e PLEK, e semelhantes ao BASiNET. Além disso, o método proposto executou a classificação com menor tempo de processamento, indicando uma diminuição da complexidade mantendo a assertividade na classificação.

Palavras-chave


Classificação de RNA; Máxima Entropia; Grafos

Texto completo: PDF