Tamanho da fonte:
Classificação de sequências biológicas usando Máxima Entropia
Última alteração: 2021-10-18
Resumo
Nas últimas décadas, a quantidade de genes de RNAs sequenciados vêm aumentando drasticamente, as novas tecnologias de sequenciamento estão gerando milhares de RNAs não codificantes, cuja função e significado ainda não são completamente entendidos. Diante disto, um importante desafio é a necessidade de distinguir mRNAs, lncRNAs e sncRNAs de forma assertiva. A correta identificação dessas transcrições favorece a compreensão da expressão e da regulação da informação genética. Por outro lado, a utilização da Máxima Entropia foi aplicada com sucesso em muitos problemas do mundo real em diferentes contextos. Portanto, este trabalho apresenta uma metodologia eficiente e eficaz baseada na Máxima Entropia e na utilização de características extraídas de grafos para classificação de sequências de mRNA e ncRNA. Considerando dois conjuntos de dados, experimentos foram realizados para avaliar o método proposto em comparação a métodos importantes na literatura como CPC2, PLEK e BASiNET. Os resultados indicaram a adequação da metodologia proposta, alcançando acurácias superiores aos trabalhos CPC2 e PLEK, e semelhantes ao BASiNET. Além disso, o método proposto executou a classificação com menor tempo de processamento, indicando uma diminuição da complexidade mantendo a assertividade na classificação.
Palavras-chave
Classificação de RNA; Máxima Entropia; Grafos
Texto completo:
PDF