Última alteração: 2020-10-30
Resumo
Este trabalho tem como intuito a produção de um método eficaz para a classificação de sequências de RNA, e determinar se são codificantes ou não-codificantes. O algoritmo facilita a análise destes dados geralmente brutos e em enorme quantidade.MÉTODOS: Para cada sequência de RNA foi gerado grafo com base em 2 parâmetros: passo e tamanho da palavra. Após a produção dos grafos, é realizada uma filtragem das arestas mais exclusivas de cada classe, e assim abstraír medidas que descrevem a rede e partir dessas medidas foram feitas as classificações com o algoritmos Random Forest. RESULTADOS: Após aplicado a metodologia deste trabalho, os resultados finais foram muito positivos, com média de 99,78% de acerto para o classificador Random Forest, e superiores aos métodos comparados. CONCLUSÕES: Os resultados indicaram uma alta distinção entre as classes de RNA devido a filtragem das arestas exclusivas. A aplicação e estudo mais aprofundado deste método pode levar a um melhor entendimento do RNA não codificante.