Portal de Eventos Científicos da UTFPR (EVIN), XXV Seminário de Iniciação Científica e Tecnológica da UTFPR

Tamanho da fonte: 
Similaridade entre sequências genômicas aplicada na inferência de redes de regulação gênicas
MURILO MONTANINI BREVE, Fabrício Martins Lopes

Última alteração: 2020-10-30

Resumo


Este trabalho tem como intuito a produção de um método eficaz para a classificação de   sequências de RNA, e determinar se são codificantes ou não-codificantes. O algoritmo facilita a análise destes dados geralmente brutos e em enorme quantidade.MÉTODOS: Para cada sequência de RNA foi gerado grafo com base em 2 parâmetros: passo e tamanho da palavra. Após a produção dos grafos, é realizada uma filtragem das arestas mais exclusivas de cada classe, e assim abstraír medidas que descrevem a rede e partir dessas medidas foram feitas as classificações com o algoritmos Random Forest. RESULTADOS: Após aplicado a metodologia deste trabalho, os resultados finais foram muito positivos, com média de 99,78%  de acerto para o classificador Random Forest, e superiores aos métodos comparados.  CONCLUSÕES: Os resultados indicaram uma alta distinção entre as classes de RNA devido a filtragem das arestas exclusivas. A aplicação e estudo mais aprofundado deste método pode levar a um melhor entendimento do RNA não codificante.


Palavras-chave


Bioinformática; Reconhecimento de padrões; Grafos

Texto completo: PDF