QuickDBC: Uma separação rápida de clusters baseada em densidade para Espaços Métricos

JOAO VICTOR DO PILAR

Portal de Eventos Científicos da UTFPR (EVIN), XXIII Seminário de Iniciação Científica e Tecnológica da UTFPR

JOAO VICTOR DO PILAR

Última alteração: 2018-12-06

Resumo

A tarefa de identificação de classes para bancos de dados pode ser obtida por algoritmos de agrupamento. No entanto, é necessário um conhecimento de domínio para determinar alguns parâmetros de entrada para descobrir clusters e a melhoria de sua eficiência em grandes bancos de dados continua sendo um desafio. Aplicações modernas também lidam com dados complexos e os mecanismos de comparação são baseados em predicados de similaridade, o que exige uma nova frente de algoritmos de clustering. Dados complexos são geralmente imersos em espaços métricos onde funções de distância são empregadas para expressar a similaridade. O clustering se torna uma tarefa difícil devido à necessidade de realizar cálculos de distância. Algoritmos baseados em densidade são uma das abordagens para encontrar clusters em espaços métricos e têm a vantagem de encontrar clusters sem a necessidade de especificar o número de clusters a serem encontrados. Neste artigo, propomos uma nova técnica para separar clusters usando pivôs selecionados na borda do espaço de dados. Vários pivôs particionam o espaço de dados em clusters candidatos com base no nível de densidade desejado, depois todos os candidatos são fundidos gerando uma boa separação de clusters. Nossa técnica também pode ser usada antes de qualquer técnica de agrupamento existente para realizar uma pré-filtragem.

Palavras-chave

Agrupamento por densidade. Mineração de Dados. Espaço Métrico.