mineração padrão freqüente , também conhecido como mineração conjunto de itens freqüente, é uma técnica para descobrir grupos de itens que freqüentemente ocorrem juntos em um banco de dados. De acordo com o Dr. Christian Borgelt , Investigador Principal do Centro Europeu para Soft Computing , mineração padrão freqüente tem sido um dos temas mais pesquisados ativamente nas áreas de mineração de dados desde o início de 1990 e vários algoritmos matemáticos têm sido desenvolvidos. Frequent Pattern Mining
padrão freqüente de mineração é um problema fundamental em muitas aplicações. Um banco de dados transacional típico - como um banco de dados que descreve o comportamento dos compradores on Main Street, por correspondência ou on-line - contém um grande número de conjuntos de itens e apresenta um desafio em termos de desenvolvimento de algoritmos eficientes, escaláveis. Algoritmos padrão freqüente de mineração conhecida como Apriori , Eclat e FP- crescimento estão entre os mais amplamente conhecido .
Apriori Algoritmo
O algoritmo Apriori , proposta inicialmente por Rakesh Agrawal e Ramkrishnan Srikant do Centro de Pesquisa Almaden da IBM em 1994, trabalha com o princípio de que os conjuntos de itens são contados quando ocorrem nas transações. O banco de dados é verificado para encontrar freqüentes 1- conjuntos de itens , os 1- conjuntos de itens são usados para gerar 2 - conjuntos de itens e assim por diante até k- conjuntos de itens . A k- conjunto de itens é dito ser freqüente , se e somente se todos os seus subitemsets são freqüentes. Desde que foi proposto pela primeira vez , foram sugeridas inúmeras melhorias no algoritmo Apriori
FP- crescimento Algoritmo
O algoritmo FP- crescimento - . FP fica para " Frequent Pattern" - emprega uma técnica conhecida como o algoritmo verifica o banco de dados para criar uma lista de itens freqüentes em ordem decrescente , o que ele usa para compactar o banco de dados em uma árvore- FP " dividir e conquistar ". . A árvore de FP - próprio é extraído , começando com cada comprimento frequente - 1 padrão - também conhecida como um padrão de sufixo - para criar uma árvore FP condicional , o qual contém os prefixos correspondentes aos itens que co - ocorrem com o padrão sufixo inicial . O padrão de sufixo inicial é concatenado com os padrões freqüentes encontradas no árvore- FP condicional para alcançar um crescimento padrão .
Eclat Algoritmo
A mina Apriori e algoritmos FP- crescimento padrões freqüentes de um conjunto de transações dispostas horizontalmente . A Transformação ( Eclat ) algoritmo de classe de equivalência - proposto por J. Mohammed Zaki , um professor de ciência da computação no Instituto Politécnico Rensselaer, em 2000 - por outro lado , as minas de padrões freqüentes em um conjunto de transações dispostas verticalmente . O algoritmo Eclat começa com um único item e usa uma interseção de conjunto para determinar os conjuntos de itens freqüentes e se repete até que nenhum conjunto de itens mais freqüentes podem ser encontradas .