scholarly journals Extraction of Association Rules for the Prediction of Missing Values

2005 ◽  
Vol Volume 3, Special Issue... ◽  
Author(s):  
Sylvie Jami ◽  
Tao-Yan Jen ◽  
Dominique Laurent ◽  
Georges Loizou ◽  
Oumar Sy

International audience Missing values in databases have motivated many researches in the field of KDD, specially concerning prediction. However, to the best of our knowledge, few appraoches based on association rules have been proposed so far. In this paper, we show how to adapt the levelwise algorithm for the mining of association rules in order to mine frequent rules with a confidence equal to 1 from a relational table. In our approach, the consequents of extracted rules are either an interval or a set of values, according to whether the domain of the predicted attribute is continuous or discrete. La présence de valeurs manquantes ou valeurs nulles dans les bases de donnnées a suscité de nombreuses recherches dans le domaine de la découverte des connaissances, notamment en ce qui concerne la prédiction. Cependant, à notre connaissance, peu de telles approches utilisent les règles d'association pour la prédiction des valeurs manquantes. Dans cet article, il est montré comment adapter les différents concepts et algorithmes par niveau liés aux règles d'association, afin d'obtenir des règles fréquentes et de confiance 1, permettant la prédiction de valeurs manquantes dans une table relationnelle. La particularité des règles extraites dans notre approche est que leurs conséquents se présentent sous la forme d'intervalles ou d'ensembles de valeurs, selon que le domaine de l'attribut sur lequel les valeurs sont prédites est soit continu soit discret.

2005 ◽  
Vol Volume 3, Special Issue... ◽  
Author(s):  
Sondess Ben Tekaya ◽  
Sadok Ben Yahia ◽  
Yahia Slimani

International audience The extremely large number of association rules that can be drawn from ―even reasonably sized datasets―, bootstrapped the development of more acute techniques or methods to reduce the size of the reported rule sets. In this context, the battery of results provided by the Formal Concept Analysis (FCA) allowed to define "irreducible" nuclei of association rule subset better known as generic basis. However, a thorough overview of the literature shows that all the algorithms dedicated neglected an essential component: the relation of order, or the extraction of the minimal generators. In this paper, we introduce the GenAll algorithm to build a formal concept lattice, in which each formal concept is "decorated" by its minimal generators. The GenAll algorithm aims to extract generic bases of association rules. The main novelty in this algorithm is the use of refinement process to compute immediate successor lists to simultaneously determine the set of formal concepts, their underlying partial order and the set of minimal generators associated with each formal concept. Carried out experiments showed that the GenAll algorithm is especially efficient for dense extraction contexts compared to that of Nourine et al. Response times obtained from the GenAll algorithm largely outperform those of Nourine et al. Le nombre prohibitif de règles d'association qui peuvent être dérivées même pour des bases de données de taille raisonnable est à l'origine du développement de techniques pour réduire la taille de l'ensemble de ces règles. Dans ce contexte, les résultats obtenus par l'Analyse de Concepts Formels (AFC) a permis de définir un sous-ensemble de règles appelé base générique. Cependant, un survol de la littérature montre que tous les algorithmes qui leur sont dédiés ont négligé une composante essentielle : soit la relation d'ordre sous-jacente ou c'est l'extraction des générateurs minimaux qui manque à l'appel. Dans ce papier, nous proposons un algorithme, appelé GenAll, pour construire un treillis de concepts formels, dans lequel chaque concept formel est "décoré" par ses générateurs minimaux. L'objectif de cet algorithme est d'extraire toute la connaissance nécessaire pour extraire les bases génériques des règles d'association. La principale originalité de GenAll est l'emploi d'un processus de raffinement des listes des successeurs immédiats pour déterminer, d'une manière simultanée, l'ensemble des concepts formels, leur ordre partiel sous-jacent et l'ensemble de générateurs minimaux associés à chacun des concepts formels. Les résultats expérimentaux ont prouvé que l'algorithme proposé est particulièrement efficace pour des contextes d'extraction denses comparé à Nourine et al. Le temps de réponse de l'algorithme GenAll surpasse celui de l'algorithme de Nourine et al.


2007 ◽  
Vol 33 (4) ◽  
pp. 468-480 ◽  
Author(s):  
Jau-Ji Shen ◽  
Chin-Chen Chang ◽  
Yu-Chiang Li

Sign in / Sign up

Export Citation Format

Share Document