data cleansing
Recently Published Documents


TOTAL DOCUMENTS

160
(FIVE YEARS 49)

H-INDEX

11
(FIVE YEARS 3)

2021 ◽  
Author(s):  
Ranier A. A. Moura ◽  
Domingos B. S. Santos ◽  
Daniel G. M. Lira ◽  
José E. B. Maia

Aplicações computacionais baseadas em dados de sensores são uma realidade, mas os dados coletados e transmitidos para as aplicações raramente chegam prontos para o uso devido a perdas e ruídos de vários tipos. Neste trabalho desenvolve-se uma abordagem baseada em correlação espaço temporal para limpeza de dados de múltiplas séries temporais de sensores quanto à ruído, dados ausentes e outliers. O método foi testato em seis conjuntos de dados reais publicamente disponíveis e o seu desempenho foi comparado com um método baseline, com um autoencoder denoising e com outro método publicado. Os resultados mostram que a abordagem proposta é competitiva e requer menos dados de treinamento do que os concorrentes.


2021 ◽  
Vol 3 (1) ◽  
Author(s):  
Gauthier Lyan ◽  
David Gross-Amblard ◽  
Jean-Marc Jezequel ◽  
Simon Malinowski

Author(s):  
Mehdi Hosseinzadeh ◽  
Elham Azhir ◽  
Omed Hassan Ahmed ◽  
Marwan Yassin Ghafour ◽  
Sarkar Hasan Ahmed ◽  
...  

2021 ◽  
Vol 11 (1) ◽  
Author(s):  
M. A. Dakka ◽  
T. V. Nguyen ◽  
J. M. M. Hall ◽  
S. M. Diakiw ◽  
M. VerMilyea ◽  
...  

AbstractThe detection and removal of poor-quality data in a training set is crucial to achieve high-performing AI models. In healthcare, data can be inherently poor-quality due to uncertainty or subjectivity, but as is often the case, the requirement for data privacy restricts AI practitioners from accessing raw training data, meaning manual visual verification of private patient data is not possible. Here we describe a novel method for automated identification of poor-quality data, called Untrainable Data Cleansing. This method is shown to have numerous benefits including protection of private patient data; improvement in AI generalizability; reduction in time, cost, and data needed for training; all while offering a truer reporting of AI performance itself. Additionally, results show that Untrainable Data Cleansing could be useful as a triage tool to identify difficult clinical cases that may warrant in-depth evaluation or additional testing to support a diagnosis.


2021 ◽  
Vol 42 ◽  
pp. 105587
Author(s):  
Karl Stöger ◽  
David Schneeberger ◽  
Peter Kieseberg ◽  
Andreas Holzinger
Keyword(s):  

Author(s):  
Baumgart Matthias ◽  
Romer Lisa ◽  
Luhr Matthias ◽  
Roschke Christian ◽  
Ritter Marc ◽  
...  

Author(s):  
Nikolay. A. Sumenkov ◽  
Natalya. S. Fokina ◽  
Aleksey I. Baranchikov ◽  
Andrey A. Rodionov ◽  
Ivan I. Yakovlev
Keyword(s):  

Sign in / Sign up

Export Citation Format

Share Document