Quality control of next-generation sequencing data without a reference

Quality assurance and quality control are essential for robust next generation sequencing (NGS). Here we present CoverView, a fast, flexible, user-friendly quality evaluation tool for NGS data. CoverView processes mapped sequencing reads and user-specified regions to report depth of coverage, base and mapping quality metrics with increasing levels of detail from a chromosome-level summary to per-base profiles. CoverView can flag regions that do not fulfil user-specified quality requirements, allowing suboptimal data to be systematically and automatically presented for review. It also provides an interactive graphical user interface (GUI) that can be opened in a web browser and allows intuitive exploration of results. We have integrated CoverView into our accredited clinical cancer predisposition gene testing laboratory that uses the TruSight Cancer Panel (TSCP). CoverView has been invaluable for optimisation and quality control of our testing pipeline, providing transparent, consistent quality metric information and automatic flagging of regions that fall below quality thresholds. We demonstrate this utility with TSCP data from the Genome in a Bottle reference sample, which CoverView analysed in 13 seconds. CoverView uses data routinely generated by NGS pipelines, reads standard input formats, and rapidly creates easy-to-parse output text (.txt) files that are customised by a simple configuration file. CoverView can therefore be easily integrated into any NGS pipeline. CoverView and detailed documentation for its use are freely available at github.com/RahmanTeamDevelopment/CoverView/releases and www.icr.ac.uk/CoverView

Download Full-text

Rapid evaluation and quality control of next generation sequencing data with FaQCs

BMC Bioinformatics ◽

10.1186/s12859-014-0366-2 ◽

2014 ◽

Vol 15 (1) ◽

Cited By ~ 88

Author(s):

Chien-Chi Lo ◽

Patrick S G Chain

Keyword(s):

Quality Control ◽

Next Generation Sequencing ◽

Next Generation Sequencing Data ◽

Rapid Evaluation ◽

Next Generation ◽

Sequencing Data ◽

Generation Sequencing

Download Full-text

Masking as an effective quality control method for next-generation sequencing data analysis

BMC Bioinformatics ◽

10.1186/s12859-014-0382-2 ◽

2014 ◽

Vol 15 (1) ◽

Cited By ~ 4

Author(s):

Sajung Yun ◽

Sijung Yun

Keyword(s):

Quality Control ◽

Data Analysis ◽

Next Generation Sequencing ◽

Control Method ◽

Next Generation Sequencing Data ◽

Next Generation ◽

Sequencing Data ◽

Quality Control Method ◽

Generation Sequencing ◽

Sequencing Data Analysis

Download Full-text

NGS QC Toolkit: A Platform for Quality Control of Next-Generation Sequencing Data

Encyclopedia of Metagenomics ◽

10.1007/978-1-4614-6418-1_348-2 ◽

2013 ◽

pp. 1-5 ◽

Cited By ~ 1

Author(s):

Ravi K. Patel ◽

Mukesh Jain

Keyword(s):

Quality Control ◽

Next Generation Sequencing ◽

Next Generation Sequencing Data ◽

Next Generation ◽

Sequencing Data ◽

Generation Sequencing

Download Full-text

NGS QC Toolkit: A Toolkit for Quality Control of Next Generation Sequencing Data

PLoS ONE ◽

10.1371/journal.pone.0030619 ◽

2012 ◽

Vol 7 (2) ◽

pp. e30619 ◽

Cited By ~ 1500

Author(s):

Ravi K. Patel ◽

Mukesh Jain

Keyword(s):

Quality Control ◽

Next Generation Sequencing ◽

Next Generation Sequencing Data ◽

Next Generation ◽

Sequencing Data ◽

Generation Sequencing

Download Full-text

QACtools: A Quality Assessment and Quality Control Tool for Next-Generation Sequencing Data

Proceedings of the 2015 Chinese Intelligent Automation Conference - Lecture Notes in Electrical Engineering ◽

10.1007/978-3-662-46466-3_46 ◽

2015 ◽

pp. 463-470

Author(s):

Dandan Song ◽

Ning Li ◽

Lejian Liao

Keyword(s):

Quality Control ◽

Next Generation Sequencing ◽

Quality Assessment ◽

Next Generation Sequencing Data ◽

Next Generation ◽

Sequencing Data ◽

Quality Control Tool ◽

Generation Sequencing ◽

Control Tool

Download Full-text

ForestQC: Quality control on genetic variants from next-generation sequencing data using random forest

PLoS Computational Biology ◽

10.1371/journal.pcbi.1007556 ◽

2019 ◽

Vol 15 (12) ◽

pp. e1007556

Author(s):

Jiajin Li ◽

Brandon Jew ◽

Lingyu Zhan ◽

Sungoo Hwang ◽

Giovanni Coppola ◽

...

Keyword(s):

Quality Control ◽

Next Generation Sequencing ◽

Random Forest ◽

Genetic Variants ◽

Next Generation Sequencing Data ◽

Next Generation ◽

Sequencing Data ◽

Generation Sequencing

Download Full-text

Methods for analyzing next-generation sequencing data IV. FASTQ quality control and program installation

Japanese Journal of Lactic Acid Bacteria ◽

10.4109/jslab.26.124 ◽

2015 ◽

Vol 26 (2) ◽

pp. 124-132

Author(s):

Jianqiang Sun ◽

Min Tang ◽

Kentaro Shimizu ◽

Koji Kadota

Keyword(s):

Quality Control ◽

Next Generation Sequencing ◽

Next Generation Sequencing Data ◽

Next Generation ◽

Sequencing Data ◽

Generation Sequencing

Download Full-text

Automated quality control of next generation sequencing data using machine learning

10.1101/768713 ◽

2019 ◽

Author(s):

Steffen Albrecht ◽

Miguel A. Andrade-Navarro ◽

Jean-Fred Fontaine

Keyword(s):

Quality Control ◽

Next Generation Sequencing ◽

Predictive Models ◽

Next Generation Sequencing Data ◽

Control Procedure ◽

Next Generation ◽

Sequencing Data ◽

Statistical Guidelines ◽

Ngs Data ◽

Generation Sequencing

AbstractControlling quality of next generation sequencing (NGS) data files is a necessary but complex task. To address this problem, we statistically characterized common NGS quality features and developed a novel quality control procedure involving tree-based and deep learning classification algorithms. Predictive models, validated on internal data and external disease diagnostic datasets, are to some extent generalizable to data from unseen species. The derived statistical guidelines and predictive models represent a valuable resource for users of NGS data to better understand quality issues and perform automatic quality control. Our guidelines and software are available at the following URL: https://github.com/salbrec/seqQscorer.

Download Full-text