scholarly journals An Overview of RNA-seq Data Analysis

2017 ◽  
Vol 8 (2) ◽  
pp. 57
Author(s):  
Tahsin Ferdous ◽  
Mohammad Ohid Ullah

Latest breakthrough in high-throughput DNA sequencing have been launched different arenas for transcriptome analyses, jointly named RNA-seq (RNA-sequencing). It exposes the existence and amount of RNA in a biotic sample at a specific time by utilizing next generation sequencing (NGS). In this review, we aimed to explore the several methods which are applied in analyzing RNA-seq data. We also discussed its importance over microarray data. As establishment of several methods have already taken place to analyze RNA-seq data, therefore, further analysis is very essential to select the best one to avoid false positive outcomes.

2013 ◽  
Vol 37 (6) ◽  
Author(s):  
Ina Vogl ◽  
Anna Benet-Pagès ◽  
Sebastian H. Eck ◽  
Marius Kuhn ◽  
Sebastian Vosberg ◽  
...  

Abstract:Over the past 6 years, next-generation sequencing (NGS) has been established as a valuable high-throughput method for research in molecular genetics and has successfully been employed in the identification of rare and common genetic variations. Although the high expectations regarding the discovery of new diagnostic targets and an overall reduction of cost have been achieved, technological challenges in instrument handling, robustness of the chemistry, and data analysis need to be overcome. Each workflow and sequencing platform have their particular problems and caveats, which need to be addressed. Regarding NGS, there is a variety of different enrichment methods, sequencing devices, or technologies as well as a multitude of analyzing software products available. In this manuscript, the authors focus on challenges in data analysis when employing different target enrichment methods and the best applications for each of them.


2021 ◽  
Author(s):  
Gabriella Rustici ◽  
Eleanor Williams ◽  
Mitra Barzine ◽  
Alvis Brazma ◽  
Roger Bumgarner ◽  
...  

ABSTRACTOver the last two decades, molecular biology has been changed by the introduction of high-throughput technologies. Data sharing requirements have prompted the establishment of persistent data archives. A standardized approach for recording and managing these data was first proposed in the Minimal Information About a Microarray Experiment (MIAME) guidelines. The Minimal Information about a high throughput nucleotide Sequencing Experiment (MINSEQE) proposal was introduced in 2008 as a logical extension of the guidelines to next-generation sequencing (NGS) technologies used for transcriptome analysis.We present a historical snapshot of the data-sharing situation focusing on transcriptomics data from both microarray and RNA-sequencing experiments published between 2009 and 2013, a period during which RNA-seq studies became increasingly popular for transcriptome analysis. We assess how much data from RNA-seq based experiments is actually available in persistent data archives, compared to data derived from microarray based experiments, and evaluate how these types of data differ. Based on this analysis, we provide recommendations to improve RNA-seq data availability, reusability, and reproducibility.


2021 ◽  
Vol 17 (5) ◽  
pp. e1008980
Author(s):  
Wojciech Wesołowski ◽  
Beata Domnicz ◽  
Joanna Augustynowicz ◽  
Marek Szklarczyk

Next-generation sequencing (NGS) is a powerful tool for massive detection of DNA sequence variants such as single nucleotide polymorphisms (SNPs), multi-nucleotide polymorphisms (MNPs) and insertions/deletions (indels). For routine screening of numerous samples, these variants are often converted into cleaved amplified polymorphic sequence (CAPS) markers which are based on the presence versus absence of restriction sites within PCR products. Current computational tools for SNP to CAPS conversion are limited and usually infeasible to use for large datasets as those generated with NGS. Moreover, there is no available tool for massive conversion of MNPs and indels into CAPS markers. Here, we present VCF2CAPS–a new software for identification of restriction endonucleases that recognize SNP/MNP/indel-containing sequences from NGS experiments. Additionally, the program contains filtration utilities not available in other SNP to CAPS converters–selection of markers with a single polymorphic cut site within a user-specified sequence length, and selection of markers that differentiate up to three user-defined groups of individuals from the analyzed population. Performance of VCF2CAPS was tested on a thoroughly analyzed dataset from a genotyping-by-sequencing (GBS) experiment. A selection of CAPS markers picked by the program was subjected to experimental verification. CAPS markers, also referred to as PCR-RFLPs, belong to basic tools exploited in plant, animal and human genetics. Our new software–VCF2CAPS–fills the gap in the current inventory of genetic software by high-throughput CAPS marker design from next-generation sequencing (NGS) data. The program should be of interest to geneticists involved in molecular diagnostics. In this paper we show a successful exemplary application of VCF2CAPS and we believe that its usefulness is guaranteed by the growing availability of NGS services.


2021 ◽  
Author(s):  
Ειρήνη Αλεξοπούλου

Η παρούσα διδακτορική διατριβή μελετά τους μηχανισμούς ρύθμισης της επαγόμενης γονιδιακής έκφρασης ευκαρυωτικών κυττάρων σε επίπεδο ολόκληρου του γονιδιώματος και πιο συγκεκριμένα, την ταυτοποίηση των μοριακών διακοπτών, οι οποίοι βάση της συντονισμένης απόκρισης των κυττάρων, ελέγχουν τη λειτουργία των ενισχυτών σε διαφορετικούς κυτταρικούς τύπους πριν και μετά από ιϊκή μόλυνση. O χαρακτηρισμός των ενισχυτών που αποκρίνονται σε ιϊκές μολύνσεις στο ανθρώπινο γονιδίωμα απαιτείται για την κατανόηση του συντονισμού της ανοσολογικής απόκρισης και των μοριακών χαρακτηριστικών που κυμαίνονται από την πρόσδεση μεταγραφικών παραγόντων, συνενεργοποιητών, τροποποιητών και αναδιαμορφωτών της χρωματίνης μέχρι την ενεργοποίηση της μεταγραφής γονιδίων.Η έρευνά μας συνίσταται από μια πρωτοποριακή και ολιστική προσέγγιση του φαινομένου των ιϊκών μολύνσεων, η εφαρμογή της οποίας συνδυάζει όλα τα δεδομένα που προέρχονται από μια πληθώρα τεχνικών της γονιδιωματικής. Χρησιμοποιήθηκαν περισσότερες από 150 αναλύσεις των μεθόδων RNA-seq, ChIP-seq, DNaseI-seq, FAIRE-seq, STARR-seq και πολυεπίπεδων βιοπληροφορικών αναλύσεων, τα οποία έχουν ως κοινή μέθοδο ανάλυσης την τεχνολογία αλληλούχησης ευρείας κλίμακας νέας γενιάς (Next Generation Sequencing, NGS). Η σύγκριση των ρυθμιστικών προγραμμάτων γονιδιακής έκφρασης στη διάρκεια της μόλυνσης πραγματοποιήθηκε σε διαφορετικούς κυτταρικούς τύπους, στα επιθηλιακά κύτταρα HeLa και στα Β-λεμφοκύτταρα Namalwa, τα οποία διαμολύνθηκαν με ιό Sendai, ως περιβαλλοντικό ερέθισμα. Τα χαρακτηριστικά της χρωματίνης, το προφίλ του επιγονιδιώματος καθώς και η συμμετοχή της μεταγραφικής μηχανής σε γονιδιωματικές συντεταγμένες, όπου εδράζονται οι ενισχυτές και ένας μεγάλος αριθμός καλά χαρακτηρισμένων αντι-ιϊκών γονιδίων, έθεσαν τις βάσεις για την κατασκευή μιας "μοριακής-ψηφιακής εγκυκλοπαίδειας" των γονιδίων και των ενισχυτών. Η εγκυκλοπαίδεια χαρακτηρίζεται με υψηλή εν δυνάμει πιθανότητα να παρουσιάσει "αντι-ιϊκές ιδιότητες" και ονομάζεται ΆΤΛΑΝΤΑΣ των ιϊκών μολύνσεων (Human-ATLAS-of-Virus-Infection). Ο ΑΤΛΑΝΤΑΣ επικυρώθηκε με την εφαρμογή της μεθόδου ChIP-STARR-seq. Η πρωτοποριακή αυτή μέθοδος ευρείας κλίμακας μας επέτρεψε την ταυτόχρονη εξέταση της ιϊκά επαγόμενης ενεργότητας των πολυάριθμων περιοχών πρόσδεσης των μεταγραφικών ρυθμιστών της αντι-ιϊκής απόκρισης IRF3 και p65. Αναλύσεις βασισμένες στη συντήρηση των αλληλουχιών αποκάλυψαν ότι οι λειτουργικοί αντι-ιϊκοί ενισχυτές που περιέχουν συμπλέγματα IRF μοτίβων είναι σε μεγάλο βαθμό σταθεροί σε όλη την εξέλιξη καθώς βρίσκονται στα γονιδιώματα διαφορετικών ειδών που αντιπροσωπεύουν τα σπονδυλωτά, τα ασπόνδυλα, τα φυτά, ακόμη και μικρόβια, συμπεριλαμβανομένων των ιϊκών στελεχών. Αυτές οι απλές επαναλαμβανόμενες αλληλουχίες αποτελούν τα πρώτα παραδείγματα επαναλαμβανόμενων αλληλουχιών με αρχέγονη προέλευση ρύθμισης της αντι-ιϊκής απόκρισης. Προκειμένου να μελετηθεί συστηματικά η λειτουργία των συντηρημένων αλληλουχιών από τους παραπάνω διαφορετικούς οργανισμούς σε ανθρώπινα κύτταρα, αλλά και να διαπιστωθεί αν αυτές οι αλληλουχίες παρουσιάζουν και συντηρημένη ενεργότητα ενισχυτών, προβήκαμε σε κλωνοποίηση σε φορείς STARR. Έγινε διαμόλυνση σε κύτταρα HeLa και παρακολουθήσαμε την ικανότητά τους να ενεργοποιούν την έκφραση του γονίδιο αναφοράς GFP in νίνο. Αυτή είναι μία από τις λίγες φορές που οι ενισχυτές διατηρούνται συντηρημένοι σε διαφορετικά Φύλα και οι αλληλουχίες με την αρχέγονη προέλευση φαίνεται να λειτουργούν ως ρυθμιστές της ανθρώπινης επαγώγιμης γονιδιακής έκφρασης κατά την αντι-ιϊκή κυτταρική απόκριση. Με βάση όλα τα παραπάνω η ολοκλήρωση της διδακτορικής αυτής διατριβής οδηγεί στη λεπτομερέστερη παρατήρηση του μηχανισμού που χρησιμοποιούν τα ανθρώπινα κύτταρα για να αποκριθούν στη διάρκεια των ιϊκών μολύνσεων. Θέτει επίσης τις βάσεις για περαιτέρω διερεύνηση τους καθώς και στην ανακάλυψη άγνωστων ως σήμερα στοιχείων αυτής της διαδικασίας. Η αποκωδικοποίηση της ρυθμιστικής λογικής πίσω από την αναδιαμόρφωση του γονιδιώματος μετά από ιϊκή μόλυνση θα οδηγήσει σε βαθύτερη κατανόηση των βασικών αρχών οργάνωσης του γονιδιώματος και στη δυνατότητα πρόβλεψης της απόκρισης των ασθενών σε θεραπευτικές και προληπτικές αγωγές με απώτερο σκοπό στο μέλλον να εφαρμόζονται σε εξατομικευμένη βάση.


Sign in / Sign up

Export Citation Format

Share Document