sequence reconstruction
Recently Published Documents


TOTAL DOCUMENTS

186
(FIVE YEARS 84)

H-INDEX

18
(FIVE YEARS 5)

2022 ◽  
Author(s):  
Michael Sennett ◽  
Douglas Theobald

Ancestral sequence reconstruction (ASR) has become widely used to analyze the properties of ancient biomolecules and to elucidate the mechanisms of molecular evolution. By recapitulating the structural, mechanistic, and functional changes of proteins during their evolution, ASR has been able to address many fundamental and challenging evolutionary questions where more traditional methods have failed. Despite the tangible successes of ASR, the accuracy of its reconstructions is currently unknown, because it is generally impossible to compare resurrected proteins to the true ancient ancestors that are now extinct. Which evolutionary models are the best for ASR? How accurate are the resulting inferences? Here we answer these questions by applying cross-validation (CV) to sets of aligned extant sequences. To assess the adequacy of a chosen evolutionary model for predicting extant sequence data, our column-wise CV method iteratively cross-validates each column in an alignment. Unlike other phylogenetic model selection criteria, this method does not require bias correction and does not make restrictive assumptions commonly violated by phylogenetic data. We find that column-wise CV generally provides a more conservative criterion than the AIC by preferring less complex models. To validate ASR methods, we also apply cross-validation to each sequence in an alignment by reconstructing the extant sequences using ASR methodology, a method we term extant sequence reconstruction (ESR). We can thus quantify the accuracy of ASR methodology by comparing ESR reconstructions to the corresponding true sequences. We find that a common measure of the quality of a reconstructed sequence, the average probability of the sequence, is indeed a good estimate of the fraction of the sequence that is correct when the evolutionary model is accurate or overparameterized. However, the average probability is a poor measure for comparing reconstructions, because more accurate phylogenetic models typically result in reconstructions with lower average probabilities. In contrast, the entropy of the reconstructed distribution is a reliable indicator of the quality of a reconstruction, as the entropy provides an accurate estimate of the log-probability of the true sequence. Both column-wise CV and ESR are useful methods to validate evolutionary models used for ASR and can be applied in practice to any phylogenetic analysis of real biological sequences.


Author(s):  
Mohamad Farihan Afnan Mohd Rozi ◽  
Raja Noor Zaliha Raja Abd. Rahman ◽  
Adam Thean Chor Leow ◽  
Mohd Shukuri Mohamad Ali

2021 ◽  
Vol 22 (21) ◽  
pp. 11992
Author(s):  
Andrii Mazur ◽  
Pavel Grinkevich ◽  
Radka Chaloupkova ◽  
Petra Havlickova ◽  
Barbora Kascakova ◽  
...  

Haloalkane dehalogenases (EC 3.8.1.5) play an important role in hydrolytic degradation of halogenated compounds, resulting in a halide ion, a proton, and an alcohol. They are used in biocatalysis, bioremediation, and biosensing of environmental pollutants and also for molecular tagging in cell biology. The method of ancestral sequence reconstruction leads to prediction of sequences of ancestral enzymes allowing their experimental characterization. Based on the sequences of modern haloalkane dehalogenases from the subfamily II, the most common ancestor of thoroughly characterized enzymes LinB from Sphingobium japonicum UT26 and DmbA from Mycobacterium bovis 5033/66 was in silico predicted, recombinantly produced and structurally characterized. The ancestral enzyme AncLinB-DmbA was crystallized using the sitting-drop vapor-diffusion method, yielding rod-like crystals that diffracted X-rays to 1.5 Å resolution. Structural comparison of AncLinB-DmbA with their closely related descendants LinB and DmbA revealed some differences in overall structure and tunnel architecture. Newly prepared AncLinB-DmbA has the highest active site cavity volume and the biggest entrance radius on the main tunnel in comparison to descendant enzymes. Ancestral sequence reconstruction is a powerful technique to study molecular evolution and design robust proteins for enzyme technologies.


2021 ◽  
Author(s):  
Roy Shafir ◽  
Omer Sabary ◽  
Leon Anavy ◽  
Eitan Yaakobi ◽  
Zohar Yakhini

Electronics ◽  
2021 ◽  
Vol 10 (19) ◽  
pp. 2433
Author(s):  
Aritra Sarkar ◽  
Zaid Al-Ars ◽  
Carmen G. Almudever ◽  
Koen L. M. Bertels

With small-scale quantum processors transitioning from experimental physics labs to industrial products, these processors in a few years are expected to scale up and be more robust for efficiently computing important algorithms in various fields. In this paper, we propose a quantum algorithm to address the challenging field of data processing for genome sequence reconstruction. This research describes an architecture-aware implementation of a quantum algorithm for sub-sequence alignment. A new algorithm named QiBAM (quantum indexed bidirectional associative memory) is proposed, which uses approximate pattern-matching based on Hamming distances. QiBAM extends the Grover’s search algorithm in two ways, allowing: (1) approximate matches needed for read errors in genomics, and (2) a distributed search for multiple solutions over the quantum encoding of DNA sequences. This approach gives a quadratic speedup over the classical algorithm. A full implementation of the algorithm is provided and verified using the OpenQL compiler and QX Simulator framework. Our implementation represents a first exploration towards a full-stack quantum accelerated genome sequencing pipeline design.


2021 ◽  
Author(s):  
Αικατερίνη Τατσάκη

Η μελέτη των διαφορών εξειδίκευσης μεταξύ διαμεμβρανικών μεταφορέων πουρινών από διαφορετικούς οργανισμούς είναι ένα πεδίο έρευνας με δυνατότητες εφαρμογών (α) στην κατανόηση της μοριακής βάσης των διαφορών εξειδίκευσης μεταξύ εξελικτικά διαφορετικών ομάδων οργανισμών, (β) στο σχεδιασμό/επιλογή κυτταροτοξικών αναλόγων πουρινών με μεγαλύτερη εξειδίκευση έναντι κυττάρων-στόχων, (γ) στη βελτίωση της δράσης συγκεκριμένων χημειοθεραπευτικών αναλόγων πουρινών βάσει της ανάλυσης των μηχανισμών πρόσληψης των φαρμάκων αυτών από βακτήρια του μικροβιώματος. Οι έως τώρα μελέτες για την κατανόηση των διαφορών εξειδίκευσης των μεταφορέων αυτών έχουν στηριχθεί σε συγκριτική ανάλυση και διεξοδική μεταλλαξιγένεση σημερινών ομολόγων. Στην παρούσα Διδακτορική Διατριβή, εφαρμόστηκε μία διαφορετική προσέγγιση που βασίζεται σε διερεύνηση της εξελικτικής βάσης των διαφορών εξειδίκευσης μετά από φυλογενετική ανάλυση και ανασύσταση προγονικών αλληλουχιών (Αncestral Sequence Reconstruction). Ειδικότερα, η διατριβή αναφέρεται στην εξέλιξη των εξειδικεύσεων της οικογένειας NAT/NCS2 (Nucleobase-Ascorbate Transporter/Nucleobase-Cation Symporter-2), της κυριότερης και εξελικτικά ευρύτερης οικογένειας μεταφορέων πουρινών-πυριμιδινών. Αρχικά, πραγματοποιήθηκε εκτενής φυλογενετική ανάλυση, ανασύσταση και λειτουργική ανάλυση των προγονικών αλληλουχιών που αντιπροσωπεύουν την «κοινή ρίζα» τριών μονοφυλετικών κλάδων βακτηριακών NAT/NCS2 ομολόγων με διακριτά προφίλ εξειδίκευσης. Ακολούθησε ανάλυση μεταλλαξιγένεσης στο υπόβαθρο των προγονικών αλληλουχιών με κριτήριο τις διαφορές στην αλληλουχία των προγονικών αλληλουχιών σε σχέση με τις σημερινές ομόλογες πρωτεΐνες διαφορετικής εξειδίκευσης και αναλύσεις μοριακής δυναμικής των προγονικών αλληλουχιών για την κατανόηση σε δομικό πλαίσιο του ρόλου των μεταλλαγών που βρέθηκε να έχουν σημαντική επίπτωση στην εξειδίκευση. Από τα αποτελέσματα της Διατριβής που βασίστηκε στην εφαρμογή της στρατηγικής της ανασύστασης προγονικών αλληλουχιών, αποκαλύφθηκαν λειτουργικά προφίλ και προφίλ εξειδίκευσης που δεν θα μπορούσαν να προβλεφθούν μόνο από τη σύγκριση των σημερινών ομολόγων. Η εφαρμογή τέτοιων εξελικτικών μεθόδων θα μπορούσε να προσφέρει ένα νέο αποτελεσματικό τρόπο για την ανάλυση των σχέσεων δομής-λειτουργίας και εξειδίκευσης στις πρωτεΐνες διαμεμβρανικής μεταφοράς.


Sign in / Sign up

Export Citation Format

Share Document