protein structure comparison Latest Research Papers

Η σύγκριση πρωτεϊνών με βάση τη δομή τους (protein structure comparison, PSC) αποτελεί τομέα της υπολογιστικής πρωτεομικής με ενεργό ενδιαφέρον καθότι χρησιμοποιείται ευρέως στη δομική βιολογία και την ανακάλυψη νέων φαρμάκων. Η ταχεία αύξηση των υπολογιστικών απαιτήσεων για τη σύγκριση πρωτεϊνικών δομών είναι αποτέλεσμα τριών κυρίως παραγόντων: ταχεία επέκταση των βάσεων δεδομένων με νέες δομές πρωτεϊνών, υψηλή υπολογιστική πολυπλοκότητα των αλγορίθμων σύγκρισης δύο πρωτεινών, τάση στον τομέα για χρήση πολλαπλών μεθόδων σύγκρισης και συνδυασμό των αποτελεσμάτων τους (multicriteria PSC, MCPSC) σε ένα σκορ συναίνεσης (consensus methods). Παρά την μεγάλη πρόοδο, εξακολουθούν να υπάρχουν ανοικτές προκλήσεις στην εφαρμογή MCPSC τεχνικών σε ευρεία κλίμακα. Πρώτον, η επιτάχυνση της λειτουργίας MCPSC με τη χρήση σύγχρονων αρχιτεκτονικών επεξεργαστών πολλών πυρήνων παραμένει κατά πολύ ανεξερεύνητη. Δεύτερον, η εφαρμογή μέθόδων MCPSC στη ταξινόμηση νεων δομών πρωτεϊνών είναι περιορισμένη λόγω του υπολογιστικού κόστους και της ανάγκης χρήσης υπερυπολογιστικών δομών. Τέλος, υπάρχει έλλειψη ελεύθερα διαθέσιμων εργαλείων βιοπληροφορικής που να υποστηρίζουν τη συστηματική σύγκριτική ανάλυση και κατηγοριοποίηση μεγάλων συνόλων πρωτεϊνών με βάση τη δομή τους σε κοινούς υπολογιστές.Προκειμένου να αντιμετωπιστούν αυτές οι σημαντικές προκλήσεις, σε αυτή την διατριβή αναπτύξαμε πλαίσιο λογισμικού που εκμεταλλεύεται σύγχρονους επεξεργαστές (CPUs) για την αποδοτική υλοποίηση παράλληλων MCPSC τεχνικών βασισμένων σε τρεις δημοφιλείς μεθόδους PSC, τις TMalign, CE και USM. Συγκρίνουμε και αξιολογούμε την απόδοση και την αποδοτικότητα δύο παράλληλων υλοποιήσεων, μια για τον επεξεργαστή αρχιτεκτονικής many-core Intel Single Cloud Computer (SCC) με 48 πυρήνες οργανωμένους σε δίκτυο πλέγματος (Network on Chip), και μια και για τον γνωστό επεξεργαστή Intel Core i7 πολλαπλών πυρήνων (multi-core CPU). Επιπλέον, αναπτύξαμε Python εφαρμογή, που ονομάζεται pyMCPSC, και επιτρέπει στους χρήστες να εκτελούν εύκολα υπολογιστικά πειράματα βασισμένα σε MCPSC με μεγάλα σύνολα δεδομένων, αξιοποιώντας τον παραλληλισμό που προσφέρουν οι επεξεργαστές πολλαπλών πυρήνων των σημερινών επιτραπέζιων υπολογιστών. Δείχνουμε πώς το pyMCPSC, το οποίο συνδυάζει πέντε δημοφιλείς μεθόδους PSC για τη δημιουργία πέντε διαφορετικών σκορ συναίνεσης (consensus scores), επιταχύνει σημαντικά και διευκολύνει την συγκριτική ανάλυση μεγάλων συνόλων δεδομένων με δομές πρωτεϊνών. Επιπλέον μπορεί να επεκταθεί εύκολα ώστε να ενσωματώνει στους αλγόριθμους συναίνεση και νέες μεθόδους PSC που μπορεί να προταθούν μελλοντικά καθώς ο τομέας εξελίσσεται.Τα αποτελέσματα συγκριτικής ανάλυσής δείχνουν ότι ο επεξεργαστής Intel SCC με 48 πυρήνες (Network on Chip) είναι πιο αποδοτικός από την τελευταίας γενιάς Core i7 CPU, επιτυγχάνοντας συντελεστή επιτάχυνσης 42 (απόδοση 0,9), και καθιστώντας τους επεξεργαστές αρχιτεκτονικής many-core τεχνολογία επιλογής για την υπολογιστική δομική πρωτεομική μεγάλης κλίμακας. Επιπλέον, δείχνουμε ότι το MCPSC ξεπερνά τις μεθόδους PSC στις οποίες στηρίζεται ως προς την επιτυχία της ομαδοποίησης νεων πρωτεϊνών, επιτυγχάνοντας F-measure 0,91 στο σύνολο δεδομένων αναφοράς CK34. Επιπλέον, δείχνουμε, με τη χρήση του συνόλου δεδομένων Proteus300, ότι οι τεχνικές MCPSC που αναπτύχθηκαν βελτιωνουν την κατηγοριοποίηση πρωτεϊνών, όπως αυτό αποδεικνύεται τόσο από την ανάλυση ROC όσο και από την ανάλυση κοντινότερων γειτόνων (Nearest-Neighbor). Επιπλεον. τα ”φυλογενετικά δέντρα” που προκύπτουν με τη χρηση MCPSC παρέχουν χρήσιμες πληροφορίες και σχετικά με τη πιθανή λειτουργικότητα νεων πρωτεϊνών. Τέλος, η συγκριτική ανάλυση αναδεικνύει την ύπαρξη ισχυρής συσχέτισης πρωτεϊνικών δομών της κατηγορίας SCOP class C και χαλαρής συσχέτισης μεταξύ εκείνων της κατηγορίας SCOP class D (Proteus300). Τέτοιου είδους ενδελεχείς αναλύσεις δεδομένων και οι αντίστοιχες οπτικοποιήσεις που τις συνοδεύουν βοηθούν τους χρήστες να εξερευνούν και να εξάγουν γνώση από σύνολα δεδομένων που αναλύουν, όσο μεγάλα κι αν είναι αυτά. Δειχνουμε ότι ακόμη και σε πολύ μεγάλα σύνολα δεδομένων, με χιλιάδες domains (όπως το SCOPCATH), μπορεί να εφαρμοστεί αποδοτικά MCPSC επεξεργασία προκειμένου να διερευνηθεί η εσωτερική δομή τους, αξιοποιώντας τους επεξεργαστές πολλών πυρήνων που υπάρχουν σήμερα στους ατομικούς υπολογιστες. Το pyMCPSC που υλοποιεί παράλληλα όλη την υπολογιστική ροή (pipeline) που αξιοποιεί μεθόδους MCPSC οι οποίες αναπτύχθηκαν σε αυτή την διδακτορική διατριβή διατίθεται ελεύθερα στη επιστημονική κοινότητα στο σύνδεσμο https://github.com/xulesc/pymcpsc.

Download Full-text

Multi-criteria protein structure comparison and structural similarities analysis using pyMCPSC

PLoS ONE ◽

10.1371/journal.pone.0204587 ◽

2018 ◽

Vol 13 (10) ◽

pp. e0204587 ◽

Cited By ~ 1

Author(s):

Anuj Sharma ◽

Elias S. Manolakos

Keyword(s):

Protein Structure ◽

Structure Comparison ◽

Protein Structure Comparison

Download Full-text

Acceleration of a protein structure comparison algorithm on FPGA

2017 European Conference on Circuit Theory and Design (ECCTD) ◽

10.1109/ecctd.2017.8093342 ◽

2017 ◽

Author(s):

Arpad Goretity ◽

Zoltan Nagy ◽

Zoltan Gaspari

Keyword(s):

Protein Structure ◽

Structure Comparison ◽

Protein Structure Comparison

Download Full-text

An efficient algorithm for protein structure comparison using elastic shape analysis

Algorithms for Molecular Biology ◽

10.1186/s13015-016-0089-1 ◽

2016 ◽

Vol 11 (1) ◽

Cited By ~ 4

Author(s):

S. Srivastava ◽

S. B. Lal ◽

D. C. Mishra ◽

U. B. Angadi ◽

K. K. Chaturvedi ◽

...

Keyword(s):

Protein Structure ◽

Shape Analysis ◽

Efficient Algorithm ◽

Structure Comparison ◽

Protein Structure Comparison ◽

Elastic Shape Analysis

Download Full-text

A Framework to Accelerate Protein Structure Comparison Tools

2015 15th IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing ◽

10.1109/ccgrid.2015.136 ◽

2015 ◽

Author(s):

Ahmad Salah ◽

Kneli Li ◽

Tarek F. Gharib

Keyword(s):

Protein Structure ◽

Structure Comparison ◽

Protein Structure Comparison

Download Full-text

Efficient Multicriteria Protein Structure Comparison on Modern Processor Architectures

BioMed Research International ◽

10.1155/2015/563674 ◽

2015 ◽

Vol 2015 ◽

pp. 1-13 ◽

Cited By ~ 2

Author(s):

Anuj Sharma ◽

Elias S. Manolakos

Keyword(s):

Protein Structure ◽

Large Scale ◽

Protein Structures ◽

Structural Proteomics ◽

Single Chip ◽

Structure Comparison ◽

Protein Structure Comparison ◽

Processor Architectures ◽

Comparison Algorithms ◽

Many Core

Fast increasing computational demand for all-to-all protein structures comparison (PSC) is a result of three confounding factors: rapidly expanding structural proteomics databases, high computational complexity of pairwise protein comparison algorithms, and the trend in the domain towards using multiple criteria for protein structures comparison (MCPSC) and combining results. We have developed a software framework that exploits many-core and multicore CPUs to implement efficient parallel MCPSC in modern processors based on three popular PSC methods, namely, TMalign, CE, and USM. We evaluate and compare the performance and efficiency of the two parallel MCPSC implementations using Intel’s experimental many-core Single-Chip Cloud Computer (SCC) as well as Intel’s Core i7 multicore processor. We show that the 48-core SCC is more efficient than the latest generation Core i7, achieving a speedup factor of 42 (efficiency of 0.9), making many-core processors an exciting emerging technology for large-scale structural proteomics. We compare and contrast the performance of the two processors on several datasets and also show that MCPSC outperforms its component methods in grouping related domains, achieving a highF-measure of 0.91 on the benchmark CK34 dataset. The software implementation for protein structure comparison using the three methods and combined MCPSC, along with the developed underlyingrckskelalgorithmic skeletons library, is available via GitHub.

Download Full-text

protein structure comparison
Recently Published Documents

TOTAL DOCUMENTS

H-INDEX

Evolution-aware Protein Structure Comparison and Applications in Protein-Protein Interaction Prediction

Using Dali for Protein Structure Comparison

A Novel Approach for Fast Protein Structure Comparison and Heuristic Structure Database Searching Based on Residue EigenRank Scores

In silico Protein Structure Comparison of Conotoxins with VI/VII Cysteine Framework

Efficient algorithms and architectures for protein 3-D structure comparison

Multi-criteria protein structure comparison and structural similarities analysis using pyMCPSC

Acceleration of a protein structure comparison algorithm on FPGA

An efficient algorithm for protein structure comparison using elastic shape analysis

A Framework to Accelerate Protein Structure Comparison Tools

Efficient Multicriteria Protein Structure Comparison on Modern Processor Architectures

Export Citation Format

protein structure comparisonRecently Published Documents

TOTAL DOCUMENTS

H-INDEX

Evolution-aware Protein Structure Comparison and Applications in Protein-Protein Interaction Prediction

Using Dali for Protein Structure Comparison

A Novel Approach for Fast Protein Structure Comparison and Heuristic Structure Database Searching Based on Residue EigenRank Scores

In silico Protein Structure Comparison of Conotoxins with VI/VII Cysteine Framework

Efficient algorithms and architectures for protein 3-D structure comparison

Multi-criteria protein structure comparison and structural similarities analysis using pyMCPSC

Acceleration of a protein structure comparison algorithm on FPGA

An efficient algorithm for protein structure comparison using elastic shape analysis

A Framework to Accelerate Protein Structure Comparison Tools

Efficient Multicriteria Protein Structure Comparison on Modern Processor Architectures

protein structure comparison
Recently Published Documents