Συμβουλές για την κατασκευή και την ανακαίνιση

Η βιοπληροφορική ως επιστήμη αναδύθηκε στη διασταύρωση της μοριακής βιολογίας, της γενετικής, των μαθηματικών και της τεχνολογίας των υπολογιστών. Κύριο καθήκον του είναι η ανάπτυξη υπολογιστικών αλγορίθμων για την ανάλυση και τη συστηματοποίηση δεδομένων σχετικά με τη δομή και τις λειτουργίες βιολογικών μορίων, κυρίως νουκλεϊκών οξέων και πρωτεϊνών. Η ποσότητα της γενετικής πληροφορίας που συσσωρεύτηκε στις τράπεζες δεδομένων άρχισε να αυξάνεται με αυξανόμενο ρυθμό μετά την ανάπτυξη μεθόδων ταχείας αλληλούχισης (αποκωδικοποίηση των νουκλεοτιδικών αλληλουχιών του DNA). Οι μέθοδοι βιοπληροφορικής καθιστούν δυνατή όχι μόνο την επεξεργασία αυτού του τεράστιου όγκου δεδομένων, αλλά και τον εντοπισμό μοτίβων που δεν μπορούν πάντα να φανούν σε συνηθισμένα πειράματα, την πρόβλεψη των λειτουργιών των γονιδίων και των πρωτεϊνών που κωδικοποιούνται σε αυτά, τη δημιουργία μοντέλων αλληλεπίδρασης γονιδίων σε ένα κύτταρο, και σχεδιάζουν φάρμακα. Τον Ιούλιο του 2004, πραγματοποιήθηκε στο Novosibirsk Academgorodok το τέταρτο Διεθνές Συνέδριο για τη Βιοπληροφορική της ρύθμισης και της δομής του γονιδιώματος (BGRS "2004), που διοργανώθηκε από το Ινστιτούτο Κυτταρολογίας και Γενετικής του Παραρτήματος της Σιβηρίας της Ρωσικής Ακαδημίας Επιστημών. περισσότεροι από 200 επιστήμονες από διαφορετικές χώρες - Ρωσία, Γερμανία, ΗΠΑ, Αγγλία, Ιταλία, Γαλλία, Ιαπωνία και άλλες - συζήτησαν τα προβλήματα της γονιδιωματικής των υπολογιστών, των συστημάτων και της εξελικτικής βιολογίας, καθώς και της πρωτεϊνομικής - μια νέα επιστημονική κατεύθυνση που σχετίζεται με τη μελέτη των πρωτεϊνών και των αλληλεπιδράσεων τους στο σώμα Στο συνέδριο συμμετείχε ειδικός ανταποκριτής του περιοδικού «Science and Life» Γ. ΑΦΑΝΑΣΙΕΒΑ.

Επιστήμη και ζωή // Εικονογραφήσεις

Το αντεπιστέλλον μέλος της Ρωσικής Ακαδημίας Επιστημών N. A. Kolchanov ανοίγει το Τέταρτο Διεθνές Συνέδριο για τη Βιοπληροφορική της Ρύθμισης και Δομής του Γονιδιώματος.

Τρισδιάστατο μοντέλο επαφής ρυθμιστικής πρωτεΐνης με μόριο DNA. Οι R. G. Efremov (Institute of Bioorganic Chemistry) και K. V. Shaitan (MSU) μίλησαν για τη μοριακή μοντελοποίηση της χωρικής δομής των πρωτεϊνών και την αλληλεπίδρασή τους με τα νουκλεϊκά οξέα.

Τη συνάντηση για την εξελικτική βιολογία προεδρεύει ο Διδάκτωρ Βιολογικών Επιστημών M. S. Gelfand.

Χωρική οργάνωση και λειτουργία ενεργών κέντρων πρωτεϊνών.

Για να σχεδιάσετε ένα στοχευμένο φάρμακο, πρέπει να επιλέξετε μια ουσία (συνδέτη) που ταιριάζει στην πρωτεΐνη στόχο, όπως ένα κλειδί σε μια κλειδαριά. Για να γίνει αυτό, πρέπει να γνωρίζετε τη χωρική δομή των μορίων.

Αλληλουχία νουκλεοτιδίων ανθρώπινης ε-αιμοσφαιρίνης.

Δίκτυο γονιδίων απόκρισης κατά των ιών.

Ρύθμιση του αναπνευστικού συστήματος.

Οι ζωηρές συζητήσεις συνεχίστηκαν μεταξύ των συνεδριών. Ένας επισκέπτης από την Ινδία, ο Δρ. Srinivasan Ramachandran (Ινστιτούτο Γονιδιωματικής, Δελχί), εξηγεί την περίπλοκη επιστήμη «στα χέρια του».

ΟΤΑΝ Η ΒΙΟΛΟΓΙΑ ΑΡΧΙΣΕ ΝΑ ΜΙΛΑΕΙ ΤΗ ΓΛΩΣΣΑ ΤΩΝ ΜΑΘΗΜΑΤΙΚΩΝ...

Πότε λοιπόν εμφανίστηκε η βιοπληροφορική, η οποία τώρα με σιγουριά ονομάζεται επιστήμη της τρίτης χιλιετίας; Δείτε τι λέει σχετικά ο Διδάκτωρ Βιολογικών Επιστημών Rustem Nurovich Churaev, επικεφαλής του τμήματος επιγενετικής στο Ινστιτούτο Βιολογίας του Επιστημονικού Κέντρου Ufa και επικεφαλής του εργαστηρίου μαθηματικής και μοριακής γενετικής:

«Μπορούμε να υποθέσουμε ότι αυτή η επιστήμη ξεκίνησε τον 13ο αιώνα, τότε ο νεαρός Ιταλός Λεονάρντο από την Πίζα, ο οποίος πέρασε στην ιστορία των μαθηματικών με το όνομα Φιμπονάτσι, περιέγραψε τη λύση στο πρόβλημα της αναπαραγωγής κουνελιού και έτσι έχτισε το πρώτο μαθηματικό μοντέλο. Στην πραγματικότητα, αυτή η περίεργη υπόθεση έθεσε τα θεμέλια για τη μαθηματική βιολογία Στη δεκαετία του 20 του 20ού αιώνα, ένας άλλος Ιταλός μαθηματικός, ο Vito Volterra, δημιούργησε ένα μοντέλο της συνύπαρξης δύο βιολογικών πληθυσμών του «αρπακτικού. Οι μαθηματικοί άρχισαν να ενδιαφέρονται για τη θεωρητική βιολογία Ο Schrödinger με τη δημοσίευση του βιβλίου του "Τι είναι η ζωή από την άποψη της φυσικής;" για να αναπτυχθεί. Ο Vadim Aleksandrovich Ratner, μαθητής του Lyapunov, στις αρχές της δεκαετίας του 1960 εφάρμοσε μια μαθηματική προσέγγιση στην περιγραφή φαινομένων μοριακού επιπέδου σε πολύπλοκα συστήματα.

Το 1975, δημιουργήθηκε το πρώτο γνωστό ποσοτικό μοντέλο για τον έλεγχο της ανάπτυξης του λάμδα φάγου. Το γονιδίωμά του περιέχει 48 γονίδια (πολύ λίγα με τα σημερινά πρότυπα), αλλά έχει ένα πολύπλοκο σύστημα ελέγχου. Αυτό και πιο πολύπλοκα συστήματα απαιτούσαν ήδη τη χρήση υπολογιστών. Ένας ξεχωριστός κλάδος άρχισε να αναδύεται από τη μαθηματική βιολογία - η βιοπληροφορική, που περιλαμβάνει τη χρήση τεχνολογιών πληροφοριών για τη μελέτη βιολογικών συστημάτων. Πρέπει να σημειωθεί ο μεγάλος ρόλος του Ινστιτούτου Κυτταρολογίας και Γενετικής του Παραρτήματος της Σιβηρίας της Ρωσικής Ακαδημίας Επιστημών στην ανάπτυξη της βιοπληροφορικής. Πρόκειται για έναν τομέα με τα δικά του προβλήματα και μεθόδους, που είναι αδιανόητα χωρίς υπολογιστές. Συσσωρεύονται πολλά δεδομένα, υπάρχει κατακλυσμός πληροφοριών σχετικά με τις πρωτογενείς αλληλουχίες των γονιδιωμάτων των μορίων DNA».

ΣΕ SILICO Ή IN VIVO;

Φυσικά, η ανάλυση ενός τεράστιου όγκου δεδομένων απαιτεί υπολογιστές υψηλής απόδοσης και ένας συμβατικός υπολογιστής δεν είναι σε θέση να αντιμετωπίσει μια τέτοια εργασία - δεν υπάρχει αρκετή μνήμη και χρόνος. Ποιες τεχνολογίες υπολογιστών προσφέρονται σήμερα στους βιοπληροφορικούς; Πρώτα, το σύστημα Cray υψηλής απόδοσης εμφανίστηκε στις Ηνωμένες Πολιτείες - μια τεράστια εγκατάσταση που καταλαμβάνει τον όγκο ενός δωματίου, αλλά αν συνδυάσετε συνηθισμένους υπολογιστές για να έχετε την ίδια ισχύ, θα έχετε ένα πενταόροφο σπίτι. Σήμερα, για παράδειγμα, ο υπερυπολογιστής "Blue" χρησιμοποιείται όλο και περισσότερο (αυτός ήταν που κέρδισε τον Garry Kasparov σε έναν αγώνα σκακιού). Αυτός ο υπολογιστής είναι σε θέση να αναλύσει έναν τεράστιο αριθμό συνδυασμών σε αρκετά σύντομο χρονικό διάστημα (από αρκετά λεπτά έως αρκετές ημέρες, ανάλογα με την πολυπλοκότητα της εργασίας). Δεν είναι λιγότερο σημαντικά τα λεγόμενα συμπλέγματα υπολογιστών, δηλαδή αρκετοί συνηθισμένοι υπολογιστές που συνδέονται σειριακά. Η εργασία χωρίζεται σε μέρη, τα οποία δουλεύονται παράλληλα. Ίσως μια τέτοια τεχνολογία να βρει ευρεία εφαρμογή στο μέλλον, αφού η παράλληλη επεξεργασία δεδομένων είναι πιο αποτελεσματική. Πρόσφατα, εμφανίστηκε μια μέθοδος που ονομάζεται κατανεμημένη υπολογιστική, όταν πολλοί υπολογιστές σε διαφορετικές χώρες συμμετέχουν στους υπολογισμούς και κάθε υπολογιστής εκτελεί ένα μικρό μέρος της εργασίας.

Υπερυπολογιστές της απαιτούμενης ισχύος υπάρχουν και στη Ρωσία, για παράδειγμα στο Pushchino. Εάν υπάρχουν δίκτυα οπτικών ινών, ένα εργαστήριο που βρίσκεται ακόμη και σε άλλη πόλη μπορεί να συνδεθεί σε αυτό.

Σχετικά πρόσφατα εμφανίστηκε στην επιστήμη ο όρος «βιολογία στο πυρίτιο», η κυριολεκτική σημασία του οποίου είναι «βιολογία στο πυρίτιο», με άλλα λόγια, διεξαγωγή βιολογικού πειράματος σε υπολογιστή. Τώρα αυτή η ιδέα έχει γίνει αρκετά επίσημη και χρησιμοποιείται ευρέως. Υπάρχει ένα περιοδικό που ονομάζεται «In silico biology».

Η βιοπληροφορική καθιστά δυνατή τη γρήγορη και φθηνή διεξαγωγή ενός πειράματος μοντέλου και συχνά την πρόβλεψη του αποτελέσματος ενός συμβατικού πειράματος. Αλλά τα μοντέλα της ζωής των υπολογιστών απέχουν ακόμα πολύ από την πραγματικότητα. Ενεργή έρευνα βρίσκεται σε εξέλιξη σε όλο τον κόσμο για να φέρει το πυρίτιο όσο το δυνατόν πιο κοντά στο in vivo. Αυτό σημαίνει όχι μόνο τη συμμετοχή δεδομένων σχετικά με τη δομή και τη λειτουργία της πρωτεΐνης υπό μελέτη στους υπολογισμούς, αλλά και τη συνεκτίμηση της αλληλεπίδρασης μεταξύ των πρωτεϊνών σε πραγματικό περιβάλλον. Τεράστια χρηματικά ποσά επενδύονται αυτήν τη στιγμή στο έργο εικονικών κυττάρων. Στη Ρωσία, για παράδειγμα, τέτοιες εργασίες πραγματοποιούνται στο Επιστημονικό Κέντρο Pushchino. Η δημιουργία μιας «ηλεκτρονικής κυψέλης» θα καταστήσει δυνατό τον αποτελεσματικό σχεδιασμό μιας νέας γενιάς φαρμάκων. Ο Διδάκτωρ Βιολογικών Επιστημών Mikhail Sergeevich Gelfand μίλησε για τις προοπτικές της βιοπληροφορικής και την εμπιστοσύνη των πειραματιστών στις προβλέψεις του πυριτίου:

"Η βιοπληροφορική είναι ένας τρόπος να γίνονται βιολογικές δηλώσεις χωρίς να παρατηρούμε άμεσα τη φύση (όπως, για παράδειγμα, στη ζωολογία) και χωρίς να κάνουμε πειράματα (όπως στη μοριακή βιολογία), αλλά αναλύοντας ήδη τεράστια πειραματικά αποτελέσματα. Φυσικά, η βάση όλων είναι το γονιδίωμα: μόνο γνωρίζοντας όλα τα γονίδια ενός οργανισμού, μπορούν να εξαχθούν αξιόπιστα συμπεράσματα. , ο προσδιορισμός των αλληλεπιδράσεων πρωτεΐνης-πρωτεΐνης σε διάφορους οργανισμούς, κύτταρα, συνθήκες ανάπτυξης... Προηγουμένως, για να ληφθεί αυτό Με αυτό το είδος δεδομένων, πραγματοποιήθηκαν ειδικά πειράματα, αλλά φανταστείτε: το μέσο βακτήριο έχει περίπου 3000 γονίδια, ένα άτομο έχει μια τάξη μεγέθους περισσότερες, 30.000, ακόμη περισσότερες πρωτεΐνες - πόσα πειράματα πρέπει να γίνουν, για παράδειγμα, για να ελεγχθούν όλα τα ζεύγη πρωτεϊνών, αν αλληλεπιδρούν. Και ταυτόχρονα, τις περισσότερες φορές θα είναι δαπανώνται σε «κενά» πειράματα, με πρωτεΐνες που δεν αλληλεπιδρούν. Ένα τεράστιο πείραμα είναι εκατό πειράματα που εκτελούνται ταυτόχρονα από πολλές δεκάδες ρομπότ. Ωστόσο, αυτό δημιουργεί ένα υψηλό επίπεδο «θορύβου» - τυχαία σφάλματα, και το καθήκον της βιοπληροφορικής είναι να εξάγει αξιόπιστες δηλώσεις από αυτά τα δεδομένα.

Το ίδιο συμβαίνει και με τις γονιδιακές λειτουργίες. Κατ' αρχήν, η αποσαφήνιση της λειτουργίας ενός γονιδίου σε ένα πείραμα απαιτεί ένα χρόνο εργασίας από έναν ισχυρό ερευνητή και ένα καλό άρθρο. Υπάρχουν όμως χιλιάδες γονίδια σε κάθε οργανισμό. Και αποδεικνύεται ότι η βιοπληροφορική καθιστά δυνατή την πραγματοποίηση αξιόπιστων προβλέψεων που επιδέχονται στοχευμένη πειραματική επαλήθευση. Αποδεικνύεται πολύ πιο εύκολο, πιο γρήγορο και φθηνότερο. Φυσικά, υπάρχουν και λανθασμένα συμπεράσματα, τα οποία προκαλούν δυσπιστία στους «παραδοσιακούς» βιολόγους. Αλλά εδώ η κατάσταση είναι ίδια με κάθε νέα ερευνητική τεχνική. Όταν εμφανίστηκε το μικροσκόπιο, στην αρχή φαντάστηκαν επίσης πολλά πράγματα, για παράδειγμα, κάποιοι περιέγραψαν ότι είδαν ένα μικρό έμβρυο σε ένα σπέρμα. Αλλά σταδιακά οι πειραματιστές αποκτούν μια γεύση για τις μεθόδους βιοπληροφορικής και μαθαίνουν να διαχωρίζουν το σιτάρι από την ήρα, και οι ίδιοι οι βιοπληροφορικοί αρχίζουν να είναι πιο επικριτικοί για τη δουλειά τους. Τελικά, αναδύεται ένα εντελώς νέο και ισχυρό εργαλείο για τη βιολογική έρευνα. Στην πραγματικότητα, υπάρχει ήδη, πρέπει να το αναπτύξουμε και να μάθουμε να το χρησιμοποιούμε - γι' αυτό γίνονται τέτοια συνέδρια».

Μεταξύ των κύριων καθηκόντων της βιοπληροφορικής είναι η περιγραφή των γονιδιακών δικτύων, η εφεύρεση νέων φαρμάκων με συγκεκριμένες ιδιότητες και η ανάπτυξη μοντέλων υπολογιστή των διεργασιών που συμβαίνουν στο σώμα.

Ο ΥΠΟΛΟΓΙΣΤΗΣ ΣΧΕΔΙΑΖΕΙ ΤΑ ΦΑΡΜΑΚΑ

Ένας από τους πιο πολλά υποσχόμενους και ταχέως αναπτυσσόμενους τομείς της βιοπληροφορικής είναι ο σχεδιασμός στοχευμένων φαρμάκων. Η δράση τέτοιων φαρμάκων στοχεύει στα κέντρα δέσμευσης μιας συγκεκριμένης πρωτεΐνης στο σώμα του παθογόνου. Ταυτόχρονα, παρόμοιες ανθρώπινες πρωτεΐνες δεν υφίστανται αλλαγές, πράγμα που σημαίνει ότι δεν υπάρχουν παρενέργειες. Ο σχεδιασμός ενός στοχευμένου φαρμάκου απαιτεί γνώση της τρισδιάστατης δομής της πρωτεΐνης στόχου, καθώς η ακριβής χωρική αντιστοιχία είναι το κλειδί.

Η δομή των πρωτεϊνών είναι κρυπτογραφημένη στο DNA, αλλά η κατανόηση αυτού του κώδικα δεν είναι τόσο εύκολη. Το γεγονός είναι ότι το γονίδιο πρωτεΐνης, εκτός από τα κωδικοποιητικά θραύσματα (ονομάζονται εξόνια), περιέχει εσώνια - περιοχές που δεν φέρουν καμία χρήσιμη πληροφορία για την πρωτεΐνη. Δηλαδή, οι «λέξεις» του γενετικού κώδικα διακόπτονται από μάλλον μεγάλα ένθετα από ένα τυχαίο σύνολο «γραμμάτων». Ένας μεγάλος αριθμός αναφορών στο συνέδριο BGRS 2004 αφιερώθηκε στην αναζήτηση νέων αποτελεσματικών μεθόδων για την αναγνώριση της δομής εξωνίου-ιντρονίου του DNA, καθώς και στον προσδιορισμό της χωρικής δομής των πρωτεϊνών με βάση μια γνωστή αλληλουχία αμινοξέων Οι ομιλίες τους από τον Yu. που καθιστούν δυνατό να κρίνουμε τη λειτουργία των τμημάτων του DNA από τον τρόπο κατανομής των νουκλεοτιδίων σε αυτό.

Σήμερα, η πιο αποτελεσματική μέθοδος για την ανάλυση πρωτεϊνών δεν είναι η σταδιακή αποκρυπτογράφηση της δομής κάθε μεμονωμένης πρωτεΐνης, αλλά η σύγκρισή της με τις δομές σχετικών (ομόλογων) πρωτεϊνών που έχουν ήδη αποκρυπτογραφηθεί. Η πλησιέστερη γνωστή ακολουθία λαμβάνεται ως «σημείο εκκίνησης» και βελτιώνεται περαιτέρω. Τα δεδομένα περίθλασης ακτίνων Χ και πυρηνικού μαγνητικού συντονισμού καθιστούν δυνατή την πρόβλεψη της χωρικής δομής παρόμοιων πρωτεϊνών και την εξαγωγή συμπερασμάτων σχετικά με την πιθανή λειτουργία τους στο σώμα.

Όταν εδραιωθεί η χωρική δομή της πρωτεΐνης στόχου, ξεκινά το επόμενο στάδιο: η αναζήτηση μιας ουσίας χαμηλού μοριακού βάρους (συνδέτης) που, όταν συνδυαστεί με την πρωτεΐνη, θα έχει το επιθυμητό φαρμακολογικό αποτέλεσμα. Μια τέτοια αναζήτηση περιλαμβάνει αναζήτηση σε χιλιάδες επιλογές, και αυτό δεν μπορεί να γίνει χωρίς την τεχνολογία υπολογιστών.

ΔΙΚΤΥΑ ΓΟΝΙΔΙΩΝ

Τα γονίδια στα κύτταρα του σώματος μπορούν να αλληλεπιδράσουν μεταξύ τους μέσω των προϊόντων τους - των πρωτεϊνών. Για παράδειγμα, οι ρυθμιστικές πρωτεΐνες είναι σε θέση να συνδέονται σε συγκεκριμένα τμήματα του DNA και έτσι ένα γονίδιο μπορεί να ενεργοποιήσει ή να απενεργοποιήσει ένα άλλο. Χάρη σε μια τέτοια αλληλεπίδραση, σχηματίζεται ένα δίκτυο γονιδίων, που καλύπτει σημαντικό αριθμό γονιδίων (από δεκάδες έως εκατοντάδες), τα οποία συντονίζουν τις δραστηριότητές τους και ελέγχουν την απόδοση ορισμένων λειτουργιών στο σώμα. Η αποσαφήνιση των μηχανισμών λειτουργίας των γονιδιακών δικτύων είναι ένα θεμελιωδώς σημαντικό έργο, επειδή καθορίζουν τα εξωτερικά σημάδια του σώματος και τις κληρονομικές ασθένειες. Μια πλήρης και σαφής εικόνα των γονιδιακών αλληλεπιδράσεων θα ανοίξει νέες ευκαιρίες για γονιδιακή διάγνωση και γονιδιακή θεραπεία. Το θέμα αυτό ήταν ένα από τα κεντρικά του συνεδρίου.

Στην κατασκευή τεχνητών δικτύων γονιδίων, χρησιμοποιείται η έννοια του επιγονιδίου ως νέας κατηγορίας κληρονομικών μονάδων, που αναπτύχθηκε από τον R. N. Churaev το 1975. Ένα επιγονίδιο είναι ένα «υπεργονιδιακό» σύστημα με δύο ή περισσότερους κληρονομικούς τρόπους λειτουργίας γονιδίου (για παράδειγμα, όταν ένα συγκεκριμένο γονίδιο είναι «ενεργό» και όταν είναι «απενεργοποιημένο»). Το Epigene θυμάται τον τρόπο με τον οποίο βρίσκεται και μεταδίδει πληροφορίες σχετικά με τη γονιδιακή δραστηριότητα με κληρονομικότητα. Αυτή η έννοια καθιστά δυνατή την εξήγηση πειραματικά παρατηρούμενων περιπτώσεων κληρονομικότητας επίκτητων χαρακτηριστικών και ορισμένων άλλων φαινομένων.

ΕΞΕΛΙΞΗ ΜΕΣΑ ΑΠΟ ΤΟ ΠΡΙΣΜΑ ΤΗΣ ΒΙΟΠΛΗΡΟΦΟΡΙΚΗΣ

Η σύγκριση των γονιδιωμάτων διαφορετικών οργανισμών καθιστά δυνατή την ανίχνευση της εξέλιξης των ζωντανών οργανισμών. Στην ενότητα της εξελικτικής βιολογίας υπολογιστών, ο M. S. Gelfand παρουσίασε μια αναφορά σχετικά με την εξέλιξη των βακτηριακών ρυθμιστικών συστημάτων. Η ανάλυση εκατοντάδων βακτηριακών γονιδιωμάτων κατέστησε δυνατή την περιγραφή της συμπεριφοράς των ρυθμιστικών συστημάτων κατά την εξέλιξη σε διάφορα επίπεδα: την εξέλιξη μεμονωμένων ρυθμιστικών σημάτων, αλλαγές στη δομή των ρυθμιστικών πρωτεϊνών, τη συμπεριφορά συνόλων ρυθμιζόμενων γονιδίων και, τέλος , πλήρης αναδιάρθρωση των ρυθμιστικών συστημάτων. Ίσως το αρχαιότερο ρυθμιστικό σύστημα είναι οι λεγόμενοι διακόπτες RNA, οι οποίοι περιγράφηκαν από τον Διδάκτωρ Βιολογικών Επιστημών Αντρέι Αλεξάντροβιτς Μιρόνοφ. Ένας διακόπτης RNA είναι ένα μόριο RNA που είναι ικανό όχι μόνο να μεταφέρει πληροφορίες, αλλά και να ελέγχει τη δραστηριότητα των γονιδίων ανεξάρτητα, χωρίς τη βοήθεια πρωτεϊνών. Οι ρυθμιστικές ιδιότητες των διακοπτών RNA είχαν αρχικά προβλεφθεί με μεθόδους βιοπληροφορικής και στη συνέχεια ανακαλύφθηκαν πειραματικά. Δύο γεγονότα υποστηρίζουν την υπόθεση για την αρχαιότητα του συστήματος μεταγωγής RNA: η παρουσία ρυθμιστικών σημάτων αυτού του τύπου σε όλες σχεδόν τις ομάδες οργανισμών από βακτήρια και αρχαιοβακτήρια έως φυτά και μύκητες και το γεγονός ότι η ρύθμιση λαμβάνει χώρα απευθείας όταν δεσμεύεται η ρυθμιστική δομή του RNA σε μικρά μόρια (βιταμίνες και αμινοξέα) χωρίς τη συμμετοχή κανενός ενδιάμεσου. Έτσι, τέτοια ρυθμιστικά συστήματα θα μπορούσαν να υπάρχουν στον «κόσμο του RNA» ακόμη και πριν από την εμφάνιση των πρωτεϊνών.

Από πρακτική άποψη, μια ενδιαφέρουσα μελέτη πραγματοποιήθηκε στην ομάδα του Gelfand από τους A. E. Kazakov, O. V. Kalinina και E. A. Permina. Μελέτησαν την αντοχή των βακτηρίων στα βαρέα μέταλλα. Σε πολλές περιπτώσεις, αυτή η αντίσταση παρέχεται από πρωτεΐνες μεταφορείς που απελευθερώνουν τοξικά μεταλλικά κατιόντα από το κύτταρο. Ωστόσο, υπάρχουν πολλοί διαφορετικοί μεταφορείς, είναι πολύ διαφορετικοί και δεν είναι πάντα δυνατό να προβλεφθεί η ειδικότητα μιας πρωτεΐνης μεταφορέα σε ένα συγκεκριμένο μέταλλο. Οι ερευνητές ακολούθησαν διαφορετική διαδρομή: μελέτησαν πώς ρυθμίζεται το έργο των γονιδίων που κωδικοποιούν τις πρωτεΐνες μεταφορείς. Αποδείχθηκε ότι περιλαμβάνει μια ορισμένη οικογένεια πρωτεϊνών καταστολέα που αναγνωρίζουν την παρουσία μεταλλικών κατιόντων χρησιμοποιώντας μια ειδική λειτουργική περιοχή, η οποία περιλαμβάνει τουλάχιστον τρία υπολείμματα αμινοξέων κυστεΐνης. Με τη σύνδεση με το κατιόν, η πρωτεΐνη καταστολέα απελευθερώνει την περιοχή σήματος του DNA και έτσι ενεργοποιεί τη λειτουργία του γονιδίου που κωδικοποιεί την πρωτεΐνη μεταφορέα. Οι συγγραφείς έδειξαν ότι η αλληλουχία της περιοχής σήματος στο DNA μπορεί να χρησιμοποιηθεί για να προβλέψει σε ποια ομάδα ανήκει η αντίστοιχη πρωτεΐνη καταστολέα και αυτές οι πρωτεΐνες είναι εξαιρετικά ειδικές για τα κατιόντα μετάλλων. Τα αποτελέσματα που λαμβάνονται μπορούν να χρησιμοποιηθούν για τη δημιουργία αξιόπιστων δεικτών ρύπανσης. Και σύμφωνα με το σχήμα που κατασκεύασαν οι επιστήμονες, είναι δυνατό να προβλεφθεί σε ποια μέταλλα θα είναι μη ευαίσθητο ένα συγκεκριμένο βακτήριο, κάτι που είναι ιδιαίτερα σημαντικό κατά τη δημιουργία στελεχών που χρησιμοποιούνται για τη βιολογική επεξεργασία βιομηχανικών λυμάτων.

ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ - ΕΠΙΣΤΗΜΗ Ή ΕΡΕΥΝΗΤΙΚΗ ΜΕΘΟΔΟΣ;

Σε αυτό το ερώτημα, που προκαλεί πολλές διαμάχες μεταξύ των επιστημόνων, απάντησε ο πρόεδρος της οργανωτικής επιτροπής του συνεδρίου, αντεπιστέλλον μέλος της Ρωσικής Ακαδημίας Επιστημών Νικολάι Αλεξάντροβιτς Κολτσάνοφ:

"Και επιστήμη, μέθοδος και στρατηγική έρευνας. Μέθοδος - αν θεωρήσουμε τη βιοπληροφορική ως ένα σύνολο τεχνολογιών που σας επιτρέπει να εργαστείτε με έναν τεράστιο όγκο δεδομένων και να αποκτήσετε νέα αποτελέσματα με τη βοήθειά τους. Η επιστημονική πλευρά της βιοπληροφορικής συνδέεται με Όπως κάθε επιστήμη, έχει τα δικά της καθήκοντα και μελετά τους μηχανισμούς αποθήκευσης, μετάδοσης και εφαρμογής βιολογικών πληροφοριών σε διαφορετικά επίπεδα: γονιδίωμα, κύτταρο, αλληλεπίδραση μεταξύ κυττάρων, οργανισμός, πληθυσμός ως σύνολο διασταύρωση των επιστημών - μοριακή βιολογία, φυσιολογία, μαθηματικά, επιστήμη των υπολογιστών, φυσική και χημεία, και τέτοιες ενώσεις είναι στρατηγικής φύσης Τα μεγαλύτερα επιτεύγματα προκύπτουν όταν συμβαίνει μια σύνθεση επιστημών - μια κλασική αντανάκλαση αυτής της κατάστασης.

Το πρώτο συνέδριο για τη βιοπληροφορική της ρύθμισης και της δομής του γονιδιώματος πραγματοποιήθηκε στο Akademgorodok με πρωτοβουλία του Ινστιτούτου Κυτταρολογίας και Γενετικής του Παραρτήματος της Σιβηρίας της Ρωσικής Ακαδημίας Επιστημών το 1998. Τι έχει αλλάξει τα τελευταία έξι χρόνια; Και πάλι, η λέξη προς τον N. A. Kolchanov:

«Το 2002, ολοκληρώθηκε η αποκρυπτογράφηση του ανθρώπινου γονιδιώματος Η επόμενη πιο σημαντική εργασία είναι η αποκρυπτογράφηση του πρωτεϊνικού στοιχείου. Φυσικά, η απόκτηση ενός «πρωτεϊνικού πορτραίτου» του οργανισμού θα πάρει χρόνο, αλλά καταρχήν αυτό το έργο είναι απολύτως επιλύσιμο Δεν είναι απλώς ο συνδυασμός των επιτευγμάτων που επιτυγχάνονται με διάφορες μεθόδους, αλλά η ενσωμάτωση της γνώσης και η μεταφορά της σε ένα ποιοτικά νέο επίπεδο αντικατοπτρίζεται επίσης στα θέματα του συνεδρίου».

Απεικόνιση "Χωρική οργάνωση και λειτουργία ενεργών κέντρων πρωτεϊνών."
Η διαμόρφωση του ενεργού κέντρου της πρωτεΐνης (επισημασμένο με χρώμα) εξασφαλίζει την επιλεκτικότητα των βιοχημικών αλληλεπιδράσεων. Τα τελευταία επιτεύγματα σε μελέτες της χωρικής οργάνωσης και λειτουργίας των ενεργών κέντρων πρωτεϊνών παρουσιάστηκαν από τους M. Ondrechen (ΗΠΑ), S. Ramachandran (Ινδία), D. A. Afonnikov, V. A. Ivanisenko (Ινστιτούτο Κυτταρολογίας και Γενετικής, Νοβοσιμπίρσκ) και άλλοι συνέδρια συμμετεχόντων.

Απεικόνιση "Νουκλεοτιδική αλληλουχία ανθρώπινης ε-αιμοσφαιρίνης."
Αλληλουχία νουκλεοτιδίων ανθρώπινης ε-αιμοσφαιρίνης. Οι ενημερωτικές περιοχές - εξόνια - επισημαίνονται με μπλε, τα "χωρίς νόημα" εσώνια επισημαίνονται με κόκκινο. Ένα από τα καθήκοντα της βιοπληροφορικής είναι να προσδιορίσει τη δομή εξονίου-ιντρονίου και να αναγνωρίσει αυτές τις περιοχές στα γονιδιώματα που κωδικοποιούν πρωτεΐνες.

Απεικόνιση "Δίκτυο γονιδίων αντιιικής απόκρισης."
Το παράδειγμα δικτύου γονιδίων στο σχήμα περιλαμβάνει έναν συνδυασμό θετικών και αρνητικών ανατροφοδοτήσεων. Όταν ένας ιός εισέρχεται σε ένα κύτταρο, το γονίδιο της ιντερφερόνης-β (IFN-β) ενεργοποιείται. Η πρωτεΐνη (παράγοντας μεταγραφής) IRF-1 ενισχύει πρώτα το γονίδιο που παράγει ιντερφερόνη και αργότερα πυροδοτεί τη σύνθεση μιας άλλης πρωτεΐνης, της IRF-2, η οποία καταστέλλει την παραγωγή ιντερφερόνης, διασφαλίζοντας ότι το σύστημα επιστρέφει στην αρχική του κατάσταση. Τα ορθογώνια στο σχήμα υποδεικνύουν γονίδια και οι κύκλοι υποδεικνύουν πρωτεΐνες.

Εικονογράφηση "Ρύθμιση του αναπνευστικού συστήματος."
Διάφορες ρυθμιστικές πρωτεΐνες (παράγοντες μεταγραφής) εμπλέκονται στη ρύθμιση του αναπνευστικού συστήματος στα βακτήρια, ιδιαίτερα FNR (διακόπτης αερόβιου-αναερόβιου μεταβολισμού), ArcA (αισθητήρας παρουσίας οξυγόνου) και NarP (ρυθμιστής αναπνοής αζώτου). Οι D. A. Ravcheev και A. V. Gerasimova από την ερευνητική ομάδα του M. S. Gelfand πραγματοποίησαν μια σύγκριση βακτηριακών γονιδιωμάτων σε υπολογιστή και βρήκαν ότι σε μικροοργανισμούς διαφορετικών ομάδων αυτές οι πρωτεΐνες μπορούν να σχηματίσουν διαφορετικούς ρυθμιστικούς καταρράκτες. Στο σχήμα, οι πρωτεΐνες αντιπροσωπεύονται με έγχρωμα σχήματα, τα γονίδια που κωδικοποιούν αντιπροσωπεύονται από θραύσματα DNA του αντίστοιχου χρώματος και οι ρυθμιστικές αλληλεπιδράσεις φαίνονται ως λεπτά βέλη. Ήταν γνωστό από πειραματικές εργασίες ότι στην Escherichia coli (A) ο κύριος παράγοντας είναι το FNR, το οποίο ρυθμίζει το δικό του γονίδιο fnr, καθώς και γονίδια που κωδικοποιούν άλλους ρυθμιστές (arcA και narXL). Αποδείχθηκε ότι στην Pasteurella (B) οι παράγοντες FNR και NаrP σχηματίζουν έναν βρόχο (ρυθμίζουν ο ένας τα γονίδια του άλλου) και, επιπλέον, το γονίδιο fnr ρυθμίζεται από τους παράγοντες FNR (αυτορυθμιστικός βρόχος) και ArcA. Τα Vibrios (Β) δείχνουν αυτορρύθμιση των γονιδίων fnr και narP και το ArcA ρυθμίζει και τα δύο αυτά γονίδια και φαίνεται να είναι ο κύριος ρυθμιστής.

Βιοπληροφορικήέχει γίνει τσιτάτο στον σύγχρονο κόσμο της επιστήμης. Μέχρι πριν από περίπου μια δεκαετία ή δύο, οι άνθρωποι έβλεπαν τη βιολογία και την επιστήμη των υπολογιστών ως δύο εντελώς διαφορετικούς τομείς. Ο ένας μελέτησε τα ζωντανά όντα και τις λειτουργίες του σώματός τους, ενώ ο άλλος ασχολήθηκε με υπολογιστές και συστήματα πληροφοριών. Ωστόσο, στις μέρες μας φαίνεται να υπάρχει σύνδεση μεταξύ αυτών των δύο πεδίων και αυτό το νέο πεδίο, η βιοπληροφορική, έχει εμφανιστεί ως συνδυασμός Επιστήμης Υπολογιστών και Βιολογίας.

Τι είναι η βιοπληροφορική;

βιο + πληροφορική = βιοπληροφορική
Βιοπληροφορική  — είναι ένα διεπιστημονικό πεδίο που αναπτύσσει μεθόδους και εργαλεία λογισμικού για την κατανόηση βιολογικών δεδομένων. Ως διεπιστημονικό πεδίο της επιστήμης, η βιοπληροφορική συνδυάζει την επιστήμη των υπολογιστών, τη στατιστική, τα μαθηματικά και τη μηχανική για την ανάλυση και την ερμηνεία βιολογικών δεδομένων.

Διάφορες βιολογικές αναλύσεις έχουν ως αποτέλεσμα μια εκθετική αύξηση της ποσότητας των βιολογικών δεδομένων και είναι πολύ δύσκολο να αναλυθούν με το χέρι. Εδώ έρχεται να σώσει η επιστήμη των υπολογιστών και η τεχνολογία των πληροφοριών. Διάφορες υπολογιστικές μέθοδοι χρησιμοποιούνται για την ακριβέστερη και αποτελεσματικότερη ανάλυση βιολογικών δεδομένων και την αυτοματοποίηση της διαδικασίας επεξεργασίας. Επομένως, η βιοπληροφορική μπορεί να θεωρηθεί ως πεδίο της επιστήμης δεδομένων για την επίλυση προβλημάτων στον τομέα της βιολογίας και της ιατρικής.

Γιατί να μελετήσετε και να εφαρμόσετε βιοπληροφορική;

Η βιοπληροφορική έχει γίνει μια διεπιστημονική επιστήμη και αν είστε βιολόγος, τότε η γνώση της βιοπληροφορικής μπορεί να σας ωφελήσει πολύ στα πειράματα και την έρευνά σας.

Η διεθνής αγορά εργασίας είναι σήμερα γεμάτη με θέσεις εργασίας για άτομα με δεξιότητες βιοπληροφορικής. Μεγάλες εταιρείες φαρμακευτικής, βιοτεχνολογίας και λογισμικού αναζητούν να προσλάβουν επαγγελματίες με τεχνογνωσία στη βιοπληροφορική για να εργαστούν με τεράστιες ποσότητες βιολογικών και ιατρικών πληροφοριών.

Η βιοπληροφορική χρησιμοποιείται κυρίως στον τομέα της ακρίβειαΚαι προληπτικό φάρμακο. Η βάση της ιατρικής ακριβείας είναι οι ιατρικές μέθοδοι προσαρμοσμένες σε μεμονωμένους ασθενείς, συμπεριλαμβανομένων των μεθόδων θεραπείας και διάγνωσης. Αντί για τη θεραπεία ασθενειών, η ιατρική ακριβείας εστιάζει στην ανάπτυξη παρεμβάσεων για την πρόληψη και την πρόληψη ασθενειών. Επικεντρώνεται σε ασθένειες όπως γρίπη, Καρκίνος, καρδιακές παθήσειςΚαι Διαβήτης.

Γίνεται έρευνα για τον εντοπισμό γενετικές αλλαγέςσε ασθενείς, επιτρέποντας στους επιστήμονες να προτείνουν καλύτερες θεραπείες και ακόμη πιθανά προληπτικά μέτρα. Ορισμένοι τύποι καρκίνου που προκαλούνται από τέτοιες γενετικές αλλαγές μπορούν να εντοπιστούν έγκαιρα και η θεραπεία μπορεί να ξεκινήσει πριν επιδεινωθεί η κατάσταση.

Πώς να γίνετε ειδικός στη βιοπληροφορική;

Πριν βουτήξετε στο θέμα, στο αρχικό στάδιο πρέπει να μάθετε λίγα πράγματα βιολογία , γενεσιολογίαΚαι γονιδιωματική. Αυτό περιλαμβάνει τη μελέτη γονιδίων, DNA, RNA, πρωτεϊνικές δομές, διάφορες διαδικασίες σύνθεσης κ.λπ.

Τότε θα χρειαστεί να μελετήσετε βιομοριακές δομές(για παράδειγμα, ακολουθίες που βρίσκονται σε DNA, RNAκαι πρωτεΐνες) και μεθόδους για την ανακάλυψη και ανάλυση διαφόρων μοντέλων, καθώς και ιστοσελίδες πληροφοριών για αυτά. Θα συναντήσετε διαφορετικούς αλγόριθμους που χρησιμοποιούνται από διαφορετικές μεθόδους. Επιπλέον, θα έχετε την ευκαιρία να χρησιμοποιήσετε διάφορες τεχνικές μηχανικής εκμάθησης και εξόρυξης δεδομένων, όπως το κρυφό μοντέλα Markov, νευρωνικά δίκτυαΚαι ομαδοποίηση.

Δεδομένου ότι θα έχετε να κάνετε με μεγάλο όγκο δεδομένων, είναι σημαντικό να έχετε καλή κατανόηση στατιστικήπώς πρέπει να αναλύσετε τα δεδομένα σύμφωνα με συγκεκριμένες απαιτήσεις.

Φυσικά θα χρειαστείτε καλές δεξιότητες προγραμματισμός. Γλώσσες προγραμματισμού όπως π.χ R, ΠύθωνΚαι Βίαιο χτύπημαείναι οι πιο συχνά χρησιμοποιούμενες γλώσσες στην ανάλυση βιολογικών δεδομένων. Το να αποφασίσετε από πού να ξεκινήσετε εξαρτάται από τους στόχους σας. Μπορείτε να χρησιμοποιήσετε άλλες γλώσσες όπως π.χ C/C++Και Ιάβα.

Μετά από μια βασική κατανόηση των θεμελιωδών εννοιών, μπορείτε να εξερευνήσετε άλλους τομείς όπως π.χ δομική βιοπληροφορική,βιολογία συστημάτωνΚαι βιολογικών δικτύων.

Ο άνθρωπος είναι ένα καταπληκτικό πλάσμα και το γονιδίωμά του είναι ακόμα πιο συναρπαστικό. Ολόκληρο το ανθρώπινο γονιδίωμα που είναι αποθηκευμένο σε ένα μόριο DNA είναι εκπληκτικό! Τεράστιοι όγκοι δεδομένων μπορούν να κωδικοποιηθούν σε ένα λεπτό και να αποκρυπτογραφηθούν για να καταλάβουμε ποιες αλλαγές στη γονιδιακή έκφραση μπορούν να οδηγήσουν σε θανατηφόρες γενετικές ασθένειες. Τα συστήματα υγείας χρειάζονται μέτρα για την ανίχνευση τέτοιων ασθενειών, καθώς και μέτρα θεραπείας και πρόληψης που βοηθούν στη διάσωση ζωών.

Η βιοπληροφορική έχει αποδειχθεί ότι έχει μεγάλες δυνατότητες για τον εντοπισμό ασθενειών σε πρώιμο στάδιο, τον εντοπισμό θεραπειών για αυτές και τη βελτίωση της ζωής των ανθρώπων. Εμπνευσμένοι από τη γνώση της επιστήμης των υπολογιστών, τομείς όπως η γενετική μηχανική, η ιατρική και η δημόσια υγεία μπορούν να εξελιχθούν από τη θεραπεία μεμονωμένων ασθενών έως τη θεραπεία ολόκληρων πληθυσμών.

Αν ρωτήσετε έναν τυχαίο περαστικό τι είναι η βιολογία, πιθανότατα θα απαντήσει κάτι σαν «η επιστήμη της ζωντανής φύσης». Σχετικά με την πληροφορική θα πει ότι ασχολείται με τους υπολογιστές και τις πληροφορίες. Αν δεν φοβόμαστε να είμαστε παρεμβατικοί και του κάνουμε την τρίτη ερώτηση - τι είναι η βιοπληροφορική; – εδώ είναι που μάλλον θα μπερδευτεί. Είναι λογικό: δεν γνωρίζουν όλοι για αυτόν τον τομέα γνώσεων ακόμη και στο ΕΠΑΜ, αν και υπάρχουν ειδικοί στη βιοπληροφορική στην εταιρεία μας. Ας βρούμε γιατί χρειάζεται αυτή η επιστήμη για την ανθρωπότητα γενικά και το ΕΠΑΜ ειδικότερα: στο τέλος ξαφνικά μας ρωτούν για αυτό στο δρόμο.

Γιατί η βιολογία δεν μπορεί πλέον να αντεπεξέλθει χωρίς την επιστήμη των υπολογιστών και τι σχέση έχει ο καρκίνος;

Για τη διεξαγωγή έρευνας, δεν αρκεί πλέον οι βιολόγοι να παίρνουν δείγματα και να κοιτάζουν μέσα από ένα μικροσκόπιο. Η σύγχρονη βιολογία ασχολείται με τεράστιες ποσότητες δεδομένων. Συχνά είναι απλώς αδύνατη η χειροκίνητη επεξεργασία τους, έτσι πολλά βιολογικά προβλήματα επιλύονται με υπολογιστικές μεθόδους. Ας μην πάμε μακριά: το μόριο του DNA είναι τόσο μικρό που δεν μπορεί να φανεί με μικροσκόπιο φωτός. Και ακόμα κι αν είναι δυνατό (ηλεκτρονική), η οπτική μελέτη εξακολουθεί να μην βοηθά στην επίλυση πολλών προβλημάτων.

Το ανθρώπινο DNA αποτελείται από τρία δισεκατομμύρια νουκλεοτίδια. Λοιπόν, ίσως είναι αρκετό - μια ζωή για να αναλυθεί ένα μόριο - αλλά είναι πολύ χρονοβόρο, δαπανηρό και μη παραγωγικό, επομένως το γονιδίωμα αναλύεται χρησιμοποιώντας υπολογιστές και υπολογισμούς.

Η βιοπληροφορική είναι το σύνολο των μεθόδων υπολογιστών για την ανάλυση βιολογικών δεδομένων: ανάγνωση δομών DNA και πρωτεϊνών, μικροφωτογραφίες, σήματα, βάσεις δεδομένων με πειραματικά αποτελέσματα κ.λπ.

Μερικές φορές απαιτείται αλληλουχία DNA για να καθοριστεί η σωστή θεραπεία. Η ίδια ασθένεια, που προκαλείται από διαφορετικές κληρονομικές διαταραχές ή περιβαλλοντικές επιρροές, πρέπει να αντιμετωπίζεται διαφορετικά. Υπάρχουν επίσης περιοχές στο γονιδίωμα που δεν σχετίζονται με την ανάπτυξη της νόσου, αλλά, για παράδειγμα, είναι υπεύθυνες για την ανταπόκριση σε ορισμένα είδη θεραπείας και φάρμακα. Επομένως, διαφορετικά άτομα με την ίδια ασθένεια μπορεί να ανταποκρίνονται διαφορετικά στην ίδια θεραπεία.

Απαιτείται επίσης βιοπληροφορική για την ανάπτυξη νέων φαρμάκων. Τα μόριά τους πρέπει να έχουν συγκεκριμένη δομή και να συνδέονται με συγκεκριμένη πρωτεΐνη ή τμήμα DNA. Οι υπολογιστικές μέθοδοι βοηθούν στη μοντελοποίηση της δομής ενός τέτοιου μορίου.

Τα επιτεύγματα της βιοπληροφορικής χρησιμοποιούνται ευρέως στην ιατρική, κυρίως στη θεραπεία του καρκίνου. Το DNA κωδικοποιεί πληροφορίες σχετικά με την προδιάθεση για άλλες ασθένειες, αλλά η περισσότερη δουλειά γίνεται για τη θεραπεία του καρκίνου. Αυτή η κατεύθυνση θεωρείται η πιο πολλά υποσχόμενη, οικονομικά ελκυστική, σημαντική - και η πιο δύσκολη.

Βιοπληροφορική στο ΕΠΑΜ

Στο ΕΠΑΜ, το τμήμα Life Sciences ασχολείται με τη βιοπληροφορική. Εκεί αναπτύσσουν λογισμικό για φαρμακευτικές εταιρείες, βιολογικά και βιοτεχνολογικά εργαστήρια όλων των μεγεθών - από νεοφυείς επιχειρήσεις έως κορυφαίες παγκόσμιες εταιρείες. Μόνο άτομα που καταλαβαίνουν τη βιολογία και ξέρουν πώς να γράφουν αλγόριθμους και προγράμματα μπορούν να αντεπεξέλθουν σε μια τέτοια εργασία.

Οι βιοπληροφορικοί είναι ειδικοί στα υβρίδια. Είναι δύσκολο να πούμε ποια γνώση είναι πρωταρχική για αυτούς: η βιολογία ή η επιστήμη των υπολογιστών. Εάν θέσετε την ερώτηση έτσι, πρέπει να γνωρίζουν και τα δύο. Πρώτα από όλα, ίσως, σημαντικό είναι το αναλυτικό μυαλό και η διάθεση να μάθεις πολλά. Στο ΕΠΑΜ υπάρχουν βιολόγοι που ολοκλήρωσαν τις σπουδές τους στην πληροφορική, και προγραμματιστές και μαθηματικοί που σπούδασαν επιπλέον βιολογία.

Πώς να γίνετε βιοπληροφορικός

Maria Zueva, προγραμματιστής:

«Έλαβα μια τυπική εκπαίδευση πληροφορικής, μετά σπούδασα στα μαθήματα Java Lab του EPAM, όπου άρχισα να ενδιαφέρομαι για τη μηχανική μάθηση και την επιστήμη δεδομένων. Όταν αποφοίτησα από το εργαστήριο, μου είπαν: «Πήγαινε στο Life Sciences, κάνουν βιοπληροφορική και απλώς στρατολογούν ανθρώπους». Δεν λέω ψέματα: τότε ήταν που άκουσα τη λέξη «βιοπληροφορική» για πρώτη φορά. Το διάβασα στη Wikipedia και πήγα.

Στη συνέχεια, μια ολόκληρη ομάδα νεοφερμένων προσλήφθηκε στη μονάδα και μελετήσαμε μαζί βιοπληροφορική. Ξεκινήσαμε επαναλαμβάνοντας το σχολικό πρόγραμμα για το DNA και το RNA, στη συνέχεια αναλύσαμε λεπτομερώς υπάρχοντα προβλήματα στη βιοπληροφορική, προσεγγίσεις για την επίλυσή τους και αλγόριθμους και μάθαμε να εργαζόμαστε με εξειδικευμένο λογισμικό».

«Είμαι βιοφυσικός με εκπαίδευση το 2012 υπερασπίστηκα το διδακτορικό μου στη γενετική. Για κάποιο διάστημα εργάστηκα στην επιστήμη, έκανα έρευνα - και συνεχίζω να το κάνω. Όταν προέκυψε η ευκαιρία να εφαρμόσω την επιστημονική γνώση στην παραγωγή, αμέσως την πήδηξα.

Για έναν αναλυτή επιχειρήσεων, έχω μια πολύ συγκεκριμένη δουλειά. Για παράδειγμα, τα οικονομικά θέματα με περνούν, είμαι περισσότερο ειδικός σε θέματα. Πρέπει να καταλάβω τι θέλουν οι πελάτες από εμάς, να κατανοήσω το πρόβλημα και να δημιουργήσω τεκμηρίωση υψηλού επιπέδου - μια εργασία για προγραμματιστές, μερικές φορές να φτιάξω ένα λειτουργικό πρωτότυπο του προγράμματος. Καθώς το έργο εξελίσσεται, διατηρώ επαφή με προγραμματιστές και πελάτες, ώστε και οι δύο να είναι σίγουροι ότι η ομάδα κάνει ό,τι απαιτείται από αυτήν. Στην πραγματικότητα, είμαι μεταφραστής από τη γλώσσα των πελατών – βιολόγων και βιοπληροφορικών – στη γλώσσα των προγραμματιστών και πίσω».

Πώς να διαβάσετε το γονιδίωμα

Για να κατανοήσετε τα έργα βιοπληροφορικής του EPAM, πρέπει πρώτα να κατανοήσετε πώς γίνεται η αλληλουχία του γονιδιώματος. Γεγονός είναι ότι τα έργα για τα οποία θα μιλήσουμε σχετίζονται άμεσα με την ανάγνωση του γονιδιώματος. Ας απευθυνθούμε σε βιοπληροφορικούς για μια εξήγηση.

Mikhail Alperovich, επικεφαλής της μονάδας βιοπληροφορικής:

«Φανταστείτε να έχετε δέκα χιλιάδες αντίτυπα του War and Peace. Τα βάζετε μέσα από έναν τεμαχιστή, τα ανακατεύετε καλά, βγάζετε τυχαία ένα σωρό λωρίδες χαρτιού από αυτό το σωρό και προσπαθείτε να συναρμολογήσετε το αρχικό κείμενο από αυτές. Επιπλέον, έχετε το χειρόγραφο του War and Peace. Το κείμενο που θα συλλέξετε θα πρέπει να συγκριθεί με αυτό για να πιάσει τυπογραφικά λάθη (και σίγουρα θα υπάρχουν). Οι σύγχρονες μηχανές προσδιορισμού αλληλουχίας διαβάζουν το DNA με τον ίδιο σχεδόν τρόπο. Το DNA απομονώνεται από κυτταρικούς πυρήνες και χωρίζεται σε θραύσματα των 300-500 ζευγών νουκλεοτιδίων (θυμόμαστε ότι στο DNA τα νουκλεοτίδια συνδέονται μεταξύ τους σε ζεύγη). Τα μόρια είναι κατακερματισμένα επειδή κανένα σύγχρονο μηχάνημα δεν μπορεί να διαβάσει το γονιδίωμα από την αρχή μέχρι το τέλος. Η σειρά είναι πολύ μεγάλη και τα σφάλματα συσσωρεύονται καθώς τη διαβάζετε.

Θυμόμαστε το "War and Peace" μετά τον καταστροφέα. Για να επαναφέρουμε το αρχικό κείμενο του μυθιστορήματος, πρέπει να διαβάσουμε και να τακτοποιήσουμε όλα τα κομμάτια του μυθιστορήματος με τη σωστή σειρά. Αποδεικνύεται ότι διαβάσαμε το βιβλίο αρκετές φορές σε μικροσκοπικά κομμάτια. Το ίδιο και με το DNA: ο προσδιοριστής αλληλουχίας διαβάζει κάθε τμήμα της αλληλουχίας με πολλαπλές επικαλύψεις - τελικά, δεν αναλύουμε ένα, αλλά πολλά μόρια DNA.

Τα θραύσματα που προκύπτουν είναι ευθυγραμμισμένα - καθένα από αυτά "κολλάται" στο γονιδίωμα αναφοράς και γίνεται προσπάθεια να κατανοηθεί σε ποιο τμήμα του προτύπου αντιστοιχεί το θραύσμα ανάγνωσης. Στη συνέχεια, εντοπίζονται παραλλαγές στα ευθυγραμμισμένα θραύσματα - σημαντικές διαφορές μεταξύ των αναγνώσεων και του γονιδιώματος αναφοράς (τυπογραφικά λάθη στο βιβλίο σε σύγκριση με το χειρόγραφο αναφοράς). Αυτό γίνεται από προγράμματα που ονομάζονται variant callers (από την αγγλική παραλλαγή caller - mutation detector). Αυτό είναι το πιο δύσκολο κομμάτι της ανάλυσης, επομένως υπάρχουν πολλά διαφορετικά προγράμματα - παραλλαγές καλούντων και βελτιώνονται συνεχώς και αναπτύσσονται νέα.

Η συντριπτική πλειοψηφία των μεταλλάξεων που βρέθηκαν είναι ουδέτερες και δεν επηρεάζουν τίποτα. Υπάρχουν όμως και εκείνα που κωδικοποιούν μια προδιάθεση για κληρονομικές ασθένειες ή την ικανότητα ανταπόκρισης σε διαφορετικούς τύπους θεραπείας».

Για ανάλυση, λαμβάνεται ένα δείγμα που περιέχει πολλά κύτταρα - και επομένως αντίγραφα του πλήρους συνόλου DNA του κυττάρου. Κάθε μικρό κομμάτι DNA διαβάζεται πολλές φορές για να ελαχιστοποιηθεί η πιθανότητα λάθους. Εάν παραλειφθεί έστω και μία σημαντική μετάλλαξη, ο ασθενής μπορεί να διαγνωστεί εσφαλμένα ή να λάβει ακατάλληλη θεραπεία. Η ανάγνωση κάθε κομματιού DNA μία φορά είναι πολύ μικρή: μία μόνο ανάγνωση μπορεί να είναι λάθος και δεν θα το γνωρίζαμε. Αν διαβάσουμε το ίδιο απόσπασμα δύο φορές και πάρουμε ένα σωστό και ένα λάθος αποτέλεσμα, θα είναι δύσκολο για μας να μάθουμε ποια ανάγνωση είναι αληθινή. Και αν έχουμε εκατό αναγνώσεις και σε 95 από αυτές δούμε το ίδιο αποτέλεσμα, καταλαβαίνουμε ότι είναι σωστό.

Γκενάντι Ζαχάρωφ:

«Για να αναλύσετε τον καρκίνο, πρέπει να προσδιορίσετε την αλληλουχία τόσο των υγιών όσο και των νοσούντων κυττάρων. Ο καρκίνος εμφανίζεται ως αποτέλεσμα μεταλλάξεων που συσσωρεύει ένα κύτταρο κατά τη διάρκεια της ζωής του. Εάν οι μηχανισμοί που ευθύνονται για την ανάπτυξή του και τη διαίρεση του σε ένα κύτταρο έχουν επιδεινωθεί, τότε το κύτταρο αρχίζει να διαιρείται επ' αόριστον, ανεξάρτητα από τις ανάγκες του σώματος, δηλαδή γίνεται καρκινικός όγκος. Για να κατανοήσουμε τι ακριβώς προκαλεί καρκίνο, λαμβάνεται από τον ασθενή δείγμα υγιούς ιστού και καρκινικού όγκου. Αναλύεται η αλληλουχία και των δύο δειγμάτων, συγκρίνονται τα αποτελέσματα και βρίσκουν πώς διαφέρει το ένα από το άλλο: ποιος μοριακός μηχανισμός έχει διασπαστεί στο καρκινικό κύτταρο. Με βάση αυτό, επιλέγεται ένα φάρμακο που είναι αποτελεσματικό έναντι των κυττάρων με «σπάσιμο».

Βιοπληροφορική: παραγωγή και ανοιχτού κώδικα

Το τμήμα βιοπληροφορικής στο ΕΠΑΜ διαθέτει έργα παραγωγής και ανοιχτού κώδικα. Επιπλέον, μέρος ενός έργου παραγωγής μπορεί να εξελιχθεί σε ανοιχτού κώδικα και ένα έργο ανοιχτού κώδικα μπορεί να γίνει μέρος της παραγωγής (για παράδειγμα, όταν ένα προϊόν ανοιχτού κώδικα EPAM πρέπει να ενσωματωθεί στην υποδομή του πελάτη).

Έργο Νο. 1: επιλογή καλούντος

Για έναν από τους πελάτες του, μια μεγάλη φαρμακευτική εταιρεία, το ΕΠΑΜ εκσυγχρονίζει το πρόγραμμα option-caller. Η ιδιαιτερότητά του είναι ότι είναι σε θέση να βρίσκει μεταλλάξεις που είναι απρόσιτες σε άλλα παρόμοια προγράμματα. Αρχικά, το πρόγραμμα ήταν γραμμένο σε Perl και είχε πολύπλοκη λογική. Στο EPAM, το πρόγραμμα γράφτηκε ξανά σε Java και βελτιστοποιήθηκε - τώρα εκτελείται 20, αν όχι 30 φορές πιο γρήγορα.

Ο πηγαίος κώδικας του προγράμματος είναι διαθέσιμος στο GitHub.

Έργο #2: 3D Molecule Viewer

Υπάρχουν πολλές εφαρμογές επιτραπέζιου υπολογιστή και web για την απεικόνιση της δομής των μορίων σε 3D. Η κατανόηση του πώς μοιάζει ένα μόριο στο διάστημα είναι ζωτικής σημασίας για την ανάπτυξη φαρμάκων, για παράδειγμα. Ας υποθέσουμε ότι πρέπει να συνθέσουμε ένα φάρμακο που έχει στοχευμένη δράση. Αρχικά, θα χρειαστεί να σχεδιάσουμε το μόριο του φαρμάκου και να βεβαιωθούμε ότι αλληλεπιδρά με τις σωστές πρωτεΐνες όπως θέλουμε. Στη ζωή, τα μόρια είναι τρισδιάστατα, επομένως αναλύονται και με τη μορφή τρισδιάστατων δομών.

Για την τρισδιάστατη προβολή μορίων, το EPAM δημιούργησε ένα διαδικτυακό εργαλείο που αρχικά λειτουργούσε μόνο σε παράθυρο του προγράμματος περιήγησης. Στη συνέχεια, με βάση αυτό το εργαλείο, ανέπτυξαν μια έκδοση που σας επιτρέπει να οπτικοποιείτε μόρια σε γυαλιά εικονικής πραγματικότητας HTC Vive. Τα γυαλιά συνοδεύονται από ελεγκτές που μπορούν να χρησιμοποιηθούν για να περιστρέψουν το μόριο, να το μετακινήσουν, να το τοποθετήσουν δίπλα σε άλλο μόριο ή να περιστρέψουν μεμονωμένα μέρη του μορίου. Το να κάνετε όλα αυτά σε 3D είναι πολύ πιο βολικό από ότι σε μια επίπεδη οθόνη. Αυτό το μέρος του έργου βιοπληροφορικής του ΕΠΑΜ έγινε από κοινού με το τμήμα Virtual Reality, Augmented Reality και Game Experience Delivery.

Το πρόγραμμα μόλις ετοιμάζεται για δημοσίευση στο GitHub, αλλά προς το παρόν υπάρχει ένας σύνδεσμος όπου μπορείτε να δείτε την επίδειξη του.

Μπορείτε να μάθετε πώς φαίνεται η εργασία με την εφαρμογή από το βίντεο.

Έργο #3: NGB γονιδιωματικό πρόγραμμα περιήγησης

Το πρόγραμμα περιήγησης γονιδιώματος οπτικοποιεί μεμονωμένες αναγνώσεις DNA, παραλλαγές και άλλες πληροφορίες που δημιουργούνται από βοηθητικά προγράμματα ανάλυσης γονιδιώματος. Όταν οι αναγνώσεις συγκρίνονται με το γονιδίωμα αναφοράς και εντοπιστούν μεταλλάξεις, ο επιστήμονας πρέπει να ελέγξει εάν οι μηχανές και οι αλγόριθμοι λειτούργησαν σωστά. Το πόσο ακριβείς εντοπίζονται οι μεταλλάξεις στο γονιδίωμα καθορίζει ποια διάγνωση θα δοθεί στον ασθενή ή ποια θεραπεία θα του συνταγογραφηθεί. Επομένως, στην κλινική διάγνωση, ένας επιστήμονας πρέπει να ελέγχει τη λειτουργία των μηχανών και σε αυτό τον βοηθά το γονιδιωματικό πρόγραμμα περιήγησης.

Για τους προγραμματιστές βιοπληροφορικής, το πρόγραμμα περιήγησης γονιδιώματος βοηθά στην ανάλυση περίπλοκων περιπτώσεων για την εύρεση σφαλμάτων στους αλγόριθμους και την κατανόηση του τρόπου βελτίωσής τους.

Το νέο πρόγραμμα περιήγησης γονιδιώματος NGB (New Genome Browser) από το EPAM λειτουργεί στο διαδίκτυο, αλλά δεν είναι κατώτερο σε ταχύτητα και λειτουργικότητα από τα αντίστοιχα του επιτραπέζιου υπολογιστή. Αυτό είναι ένα προϊόν που έλειπε στην αγορά: τα προηγούμενα διαδικτυακά εργαλεία ήταν πιο αργά και μπορούσαν να κάνουν λιγότερα από τα επιτραπέζια εργαλεία. Σήμερα, πολλοί πελάτες επιλέγουν διαδικτυακές εφαρμογές για λόγους ασφαλείας. Το διαδικτυακό εργαλείο σάς επιτρέπει να μην εγκαταστήσετε τίποτα στον υπολογιστή εργασίας του επιστήμονα. Μπορείτε να εργαστείτε με αυτό από οπουδήποτε στον κόσμο μεταβαίνοντας στην εταιρική πύλη. Ένας επιστήμονας δεν χρειάζεται να έχει μαζί του έναν υπολογιστή εργασίας παντού και να κατεβάζει σε αυτόν όλα τα απαραίτητα δεδομένα, από τα οποία μπορεί να υπάρχουν πολλά.

Gennady Zakharov, επιχειρηματικός αναλυτής:

«Εργάστηκα σε βοηθητικά προγράμματα ανοιχτού κώδικα εν μέρει ως πελάτης: έθεσα μια εργασία. Μελέτησα τις καλύτερες λύσεις της αγοράς, ανέλυσα τα πλεονεκτήματα και τα μειονεκτήματά τους και έψαξα πώς να τις βελτιώσω. Χρειαζόμασταν να κάνουμε τις λύσεις web όχι χειρότερες από τις αντίστοιχες επιτραπέζιους υπολογιστές και ταυτόχρονα να προσθέσουμε κάτι μοναδικό σε αυτές.

Στην τρισδιάστατη μοριακή προβολή, αυτό ήταν εργασία με εικονική πραγματικότητα και στο πρόγραμμα περιήγησης γονιδιώματος, ήταν βελτιωμένη η εργασία με παραλλαγές. Οι μεταλλάξεις μπορεί να είναι πολύπλοκες. Οι αλλαγές στα καρκινικά κύτταρα μερικές φορές επηρεάζουν μεγάλες περιοχές. Σε αυτά εμφανίζονται επιπλέον χρωμοσώματα, κομμάτια χρωμοσωμάτων και ολόκληρα χρωμοσώματα εξαφανίζονται ή συνδυάζονται με τυχαία σειρά. Μεμονωμένα κομμάτια του γονιδιώματος μπορούν να αντιγραφούν 10-20 φορές. Τέτοια δεδομένα είναι, πρώτον, πιο δύσκολο να ληφθούν από τις αναγνώσεις και, δεύτερον, πιο δύσκολο να οπτικοποιηθούν.

Έχουμε αναπτύξει έναν οπτικοποιητή που διαβάζει σωστά τις πληροφορίες σχετικά με τέτοιες εκτεταμένες δομικές αναδιατάξεις. Κάναμε επίσης ένα σύνολο οπτικοποιήσεων που, όταν τα χρωμοσώματα έρχονται σε επαφή, δείχνουν εάν δημιουργήθηκαν υβριδικές πρωτεΐνες λόγω αυτής της επαφής. Εάν μια εκτεταμένη παραλλαγή επηρεάζει πολλές πρωτεΐνες, με ένα κλικ μπορούμε να υπολογίσουμε και να δείξουμε τι συμβαίνει ως αποτέλεσμα μιας τέτοιας παραλλαγής, ποιες υβριδικές πρωτεΐνες λαμβάνονται. Σε άλλους οπτικοποιητές, οι επιστήμονες έπρεπε να παρακολουθούν αυτές τις πληροφορίες χειροκίνητα, αλλά στο NGB είναι μια διαδικασία με ένα κλικ».

Πώς να μελετήσετε τη βιοπληροφορική

Έχουμε ήδη πει ότι οι βιοπληροφορικοί είναι υβριδικοί ειδικοί που πρέπει να γνωρίζουν τόσο τη βιολογία όσο και την επιστήμη των υπολογιστών. Η αυτοεκπαίδευση παίζει σημαντικό ρόλο σε αυτό. Φυσικά, το ΕΠΑΜ έχει ένα εισαγωγικό μάθημα στη βιοπληροφορική, αλλά είναι σχεδιασμένο για υπαλλήλους που θα χρειαστούν αυτή τη γνώση στο έργο. Τα μαθήματα γίνονται μόνο στην Αγία Πετρούπολη. Και όμως, αν σας ενδιαφέρει η βιοπληροφορική, υπάρχει η ευκαιρία να μελετήσετε: [Βίντεο][Διαφάνειες]

Η επανάσταση στην πυρηνική φυσική οδήγησε πριν από πολλά χρόνια στη συσσώρευση τεράστιου όγκου δεδομένων που έπρεπε να αποθηκευτούν και να υποβληθούν σε επεξεργασία. Μόνο οι υπολογιστές, και μετά οι υπερ-υπολογιστές, μπορούσαν να το κάνουν αυτό.

Η έκρηξη της γονιδιωματικής των τελευταίων 10-15 ετών συνέχισε αυτή την παράδοση και την πολλαπλασίασε: η βιοϊατρική έρευνα αφορά τον καθένα μας, πράγμα που σημαίνει ότι θα παράγονται όλο και περισσότερα δεδομένα, ειδικά υπό το φως της ιδέας της εξατομικευμένης ιατρικής και της απαιτήσεις των μεγάλων φαρμάκων. Δεν υπάρχει τίποτα να κάνετε εδώ χωρίς γνώσεις υπολογιστών και προϊόντα λογισμικού. Αλλά επιπλέον, πρέπει να γνωρίζετε καλά τι να μελετήσετε, πώς να αναλύσετε τα δεδομένα και πόσο μπορείτε να τα εμπιστευτείτε. Τρόπος αποθήκευσης και επεξεργασίας. Πού να κάνετε αίτηση και πού να χρησιμοποιήσετε.

Η διάλεξη καλύπτει τα περισσότερα από αυτά τα «πώς». Στόχος του Alla είναι να μιλήσει για τη σημασία και το εύρος των εφαρμογών της βιοπληροφορικής.

2. Διαδικασία μετάλλαξης και μέθοδοι για τη μελέτη της (Alexey Kondrashov, Κρατικό Πανεπιστήμιο της Μόσχας)

[Βίντεο][Διαφάνειες]

Η διαδικασία μετάλλαξης είναι ο πρώτος από τους δύο απαραίτητους παράγοντες στη δαρβινική εξέλιξη. Η διάλεξη συζητά τα αίτια και τους μηχανισμούς των μεταλλάξεων, τις μεθόδους μέτρησης των παραμέτρων της διαδικασίας μετάλλαξης σε σύντομους, μεσαίους και μεγάλους χρόνους, δεδομένα για τα ποσοστά μετάλλαξης και τα απλούστερα μοντέλα της επίδρασης της μετάλλαξης στη γενετική δομή ενός πληθυσμού.

3. Φυσική επιλογή και μέθοδοι μελέτης της (Alexey Kondrashov, Κρατικό Πανεπιστήμιο της Μόσχας)

[Βίντεο][Διαφάνειες]

Η φυσική επιλογή είναι ο δεύτερος από τους δύο απαραίτητους παράγοντες στη δαρβινική εξέλιξη. Η διάλεξη συζητά τα αίτια και τους μηχανισμούς επιλογής, τις μεθόδους και τις παραμέτρους που χρησιμοποιούνται για την περιγραφή και τη μελέτη της, δεδομένα για την επιλογή στη φύση και τα απλούστερα μοντέλα της επίδρασης της επιλογής σε έναν πληθυσμό.

4. Παιδική ανάπτυξη και βιοπληροφορική: προβλήματα και λύσεις (Elena Grigorenko, Πανεπιστήμιο Yale)

[Βίντεο][Διαφάνειες]

Η διάλεξη μιλά για πολλές «διεπαφές» μεταξύ των αναπτυξιακών επιστημών και της βιοπληροφορικής.
Συζητούνται τα προβλήματα της προγεννητικής διάγνωσης και της προγεννητικής αλληλουχίας, καθώς και της αλληλουχίας των εξωμάτων των νεογνών.

Το άρθρο περιγράφει τη μελέτη της επίδρασης του πρώιμου αναπτυξιακού περιβάλλοντος στην κατάσταση του μεθυλώματος και τη γονιδιωματική αιτιολογία των αναπτυξιακών διαταραχών της παιδικής ηλικίας. Τέλος, εξετάζονται ηθικά ζητήματα που σχετίζονται με τη χρήση γονιδιωματικών πληροφοριών στη λήψη διαγνωστικών και εξατομικευμένων αποφάσεων σχετικά με την ανάπτυξη του παιδιού.

5. Αλληλουχία επόμενης γενιάς: αρχές, ευκαιρίες και προοπτικές (Maria Logacheva, Κρατικό Πανεπιστήμιο της Μόσχας)

[Βίντεο][Διαφάνειες]

Η αλληλουχία επόμενης γενιάς (NGS) έχει μεταμορφώσει πολλούς τομείς της βιολογικής και βιοϊατρικής έρευνας. Επιτρέπει την απόκτηση αλληλουχιών γονιδίων και γονιδιωμάτων προηγουμένως μη μελετημένων ειδών σχετικά γρήγορα και φθηνά, και επίσης, χρησιμοποιώντας υλικό από μεγάλο αριθμό ατόμων του ίδιου είδους, τον εντοπισμό ενδοειδικής μεταβλητότητας και την αναζήτηση γονιδίων που σχετίζονται με χαρακτηριστικά ενδιαφέροντος. Εκτός από τον πραγματικό προσδιορισμό των αλληλουχιών του γονιδιώματος, το NGS επιτρέπει τη λεπτομερή ανάλυση της γονιδιακής έκφρασης σε διαφορετικούς ιστούς του σώματος ή υπό διαφορετικές συνθήκες και χρησιμοποιείται ευρέως σε επιγενετικές μελέτες.

Η διάλεξη παρέχει μια επισκόπηση των κύριων μεθόδων αλληλούχισης, των φυσικοχημικών αρχών τους, των χαρακτηριστικών της προετοιμασίας του δείγματος, των χαρακτηριστικών των δεδομένων που λαμβάνονται, του κόστους και των τυπικών σφαλμάτων. Ιδιαίτερη προσοχή δίνεται στην εφαρμογή διαφορετικών μεθόδων για την επίλυση βιολογικών προβλημάτων και δίνονται συστάσεις για το σχεδιασμό πειραμάτων που σχετίζονται με το NGS.

6. Δομική βιολογία των πρωτεϊνών: ανασκόπηση προβλημάτων και προσεγγίσεων (Pavel Yakovlev, BIOCAD)

[Βίντεο][Διαφάνειες]

Η χρήση μόνο πρωτογενών αλληλουχιών μας επιτρέπει να λύσουμε τις περισσότερες ερωτήσεις που σχετίζονται με τα νουκλεϊκά οξέα (DNA και RNA). Κατά τη μελέτη των λειτουργιών των πρωτεϊνών, η γνώση μόνο της κύριας αλληλουχίας δεν επιτρέπει πλέον την επίλυση των περισσότερων προβλημάτων. Ποιες πρωτεΐνες θα αλληλεπιδράσουν μεταξύ τους και πόσο έντονα; Η αντικατάσταση ενός αμινοξέος θα αλλάξει τη λειτουργία της πρωτεΐνης; Πώς να αφαιρέσετε τις παρενέργειες από τη φαρμακευτική πρωτεΐνη ή να αυξήσετε την αποτελεσματικότητά της; Ο τομέας της βιοπληροφορικής, που αναπτύσσει αλγόριθμους για τη μοντελοποίηση του χωρικού σχήματος των πρωτεϊνών και των αλληλεπιδράσεών τους, στοχεύει να απαντήσει σε αυτά τα ερωτήματα.

7. De novo συναρμολόγηση μεταγραφωμάτων (Artem Kasyanov, MIPT)

[Βίντεο][Διαφάνειες]

Λόγω της σημαντικής μείωσης του κόστους και της αύξησης της παραγωγικότητας των τεχνολογιών, ο αριθμός των έργων που αφιερώνονται στην de novo αλληλουχία των γονιδιωμάτων μη-μοντέλων οργανισμών έχει αυξηθεί σημαντικά. Σε ορισμένες περιπτώσεις, η de novo αλληλουχία και η συναρμολόγηση του γονιδιώματος είναι δύσκολη - για παράδειγμα, εάν είναι μεγάλο σε μέγεθος. Σε τέτοιες περιπτώσεις καταφεύγουν στη μελέτη της μεταγραφής. Επίσης, η de novo ανάλυση του μεταγραφώματος μπορεί να είναι απαραίτητη στην περίπτωση της μελέτης ειδών με μεγάλο αριθμό εναλλακτικά ματισμένων γονιδίων, καθώς ακόμη και αν υπάρχει διαθέσιμο γονιδίωμα, είναι αρκετά δύσκολο να προσδιοριστεί ο πλήρης κατάλογος των ισομορφών.

Η διάλεξη είναι αφιερωμένη στα ζητήματα της συγκέντρωσης μεταγραφικών δεδομένων απουσία γονιδιώματος. Εξετάζονται θέματα όπως γραφήματα συναρμολόγησης, προγράμματα τριάδας και νέων, σύγκριση και ανάλυση συγκροτημάτων, συναρμολόγηση μεταγραφωμάτων πολυπλοειδών οργανισμών.

8. Εξέλιξη αλγορίθμων συναρμολόγησης γονιδιώματος (Anton Bankevich, SPbAU RAS)

[Βίντεο][Διαφάνειες]

Αυτή τη στιγμή, υπάρχουν ήδη αρκετές γενιές μεθόδων προσδιορισμού αλληλουχίας DNA. Ωστόσο, οι νέες τεχνολογίες δεν έχουν νόημα χωρίς αλγόριθμους που μπορούν να επεξεργαστούν τα αποτελέσματά τους. Οι συνεχώς αναδυόμενες νέες μέθοδοι αλληλουχίας θέτουν νέες αλγοριθμικές προκλήσεις. Ένα από τα πιο σημαντικά από αυτά τα καθήκοντα είναι η συναρμολόγηση γονιδιώματος. Η διάλεξη μιλά για την εξέλιξη των μεθόδων αλληλούχισης και των αλγοριθμικών προσεγγίσεων για τη συναρμολόγηση του γονιδιώματος που έχουν προκύψει και συνεχίζουν να εμφανίζονται με κάθε βήμα αυτής της εξέλιξης.

9. Εισαγωγή στη μοριακή βιολογία και γενετική (Pavel Dobrynin, Κρατικό Πανεπιστήμιο Αγίας Πετρούπολης)

[Βίντεο][Διαφάνειες]

Η διάλεξη είναι αφιερωμένη στη δομή και την οργάνωση του DNA σε προκαρυώτες και ευκαρυώτες, τους μοριακούς μηχανισμούς που είναι υπεύθυνοι για τη διατήρηση και την αναπαραγωγή του γενετικού υλικού. Αναλύονται οι κύριοι μηχανισμοί πίσω από τη γενετική μεταβλητότητα και οι επιλογές για την εφαρμογή του γενετικού υλικού.

10. Το πρόβλημα της πολλαπλής τοπικής ευθυγράμμισης και κατασκευής συνθετικών μπλοκ (Ilya Minkin, Pennsylvania State University)

[Βίντεο][Διαφάνειες]

Η διάλεξη συζητά δύο παρόμοια αλγοριθμικά προβλήματα στη συγκριτική γονιδιωματική: πολλαπλή τοπική ευθυγράμμιση και κατασκευή συνθετικών μπλοκ. Αυτοί οι αλγόριθμοι παίζουν ζωτικό ρόλο στη σύγκριση πλήρων αλληλουχιών γονιδιώματος. Μιλάει για τη διατύπωση προβλημάτων και τις βασικές ιδέες πάνω στις οποίες χτίζονται κάποιοι σύγχρονοι αλγόριθμοι.

11. Γιατί και πώς να κάνετε παρουσιάσεις (Andrey Afanasyev, iBinom)

[Βίντεο][Διαφάνειες]

Η διάλεξη συζητά τους τύπους παρουσιάσεων, γιατί χρειάζονται πραγματικά, και λέει πώς να μιλήσετε, ώστε το κοινό να καταλαβαίνει τα πάντα και να μην αποκοιμιέται, καθώς και ποια λάθη πρέπει να αποφεύγονται και ποιον να παίρνετε ως παράδειγμα κατά την προετοιμασία της ομιλίας σας .

12. Επιχειρήσεις στη βιοπληροφορική (Andrey Afanasyev, iBinom)

[Βίντεο][Διαφάνειες]

Η διάλεξη λέει ποιες εταιρείες βιοπληροφορικής υπάρχουν στη Ρωσία και στον κόσμο, ποιος τις δημιούργησε και πώς ακριβώς βγάζουν χρήματα.
Συζητήθηκαν σχέδια σημαντικών παραγόντων και τάσεις στον κλάδο.

Στο τελευταίο μέρος της διάλεξης, ο Andrey δίνει τροφή για σκέψη σχετικά με την οργάνωση της δικής σας startup ή την επιλογή ενός νέου τόπου εργασίας.

13. Προοπτικές και προβλήματα της βιολογίας συστημάτων (Ilya Serebriysky, Fox Chase Cancer Center)

[Βίντεο][Διαφάνειες]

Η διάλεξη έχει σκοπό να δώσει μια γενική ιδέα για τις συστημικές ιδιότητες των βιολογικών αντικειμένων. Ο Ilya Serebriysky μιλά για τα κύρια συστατικά της βιολογίας συστημάτων, την αλληλεπίδραση και την κατασκευή μοντέλων, τα κύρια προβλήματα στη βιολογία συστημάτων και τις προσπάθειες επίλυσής τους. Συζητούνται ορισμένες εξελίξεις στη βιολογία συστημάτων (κυρίως από τον τομέα της ογκολογίας). Επίσης, εξετάζονται οι διαθέσιμοι πόροι για τη βιολογία συστημάτων (TCGA/cBioPortal, CCLE).

14. Εργαστήριο στη βιολογία συστημάτων (Ilya Serebriysky, Fox Chase Cancer Center)

[Βίντεο][Διαφάνειες]

Το μάθημα είναι αφιερωμένο στη δημιουργία δικτύων αλληλεπίδρασης που βασίζονται σε βάσεις δεδομένων που είναι διαθέσιμες στο κοινό. Χρησιμοποιήθηκαν βάσεις δεδομένων και διαδικτυακές υπηρεσίες όπως Entrez, GeneMANIA, BioGRID και άλλες. Εξετάζονται διάφορες μέθοδοι για την οπτικοποίηση δικτύων αλληλεπίδρασης, ιδίως χρησιμοποιώντας το πρόγραμμα Cytoscape.

15. Μεταγονιδιωματική (Alla Lapidus, SPbAU RAS)

[Βίντεο][Διαφάνειες]

Τα μικρόβια είναι παντού, τα μικρόβια κυβερνούν τον κόσμο, αλλά δεν μπορούν να συναντηθούν όλα σε εργαστηριακές συνθήκες. Δεν ξέρουμε πώς να μεγαλώσουμε τη συντριπτική τους πλειοψηφία, πράγμα που σημαίνει ότι πρέπει να απομακρυνθούν με κάποιο τρόπο από το φυσικό τους περιβάλλον - γη, νερό, κάτω από τις ρίζες των δέντρων κ.λπ., όπου ζουν σε μεγάλες ομάδες.

Η μεταγονιδιωματική βοηθά σε αυτές τις πολύ συγκεχυμένες μελέτες. Βοηθά επίσης να ταΐσει, να ζεστάνει, να περιθάλψει ανθρώπους και να πιάσει εγκληματίες. Αυτή η διάλεξη ήταν αφιερωμένη σε όλα αυτά και τη βιοπληροφορική στη μεταγονιδιωματική.

16. Το πρόβλημα της δοκιμής πολλαπλών στατιστικών υποθέσεων (Anton Korobeinikov, State University St. Petersburg, St. Petersburg Agrarian University RAS)

[Βίντεο][Διαφάνειες]

Η διάλεξη εξετάζει το κλασικό πρόβλημα του ελέγχου πολλαπλών υποθέσεων ταυτόχρονα. Προβλήματα αυτού του είδους προκύπτουν συνεχώς, για παράδειγμα, κατά τη διάρκεια αναζητήσεων συσχέτισης σε όλο το γονιδίωμα ή ανάλυσης δεδομένων μικροσυστοιχιών. Εξετάζονται πιθανές λύσεις σε αυτό το πρόβλημα, ξεκινώντας από την κλασική προσέγγιση Bonferroni και τελειώνοντας με μεθόδους που σας επιτρέπουν να ελέγχετε το FDR (false discovery rate).

17. Πώς να χρησιμοποιήσετε τα στατιστικά σωστά και λανθασμένα (Nikita Alekseev, St. Petersburg State University, George Washington University)

[Βίντεο][Διαφάνειες]

Η διάλεξη είναι αφιερωμένη στα λάθη στη χρήση στατιστικών και στους τρόπους αποτροπής τους. Συγκεκριμένα, δίνεται η απάντηση στο ερώτημα: σε ποιες περιπτώσεις μπορούν να χρησιμοποιηθούν τυπικά κριτήρια για τη σύγκριση τυπικών εκπροσώπων ενός δείγματος και τι πρέπει να γίνει εάν τα τυπικά κριτήρια δεν είναι κατάλληλα;

18. Μαθηματικά μοντέλα ρύθμισης γονιδιακής έκφρασης (Maria Samsonova, Κρατικό Πολυτεχνείο Αγίας Πετρούπολης)

[Βίντεο][Διαφάνειες]

Η κατανόηση των λεπτών μηχανισμών ρύθμισης της γονιδιακής δραστηριότητας είναι απαραίτητη προϋπόθεση για την αποκρυπτογράφηση των μηχανισμών της νόσου στον άνθρωπο. Δυστυχώς, σήμερα δεν υπάρχει τέτοια κατανόηση: δεν μπορούμε να εξηγήσουμε ικανοποιητικά πώς ομάδες παραγόντων μεταγραφής αλληλεπιδρούν μεταξύ τους, με πρωτεΐνες χρωματίνης, άλλες πρωτεΐνες προσαρμογής και το σύμπλεγμα πολυμεράσης RNA, ούτε πώς και γιατί αυτό ή εκείνο το τμήμα της αλληλουχίας DNA μπορεί να ελέγξει ένα σύνθετο, χωρικά περιορισμένο και χρονικά καθορισμένο πρότυπο γονιδιακής έκφρασης.

Η μαθηματική μοντελοποίηση βοηθά στην κατανόηση των μηχανισμών γονιδιακής ρύθμισης περιγράφοντας τη διαδικασία μηχανιστικά και ποσοτικά. Η διάλεξη συζητά τις δύο πιο κοινές προσεγγίσεις για τη μοντελοποίηση της έκφρασης γονιδίων - με βάση τις μη γραμμικές εξισώσεις αντίδρασης-διάχυσης και τη θερμοδυναμική ισορροπία. Τα στάδια κατασκευής τέτοιων μοντέλων εξετάζονται διαδοχικά και δίνονται παραδείγματα χρήσης τους για τη δημιουργία νέας γνώσης.

19. Ημι-τοπική και τοπική στοίχιση ακολουθίας (Alexander Tiskin, University of Warwick)

[Βίντεο][Διαφάνειες]

Ο υπολογισμός της μακρύτερης κοινής υποακολουθίας (LCS) δύο χορδών είναι ένα από τα κλασικά αλγοριθμικά προβλήματα, με εκτεταμένες εφαρμογές τόσο στην επιστήμη των υπολογιστών όσο και στην υπολογιστική βιολογία, όπου είναι γνωστή ως "σφαιρική στοίχιση ακολουθιών". Πολλές εφαρμογές απαιτούν μια γενίκευση αυτού του προβλήματος, το οποίο ονομάζουμε ημι-τοπικό υπολογισμό LCS ή "ημι-τοπική στοίχιση". Σε αυτήν την περίπτωση, πρέπει να υπολογίσετε το LCS μεταξύ μιας συμβολοσειράς και όλων των υποσυμβολοσειρών μιας άλλης συμβολοσειράς ή/και μεταξύ όλων των προθεμάτων μιας συμβολοσειράς και όλων των επιθημάτων μιας άλλης συμβολοσειράς. Εκτός από τον σημαντικό ρόλο αυτού του γενικευμένου προβλήματος στους αλγόριθμους χορδών, έχει απροσδόκητες συνδέσεις με ημιομαδική άλγεβρα και υπολογιστική γεωμετρία, με δίκτυα σύγκρισης, καθώς και πρακτικές εφαρμογές στην υπολογιστική βιολογία. Επιπλέον, η εργασία του υπολογισμού ημι-τοπικού LCS μπορεί να χρησιμοποιηθεί ως μια ευέλικτη και αποτελεσματική προσέγγιση για την (πλήρως) τοπική ευθυγράμμιση βιολογικών ακολουθιών.

Η διάλεξη παρουσιάζει μια αποτελεσματική λύση στο πρόβλημα του υπολογισμού ημιτοπικού LCS και παρέχει μια επισκόπηση των κύριων σχετικών αποτελεσμάτων και εφαρμογών. Αυτά περιλαμβάνουν δυναμική υποστήριξη LCS. γρήγορος υπολογισμός των κλίκων σε ορισμένα ειδικά γραφήματα. γρήγορη σύγκριση συμπιεσμένων χορδών. παράλληλος υπολογισμός σε χορδές.

20. Ανάλυση οικογενειών μοριακών αλληλουχιών (Sergey Nurk, SPbAU RAS)

[Βίντεο][Διαφάνειες]

Κατά την επίλυση ποικίλων προβλημάτων, από την αναζήτηση ρυθμιστικών μοτίβων μέχρι την πρόβλεψη πρωτεϊνικών λειτουργιών, οι βιοπληροφορικοί πρέπει να συνεργάζονται με ολόκληρες «οικογένειες» εξελικτικά σχετικών αλληλουχιών νουκλεοτιδίων ή αμινοξέων. Η διάλεξη συζητά διάφορους τρόπους αναπαράστασης τέτοιων οικογενειών, που χρησιμοποιούνται σε δημοφιλή εργαλεία και βάσεις δεδομένων βιοπληροφορικής. Περιγράφεται ο τρόπος αποκρυπτογράφησης του μοτίβου PROSITE και η ερμηνεία του λογότυπου της ακολουθίας, ποια είναι η διαφορά μεταξύ προφίλ HMM και PSSM, καθώς και τρόπος αποφυγής λαθών κατά την κατασκευή τους και την ανάλυση των αποτελεσμάτων.

21. Επιγονιδιωματική, RNA και όλα αυτά (Andrey Mironov, IITP RAS)

[Βίντεο][Διαφάνειες]

Η διάλεξη παρέχει μια επισκόπηση της έννοιας της επιγενετικής. Λαμβάνονται υπόψη τα επίπεδα δομικής οργάνωσης της χρωματίνης, περιγράφονται διάφορες επιγονιδιωματικές τροποποιήσεις: τροποποιήσεις ιστόνης, μεθυλίωση μοτίβων CpG. Η επιρροή τους στη γονιδιακή έκφραση συζητείται.
Εξετάζεται επίσης ο ρόλος των επιγονιδιωματικών τροποποιήσεων στο μάτισμα, την αποτύπωση κ.λπ.

Περιγράφεται το σύστημα XIST (X-inactivation specific transcript), τα αντιπληροφοριακά RNA, το μάτισμα και η εξαρτώμενη από RNA ρύθμιση.
Εξετάζονται επίσης μοντέλα για τη μελέτη των επιγονιδιωματικών τροποποιήσεων.

22. Έλεγχος ποιότητας δεδομένων NGS (Konstantin Okonechnikov, Max Planck Institute for Infection Biology)

[Βίντεο][Διαφάνειες]

Η διάλεξη περιγράφει σφάλματα αλληλουχίας χαρακτηριστικά των τεχνολογιών NGS. Παραδείγματα τέτοιων σφαλμάτων είναι η ενίσχυση PCR, σφάλματα ανάγνωσης ειδικά για την αλληλουχία, ανομοιόμορφη κατανομή της σύνθεσης GC και άλλα. Συζητούνται διάφορες μέθοδοι για την αξιολόγηση αυτών των σφαλμάτων και τη λήψη τους υπόψη στην ανάλυση. Τίθεται το ζήτημα των πρακτικών μεθόδων λύσης και των υπαρχόντων εργαλείων λογισμικού.

23. Ποιοτικός έλεγχος δεδομένων NGS, σεμινάριο (Konstantin Okonechnikov, Max Planck Institute for Infection Biology)

[Βίντεο][Διαφάνειες]

Κατά τη διάρκεια του εργαστηρίου, οι συμμετέχοντες έμαθαν να εφαρμόζουν τις δεξιότητες προγραμματισμού στον ποιοτικό έλεγχο των δεδομένων NGS. Συζητήθηκαν μορφές δεδομένων BAM/SAM, βιβλιοθήκες pysam και pyplot και θεμελιώδεις έννοιες. Συγκεκριμένα, συζητούνται παραδείγματα υπολογισμού της σύνθεσης GC, εκτίμησης της συχνότητας των διπλασιασμών, της κατανομής μήκους εισαγωγής και του υπολογισμού της κάλυψης στα παράθυρα.

24. Πρακτική αλληλουχία RNA (Konstantin Okonechnikov, Max Planck Institute for Infection Biology)

[Βίντεο][Διαφάνειες 1] [Διαφάνειες 2]

Το σεμινάριο ασχολήθηκε με το πρακτικό πρόβλημα της ανάλυσης δεδομένων RNA-seq.
Στη μορφή παρουσίασης και πρακτικής, συζητήθηκαν και επιδείχθηκαν μέθοδοι: ευθυγράμμιση ανάγνωσης, αρχικός ποιοτικός έλεγχος, αγωγοί για τη μελέτη γονιδιακής έκφρασης DESeq και Μανικετόκουμπα, εύρεση ισομορφών μεταγραφής, αναζήτηση υβριδικών γονιδίων.

25. Βιοπληροφορικές προσεγγίσεις στη μελέτη και θεραπεία του καρκίνου χρησιμοποιώντας το παράδειγμα του καρκίνου του πνεύμονα (Maria Shutova, IOGEN RAS)

[Βίντεο][Διαφάνειες]

Ο καρκίνος είναι μια από τις πιο κοινές και επικίνδυνες ασθένειες. Ονομάζεται «νόσος του γονιδιώματος» για την τεράστια συμβολή συσσωρευμένων και νέων μεταλλάξεων στην εμφάνιση και την ανάπτυξή της. Είναι γνωστό ότι όχι μόνο η κατάσταση του γονιδιώματος, αλλά και η μεταγραφική και ακόμη και η επιγενετική κατάσταση των πρωτοπαθών καρκινικών κυττάρων, καθώς και η πολύπλοκη ομοιόσταση ενός αναπτυσσόμενου όγκου επηρεάζουν άμεσα τις ιδιότητές του και, κυρίως, την ευαισθησία στη θεραπεία. Η μόνη ευκαιρία για να κατανοήσουμε αυτό το κουβάρι αλληλοεξαρτώμενων παραγόντων παρέχεται από τη βιοπληροφορική. Η διάλεξη εξετάζει τα κύρια ερωτήματα που σχετίζονται με τη μελέτη του σχηματισμού όγκων και πιθανούς τρόπους απάντησης χρησιμοποιώντας προσεγγίσεις βιοπληροφορικής.

26. Νέα omics στην ανθρώπινη βιολογία: μεταβολομική και λιπιδομική (Philip Khaitovich, Skoltech)

[Βίντεο][Διαφάνειες]

Η αλληλούχιση του ανθρώπινου γονιδιώματος, η μελέτη των ανθρώπινων γενετικών παραλλαγών, η αλληλουχία του ανθρώπινου μεταγονιδιώματος, η μεταγραφική ανάλυση του ανθρώπινου ιστού - όλες αυτές οι βιολογικές μέθοδοι, όταν εφαρμόζονται σε μεγάλα δεδομένα, έχουν δώσει στους επιστήμονες πολλές πολύτιμες πληροφορίες για το τι διακρίνει τον άνθρωπο από τα άλλα ζώα.

Αυτή η διάλεξη είναι αφιερωμένη σε νέες «ωμικές» που μας επιτρέπουν να απαντάμε σε ερωτήσεις σχετικά με το ανθρώπινο σώμα κατά τη μελέτη του εγκεφάλου και άλλων ιστών - μεταβολομική και λιπιδομική.

27. Συναρμολόγηση γονιδιώματος: μια ματιά στο αύριο (Andrey Przhibelsky, SPbAU RAS)

[Βίντεο][Διαφάνειες]

Τα τελευταία χρόνια, οι τεχνολογίες αλληλουχίας επόμενης γενιάς έχουν κάνει ένα σημαντικό βήμα προς τα εμπρός: εμφανίστηκαν τα IonTorrent και Pacific Biosciences, η Ilumina δημιούργησε μια σειρά από νέα πρωτόκολλα. Όμως, όπως αποδεικνύεται, όλα αυτά δεν αρκούν για να θεωρηθεί λυμένο το πρόβλημα της συναρμολόγησης του γονιδιώματος. Η μετάβαση από την εξαγωγή DNA σε ένα πλήρες γονιδίωμα απαιτεί συνήθως δεκάδες διαφορετικούς ειδικούς, εκατοντάδες χιλιάδες δολάρια και χρόνια εργασίας. Ως εκ τούτου, σήμερα αυτό το έργο παραμένει σχετικό τόσο από την άποψη της βιοτεχνολογίας όσο και από την άποψη της βιοπληροφορικής. Η διάλεξη εξετάζει τις πιο πρόσφατες ανακαλύψεις στις μεθόδους συναρμολόγησης γονιδιώματος, τους πιο πρόσφατους τύπους δεδομένων που μπορεί να επιτρέψουν την προώθηση αυτής της εργασίας στο επόμενο επίπεδο και τις προοπτικές για τη γονιδιωματική στο εγγύς μέλλον.

Αντί για συμπέρασμα

  • εκπαίδευση
  • θερινό σχολείο
  • Προσθέστε ετικέτες

    Η βιολογία έχει γνωρίσει μια νέα γέννηση περισσότερες από μία φορές: αφού ήταν αρχικά μια επιστήμη «πεδίου» που μελέτησε ζώα και φυτά, τον 20ο αιώνα μετακινήθηκε σημαντικά στο εργαστήριο, επικεντρώνοντας τα μοριακά θεμέλια της ζωής και της κληρονομικότητας. Στον 21ο αιώνα, η ιστορία έχει προχωρήσει: πολλά πειράματα πραγματοποιούνται πλέον σε υπολογιστή και το υλικό για μελέτη είναι οι πρωτεΐνες και οι αλληλουχίες DNA, καθώς και πληροφορίες σχετικά με τη δομή των βιολογικών μορίων. Σε αυτό το άρθρο, θα δώσουμε μερικές συμβουλές σε όσους αποφάσισαν να συνδέσουν την καριέρα τους με την υπολογιστική βιολογία, ώστε να γίνουν βιοπληροφορικός.

    Σημείωση!

    Χορηγός αυτού του άρθρου είναι ο Lev Makarov.

    Σήμερα, κανείς στον κόσμο δεν θα εκπλαγεί από το όνομα του επαγγέλματος «υπολογιστικός βιολόγος» ή «βιοπληροφορικός», αν και μόλις πριν από μερικές δεκαετίες αυτοί οι τομείς δραστηριότητας - βιολογία και υπολογιστές - έμοιαζαν εντελώς μη αλληλοκαλυπτόμενοι, και μάλιστα λίγοι δεκαετίες πριν δεν υπήρχαν καθόλου υπολογιστές. Επιπλέον, τώρα αυτός ο όρος περιλαμβάνει ήδη αρκετά ξεχωριστά επαγγέλματα που απαιτούν διαφορετική εκπαίδευση και διαφορετικές απόψεις για την επιστήμη και τη θέση της στη ζωή: βιοπληροφορικός, ειδικός επεξεργασίας πληροφοριών, προγραμματιστής βάσεων δεδομένων, προγραμματιστής, επιμελητής οντολογίας, ειδικός μοριακής μοντελοποίησης - όλοι αυτοί κάντε διαφορετικά πράγματα, αν και από έξω θα είναι δύσκολο να τα ξεχωρίσετε. Όλα αυτά μας λένε χωρίς υπαινιγμούς ότι οι υπολογιστές έχουν εδραιωθεί σταθερά στην καθημερινή ζωή των βιολόγων, και αυτό δεν είναι μόνο το ηλεκτρονικό ταχυδρομείο και το Facebook, αλλά και πολλές πιο εξειδικευμένες δεξιότητες, χωρίς τις οποίες ένας ερευνητής δεν μπορεί να κάνει χωρίς τώρα και στο μέλλον (βλ. πλαϊνή γραμμή). Είτε είστε φοιτητής είτε καθηγητής, δεν είναι ποτέ αργά για να αρχίσετε να βελτιώνετε τις δεξιότητές σας στη βιοπληροφορική!

    Για λόγους σαφήνειας, θα αποκαλούμε βιοπληροφορικούς όλους τους βιολόγους στην εργασία των οποίων οι υπολογιστές παίζουν μεγαλύτερο ρόλο από μια απλή γραφομηχανή, αν και στη ρωσική παράδοση είναι στην πραγματικότητα κάτω από βιοπληροφορικοίεννοεί εκείνους που μελετούν τα πρότυπα των βιολογικών κειμένων - αλληλουχίες πρωτεϊνών και DNA - και η μοντελοποίηση της δυναμικής και των ιδιοτήτων των βιομορίων, για παράδειγμα, ονομάζεται συχνότερα μοριακή μοντελοποίηση.

    «Ξηρά» βιολογία

    Το "Biomolecule" δίνει μεγάλη προσοχή στον υπολογιστή ή, όπως ονομάζεται επίσης, "ξηρή" βιολογία - ένας σύγχρονος κλάδος της βιολογικής επιστήμης στον οποίο το κύριο εργαλείο του ερευνητή είναι ένας συνηθισμένος υπολογιστής. (Αλήθεια, συχνά πρέπει να καταφύγουμε στη βοήθεια όχι πολύ συνηθισμένων - σούπερυπολογιστές.) Στον ιστότοπό μας υπάρχει μια ειδική ενότητα αφιερωμένη σε αυτή την επιστήμη - "Ξηρή" βιολογία", - την οποία καλούμε τον ενδιαφερόμενο αναγνώστη να εξοικειωθεί. Ειδικότερα, ασχολείται με την έννοια της ποσοτικής βιολογίας, τους τρόπους υπολογισμού της χωρικής δομής και δυναμικής των βιολογικών μορίων (με ιδιαίτερη έμφαση στις βιομεμβράνες και τις μεμβρανικές πρωτεΐνες και υποδοχείς), καθώς και την εμφάνιση μοριακών γραφικών. Πρόσφατα άρθρα έχουν επισημάνει μεθόδους για τη μελέτη της εξέλιξης από μοριακά δεδομένα, καθώς και μια νέα έννοια της «ξηρής» βιολογίας που προβλέπει το μέλλον της βιολογίας ως επιστήμης.

    Σε αυτό το άρθρο, βασισμένο σε μετάφραση ενός πρόσφατου δοκιμίου στο περιοδικό Nature Biotechnology, παρέχουμε μερικές συμβουλές για επίδοξους βιοπληροφορικούς - ερευνητές που σχεδιάζουν να μελετήσουν τη ζωή χωρίς να φύγουν από το πληκτρολόγιο.

    Γλωσσάρι όρων υπολογιστών

    Η γραμμή εντολών είναι ένας τρόπος αλληλεπίδρασης με έναν υπολογιστή χωρίς ποντίκι ή κουμπιά, αλλά μόνο πληκτρολογώντας ειδικές εντολές σε ένα παράθυρο τερματικού και λειτουργώντας με πληροφορίες που είναι αποθηκευμένες σε αρχεία κειμένου. Τις περισσότερες φορές, η γραμμή εντολών σχετίζεται με υπολογιστές που εκτελούν UNIX/Linux, αν και τα Windows TM και Mac OS TM τα διαθέτουν επίσης. Ένα σύμπλεγμα είναι ένα δίκτυο υπολογιστών που είναι ενωμένοι σε ένα ενιαίο δίκτυο υψηλής ταχύτητας που μπορεί να χρησιμοποιηθεί για την επίλυση εργασιών έντασης πόρων. Τυπικά εξοπλισμένο με σύστημα προγραμματισμού εργασιών και αποστολής πόρων. Ένας αγωγός είναι ένας τρόπος επίλυσης συγκεκριμένων προβλημάτων επεξεργασίας δεδομένων συνδυάζοντας περισσότερα προγράμματα γενικής χρήσης σε μια αλυσίδα, έτσι ώστε η έξοδος πληροφοριών από το ένα πρόγραμμα να εισάγεται στο επόμενο. Ο πηγαίος κώδικας (πηγαίος κώδικας) είναι το κείμενο ενός προγράμματος σε μία από τις γλώσσες προγραμματισμού. Οταν διερμηνευμένες γλώσσεςτο κείμενο είναι ένα πρόγραμμα από μόνο του, αλλά ένα πρόγραμμα γραμμένο μεταγλωττισμένη γλώσσα, πρώτα πρέπει να το μετατρέψετε σε δυαδικό εκτελέσιμο αρχείο (μεταγλώττιση). Λογισμικό (λογισμικό), αυτό είναι ήδη σαφές - θα προσθέσουμε μόνο ότι αυτό είναι ένα σύνολο οδηγιών για έναν υπολογιστή που επιτρέπει στον χρήστη (ή στον προγραμματιστή) να λύσει τις εργασίες που χρειάζεται - από την πληκτρολόγηση κειμένων στο Word έως την ανάλυση ενός γενετικού ακολουθία ή υπολογισμός μοριακής δυναμικής. Ένα σενάριο είναι ένας τύπος προγράμματος που γράφεται σε μια διερμηνευμένη γλώσσα (και επομένως δεν απαιτεί ειδική μεταγλώττιση) και χρησιμοποιείται από βιοπληροφορικούς για να αυτοματοποιήσουν τα καθήκοντά τους για την υλοποίηση του παραδείγματος μετακομιστής. Το σύστημα ελέγχου έκδοσης είναι ένα σύστημα υπολογιστή για τη διαχείριση της ανάπτυξης πολύπλοκων προγραμμάτων, συμπεριλαμβανομένων δεκάδων ή εκατοντάδων αρχείων πηγής, χιλιάδων ή και εκατομμυρίων γραμμών κώδικα, και που αναπτύχθηκε από πολλούς ή πολλούς προγραμματιστές. Επιτρέπει στο πρόγραμμα να μην «σέρνεται» με την πάροδο του χρόνου και επιτρέπει στους προγραμματιστές να αλλάζουν εύκολα μεταξύ διαφορετικών εκδόσεων και «κλάδων» ανάπτυξης. Το UNIX/Linux είναι μια οικογένεια λειτουργικών συστημάτων (OS) αρχικά πολλαπλών χρηστών και πολλαπλών εργασιών. Χρησιμοποιείται συχνότερα σε διακομιστές και συμπλέγματα υπολογιστών, αλλά μπορεί επίσης να εγκατασταθεί σε προσωπικούς υπολογιστές ως εναλλακτική λύση σε εμπορικά λειτουργικά συστήματα (όπως τα Windows). Ένα ιδιαίτερο χαρακτηριστικό αυτών των λειτουργικών συστημάτων είναι το μοντέλο ανάπτυξης - δεδομένου ότι τα λειτουργικά συστήματα είναι ανοιχτού κώδικα, εθελοντές προγραμματιστές από όλο τον κόσμο συμμετέχουν στη δημιουργία τους. Ωστόσο, ο αριθμός των εκδόσεων είναι τόσο μεγάλος που υπάρχουν και ιδιόκτητα ("κλειστά") υποκαταστήματα - όπως το Mac OS, το οποίο για κάποιο χρονικό διάστημα έγινε ξαφνικά "απόγονος" των συστημάτων UNIX.

    Η επιλογή του όπλου είναι δική σας

    Σήμερα, έχει δημιουργηθεί μια τέτοια ποικιλία προγραμμάτων βιοπληροφορικής που είναι δυνατό να κάνετε πρωτότυπη έρευνα στον υπολογιστή χωρίς να προγραμματίσετε τον εαυτό σας. απλά πρέπει να επιλέξετε το σωστό λογισμικό. Ωστόσο, δεν θα πρέπει να χαλαρώνετε πολύ: για να έχετε κάτι καλό, πρέπει πρώτα να κατανοήσετε πλήρως τι κάνουν αυτά τα προγράμματα και ποια μαθηματική θεωρία τα κρύβει. Δεν θα πηγαίνατε στο εργαστήριο για να πραγματοποιήσετε μια αλυσιδωτή αντίδραση πολυμεράσης χωρίς να μάθετε πρώτα τι είναι και σε τι χρησιμεύει; Λοιπόν, το ίδιο συμβαίνει με τους υπολογιστές. Τα προγράμματα βιοπληροφορικής είναι ουσιαστικά ανάλογα του εξοπλισμού και των τεχνικών σε ένα «υγρό» εργαστήριο μοριακής βιολογίας. (Παρεμπιπτόντως, σε αντίθεση με τη λέξη "υγρό", τα εργαστήρια βιοπληροφορικής αποκαλούνται όλο και περισσότερο "ξηρά.") Επομένως, αν και δεν απαιτείται να διαβάζετε κάθε γραμμή του πηγαίου κώδικα, είναι απολύτως απαραίτητο να κατανοήσετε τις γενικές αρχές του πώς λειτουργούν τα προγράμματα.

    Λοιπόν, ελπίζουμε να μην το κάνετε. - Εκδ.

    Διαφορετικά προγράμματα συχνά ενσωματώνουν την ίδια θεωρητική προσέγγιση, αλλά εξακολουθούν να είναι προσαρμοσμένα για την επίλυση διαφορετικών πρακτικών προβλημάτων. Για παράδειγμα, όταν «συναρμολογείται» ένα γονιδίωμα από μεμονωμένες αλληλουχίες DNA που λαμβάνονται ως αποτέλεσμα της εργασίας των αυτόματων προσδιοριστών αλληλουχίας, στην περίπτωση των «μακριών» (εκατοντάδων υπολειμμάτων νουκλεοτιδίων), διαβάζεται ένας αλγόριθμος που βασίζεται στην επικάλυψη (Overlap-Layout-Consensus ) χρησιμοποιείται, ενώ για εργασία με σύνολα «μικρών» (δεκάδων υπολειμμάτων νουκλεοτιδίων) θραυσμάτων, τα γραφήματα de Bruijn ταιριάζουν καλύτερα. Και η επιλογή του σωστού προγράμματος όχι μόνο θα σας εξοικονομήσει πολύ χρόνο, αλλά θα εξασφαλίσει ουσιαστικά (ή όχι) τη σκοπιμότητα της εργασίας.

    Αν και μερικές φορές εμφανίζονται ενδιαφέρουσες εικόνες στην οθόνη βιοπληροφορικής (σε αυτή την περίπτωση, η γλυκοπρωτεΐνη του δάγκειου πυρετού), τις περισσότερες φορές μπορείτε να δείτε ένα παράθυρο κειμένου με ακατανόητες στήλες αριθμών ή γραμμές γραμμάτων.

    Κρατήστε τα πάντα υπό έλεγχο

    Ένας από τους κύριους κινδύνους είναι ότι ένας υπολογιστής μπορεί εύκολα να παράγει ένα λανθασμένο αποτέλεσμα χωρίς να το σηματοδοτήσει συγκεκριμένα με οποιονδήποτε τρόπο. Η απουσία μηνύματος σφάλματος δεν σημαίνει ότι το αποτέλεσμα που προκύπτει είναι σωστό. Εάν τροφοδοτήσετε το πρόγραμμα με άγρια ​​δεδομένα εισαγωγής ή απλώς χρησιμοποιήσετε λάθος ρυθμίσεις, θα λάβετε αναπόφευκτα μια άγρια ​​απόκριση και είναι εξαιρετικά σημαντικό να θυμάστε συνεχώς αυτή τη δυνατότητα και να μπορείτε να ελέγχετε ότι αυτό που λαμβάνετε έχει τουλάχιστον κάποια σχέση με την πραγματικότητα. Ο ευκολότερος τρόπος για να επαληθεύσετε ότι όλα λειτουργούν όπως θα έπρεπε είναι να εκτελέσετε το πρόγραμμα σε δεδομένα για τα οποία γνωρίζετε ήδη την απάντηση και να δείτε ότι αυτό λαμβάνετε. Συχνά, για μικρά σύνολα δεδομένων, οι υπολογισμοί μπορούν να γίνουν κυριολεκτικά με το χέρι και, στη συνέχεια, ο έλεγχος της απάντησης με αυτή που ελήφθη στον υπολογιστή είναι ιδιαίτερα ενδιαφέρον: εάν είναι διαφορετικό, τότε είτε το μηχάνημα είτε κάνετε λάθος. Αλλά σε αυτή την περίπτωση δεν θα έχετε θετικό αποτέλεσμα - αυτό είναι σίγουρο.

    Τα βιοχημικά πειράματα δεν πραγματοποιούνται ποτέ χωρίς αρνητικούς ή/και θετικούς «μάρτυρες», οπότε συνηθίστε να κάνετε το ίδιο σε έναν υπολογιστή. Ο έλεγχος στη βιοπληροφορική ακολουθίας είναι, κατά κανόνα, ο έλεγχος ενός μοντέλου σε ορισμένα τυχαία δεδομένα. Πρέπει να είστε πολύ, πολύ προσεκτικοί όταν επιλέγετε ένα μοντέλο τυχαίας παραγωγής δεδομένων. Ελέγξτε ξανά ότι όλα ήταν χωρίς λάθη και, το πιο σημαντικό, ότι τα αποτελέσματα που προέκυψαν έχουν κάποιο νόημα - διαφορετικά θα βρεθείτε αναπόφευκτα σε ενέδρα από «ανακαλύψεις» από το μπλε.

    Είσαι επιστήμονας, όχι προγραμματιστής

    Όπως γνωρίζετε, το καλύτερο είναι ο εχθρός του καλού. Να θυμάστε ότι οι φρέσκες σκέψεις και η καινοτομία των αποτελεσμάτων είναι σημαντικές για την εργασία σας, όχι η ομορφιά του πηγαίου κώδικα του προγράμματος. Ο εξαιρετικά γραμμένος και τεκμηριωμένος κώδικας που δεν παρέχει τη σωστή απάντηση σίγουρα δεν είναι καλός σε σύγκριση με το πρωτόγονο σενάριο που δίνει. Με άλλα λόγια, η ομορφιά θα πρέπει να εισαχθεί σε ένα πρόγραμμα μόνο αφού έχετε ήδη πειστεί περισσότερες από μία φορές ότι κάνει πραγματικά αυτό που προορίζεται να κάνει. Και - το πιο σημαντικό - χρησιμοποιήστε τις βιολογικές σας γνώσεις στο μέγιστο, γιατί αυτό είναι το μόνο πράγμα που σας κάνει επιστήμονα υπολογιστών βιολόγος. Από την άλλη πλευρά, είναι χρήσιμο να γράφετε σχόλια ακριβώς καθώς γράφετε το πρόγραμμα: «αυτή η λειτουργία/δομή χρειάζεται για...», διαφορετικά μετά από μια εβδομάδα θα ξοδέψετε πολύ χρόνο προσπαθώντας να καταλάβετε τι συμβαίνει εδώ. Η επανεκτέλεση του προγράμματος είναι μια εξαιρετική ευκαιρία για να φέρετε τον κώδικα σε ανθρώπινη μορφή. θα το κάνετε απλώς «θυμούμενοι» τη χθεσινή σειρά ενεργειών.

    Χρησιμοποιήστε τον έλεγχο έκδοσης

    Η χρήση του ελέγχου έκδοσης θα σας επιτρέψει να διαχειρίζεστε πιο ευέλικτα την ανάπτυξη κώδικα, να διευκολύνετε την επιστροφή σε προηγούμενες εκδόσεις του προγράμματος ή την εναλλαγή μεταξύ διαφορετικών κλάδων ανάπτυξης και επίσης να ανοίξετε τη δυνατότητα κοινής ανάπτυξης προγράμματος. Τα κοινά συστήματα - όπως το Git ή το Subversion - θα καταστήσουν δυνατή την εύκολη δημοσίευση ενός έργου στο Διαδίκτυο. Θα τα καταφέρετε καλύτερα για τον εαυτό σας, πρώτα απ 'όλα, εάν δεν είστε πολύ τεμπέλης να γράψετε πολλά καθαρά αρχεία README και να τα τοποθετήσετε στις σωστές θέσεις στο έργο. Αυτό θα σας βοηθήσει πάρα πολύ εάν μήνες ή και χρόνια αργότερα πρέπει να επιστρέψετε στο παλιό σας πρόγραμμα. Τεκμηριώστε προγράμματα και σενάρια ώστε να είναι ξεκάθαρο τι κάνουν. Κατά τη δημοσίευση μιας επιστημονικής εργασίας, είναι καλή ιδέα να δημοσιεύετε και τα πρωτότυπα προγράμματα που χρησιμοποιήθηκαν για τον υπολογισμό των δεδομένων: αυτό θα επιτρέψει σε άλλους να χρησιμοποιήσουν την ίδια μέθοδο και να αναπαράγουν τα αποτελέσματά σας. Καλό θα ήταν επίσης να κρατάτε ένα ηλεκτρονικό ημερολόγιο στο οποίο θα καταγράφεται όλη η πρόοδος της εργασίας. Τα ηλεκτρονικά αποθετήρια όπως το Github σάς επιτρέπουν να το κάνετε αυτό και θα σας επιτρέψουν επίσης να αποθηκεύσετε λειτουργικές εκδόσεις του προγράμματος, οι οποίες θα παρέχουν ένα επιπλέον επίπεδο αντιγράφων ασφαλείας για την εργασία σας (βλ. Πίνακα 1).

    Πίνακας 1. Σημαντικά εργαλεία για έναν υπολογιστικό βιολόγο.
    ΕργοΕργαλεία
    Ανάπτυξη κοινού προγράμματοςΚάντε τον κώδικα (και πιθανώς τα δεδομένα) σας διαθέσιμα στο διαδίκτυο μέσω διαδικτυακών αποθετηρίων όπως το Github ή το Bitbucket. Υπάρχουν πολλά μαθήματα στο Διαδίκτυο σχετικά με τον τρόπο χρήσης αυτών των συστημάτων. Υπάρχουν επίσης επιστημονικά συστήματα διαχείρισης έργων, τα οποία περιγράφονται σε ξεχωριστή πλαϊνή γραμμή.
    Για πολύπλοκες εργασίες γράψτε σενάρια και αγωγούςΓια να το κάνετε αυτό, μπορείτε να χρησιμοποιήσετε τόσο σύγχρονες εξελίξεις, όπως το Ruffus, όσο και δοκιμασμένα στο χρόνο κλασικά βοηθητικά προγράμματα UNIX όπως το Make. Η επιλογή συγκεκριμένων εργαλείων εξαρτάται από τις προσωπικές προτιμήσεις και την αγαπημένη γλώσσα προγραμματισμού
    Κάντε τους αγωγούς σας προσβάσιμουςΕίναι πιθανό να είστε άνετα στη γραμμή εντολών, αλλά οι περισσότεροι από τους συναδέλφους σας μάλλον δεν είναι. Οι αγωγοί που δημιουργείτε μπορούν να εξοπλιστούν με γραφικές διεπαφές χρησιμοποιώντας τα συστήματα Galaxy ή Taverna.
    Εργαλεία προγραμματιστών (IDE)Φυσικά, τα προγράμματα μπορούν να γραφτούν σε οποιοδήποτε πρόγραμμα επεξεργασίας κειμένου, αρχής γενομένης, αλλά θα είναι καλύτερα αν κατέχετε πιο προηγμένα εργαλεία - όπως το πρόγραμμα επεξεργασίας κειμένου Emacs ή ένα περιβάλλον ανάπτυξης με πλήρη χαρακτηριστικά όπως το Eclipse. Και, πάλι, η συγκεκριμένη επιλογή θα γίνει με βάση τις προτιμήσεις σας και την αγαπημένη σας γλώσσα προγραμματισμού.

    Συστήματα διαχείρισης έργου

    Ένα άλλο χρήσιμο εργαλείο, εκτός από τα συστήματα ελέγχου εκδόσεων, τα οποία μπορούν να δανειστούν από την πρακτική προγραμματισμού, είναι τα συστήματα διαχείρισης έργων. Είναι πιο εύκολο να τα θεωρήσετε ως ένα προηγμένο e-zine που σας παρέχει τις ακόλουθες πρόσθετες δυνατότητες:

    • Δημιουργία και ανάθεση εργασιών.Για παράδειγμα, «μετρήστε αυτό και εκείνο». Μέσα σε μια εργασία, μπορείτε να κάνετε συζητήσεις που θα είναι βολικά δομημένες και δεν θα μετατρέψουν την αλληλογραφία σας σε μια αποθήκη τρομακτικής αλληλογραφίας, όπως "Re: Project X (100). Ωστόσο, μπορείτε να ρυθμίσετε ειδοποιήσεις αλληλογραφίας, ώστε να μην χάσει κανείς ένα σημαντικό σχόλιο.
    • Επισυνάψτε και οργανώστε αρχεία με λεπτομερείς περιγραφές και υποστήριξη έκδοσης a la Dropbox. Χρειάστηκε ποτέ να ψάξετε για μεγάλο χρονικό διάστημα σε πολλά νήματα αλληλογραφίας σε ένα έργο για ορισμένα αρχεία με ασαφή ονόματα, όπως "report_ACC_clean.xxx";
    • Οι περιγραφές των διαδικασιών εκκίνησης του προγράμματος μπορούν να εισαχθούν στο ενσωματωμένο Wiki, πειραματικές τεχνικές, ενσωματώστε εγγραφές βίντεο και ακόμη και αποδώστε τύπους LaTeX.
    • Αναζήτηση κειμένου σε όλο το περιεχόμενο, συμπεριλαμβανομένων των συνημμένων αρχείων.
    • Ενοποίηση με συστήματα ελέγχου έκδοσηςγια την ανάπτυξη λογισμικού σάς επιτρέπει να συσχετίζετε εύκολα εργασίες με αλλαγές στα αποθετήρια.
    • Υπάρχουν ακόμη και τέτοιες εξωτικές δυνατότητες όπως οργανώνοντας το δικό σας ανάλογο των Εγγράφων Googleγια ταυτόχρονη επεξεργασία κειμένου. Δεν είναι δυνατή η αξιοπιστία όλων των πληροφοριών σε πόρους τρίτων.

    Στο εργαστήριό μας χρησιμοποιούμε το Redmine - αυτό είναι ένα εξαιρετικό σύστημα διαχείρισης έργου ανοιχτού κώδικα με πολλά πρόσθετα. Μπορείτε να το αναπτύξετε μόνοι σας ή να νοικιάσετε μια εικονική μηχανή με ήδη εγκατεστημένο σύστημα. Η πιο γνωστή ιδιόκτητη εναλλακτική είναι το Basecamp.

    Ζαλέφσκι Άρθουρ, Σχολή Βιομηχανικής και Βιοπληροφορικής, Κρατικό Πανεπιστήμιο της Μόσχας
    (Ομάδα Υπολογιστικής Δομικής Βιολογίας).

    Μεταφορέας μεταδοτικών ασθενειών

    Το Pipeline είναι μια αλυσίδα λογισμικού πολλών ή πολλών οδηγιών που σας επιτρέπει να πραγματοποιείτε ακριβώς τις ίδιες λειτουργίες σε ένα νέο σύνολο δεδομένων. Οι μεταφορείς και τα σενάρια είναι απαραίτητα για την εργασία ενός υπολογιστικού βιολόγου, αλλά μπορούν επίσης να οδηγήσουν το μυαλό σας στο προκρούστειο κρεβάτι ενός σεναρίου και να διακόψουν εντελώς τη φαντασία σας.

    Πτήση της φαντασίας

    Λοιπόν φυσικά μπορείς. Μπορεις να κανεις οτι θελεις. Με την έννοια ότι η δημιουργικότητα και η τολμηρή φαντασία στο έργο ενός υπολογιστικού βιολόγου είναι απολύτως απαραίτητα, γιατί διαφορετικά δεν θα είναι δυνατό τίποτα ενδιαφέρον. Προσαρμόστε τις υπάρχουσες μεθόδους, δημιουργήστε νέες, προβλέψτε την επιτυχία και μην φοβάστε την αποτυχία. Σε αυτόν τον τομέα, πολλά μπορούν να επιτευχθούν μόνο με το σερφάρισμα στο Διαδίκτυο και την επικοινωνία με συναδέλφους στο εργαστήριο ή στο διαδίκτυο. Η αυτοεκπαίδευση δεν θα σας διδάξει μόνο πώς να επιλύετε συγκεκριμένα προβλήματα - θα σας διδάξει να μαθαίνετε συνεχώς.

    Εγγραφείτε σε διαδικτυακά μαθήματα (βλ. Πίνακα 2), αλλά αυτή θα είναι μόνο η αρχή και όχι το τέλος της μάθησής σας. Μόνο ο θάνατος διακόπτει την εκπαίδευση ενός πραγματικά δημιουργικού ανθρώπου.

    Πίνακας 2. Χρήσιμοι πόροι για (αυτο)εκπαίδευση.
    Χρήσιμη δεξιότηταΠόροι
    Διαδικτυακά μαθήματα (Μαζικά ανοιχτά διαδικτυακά μαθήματα)Τώρα τέτοια μαθήματα γνωρίζουν μια έκρηξη σε δημοτικότητα και προσφέρουν ήδη ένα εξαιρετικά ευρύ φάσμα θεμάτων για μελέτη απευθείας μέσω του Διαδικτύου. Οι ιστότοποι Coursera, Udacity, edX και Kahn Academy έχουν πολλές χρήσιμες πληροφορίες στον τομέα της βιοπληροφορικής, της γονιδιωματικής, της υπολογιστικής βιολογίας, της στατιστικής και των διαφόρων μοντέλων.
    Εκπαίδευση προγραμματισμούΤο Codeacademy και το Code School δεν είναι ειδικά για τη βιολογία, αλλά είναι καλά για να ξεκινήσετε τον προγραμματισμό. Στη συνέχεια, μπορείτε να συνεχίσετε με το μάθημα «Python για βιολόγους». Πολλά καλά παραδείγματα είναι διαθέσιμα στο http://software-carpentry.org.
    Επίλυση προβλημάτων βιοπληροφορικήςΗ πρακτική εκμάθηση της βιοπληροφορικής με τη μελέτη προγραμματισμού και τον ανταγωνισμό με άλλους συμμετέχοντες στο έργο είναι διαθέσιμη στη ρωσική υπηρεσία Rosalind.
    Διεθνείς οργανισμοίΤο GOBLET είναι ένας διεθνής οργανισμός για την εκπαίδευση στη βιοπληροφορική και το ELIXIR είναι μια ευρωπαϊκή ένωση που παρέχει διάφορες πληροφορίες υποστήριξης και υποδομής για έρευνα στις βιοεπιστήμες.
    Ιστολόγια και λίστες συνδρομώνΥπάρχουν πολλά ιστολόγια και λίστες αλληλογραφίας για υπολογιστικούς βιολόγους στο διαδίκτυο, όπως http://stephenturner.us/p/edu και http://ged.msu.edu/angus/bioinformatics-courses.html. Για τους υπολογιστικούς χημικούς υπάρχει επίσης το CCL.net.
    «Τοπικοί» ρωσικοί πόροι
    Εκπαίδευση στα βασικά της βιοπληροφορικής (μαθήματα και δωρεάν παρακολούθηση)Η Σχολή Βιοπληροφορικής της Μόσχας θα παρέχει βασικές δεξιότητες σε αυτόν τον τομέα και ένα μάθημα για την εργασία με δεδομένα αλληλουχίας υψηλής απόδοσης θα σας πει πώς να αποκτήσετε πλήρεις αλληλουχίες γονιδιώματος. στην Αγία Πετρούπολη εισάγει τους μαθητές στα βασικά της βιοπληροφορικής χρησιμοποιώντας το παράδειγμα πραγματικής επιστημονικής έρευνας (γίνεται επίσης Θερινό Σχολείο).
    Πανεπιστήμια που διδάσκουν βιοπληροφορική
    • Κρατικό Πανεπιστήμιο της Μόσχας που πήρε το όνομά του M.V. Lomonosov, Σχολή Βιομηχανικής και Βιοπληροφορικής (ειδίκευση)
    • Ακαδημαϊκό Πανεπιστήμιο της Ρωσικής Ακαδημίας Επιστημών (Μάστερ)
    • Ινστιτούτο Φυσικής και Τεχνολογίας της Μόσχας, Σχολή Βιολογικής και Ιατρικής Φυσικής (Τμήμα Βιοπληροφορικής)
    • Κρατικό Πολυτεχνικό Ινστιτούτο Αγίας Πετρούπολης, Σχολή Φυσικής και Μηχανικής (Τμήμα Εφαρμοσμένων Μαθηματικών, Μεταπτυχιακό)
    Εμπειρία με Linux/UnixΜπορείτε να λάβετε βοήθεια για την εγκατάσταση και τη ρύθμιση παραμέτρων μιας από τις διανομές Linux στις ρωσικές κοινότητες Fedora ή Ubuntu. Μπορείτε επίσης να επικοινωνήσετε με το http://linux.org.ru με ερωτήσεις. Επιπλέον, σε αυτόν τον πόρο μπορείτε επίσης να λάβετε απαντήσεις σε ορισμένες επιστημονικές ερωτήσεις.

    Μην ακούς κανέναν

    Κατά την ανάπτυξη στατιστικών τεχνικών, συχνά κάνουν το ακόλουθο πείραμα: παράγουν μεγάλες σειρές τυχαίων δεδομένων, τα οποία τυχαία ορίζονται ως «δείγμα εργασίας» ή «μάρτυρας». Και στη συνέχεια εφαρμόζεται μια στατιστική δοκιμή σε αυτά τα δεδομένα, η οποία υποτίθεται ότι ανιχνεύει διαφορές μεταξύ δεδομένων που αρχικά δεν είναι διαφορετικά και... Για πολλά «δείγματα», η τιμή p υποδηλώνει συχνά μια στατιστικά σημαντική διαφορά. Τα βιολογικά σύνολα δεδομένων, όπως αυτά που λαμβάνονται από γονιδιωματική ανάλυση ή από δοκιμές διαλογής, είναι επίσης γεμάτα τυχαίους «θορύβους» και είναι συχνά τεράστιου μεγέθους. Να είστε προετοιμασμένοι για το γεγονός ότι κατά την ανάλυση τέτοιων δεδομένων, θα πρέπει να αντιμετωπίσετε ψευδώς θετικά και ψευδώς αρνητικά αποτελέσματα και ότι το συστηματικό σφάλμα μπορεί να εισχωρήσει στα αρχικά δεδομένα λόγω των χαρακτηριστικών του πειράματος ή του πειραματιστή.

    Ακόμη και βιολόγοι με εμπειρία στα στατιστικά συχνά μπαίνουν στον πειρασμό να ρίξουν προσοχή και να εμβαθύνουν σε πειράματα με ένα πρόγραμμα ή ένα σενάριο που απέδωσε ένα ενδιαφέρον αποτέλεσμα. Ωστόσο, εδώ είναι πάντα απαραίτητη προσοχή, γεγονός που υποδηλώνει ότι είναι απαραίτητο να θεωρηθεί οποιοδήποτε αποτέλεσμα ως δυνητικά λανθασμένο και να πραγματοποιηθούν πρόσθετοι έλεγχοι ως προς αυτό. Εάν το ίδιο αποτέλεσμα μπορεί να επιτευχθεί χρησιμοποιώντας διαφορετικές προσεγγίσεις, τότε η εμπιστοσύνη στην ορθότητα καθεμιάς από αυτές θα αυξηθεί. Και όμως, οι περισσότερες από αυτές τις «ανακαλύψεις» απαιτούν πειραματική επιβεβαίωση προκειμένου να διαλυθούν οι αμφιβολίες που απομένουν.

    Το πιο σημαντικό πράγμα είναι ότι για να ερμηνεύσετε τα αποτελέσματα που λαμβάνονται σε έναν υπολογιστή χρειάζεστε μια καλή βιολογική εκπαίδευση και ένστικτο. Και ακόμη και το γεγονός ότι ένα πρόγραμμα ή ένα σενάριο λειτουργεί σωστά δεν εγγυάται ότι το αποτέλεσμα που προκύπτει δεν είναι ένα τεχνούργημα ή απλώς μια εσφαλμένη ερμηνεία κάποιων άλλων φαινομένων.

    Τα σωστά εργαλεία

    Βεβαιωθείτε ότι έχετε κυριαρχήσει στη γραμμή εντολών UNIX/Linux. Τα περισσότερα προγράμματα βιοπληροφορικής διαθέτουν διεπαφή γραμμής εντολών. Στην πραγματικότητα, είναι εξαιρετικά ισχυρό, σας επιτρέπει να ελέγχετε τις εργασίες εργασίας λεπτομερώς, να εκτελείτε προγράμματα για παράλληλη εκτέλεση και, κυρίως, να ελέγχετε τη λειτουργία των βοηθητικών προγραμμάτων και να τα επανεκκινείτε απευθείας μέσω τερματικού κειμένου, ακόμη και από κινητό τηλέφωνο. Αυτό είναι ένα από τα πλεονεκτήματα της εργασίας ως βιοπληροφορικός - μπορείτε να εργαστείτε οπουδήποτε, αρκεί να έχετε έναν υπολογιστή ή tablet στο χέρι, καθώς και πρόσβαση στο Διαδίκτυο. Κατακτήστε τον παράλληλο υπολογισμό γιατί σας επιτρέπει να εκτελείτε εκατοντάδες εργασίες ταυτόχρονα και να αυξάνετε πολλαπλάσια την παραγωγικότητά σας. Σίγουρα πρέπει να γνωρίζετε τουλάχιστον λίγο προγραμματισμό, αν και η επιλογή μιας συγκεκριμένης γλώσσας προγραμματισμού δεν παίζει μεγάλο ρόλο: όλες έχουν τα πλεονεκτήματα και τα μειονεκτήματά τους και μερικές φορές χρειάζεται να συνδυάσετε πολλές διαφορετικές γλώσσες για να ολοκληρώσετε τη δουλειά γρηγορότερα.

    Να θυμάστε ότι η επιλογή μιας πιο δημοφιλής γλώσσας θα σας επιτρέψει να χρησιμοποιήσετε ένα μεγαλύτερο σύνολο υπαρχουσών βιβλιοθηκών και ρουτίνες, οι οποίες θα σας επιτρέψουν να εστιάσετε στην εργασία σας αντί να ανακαλύπτετε ξανά τον τροχό. Ένα παράδειγμα μιας τέτοιας «αποθήκης» εξελίξεων είναι το Open Bioinformatics Foundation. Προσπαθήστε να μην χρησιμοποιείτε το Microsoft Excel (μόνο για την εμφάνιση πινάκων που θα διαβάζονται από βιολόγους που δεν είναι υπολογιστές και ξέρουν μόνο πώς να δουλεύουν με αυτό). Αυτό είναι ένα καλό πρόγραμμα, αλλά εξακολουθεί να μην είναι κατάλληλο για την επεξεργασία μεγάλων ποσοτήτων δεδομένων. Είναι καλύτερο να αποθηκεύετε πειραματικά δεδομένα σε αρχεία δομημένου κειμένου (το csv είναι μια καλή επιλογή για πίνακες) ή σε μια βάση δεδομένων SQL - αυτό θα σας επιτρέψει να έχετε πρόσβαση στις πληροφορίες απευθείας από το πρόγραμμά σας.

    Και, ναι, δημιουργήστε αντίγραφα ασφαλείας!

    Elementary Watson!

    Μόλις γίνετε υπολογιστικός βιολόγος, θα πρέπει να ασχολείστε με τα δεδομένα όλη την ώρα. Αποθηκεύουν πολλές ιστορίες και είναι επαγγελματικό σας καθήκον να συλλάβετε αυτές τις ιστορίες από εκεί. Ωστόσο, πιθανότατα αυτό δεν θα είναι τόσο εύκολο. Είναι απαραίτητο να έχουμε συνεχώς κατά νου το νόημα του πειράματος και το σχήμα ανάλυσης δεδομένων, καθώς και να σκεφτόμαστε μέρα και νύχτα για το ποια βιολογική σημασία βρίσκεται στα αποτελέσματα που λαμβάνονται. Και αν το υποθετικό νόημα που παρατηρήσατε δεν είναι μια ασήμαντη συνέπεια σφαλμάτων ανάλυσης ή τεχνουργημάτων στα δεδομένα.

    Για να έχουν νόημα όλα αυτά, πρέπει να επικοινωνήσετε με άλλους ειδικούς που έλαβαν αυτά τα πειραματικά δεδομένα και να προσπαθήσετε να συνδυάσετε την εικόνα. Προτείνετε επιπλέον πειράματα που μπορούν να επιβεβαιώσουν ή να διαψεύσουν την υπόθεσή σας. Γίνετε ντετέκτιβ, φτάστε στο κάτω μέρος της απάντησης.

    Κάποιος το έχει ήδη κάνει αυτό. Βρείτε τα λοιπόν και ρώτα!

    Ανεξάρτητα από το πόσο δύσκολο είναι το πρόβλημα ή πόσο νέα είναι η μέθοδος, υπάρχει πάντα η πιθανότητα οι άνθρωποι να έχουν ήδη αντιμετωπίσει αυτό που έπρεπε να αντιμετωπίσετε. Υπάρχουν δύο ιστότοποι όπου συζητούνται προβλήματα που αντιμετωπίζονται στην έρευνα - BioStars και SeqAnswers (και ερωτήσεις καθαρά προγραμματισμού - Stack Overflow). Μερικές φορές μπορείτε να πάρετε καλές συμβουλές ακόμα και στο Twitter. Αναζητήστε στο Διαδίκτυο για να δείτε ποιος εργάζεται σε παρόμοια ζητήματα σε αυτήν τη χώρα και στον κόσμο και επικοινωνήστε μαζί τους (βλ. Πίνακα 3).

    Πίνακας 3. Ρωσικά «ξηρά» εργαστήρια.
    ΕργαστήριοΠόληΤι κάνουν
    Ομάδα Μοριακής Μοντελοποίησης στη Βιολογική Σχολή του Κρατικού Πανεπιστημίου της ΜόσχαςΜόσχαΜοριακή δυναμική πρωτεϊνών και πεπτιδίων
    Ομάδα Υπολογιστικής Δομικής Βιολογίας, Ομάδα Βιοπληροφορικής και Εργαστήριο Εξελικτικής Γονιδιωματικής στη Σχολή Βιομηχανικής και Βιοπληροφορικής του Κρατικού Πανεπιστημίου της ΜόσχαςΜόσχα
    • Μοριακή μοντελοποίηση νουκλεϊκών οξέων και νουκλεοπρωτεϊνών και βιομεμβρανών. Σχέδιο ενζύμου.
    • Βιολογία συστημάτων, βιοστατιστική, μελέτη δευτερογενούς δομής RNA.
    • Μελέτη φυσικής επιλογής σε γονιδιωματικό επίπεδο, εργασία με δεδομένα αλληλουχίας επόμενης γενιάς (NGS).
    Ομάδα Εργαστηρίου Χημικής Κυβερνητικής και Μοριακού Σχεδιασμού Υπολογιστών στη Χημική Σχολή του Κρατικού Πανεπιστημίου της ΜόσχαςΜόσχα
    • Κβαντική και φωτοχημεία
    • Μοριακή μοντελοποίηση ιικών περιβλημάτων και των αναστολέων τους, καθώς και υποδοχέων μεμβράνης
    Μοντελοποίηση σε υπολογιστή συμπλεγμάτων πρωτεϊνών με πρωτεΐνες και φάρμακα, σχεδιασμός φαρμάκων, φαρμακολογία, μελέτη σχέσεων δομής-δραστικότητας
    Εκπαιδευτικό και Επιστημονικό Κέντρο «Βιοπληροφορική» » και αρκετές ακόμη ομάδες βιοπληροφορικής στο Ινστιτούτο Προβλημάτων Μετάδοσης Πληροφοριών της Ρωσικής Ακαδημίας ΕπιστημώνΜόσχαΣυστημική βιολογία, ανάλυση χωρικών δομών βιομορίων, συγκριτική γονιδιωματική Διοργανώθηκε από το Σεμινάριο Βιοπληροφορικής της Μόσχας, τη Σχολή Βιοπληροφορικής της Μόσχας και το Συνέδριο Μοριακής Υπολογιστικής Βιολογίας της Μόσχας.
    Ομάδα Εργαστηρίου Συστημάτων Βιολογίας και Υπολογιστικής Γενετικής και Βιοπληροφορικής στο Ινστιτούτο Γενικής Γενετικής της Ρωσικής Ακαδημίας ΕπιστημώνΜόσχαΑναζήτηση λειτουργικών μοτίβων (θέσεις δέσμευσης παραγόντων μεταγραφής κ.λπ.) σε αλληλουχίες DNA
    Εργαστήριο Βιοπληροφορικής και Βιολογίας Συστημάτων στο Ινστιτούτο Μοριακής Βιολογίας RASΜόσχαΜέθοδοι βιοπληροφορικής και αναζήτηση λειτουργικών μοτίβων, πρόβλεψη ευαισθησίας σε ασθένειες
    Εργαστήριο Βιοπληροφορικής στο Ερευνητικό Ινστιτούτο Φυσικοχημικής ΙατρικήςΜόσχαΠροβλήματα μεταγονιδιωματικής και πρωτεϊνομικής
    Εργαστήριο Αλγοριθμικής Βιολογίας του Ακαδημαϊκού Πανεπιστημίου της Ρωσικής Ακαδημίας ΕπιστημώνΑγία Πετρούπολη
    Εργαστήριο "Αλγόριθμοι για τη συναρμολόγηση γονιδιωματικών ακολουθιών" του Εθνικού Ερευνητικού Πανεπιστημίου Τεχνολογιών Πληροφορικής, Μηχανικής και ΟπτικήςΑγία ΠετρούποληΠροβλήματα «συναρμολόγησης» και ανάλυσης γονιδιωμάτων
    Ομάδα Βιοπληροφορικής και Λειτουργικής Γονιδιωματικής του Ινστιτούτου Κυτταρολογίας ΡΑΣΑγία ΠετρούποληΔιερεύνηση της λειτουργικής σημασίας της συνολικής δομής του γονιδιώματος
    Εργαστήριο Λειτουργικής Γονιδιωματικής και Κυτταρικού Στρες και Μηχανισμοί Λειτουργίας Κυτταρικού Γονιδιώματος, Ινστιτούτο Κυτταρικής Βιοφυσικής, Ρωσική Ακαδημία ΕπιστημώνΠουστσίνο
    • Μοντελοποίηση δομικής οργάνωσης και αναζήτηση προαγωγέων στο βακτηριακό DNA
    • Ανάλυση της κατανομής των φυσικών ιδιοτήτων κατά μήκος της αλληλουχίας DNA, μη γραμμική δυναμική DNA
    Εργαστήριο Εφαρμοσμένων Μαθηματικών στο Ινστιτούτο Μαθηματικών Προβλημάτων Βιολογίας ΡΑΣΠουστσίνοΔευτερεύουσα δομή RNA, εναλλακτικό μάτισμα
    Εργαστήριο Πρωτεϊνικής Φυσικής, Ινστιτούτο Πρωτεϊνών, Ρωσική Ακαδημία ΕπιστημώνΠουστσίνοΘεωρητική και πειραματική μελέτη των διεργασιών αναδίπλωσης των πρωτεϊνικών μορίων
    Τμήμα Βιολογίας Συστημάτων, Ινστιτούτο Κυτταρολογίας και Γενετικής SB RASΝοβοσιμπίρσκΜεταγονιδιωματική βιοπληροφορική. Υπολογιστική ανάλυση και μοντελοποίηση μοριακών γενετικών συστημάτων. Δίκτυα γονιδίων. Μοντέλα εξέλιξης μικροοργανισμών.
    Ομάδα του Εργαστηρίου Περιβαλλοντικής Βιοχημείας του Ινστιτούτου Βιολογίας KarRC RASΠετροζαβόντσκΜοριακή μοντελοποίηση βιομεμβρανών
    Γνωρίζουμε ότι είναι αδύνατο να απαριθμήσουμε όλες τις αξιόλογες επιστημονικές ομάδες σε έναν πίνακα. Αν έχουμε ξεχάσει κάποιον, θα χαρούμε να τον προσθέσουμε. Έτοιμος πίνακας Έλενα Τσούκλινα(Ινστιτούτο Φυσικής και Τεχνολογίας της Μόσχας / Εκπαιδευτικό και Επιστημονικό Κέντρο «Βιοπληροφορική» του Ινστιτούτου Προβλημάτων Μετάδοσης Πληροφοριών της Ρωσικής Ακαδημίας Επιστημών).

    Συμπληρωματικά, μπορούμε να πούμε ότι υπάρχουν πολλά φόρουμ και ομάδες χρηστών στο Διαδίκτυο όπου μπορείτε να κάνετε ερωτήσεις. Εγκαταστήστε το Linux και ξεκινήστε να μαθαίνετε κάτι βιοπληροφορική στο διαδίκτυο. Με τη σωστή ποσότητα επιμονής, θα εκπλαγείτε πόσα μπορείτε να πετύχετε μόνο με έναν υπολογιστή και πρόσβαση στο Διαδίκτυο!

    Το άρθρο γράφτηκε με βάση ένα δοκίμιο στο περιοδικό Nature Biotechnology με τη συμμετοχή των Artur Zalevsky και Elena Chuklina.

    Βιβλιογραφία

    1. Κώδικας Ζωής: Το διάβασμα δεν σημαίνει κατανόηση.
    2. Νικ Λόμαν, Μικ Γουάτσον. (2013). Θέλετε λοιπόν να γίνετε υπολογιστικός βιολόγος; . Nat Biotechnol. 31 , 996-998.


    Εάν παρατηρήσετε κάποιο σφάλμα, επιλέξτε ένα κομμάτι κειμένου και πατήστε Ctrl+Enter
    ΜΕΡΙΔΙΟ:
    Συμβουλές για την κατασκευή και την ανακαίνιση