Δόθηκε απάντηση σε μια μεγάλη πρόκληση 50 ετών στη βιολογία

Πριν από ένα 24ωρο η εταιρεία DeepMind ανακοίνωσε την αποκρυπτογράφηση της δομής 200 εκατομμυρίων πρωτεϊνών και μονοπώλησε τα διεθνή μέσα. Τι πραγματικά σημαίνει αυτό το επίτευγμα και γιατί θα επιλύσει σημαντικά προβλήματα της ανθρωπότητας;

Με την ολοκλήρωση του έργου της αλληλούχισης του ανθρώπινου γονιδιώματος, οι επιστήμονες επικεντρώνονται  πλέον στο ανθρώπινο «πρωτέωμα», δηλαδή στον κατάλογο όλων των ανθρώπινων πρωτεϊνών, υποδεικνύοντας έναν συναρπαστικό κόσμο, γεμάτο μόρια με τόσο περίπλοκα σχήματα και ακριβείς λειτουργίες που φαίνεται σχεδόν φανταστικός.

Συχνά σκεφτόμαστε τις πρωτεΐνες ως θρεπτικά συστατικά στο φαγητό μας  ή ως το κύριο συστατικό των μυών, αλλά οι πρωτεΐνες ως μικροσκοπικά μόρια μέσα στα κύτταρα εκτελούν διάφορες και ζωτικές λειτουργίες.  Η λειτουργία μιας πρωτεΐνης εξαρτάται απόλυτα από το σχήμα της και όταν ο σχηματισμός πρωτεϊνών πάει στραβά, οι προκύπτουσες παραμορφωμένες πρωτεΐνες προκαλούν προβλήματα που μπορεί να είναι ελαφρώς «ανώδυνα», όταν παραμελούν το σημαντικό τους έργο, έως πολύ σημαντικά, όταν σχηματίζουν ένα άβολο χάος στο εσωτερικό των κυττάρων. Όμως, ο σχηματισμός  των πρωτεϊνών είναι μια διαδικασία επιρρεπής σε σφάλματα, τα οποία συνδέονται με μια σειρά ανθρώπινων ασθενειών.

Ένας πολύπλοκος κόσμος

Υπάρχουν 20.000 έως πάνω από 100.000 μοναδικοί τύποι πρωτεϊνών σε ένα τυπικό ανθρώπινο κύτταρο που ο καθένας εκτελεί μια εξειδικευμένη λειτουργία. Μερικοί τύποι είναι δομικοί, άλλοι είναι μεταφορείς, ενώ άλλοι καταλύουν αντιδράσεις που επιτρέπουν στα κύτταρα να διαιρεθούν και να αναπτυχθούν. Αυτή η ποικιλομορφία και η εξειδίκευση στη λειτουργία καθίστανται δυνατές από μια φαινομενικά απλή ιδιότητα των πρωτεϊνών, αυτή της αναδίπλωσης.

C FLIPl

wikimedia commons

Μια πρωτεΐνη ξεκινά στο κύτταρο ως μια μακριά αλυσίδα από 300 δομικά στοιχεία, κατά μέσο όρο, που ονομάζονται αμινοξέα. Υπάρχουν 22 διαφορετικοί τύποι αμινοξέων και η σειρά τους καθορίζει τον τρόπο με τον οποίο η αλυσίδα πρωτεΐνης θα αναδιπλωθεί. Κατά την αναδίπλωση, συνήθως σχηματίζονται πρώτα δύο τύποι δομών. Ορισμένες περιοχές της πρωτεϊνικής αλυσίδας τυλίγονται σε σχηματισμούς που ονομάζονται “α-έλικες”, ενώ άλλες περιοχές διπλώνουν σε τεθλασμένα μοτίβα που ονομάζονται “β-πτυχωτές επιφάνειες” τα οποία μοιάζουν με τα πτερύγια ενός χάρτινου ανεμιστήρα. Αυτές οι δύο δομές μπορούν να αλληλεπιδράσουν για να σχηματίσουν πιο σύνθετες δομές (τριτοταγής δομή) και αναδιπλωμένες σε ξεχωριστά σχήματα, μπορούν να διαδραματίσουν πολύ διαφορετικούς ρόλους παρόλο που αποτελούνται από τα ίδια βασικά δομικά στοιχεία

Στην ομιλία αποδοχής του Βραβείου Νόμπελ Χημείας το 1972, ο αμερικανός βιοχημικός Christian Anfinsen υπέθεσε περίφημα ότι, θεωρητικά, η αλληλουχία αμινοξέων μιας πρωτεΐνης θα πρέπει να καθορίζει πλήρως τη δομή της. Αυτή η υπόθεση πυροδότησε μια αναζήτηση πέντε δεκαετιών για να μπορέσουν οι επιστήμονες να προβλέψουν υπολογιστικά την τρισδιάστατη δομή μιας πρωτεΐνης βασισμένη αποκλειστικά στην αλληλουχία των αμινοξέων της. Ο αριθμός δε, των τρόπων με τους οποίους μια πρωτεΐνη θα μπορούσε θεωρητικά να αναδιπλωθεί πριν καταλήξει στην τελική τρισδιάστατη δομή της είναι αστρονομικός. Το 1969 ο μοριακός βιολόγος Cyrus Levinthal σημείωσε ότι θα χρειαζόταν περισσότερος χρόνος από την ηλικία του γνωστού σύμπαντος για να απαριθμήσει όλες τις πιθανές διαμορφώσεις μιας τυπικής πρωτεΐνης. Ωστόσο, στη φύση οι πρωτεΐνες αναδιπλώνονται αυθόρμητα, μερικές φορές μέσα σε χιλιοστά του δευτερολέπτου!

Η  αναδίπλωση πρωτεΐνης μερικές φορές αποτυγχάνει

Η αναδίπλωση μιας πρωτεΐνης είναι μια πολύπλοκη διαδικασία που μερικές φορές αποτυγχάνει για τρεις βασικούς λόγους. Πρώτον εξαιτίας μιας  μεταλλαγής που αλλάζει ένα αμινοξύ στην πρωτεϊνική αλυσίδα, καθιστώντας δύσκολο για μια συγκεκριμένη πρωτεΐνη να βρει την προτιμώμενη αναδίπλωση ή την «φυσική» της κατάσταση. Αυτό ισχύει για κληρονομικές μεταλλαγές  που εντοπίζονται στην αλληλουχία DNA ή στο «γονίδιο» που κωδικοποιεί μια συγκεκριμένη πρωτεΐνη και που επηρεάζουν μόνο αυτή και τη σχετική λειτουργία της. Από την άλλη πλευρά, η αποτυχία αναδίπλωσης πρωτεΐνης μπορεί να θεωρηθεί ως μια συνεχής και γενικότερη διαδικασία που επηρεάζει πολλές πρωτεΐνες. Όταν δημιουργούνται πρωτεΐνες, η «μηχανή» (ριβόσωμα) που «διαβάζει» τις οδηγίες από το DNA για να δημιουργήσει τις μακριές αλυσίδες αμινοξέων μπορεί να κάνει λάθη. Οι επιστήμονες εκτιμούν ότι το ριβόσωμα, κάνει λάθη σε 1 ανά 7 πρωτεΐνες!  Τέλος, ακόμα κι αν μια αλυσίδα αμινοξέων δεν έχει μεταλλαγές ή λάθη, μπορεί να μην έχει το προτιμώμενο σχήμα αναδίπλωσης απλώς και μόνο επειδή οι πρωτεΐνες δεν διπλώνουν σωστά στο 100% των περιπτώσεων. Η αναδίπλωση των πρωτεϊνών γίνεται ακόμη πιο δύσκολη εάν οι συνθήκες στο κύτταρο, όπως η οξύτητα και η θερμοκρασία, μεταβληθούν.

Γενικά, υπάρχουν δύο εντελώς διαφορετικά προβλήματα που εμφανίζονται στα κύτταρα όταν οι πρωτεΐνες τους δεν διπλώνουν σωστά. Ένας τύπος που ονομάζεται «απώλεια λειτουργίας», προκύπτει όταν δεν αναδιπλώνεται αρκετή από μια συγκεκριμένη πρωτεΐνη σωστά, προκαλώντας έλλειψη «εξειδικευμένων εργαζομένων» που χρειάζονται για να επιτελέσουν μια συγκεκριμένη εργασία.  Η κυστική ίνωση, η νόσος Tay-Sachs, το σύνδρομο Marfan, και ορισμένες μορφές καρκίνου είναι παραδείγματα ασθενειών που προκύπτουν όταν ένας τύπος πρωτεΐνης δεν είναι σε θέση να εκτελέσει τη δουλειά του. Επίσης, οι πρωτεΐνες που διπλώνουν ακατάλληλα μπορεί επίσης να επηρεάσουν την υγεία του κυττάρου ανεξάρτητα από τη λειτουργία τους. Όταν οι πρωτεΐνες αποτυγχάνουν να αναδιπλωθούν στη λειτουργική τους κατάσταση, συχνά κολλάνε μεταξύ τους σχηματίζοντας συσσωματώματα. Οι επιστήμονες υποθέτουν ότι η συσσώρευση λανθασμένων πρωτεϊνών παίζει ρόλο σε διάφορες νευρολογικές νόσους, όπως το Alzheimer, το Parkinson, το Huntington και η νόσος Lou Gehrig (ALS). Ευτυχώς, τα κύτταρα διαθέτουν μηχανισμούς για τη σωστή αναδίπλωση ή την καταστροφή των ανώμαλων πρωτεϊνικών σχηματισμών.

Η αποκάλυψη της δομής 200 εκατομμυρίων  πρωτεϊνών σηματοδοτεί ένα  επιστημονικό άλμα προς τα εμπρός

Ευτυχώς, η τεχνητή νοημοσύνη έχει καταφέρει να αποκρυπτογραφήσει τη δομή σχεδόν κάθε πρωτεΐνης που είναι γνωστή στην επιστήμη, ανοίγοντας το δρόμο για την ανάπτυξη νέων φαρμάκων ή τεχνολογιών και για την αντιμετώπιση παγκόσμιων προκλήσεων όπως η πείνα ή η ρύπανση. Αν μάθουν οι επιστήμονες πώς αναδιπλώνεται μια πρωτεΐνη, μπορούν  να κατανοήσουν πώς λειτουργεί και να αλλάξουν τη συμπεριφορά της. Αν και το DNA παρέχει τις οδηγίες για τη δημιουργία της αλυσίδας των αμινοξέων, η πρόβλεψη του τρόπου με τον οποίο αλληλεπιδρούν για να σχηματίσουν ένα τρισδιάστατο σχήμα ήταν πιο δύσκολη και, μέχρι πρόσφατα, οι επιστήμονες είχαν αποκρυπτογραφήσει μόνο ένα κλάσμα των πρωτεϊνών των 200 εκατομμυρίων που ήταν γνωστές στην επιστήμη.

Τον Νοέμβριο του 2020, η ομάδα AI DeepMind του ελληνικής καταγωγής επιστήμονα Ντέμη Χασάμπη ανακοίνωσε ότι είχε αναπτύξει ένα πρόγραμμα που ονομάζεται AlphaFold το οποίο μπορούσε να παράσχει γρήγορα αυτές τις πληροφορίες χρησιμοποιώντας έναν αλγόριθμο. Από τότε, το πρόγραμμα διεισδύει στους γενετικούς κώδικες κάθε οργανισμού στον οποίο έχει γίνει η αλληλούχιση του γονιδιώματός και προβλέπει τις δομές των εκατοντάδων εκατομμυρίων πρωτεϊνών που περιέχει συλλογικά.

Πέρυσι, η DeepMind δημοσίευσε σε μια ανοικτή βάση δεδομένων τις πρωτεϊνικές δομές για 20 είδη, συμπεριλαμβανομένων σχεδόν και των 20.000 πρωτεϊνών που εκφράζονται στον άνθρωπο. Τώρα ολοκλήρωσε τη δουλειά κυκλοφορώντας προβλεπόμενες δομές για περισσότερες από 200 εκατομμύρια πρωτεΐνες.

«Ουσιαστικά, μπορείτε να σκεφτείτε ότι το πρόγραμμα καλύπτει ολόκληρο το πρωτεϊνικό σύμπαν. Περιλαμβάνει δομές πρόβλεψης για φυτά, βακτήρια, ζώα και πολλούς άλλους οργανισμούς, ανοίγοντας στο AlphaFold τεράστιες νέες ευκαιρίες να επηρεάσει σημαντικά ζητήματα, όπως η βιωσιμότητα, η επισιτιστική ανασφάλεια και οι παραμελημένες ασθένειες», δήλωσε χθες ο Demis Hassabis, ιδρυτής της DeepMind και γενικός διευθυντής στον Guardian.

Οι επιστήμονες χρησιμοποιούν ήδη ορισμένες από τις προηγούμενες προβλέψεις του προγράμματος  για να βοηθήσουν στην ανάπτυξη νέων φαρμάκων. Τον Μάιο, ερευνητές με επικεφαλής τον καθηγητή Μάθιου Χίγκινς στο Πανεπιστήμιο της Οξφόρδης ανακοίνωσαν ότι χρησιμοποίησαν τα μοντέλα του AlphaFold για να προσδιορίσουν τη δομή μιας βασικής πρωτεΐνης παρασίτου ελονοσίας και να βρουν πού είναι πιθανό να δεσμευτούν τα αντισώματα που θα μπορούσαν να εμποδίσουν τη μετάδοση του παρασίτου.