kodowane aminokwasy. Jak kod genetyczny wpływa na charakter i przeznaczenie

Po zapoznaniu się z tymi tematami powinieneś być w stanie:

  1. Opisz następujące pojęcia i wyjaśnij związek między nimi:
    • polimer, monomer;
    • węglowodan, monosacharyd, disacharyd, polisacharyd;
    • lipidy, kwasy tłuszczowe, glicerol;
    • aminokwas, wiązanie peptydowe, białko;
    • katalizator, enzym, centrum aktywne;
    • kwas nukleinowy, nukleotyd.
  2. Wymień 5-6 powodów, dla których woda jest tak ważnym składnikiem systemów żywych.
  3. Wymień cztery główne klasy związków organicznych występujących w organizmach żywych; opisz rolę każdego z nich.
  4. Wyjaśnij, dlaczego reakcje kontrolowane przez enzymy zależą od temperatury, pH i obecności koenzymów.
  5. Opisz rolę ATP w gospodarce energetycznej komórki.
  6. Wymień materiały wyjściowe, główne etapy i produkty końcowe reakcji indukowanych światłem i reakcji wiązania węgla.
  7. Podaj krótki opis ogólnego schematu oddychania komórkowego, z którego byłoby jasne, jakie miejsce zajmują reakcje glikolizy, cykl G. Krebsa (cykl kwasu cytrynowego) i łańcuch transportu elektronów.
  8. Porównaj oddychanie i fermentację.
  9. Opisz budowę cząsteczki DNA i wyjaśnij, dlaczego liczba reszt adeniny jest równa liczbie reszt tyminy, a liczba reszt guaniny jest równa liczbie reszt cytozyny.
  10. Sporządź krótki schemat syntezy RNA do DNA (transkrypcji) u prokariotów.
  11. Opisz właściwości kodu genetycznego i wyjaśnij, dlaczego powinien on być trójkowy.
  12. Na podstawie tego łańcucha DNA i tablicy kodonów określ komplementarną sekwencję matrix RNA, wskaż kodony transferowego RNA oraz sekwencję aminokwasową, która powstaje w wyniku translacji.
  13. Wymień etapy syntezy białek na poziomie rybosomów.

Algorytm rozwiązywania problemów.

Typ 1. Samokopiowanie DNA.

Jeden z łańcuchów DNA ma następującą sekwencję nukleotydów:
AGTACCGATACCGATTTCG...
Jaką sekwencję nukleotydów ma drugi łańcuch tej samej cząsteczki?

Aby zapisać sekwencję nukleotydową drugiej nici cząsteczki DNA, gdy znana jest sekwencja pierwszej nici, wystarczy zastąpić tyminę adeniną, adeninę tyminą, guaninę cytozyną, a cytozynę guaniną. Dokonując tego podstawienia, otrzymujemy ciąg:
TACTGGCTATGAGCTAAATG...

Typ 2. Kodowanie białek.

Łańcuch aminokwasowy białka rybonukleazy ma następujący początek: lizyna-glutamina-treonina-alanina-alanina-alanina-lizyna ...
Jaka sekwencja nukleotydów rozpoczyna gen odpowiadający temu białku?

Aby to zrobić, użyj tabeli kodu genetycznego. Dla każdego aminokwasu znajdujemy jego oznaczenie kodu w postaci odpowiedniego trio nukleotydów i zapisujemy je. Układając te trojaczki jedna po drugiej w tej samej kolejności, w jakiej ułożone są odpowiednie aminokwasy, otrzymujemy wzór na strukturę sekcji informacyjnego RNA. Z reguły jest kilka takich trójek, wybór dokonywany jest zgodnie z twoją decyzją (ale tylko jedna z trójek jest brana). Rozwiązań może być kilka.
AAACAAAATSUGTSGGTSUGTSGAAG

Od jakiej sekwencji aminokwasowej zaczyna się białko, jeśli jest kodowane przez taką sekwencję nukleotydów:
ACGCCATGGCCGGT...

Zgodnie z zasadą komplementarności znajdujemy strukturę informacyjnego odcinka RNA utworzonego na danym segmencie cząsteczki DNA:
UGCGGGUACCCGCCCA...

Następnie zwracamy się do tabeli kodu genetycznego i dla każdego trio nukleotydów, zaczynając od pierwszego, znajdujemy i zapisujemy odpowiadający mu aminokwas:
Cysteina-glicyna-tyrozyna-arginina-prolina-...

Ivanova T.V., Kalinova G.S., Myagkova A.N. „Biologia ogólna”. Moskwa, „Oświecenie”, 2000

  • Temat 4. „Skład chemiczny komórki”. §2-§7 s. 7-21
  • Temat 5. „Fotosynteza”. §16-17 s. 44-48
  • Temat 6. „Oddychanie komórkowe”. §12-13 s. 34-38
  • Temat 7. „Informacje genetyczne”. §14-15 s. 39-44

Każdy żywy organizm ma specjalny zestaw białek. Pewne związki nukleotydów i ich sekwencja w cząsteczce DNA tworzą kod genetyczny. Przekazuje informacje o strukturze białka. W genetyce przyjęto pewną koncepcję. Według niej jeden gen odpowiadał jednemu enzymowi (polipeptydowi). Trzeba powiedzieć, że badania nad kwasami nukleinowymi i białkami prowadzone są od dość długiego czasu. W dalszej części artykułu przyjrzymy się bliżej kodowi genetycznemu i jego właściwościom. Podana zostanie również krótka chronologia badań.

Terminologia

Kod genetyczny to sposób kodowania sekwencji aminokwasowej białka przy użyciu sekwencji nukleotydowej. Ten sposób formowania informacji jest charakterystyczny dla wszystkich żywych organizmów. Białka to naturalne substancje organiczne o dużej masie cząsteczkowej. Związki te występują również w organizmach żywych. Składają się z 20 rodzajów aminokwasów, które nazywane są kanonicznymi. Aminokwasy układają się w łańcuch i łączą w ściśle ustalonej kolejności. Decyduje o budowie białka i jego właściwościach biologicznych. W białku występuje również kilka łańcuchów aminokwasów.

DNA i RNA

Kwas dezoksyrybonukleinowy jest makrocząsteczką. Odpowiada za przekazywanie, przechowywanie i wdrażanie informacji dziedzicznych. DNA wykorzystuje cztery zasady azotowe. Należą do nich adenina, guanina, cytozyna, tymina. RNA składa się z tych samych nukleotydów, z wyjątkiem tego, który zawiera tyminę. Zamiast tego obecny jest nukleotyd zawierający uracyl (U). Cząsteczki RNA i DNA to łańcuchy nukleotydowe. Dzięki tej strukturze tworzą się sekwencje – „alfabet genetyczny”.

Implementacja informacji

Synteza białka kodowanego przez gen odbywa się poprzez połączenie mRNA na matrycy DNA (transkrypcja). Następuje również przeniesienie kodu genetycznego na sekwencję aminokwasów. Oznacza to, że zachodzi synteza łańcucha polipeptydowego na mRNA. Do zakodowania wszystkich aminokwasów i zasygnalizowania końca sekwencji białka wystarczą 3 nukleotydy. Ten łańcuch nazywa się trójką.

Historia badań

Badania nad białkami i kwasami nukleinowymi prowadzone są od dawna. W połowie XX wieku pojawiły się wreszcie pierwsze koncepcje natury kodu genetycznego. W 1953 roku odkryto, że niektóre białka składają się z sekwencji aminokwasów. To prawda, że ​​\u200b\u200bw tamtym czasie nie mogli jeszcze określić ich dokładnej liczby i było wiele sporów na ten temat. W 1953 roku Watson i Crick opublikowali dwa artykuły. Pierwszy głosił drugorzędową strukturę DNA, drugi mówił o jego dopuszczalnym kopiowaniu za pomocą syntezy matrix. Dodatkowo położono nacisk na to, że określona sekwencja zasad jest kodem, który przenosi informację dziedziczną. Amerykański i radziecki fizyk Georgy Gamov przyznał się do hipotezy kodowania i znalazł metodę jej przetestowania. W 1954 roku opublikowano jego pracę, w której przedstawił propozycję ustalenia zgodności między łańcuchami bocznymi aminokwasów a „dziurami” w kształcie rombu i wykorzystania tego jako mechanizmu kodowania. Wtedy nazywano go rombowym. Wyjaśniając swoją pracę, Gamow przyznał, że kod genetyczny może być trójkowy. Praca fizyka była jedną z pierwszych spośród tych, które uznano za bliskie prawdy.

Klasyfikacja

Po kilku latach zaproponowano różne modele kodów genetycznych, reprezentujące dwa typy: nakładające się i nienakładające się. Pierwszy polegał na występowaniu jednego nukleotydu w składzie kilku kodonów. Należy do niego trójkątny, sekwencyjny i dur-mniejszy kod genetyczny. Drugi model zakłada dwa typy. Nienakładające się obejmują kombinacje i „kod bez przecinków”. Pierwszy wariant opiera się na kodowaniu aminokwasu przez trójki nukleotydów, a jego skład jest główny. Zgodnie z „kodem bez przecinka” niektóre trojaczki odpowiadają aminokwasom, a pozostałe nie. W tym przypadku uważano, że jeśli jakieś znaczące trojaczki zostaną ułożone sekwencyjnie, inne znajdujące się w innej ramce odczytu okażą się zbędne. Naukowcy wierzyli, że można wybrać sekwencję nukleotydów, która spełniałaby te wymagania, i że było ich dokładnie 20 trojaczków.

Chociaż Gamow i wsp. zakwestionowali ten model, uznano go za najbardziej poprawny w ciągu następnych pięciu lat. Na początku drugiej połowy XX wieku pojawiły się nowe dane, które pozwoliły wykryć pewne niedociągnięcia w „kodzie bez przecinków”. Stwierdzono, że kodony mogą indukować syntezę białek in vitro. Bliżej roku 1965 zrozumieli zasadę działania wszystkich 64 trojaczków. W rezultacie stwierdzono redundancję niektórych kodonów. Innymi słowy, sekwencja aminokwasów jest kodowana przez kilka trójek.

Cechy charakterystyczne

Właściwości kodu genetycznego obejmują:

Wariacje

Po raz pierwszy odchylenie kodu genetycznego od standardu zostało odkryte w 1979 roku podczas badania genów mitochondrialnych w organizmie człowieka. Zidentyfikowano dalsze podobne warianty, w tym wiele alternatywnych kodów mitochondrialnych. Obejmują one rozszyfrowanie kodonu stop UGA używanego jako definicja tryptofanu w mykoplazmach. GUG i UUG w archeonach i bakteriach są często używane jako warianty wyjściowe. Czasami geny kodują białko z kodonu start, który różni się od tego normalnie używanego przez ten gatunek. Również w niektórych białkach selenocysteina i pirolizyna, które są aminokwasami niestandardowymi, są wstawiane przez rybosom. Odczytuje kodon stop. Zależy to od sekwencji znalezionych w mRNA. Obecnie selenocysteina jest uważana za 21., pirolizan – za 22. aminokwas obecny w białkach.

Ogólne cechy kodu genetycznego

Jednak wszystkie wyjątki są rzadkie. Ogólnie rzecz biorąc, w organizmach żywych kod genetyczny ma wiele wspólnych cech. Należą do nich skład kodonu, na który składają się trzy nukleotydy (dwa pierwsze należą do determinujących), przeniesienie kodonów przez tRNA i rybosomy w sekwencję aminokwasową.

Kod genetyczny to system zapisu dziedzicznej informacji w cząsteczkach kwasu nukleinowego, oparty na pewnej przemianie sekwencji nukleotydów w DNA lub RNA, które tworzą kodony odpowiadające aminokwasom w białku.

Właściwości kodu genetycznego.

Kod genetyczny ma kilka właściwości.

    Trójka.

    Degeneracja lub redundancja.

    Jednoznaczność.

    Biegunowość.

    Nienakładające się.

    Ścisłość.

    Wszechstronność.

Należy zauważyć, że niektórzy autorzy podają również inne właściwości kodu związane z cechami chemicznymi zawartych w kodzie nukleotydów lub z częstością występowania poszczególnych aminokwasów w białkach organizmu itp. Jednak te właściwości wynikają z powyższego, więc rozważymy je tam.

A. Trójka. Kod genetyczny, podobnie jak wiele złożonych systemów, ma najmniejszą jednostkę strukturalną i funkcjonalną. Trójka jest najmniejszą jednostką strukturalną kodu genetycznego. Składa się z trzech nukleotydów. Kodon jest najmniejszą funkcjonalną jednostką kodu genetycznego. Z reguły trojaczki mRNA nazywane są kodonami. W kodzie genetycznym kodon spełnia kilka funkcji. Po pierwsze, jego główną funkcją jest kodowanie jednego aminokwasu. Po drugie, kodon może nie kodować aminokwasu, ale w tym przypadku pełni inną funkcję (patrz poniżej). Jak widać z definicji, trójka jest pojęciem charakteryzującym podstawowy jednostka strukturalna kod genetyczny (trzy nukleotydy). charakteryzuje kodon elementarna jednostka semantyczna genom - trzy nukleotydy określają przyłączenie do łańcucha polipeptydowego jednego aminokwasu.

Elementarną jednostkę strukturalną najpierw rozszyfrowano teoretycznie, a następnie potwierdzono jej istnienie eksperymentalnie. Rzeczywiście, 20 aminokwasów nie może być kodowanych przez jeden lub dwa nukleotydy. te ostatnie to tylko 4. Trzy z czterech nukleotydów dają 4 3 = 64 warianty, co więcej niż pokrywa liczbę aminokwasów obecnych w organizmach żywych (patrz Tabela 1).

Kombinacje nukleotydów przedstawione w tabeli 64 mają dwie cechy. Po pierwsze, spośród 64 wariantów trojaczków, tylko 61 to kodony i kodują dowolny aminokwas, nazywane są one kodony sensowne. Trzy trójki nie kodują

aminokwasy a są sygnałami stop oznaczającymi koniec translacji. Są trzy takie trojaczki UAA, UAG, UGA, są również nazywane „bezsensownymi” (kodony nonsensowne). W wyniku mutacji, która wiąże się z zamianą jednego nukleotydu w tryplecie na inny, z kodonu sensownego może powstać bezsensowny kodon. Ten typ mutacji nazywa się bezsensowna mutacja. Jeśli taki sygnał stop powstanie wewnątrz genu (w jego części informacyjnej), to podczas syntezy białka w tym miejscu proces będzie ciągle przerywany - syntetyzowana będzie tylko pierwsza (przed sygnałem stop) część białka. Osoba z taką patologią będzie odczuwać niedobór białka i będzie odczuwać objawy z tym niedoborem. Na przykład tego rodzaju mutację stwierdzono w genie kodującym łańcuch beta hemoglobiny. Syntetyzowany jest skrócony nieaktywny łańcuch hemoglobiny, który jest szybko niszczony. W rezultacie powstaje cząsteczka hemoglobiny pozbawiona łańcucha beta. Oczywiste jest, że taka cząsteczka raczej nie spełni w pełni swoich zadań. Istnieje poważna choroba, która rozwija się w zależności od rodzaju niedokrwistości hemolitycznej (talasemia beta-zero, od greckiego słowa „Talas” - Morze Śródziemne, gdzie po raz pierwszy odkryto tę chorobę).

Mechanizm działania kodonów stop różni się od mechanizmu działania kodonów sensownych. Wynika to z faktu, że dla wszystkich kodonów kodujących aminokwasy znaleziono odpowiadające im tRNA. Nie znaleziono tRNA dla kodonów nonsensownych. Dlatego tRNA nie bierze udziału w procesie hamowania syntezy białek.

kodonSIERPIEŃ (czasami GUG u bakterii) nie tylko koduje aminokwas metioninę i walinę, ale jest takżeinicjator transmisji .

B. Degeneracja lub redundancja.

61 z 64 trójek koduje 20 aminokwasów. Taka trzykrotna nadwyżka liczby trojaczków nad liczbą aminokwasów sugeruje, że w przekazywaniu informacji można zastosować dwie opcje kodowania. Po pierwsze, nie wszystkie 64 kodony mogą być zaangażowane w kodowanie 20 aminokwasów, ale tylko 20, a po drugie, aminokwasy mogą być kodowane przez kilka kodonów. Badania wykazały, że natura skorzystała z tej drugiej opcji.

Jego preferencje są jasne. Gdyby tylko 20 z 64 wariantów trypletów było zaangażowanych w kodowanie aminokwasów, to 44 trojaczki (z 64) pozostałyby niekodujące, tj. bez znaczenia (kodony nonsensowne). Wcześniej wskazaliśmy, jak niebezpieczna dla życia komórki jest transformacja trypletu kodującego w wyniku mutacji w kodon nonsensowny – to znacznie zaburza normalną pracę polimerazy RNA, prowadząc ostatecznie do rozwoju chorób. Obecnie w naszym genomie są trzy kodony nonsensowne, a teraz wyobraź sobie, co by się stało, gdyby liczba kodonów nonsensownych wzrosła około 15 razy. Oczywiste jest, że w takiej sytuacji przejście kodonów normalnych do kodonów nonsensownych będzie niepomiernie większe.

Kod, w którym jeden aminokwas jest kodowany przez kilka trójek, nazywany jest zdegenerowanym lub zbędnym. Prawie każdy aminokwas ma kilka kodonów. Tak więc aminokwas leucyna może być zakodowany przez sześć trójek - UUA, UUG, CUU, CUC, CUA, CUG. Walina jest kodowana przez cztery trojaczki, fenyloalanina tylko przez dwie tryptofan i metionina kodowane przez jeden kodon. Nazywa się właściwość, która jest powiązana z zapisem tej samej informacji różnymi znakami degeneracja.

Liczba kodonów przypisanych do jednego aminokwasu dobrze koreluje z częstością występowania aminokwasu w białkach.

I to najprawdopodobniej nie jest przypadkowe. Im wyższa częstość występowania aminokwasu w białku, im częściej kodon tego aminokwasu występuje w genomie, tym większe prawdopodobieństwo jego uszkodzenia przez czynniki mutagenne. Dlatego jasne jest, że zmutowany kodon z większym prawdopodobieństwem koduje ten sam aminokwas, jeśli jest wysoce zdegenerowany. Z tych pozycji degeneracja kodu genetycznego jest mechanizmem chroniącym ludzki genom przed uszkodzeniem.

Należy zauważyć, że termin degeneracja jest używany w genetyce molekularnej również w innym znaczeniu. Ponieważ główna część informacji w kodonie przypada na dwa pierwsze nukleotydy, zasada na trzeciej pozycji kodonu okazuje się mało istotna. Zjawisko to nazywane jest „degeneracją trzeciej zasady”. Ta ostatnia cecha minimalizuje efekt mutacji. Na przykład wiadomo, że główną funkcją krwinek czerwonych jest transport tlenu z płuc do tkanek i dwutlenku węgla z tkanek do płuc. Ta funkcja jest wykonywana przez pigment oddechowy - hemoglobinę, która wypełnia całą cytoplazmę erytrocytów. Składa się z części białkowej - globiny, która jest kodowana przez odpowiedni gen. Oprócz białka hemoglobina zawiera hem, który zawiera żelazo. Mutacje w genach globiny prowadzą do pojawienia się różnych wariantów hemoglobiny. Najczęściej mutacje są związane z zamiana jednego nukleotydu na inny i pojawienie się nowego kodonu w genie, który może kodować nowy aminokwas w łańcuchu polipeptydowym hemoglobiny. W tryplecie w wyniku mutacji można wymienić dowolny nukleotyd - pierwszy, drugi lub trzeci. Wiadomo, że kilkaset mutacji wpływa na integralność genów globiny. W pobliżu 400 z nich są związane z zastąpieniem pojedynczych nukleotydów w genie i odpowiednią substytucją aminokwasu w polipeptydzie. Tylko z tych 100 substytucje prowadzą do niestabilności hemoglobiny i różnych rodzajów chorób, od łagodnych do bardzo ciężkich. 300 (około 64%) mutacji substytucyjnych nie wpływa na czynność hemoglobiny i nie prowadzi do patologii. Jedną z przyczyn takiego stanu rzeczy jest wspomniana wyżej „degeneracja trzeciej zasady”, kiedy zastąpienie trzeciego nukleotydu w tryplecie kodującym serynę, leucynę, prolinę, argininę i niektóre inne aminokwasy prowadzi do pojawienia się kodonu synonimicznego kodujące ten sam aminokwas. Fenotypowo taka mutacja się nie objawi. Natomiast każda zamiana pierwszego lub drugiego nukleotydu w tryplecie w 100% przypadków prowadzi do pojawienia się nowego wariantu hemoglobiny. Ale nawet w tym przypadku mogą nie występować poważne zaburzenia fenotypowe. Powodem tego jest zastąpienie aminokwasu w hemoglobinie innym, podobnym do pierwszego pod względem właściwości fizykochemicznych. Na przykład, jeśli aminokwas o właściwościach hydrofilowych zostanie zastąpiony innym aminokwasem, ale o takich samych właściwościach.

Hemoglobina składa się z porfirynowej grupy żelaza hemu (do której przyłączone są cząsteczki tlenu i dwutlenku węgla) oraz białka - globiny. Hemoglobina dorosłych (HbA) zawiera dwa identyczne- łańcuchy i dwa-więzy. Cząsteczka-łańcuch zawiera 141 reszt aminokwasowych,- łańcuch - 146,- I-łańcuchy różnią się wieloma resztami aminokwasowymi. Sekwencja aminokwasowa każdego łańcucha globiny jest kodowana przez jego własny gen. Kodowanie genu- łańcuch znajduje się na krótkim ramieniu chromosomu 16,-gen - w krótkim ramieniu chromosomu 11. Zmiana w kodowaniu genów- łańcuch hemoglobiny pierwszego lub drugiego nukleotydu prawie zawsze prowadzi do pojawienia się nowych aminokwasów w białku, zakłócenia funkcji hemoglobiny i poważnych konsekwencji dla pacjenta. Na przykład zamiana „C” w jednej z trójek CAU (histydyny) na „U” doprowadzi do pojawienia się nowego trypletu UAU kodującego inny aminokwas – tyrozynę. Fenotypowo objawi się to poważną chorobą. podobna zamiana w pozycji 63-łańcuch polipeptydu histydyny do tyrozyny destabilizuje hemoglobinę. Rozwija się choroba methemoglobinemia. Zmiana w wyniku mutacji kwasu glutaminowego na walinę w pozycji 6łańcuch jest przyczyną ciężkiej choroby - anemii sierpowatej. Nie przedłużajmy smutnej listy. Zauważamy tylko, że przy zastępowaniu pierwszych dwóch nukleotydów aminokwas może wydawać się podobny pod względem właściwości fizykochemicznych do poprzedniego. Zatem zastąpienie drugiego nukleotydu w jednej z trójek kodujących kwas glutaminowy (GAA) w-łańcuch na „Y” prowadzi do pojawienia się nowego trypletu (GUA) kodującego walinę, a zastąpienie pierwszego nukleotydu przez „A” tworzy tryplet AAA kodujący aminokwas lizynę. Kwas glutaminowy i lizyna mają podobne właściwości fizykochemiczne - oba są hydrofilowe. Walina jest aminokwasem hydrofobowym. Dlatego zastąpienie hydrofilowego kwasu glutaminowego hydrofilową waliną znacząco zmienia właściwości hemoglobiny, co ostatecznie prowadzi do rozwoju anemii sierpowatokrwinkowej, natomiast zastąpienie hydrofilowego kwasu glutaminowego hydrofilową lizyną w mniejszym stopniu zmienia funkcję hemoglobiny – pacjenci rozwinąć łagodną postać anemii. W wyniku zamiany trzeciej zasady nowy tryplet może kodować te same aminokwasy, co poprzedni. Na przykład, jeśli uracyl został zastąpiony cytozyną w tryplecie CAH i powstał tryplet CAC, to praktycznie nie zostaną wykryte żadne zmiany fenotypowe u osoby. Jest to zrozumiałe, ponieważ Obie trójki kodują ten sam aminokwas, histydynę.

Podsumowując, należy podkreślić, że degeneracja kodu genetycznego i degeneracja trzeciej zasady z ogólnej pozycji biologicznej są mechanizmami ochronnymi, które są włączone w ewolucję w unikalną strukturę DNA i RNA.

V. Jednoznaczność.

Każda trójka (z wyjątkiem bezsensownych) koduje tylko jeden aminokwas. Zatem w kierunku kodon - aminokwas kod genetyczny jest jednoznaczny, w kierunku aminokwas - kodon - niejednoznaczny (zdegenerowany).

niedwuznaczny

kodon aminokwasowy

zdegenerowany

I w tym przypadku potrzeba jednoznaczności w kodzie genetycznym jest oczywista. W innym wariancie, podczas translacji tego samego kodonu, różne aminokwasy byłyby wstawiane do łańcucha białkowego, w wyniku czego powstawałyby białka o różnych strukturach pierwszorzędowych i różnych funkcjach. Metabolizm komórki przestawiłby się na tryb działania „jeden gen – kilka polipeptydów”. Oczywiste jest, że w takiej sytuacji funkcja regulacyjna genów zostałaby całkowicie utracona.

g. Polaryzacja

Odczytywanie informacji z DNA iz mRNA odbywa się tylko w jednym kierunku. Biegunowość jest niezbędna do zdefiniowania struktur wyższego rzędu (drugorzędowych, trzeciorzędowych itp.). Wcześniej mówiliśmy o tym, że struktury niższego rzędu determinują struktury wyższego rzędu. Struktura trzeciorzędowa i struktury wyższego rzędu w białkach powstają natychmiast, gdy tylko zsyntetyzowany łańcuch RNA odsunie się od cząsteczki DNA lub łańcuch polipeptydowy odsunie się od rybosomu. Podczas gdy wolny koniec RNA lub polipeptydu uzyskuje strukturę trzeciorzędową, drugi koniec łańcucha nadal jest syntetyzowany na DNA (jeśli transkrybowany jest RNA) lub rybosomie (jeśli transkrybowany jest polipeptyd).

Dlatego jednokierunkowy proces odczytu informacji (w syntezie RNA i białka) jest niezbędny nie tylko do określenia sekwencji nukleotydów czy aminokwasów w syntetyzowanej substancji, ale także do sztywnego określenia drugorzędowych, trzeciorzędowych itp. Struktury.

e. Nienakładające się.

Kod może się pokrywać lub nie. W większości organizmów kod się nie nakłada. W niektórych fagach znaleziono nakładający się kod.

Istotą kodu nienakładającego się jest to, że nukleotyd jednego kodonu nie może być jednocześnie nukleotydem innego kodonu. Gdyby kod się nakładał, to sekwencja siedmiu nukleotydów (GCUGCUG) mogłaby kodować nie dwa aminokwasy (alanina-alanina) (ryc. 33, A), jak w przypadku kodu nienakładającego się, ale trzy (jeśli jeden nukleotyd jest wspólny) (ryc. 33, B) lub pięć (jeśli wspólne są dwa nukleotydy) (patrz ryc. 33, C). W dwóch ostatnich przypadkach mutacja dowolnego nukleotydu doprowadziłaby do naruszenia sekwencji dwóch, trzech itd. aminokwasy.

Stwierdzono jednak, że mutacja jednego nukleotydu zawsze zakłóca włączenie jednego aminokwasu do polipeptydu. Jest to istotny argument przemawiający za tym, że kod się nie nakłada.

Wyjaśnijmy to na rycinie 34. Linie pogrubione przedstawiają tryplety kodujące aminokwasy w przypadku kodu nienakładającego się i nakładającego. Eksperymenty jednoznacznie wykazały, że kod genetyczny nie pokrywa się. Nie wchodząc w szczegóły eksperymentu, zauważamy, że jeśli zastąpimy trzeci nukleotyd w sekwencji nukleotydowej (patrz ryc. 34)Na (oznaczone gwiazdką) do innego wtedy:

1. Przy nienakładającym się kodzie białko kontrolowane przez tę sekwencję miałoby zamiennik jednego (pierwszego) aminokwasu (oznaczonego gwiazdkami).

2. W przypadku nakładającego się kodu w wariancie A zamiana miałaby miejsce w dwóch (pierwszym i drugim) aminokwasach (oznaczonych gwiazdkami). W wariancie B substytucja dotyczyłaby trzech aminokwasów (oznaczonych gwiazdkami).

Jednak liczne eksperymenty wykazały, że gdy jeden nukleotyd w DNA jest uszkodzony, białko zawsze wpływa tylko na jeden aminokwas, co jest typowe dla nienakładającego się kodu.

ГЦУГЦУГ ГЦУГЦУГ ГЦУГЦУГ

HCC HCC HCC UHC CUG HCC CUG UGC HCC CUG

*** *** *** *** *** ***

Alanina - Alanina Ala - Cys - Lei Ala - Lei - Lei - Ala - Lei

A B C

nienakładający się kod nakładający się kod

Ryż. 34. Schemat wyjaśniający obecność nienakładającego się kodu w genomie (wyjaśnienie w tekście).

Nienakładanie się kodu genetycznego wiąże się z inną właściwością – odczytywanie informacji zaczyna się od pewnego punktu – sygnału inicjującego. Takim sygnałem inicjującym w mRNA jest kodon kodujący metioninę AUG.

Należy zauważyć, że dana osoba nadal ma niewielką liczbę genów, które odbiegają od ogólnej zasady i nakładają się na siebie.

e. Zwartość.

Pomiędzy kodonami nie ma znaków interpunkcyjnych. Innymi słowy, trojaczki nie są od siebie oddzielone, na przykład, jednym bezsensownym nukleotydem. Eksperymentalnie udowodniono brak „znaków interpunkcyjnych” w kodzie genetycznym.

I. Wszechstronność.

Kod jest taki sam dla wszystkich organizmów żyjących na Ziemi. Bezpośredni dowód na uniwersalność kodu genetycznego uzyskano porównując sekwencje DNA z odpowiednimi sekwencjami białek. Okazało się, że we wszystkich genomach bakteryjnych i eukariotycznych stosowane są te same zestawy wartości kodowych. Są wyjątki, ale nie wiele.

Pierwsze wyjątki od uniwersalności kodu genetycznego znaleziono w mitochondriach niektórych gatunków zwierząt. Dotyczyło to kodonu terminatora UGA, którego odczyt był taki sam jak kodonu UGG kodującego aminokwas tryptofan. Stwierdzono również inne rzadsze odchylenia od uniwersalności.

System kodu DNA.

Kod genetyczny DNA składa się z 64 trójek nukleotydów. Te trójki nazywane są kodonami. Każdy kodon koduje jeden z 20 aminokwasów używanych w syntezie białek. Daje to pewną redundancję w kodzie: większość aminokwasów jest kodowana przez więcej niż jeden kodon.
Jeden kodon pełni dwie powiązane ze sobą funkcje: sygnalizuje początek translacji i koduje włączanie aminokwasu metioniny (Met) do rosnącego łańcucha polipeptydowego. System kodu DNA jest zaprojektowany w taki sposób, że kod genetyczny może być wyrażany jako kodony RNA lub jako kodony DNA. Kodony RNA występują w RNA (mRNA) i kodony te są w stanie odczytywać informacje podczas syntezy polipeptydów (proces zwany translacją). Ale każda cząsteczka mRNA nabywa sekwencję nukleotydową w transkrypcji z odpowiedniego genu.

Wszystkie oprócz dwóch aminokwasów (Met i Trp) mogą być kodowane przez 2 do 6 różnych kodonów. Jednak genom większości organizmów pokazuje, że niektóre kodony są preferowane w stosunku do innych. Na przykład u ludzi alanina jest kodowana przez GCC cztery razy częściej niż w GCG. To prawdopodobnie wskazuje na większą wydajność translacji aparatu translacyjnego (np. rybosomu) dla niektórych kodonów.

Kod genetyczny jest prawie uniwersalny. Te same kodony są przypisane do tego samego odcinka aminokwasów, a te same sygnały start i stop są w przeważającej mierze takie same u zwierząt, roślin i mikroorganizmów. Znaleziono jednak pewne wyjątki. Większość z nich obejmuje przypisanie jednego lub dwóch z trzech kodonów stop do aminokwasu.

KOD GENETYCZNY(gr. genetikos odnoszące się do pochodzenia; syn.: kod, kod biologiczny, kod aminokwasowy, kod białkowy, kod kwasu nukleinowego) - system zapisywania dziedzicznej informacji w cząsteczkach kwasu nukleinowego zwierząt, roślin, bakterii i wirusów poprzez zmianę sekwencji nukleotydów.

Informacja genetyczna (ryc.) z komórki do komórki, z pokolenia na pokolenie, z wyjątkiem wirusów zawierających RNA, jest przekazywana przez reduplikację cząsteczek DNA (patrz Replikacja). Implementacja dziedzicznej informacji DNA w procesie życia komórki odbywa się poprzez 3 rodzaje RNA: informacyjny (mRNA lub mRNA), rybosomalny (rRNA) i transportowy (tRNA), które są syntetyzowane na DNA jak na matrixie z wykorzystaniem RNA enzym polimeraza. Jednocześnie sekwencja nukleotydów w cząsteczce DNA jednoznacznie określa sekwencję nukleotydów we wszystkich trzech typach RNA (patrz Transkrypcja). Informacja o genie (patrz) kodującym cząsteczkę białkową jest przenoszona tylko przez mRNA. Końcowym produktem implementacji informacji dziedzicznej jest synteza cząsteczek białek, których specyficzność jest określona przez sekwencję ich aminokwasów (patrz Translacja).

Ponieważ w DNA lub RNA obecne są tylko 4 różne zasady azotowe [w DNA - adenina (A), tymina (T), guanina (G), cytozyna (C); w RNA - adenina (A), uracyl (U), cytozyna (C), guanina (G)], których sekwencja determinuje kolejność 20 aminokwasów w białku, problem G. to., czyli problem translacji 4-literowego alfabetu kwasów nukleinowych na 20-literowy alfabet polipeptydów.

Po raz pierwszy pomysł matrycowej syntezy cząsteczek białka z prawidłowym przewidywaniem właściwości hipotetycznej matrycy sformułował N.K. Koltsov w 1928 r. W 1944 r. Avery i wsp. ustalili, że cząsteczki DNA są odpowiedzialne za transfer cech dziedzicznych podczas transformacji u pneumokoków. W 1948 r. E. Chargaff wykazał, że we wszystkich cząsteczkach DNA istnieje ilościowa równość odpowiednich nukleotydów (AT, G-C). W 1953 r. F. Crick, J. Watson i Wilkins (M. H. F. Wilkins), opierając się na tej zasadzie i danych z analizy dyfrakcji rentgenowskiej (patrz), doszli do wniosku, że cząsteczka DNA jest podwójną helisą, składającą się z dwóch polinukleotydów nici połączone ze sobą wiązaniami wodorowymi. Co więcej, tylko T może znajdować się przeciwko A jednego łańcucha w drugim, a tylko C przeciwko G. Ta komplementarność prowadzi do tego, że sekwencja nukleotydowa jednego łańcucha jednoznacznie determinuje sekwencję drugiego. Drugim istotnym wnioskiem wynikającym z tego modelu jest to, że cząsteczka DNA jest zdolna do samoreprodukcji.

W 1954 roku G. Gamow sformułował problem G. w jego współczesnej postaci. W 1957 roku F. Crick sformułował hipotezę adaptera, zakładając, że aminokwasy oddziałują z kwasem nukleinowym nie bezpośrednio, ale przez pośredników (obecnie znanych jako tRNA). W następnych latach wszystkie główne ogniwa w ogólnym schemacie przekazywania informacji genetycznej, początkowo hipotetyczne, zostały potwierdzone eksperymentalnie. W 1957 roku odkryto mRNA [A. S. Spirin, AN Belozersky i in.; Folkin i Astrachań (E. Volkin, L. Astrachan)] i tRNA [Hoagland (M. V. Hoagland)]; w 1960 r. zsyntetyzowano DNA poza komórką przy użyciu istniejących makrocząsteczek DNA jako matrycy (A. Kornberg) i odkryto zależną od DNA syntezę RNA [Weiss (S. V. Weiss) i in.]. W 1961 roku powstał system bezkomórkowy, w którym w obecności naturalnego RNA lub syntetycznych polirybonukleotydów syntetyzowano substancje białkopodobne [M. Nirenberg i Matthaei (JH Matthaei)]. Problem poznania G. to. polegał na badaniu ogólnych właściwości kodu i faktycznym jego rozszyfrowaniu, czyli ustaleniu, które kombinacje nukleotydów (kodonów) kodują określone aminokwasy.

Ogólne właściwości kodu zostały wyjaśnione niezależnie od jego dekodowania i głównie przed nim, poprzez analizę molekularnych wzorców powstawania mutacji (F. Crick i in., 1961; N. V. Luchnik, 1963). Sprowadzają się do tego:

1. Kodeks jest uniwersalny, tj. identyczny, przynajmniej w zasadzie, dla wszystkich istot żywych.

2. Kod jest trójkowy, to znaczy każdy aminokwas jest kodowany przez potrójną liczbę nukleotydów.

3. Kod nie zachodzi na siebie, tzn. dany nukleotyd nie może być częścią więcej niż jednego kodonu.

4. Kod jest zdegenerowany, to znaczy jeden aminokwas może być zakodowany przez kilka trójek.

5. Informacje o strukturze pierwszorzędowej białka są odczytywane z mRNA sekwencyjnie, zaczynając od ustalonego punktu.

6. Większość możliwych trojaczków ma „znaczenie”, tj. koduje aminokwasy.

7. Spośród trzech „liter” kodonu tylko dwie (obowiązkowe) mają pierwszorzędne znaczenie, podczas gdy trzecia (opcjonalna) niesie znacznie mniej informacji.

Bezpośrednie rozszyfrowanie kodu polegałoby na porównaniu sekwencji nukleotydów w genie strukturalnym (lub zsyntetyzowanym na nim mRNA) z sekwencją aminokwasową w odpowiednim białku. Jednak ten sposób jest nadal technicznie niemożliwy. Zastosowano dwa inne sposoby: syntezę białek w systemie bezkomórkowym z wykorzystaniem sztucznych polirybonukleotydów o znanym składzie jako matrycy oraz analizę molekularnych wzorców powstawania mutacji (patrz). Pierwszy przyniósł pozytywne wyniki wcześniej i historycznie odegrał dużą rolę w rozszyfrowaniu G. to.

W 1961 roku M. Nirenberg i Mattei użyli jako matrycy homopolimeru - syntetycznego kwasu poliurydylowego (czyli sztucznego RNA o składzie UUUU...) i otrzymali polifenyloalaninę. Z tego wynikało, że kodon fenyloalaniny składa się z kilku U, czyli w przypadku kodu trypletowego oznacza UUU. Później wraz z homopolimerami stosowano polirybonukleotydy składające się z różnych nukleotydów. W tym przypadku znany był tylko skład polimerów, natomiast ułożenie w nich nukleotydów było statystyczne, a zatem analiza wyników miała charakter statystyczny i dawała wnioski pośrednie. Dość szybko udało nam się znaleźć co najmniej jedną trójkę dla wszystkich 20 aminokwasów. Okazało się, że obecność rozpuszczalników organicznych, zmiany pH czy temperatury, niektóre kationy, a zwłaszcza antybiotyki sprawiają, że kod jest niejednoznaczny: te same kodony zaczynają stymulować inkluzję innych aminokwasów, w niektórych przypadkach jeden kodon zaczął kodować do czterech różne aminokwasy. Streptomycyna wpływała na odczyt informacji zarówno w systemach bezkomórkowych, jak i in vivo i była skuteczna tylko w przypadku szczepów bakteryjnych wrażliwych na streptomycynę. W szczepach zależnych od streptomycyny „poprawił” odczyt z kodonów, które zmieniły się w wyniku mutacji. Podobne wyniki dały powód do zwątpienia w poprawność dekodowania G. za pomocą systemu bezkomórkowego; wymagane było potwierdzenie, a przede wszystkim dane in vivo.

Główne dane na temat G. do. in vivo uzyskano analizując skład aminokwasowy białek w organizmach traktowanych mutagenami (patrz) o znanym mechanizmie działania, na przykład azotowym do jednego, który powoduje zastąpienie C przez U i A przez D. Przydatnych informacji dostarcza również analiza mutacji wywołanych przez niespecyficzne mutageny, porównanie różnic w strukturze pierwszorzędowej spokrewnionych białek u różnych gatunków, korelacja między składem DNA a białkami itp.

Dekodowanie G. na podstawie danych in vivo i in vitro dało zbieżne wyniki. Później opracowano trzy inne metody rozszyfrowywania kodu w układach bezkomórkowych: wiązanie aminoacylo-tRNA (tj. tRNA z przyłączonym aktywowanym aminokwasem) z trinukleotydami o znanym składzie (M. Nirenberg i in., 1965), wiązanie aminoacylo-tRNA z polinukleotydami zaczynającymi się od pewnego trypletu (Mattei i in., 1966) oraz wykorzystanie polimerów jako mRNA, w którym znany jest nie tylko skład, ale i kolejność nukleotydów (X. Korana i in. ., 1965). Wszystkie trzy metody wzajemnie się uzupełniają, a wyniki są zgodne z danymi uzyskanymi w eksperymentach in vivo.

w latach 70. XX wiek istniały metody szczególnie wiarygodnego sprawdzania wyników dekodowania G. t. Wiadomo, że mutacje powstające pod wpływem proflawiny polegają na utracie lub wstawieniu oddzielnych nukleotydów, co prowadzi do przesunięcia ramki odczytu. W fagu T4 proflawina wywołała szereg mutacji, w których zmienił się skład lizozymu. Ten skład analizowano i porównywano z tymi kodonami, które powinny być otrzymane przez przesunięcie ramki odczytu. Był pełny mecz. Dodatkowo metoda ta pozwoliła ustalić, które trójki zdegenerowanego kodu kodują każdy z aminokwasów. W 1970 roku Adamsowi (J.M. Adams) i jego współpracownikom udało się częściowo rozszyfrować G. to. metodą bezpośrednią: w fagu R17 sekwencję zasad określono we fragmencie o długości 57 nukleotydów i porównano z sekwencją aminokwasową jego białko otoczki. Wyniki były całkowicie zgodne z wynikami uzyskanymi mniej bezpośrednimi metodami. W ten sposób kod jest całkowicie i poprawnie odszyfrowany.

Wyniki dekodowania podsumowano w tabeli. Wymienia skład kodonów i RNA. Skład antykodonów tRNA jest komplementarny do kodonów mRNA, tzn. zamiast U zawierają A, zamiast A - U, zamiast C - G i zamiast G - C i odpowiadają kodonom genu strukturalnego (tej nici DNA, za pomocą którego odczytuje się informacje) z tą różnicą, że uracyl zastępuje tyminę. Spośród 64 trójek, które mogą powstać z połączenia 4 nukleotydów, 61 ma „sens”, tj. koduje aminokwasy, a 3 są „nonsensowne” (pozbawione znaczenia). Istnieje dość wyraźny związek między składem trójek a ich znaczeniem, co zostało odkryte nawet podczas analizy ogólnych właściwości kodu. W niektórych przypadkach tryplety kodujące określony aminokwas (np. prolinę, alaninę) charakteryzują się tym, że pierwsze dwa nukleotydy (obowiązkowe) są takie same, a trzeci (opcjonalnie) może być dowolny. W innych przypadkach (przy kodowaniu na przykład asparaginy, glutaminy) dwie podobne trójki mają to samo znaczenie, w których pierwsze dwa nukleotydy pokrywają się, a dowolna puryna lub dowolna pirymidyna zastępuje trzecią.

Nonsensowne kodony, z których 2 mają specjalne nazwy odpowiadające oznaczeniu mutantów faga (UAA-ochra, UAG-amber, UGA-opal), chociaż nie kodują żadnych aminokwasów, mają ogromne znaczenie przy odczytywaniu informacji, kodowaniu koniec łańcucha polipeptydowego.

Informacje są odczytywane w kierunku od 5 1 -> 3 1 - do końca łańcucha nukleotydowego (patrz Kwasy dezoksyrybonukleinowe). W tym przypadku synteza białek przebiega od aminokwasu z wolną grupą aminową do aminokwasu z wolną grupą karboksylową. Początek syntezy jest kodowany przez trójki AUG i GUG, które w tym przypadku obejmują specyficzny wyjściowy aminoacylo-tRNA, a mianowicie N-formylometionylo-tRNA. Te same trojaczki, gdy są zlokalizowane w łańcuchu, kodują odpowiednio metioninę i walinę. Dwuznaczność usuwa fakt, że początek lektury poprzedzony jest bezsensem. Istnieją dowody na to, że granica między regionami mRNA kodującymi różne białka składa się z więcej niż dwóch trojaczków i że w tych miejscach zmienia się struktura drugorzędowa RNA; ta kwestia jest badana. Jeśli kodon nonsensowny występuje w genie strukturalnym, to odpowiednie białko jest budowane tylko do miejsca, w którym znajduje się ten kodon.

Odkrycie i rozszyfrowanie kodu genetycznego - wybitne osiągnięcie biologii molekularnej - wywarło wpływ na wszystkie biol nauki, w niektórych przypadkach kładąc podwaliny pod rozwój specjalnych dużych sekcji (patrz Genetyka molekularna). Efekt otwierający G. i związane z nim badania porównują się z efektem, jaki teoria Darwina wywarła na nauki biologiczne.

Uniwersalność G. to. jest bezpośrednim dowodem uniwersalności podstawowych molekularnych mechanizmów życia u wszystkich przedstawicieli świata organicznego. Tymczasem duże różnice w funkcjach aparatu genetycznego i jego budowie podczas przechodzenia od prokariontów do eukariotów i od jednokomórkowych do wielokomórkowych są prawdopodobnie związane z różnicami molekularnymi, których badanie jest jednym z zadań przyszłości. Ponieważ badania G. to dopiero kwestia ostatnich lat, znaczenie uzyskanych wyników dla medycyny praktycznej ma charakter jedynie pośredni, pozwalający na razie zrozumieć naturę chorób, mechanizm działania patogenów i substancje lecznicze. Jednak odkrycie takich zjawisk jak transformacja (patrz), transdukcja (patrz), supresja (patrz), wskazuje na fundamentalną możliwość korygowania patologicznie zmienionej informacji dziedzicznej lub jej korekty – tzw. inżynieria genetyczna (patrz).

Tabela. KOD GENETYCZNY

Pierwszy nukleotyd kodonu

Drugi nukleotyd kodonu

Po trzecie, kodon nukleotydowy

fenyloalanina

Bzdura

tryptofan

histydyna

Kwas glutaminowy

Izoleucyna

asparaginowy

Metionina

asparagina

glutamina

* Koduje koniec łańcucha.

** Koduje również początek łańcucha.

Bibliografia: Ichas M. Kod biologiczny, przeł. z angielskiego, M., 1971; łucznik Biofizyka porażek cytogenetycznych i kod genetyczny, L., 1968; Genetyka molekularna, tłum. z angielskiego, wyd. A. N. Belozersky, część 1, M., 1964; Kwasy nukleinowe, trans. z angielskiego, wyd. AN Belozersky, Moskwa, 1965. Watson JD Biologia molekularna genu, przeł. z angielskiego, M., 1967; Genetyka fizjologiczna, wyd. M.E. Lobasheva S.G., Inge-Vechtoma-va, L., 1976, bibliogr.; Desoxyribonucleins&ure, Schlttssel des Lebens, godz. v „E. Geissler, B., 1972; Kod genetyczny, Gold Spr. Port. Symp. ilość Biol., w. 31, 1966; W o e s e C. R. Kod genetyczny, N. Y. a. o., 1967.

KOD GENETYCZNY, metoda zapisu dziedzicznej informacji w cząsteczkach kwasów nukleinowych w postaci sekwencji nukleotydów tworzących te kwasy. Pewna sekwencja nukleotydów w DNA i RNA odpowiada pewnej sekwencji aminokwasów w łańcuchach polipeptydowych białek. Zwyczajowo kod jest zapisywany dużymi literami alfabetu rosyjskiego lub łacińskiego. Każdy nukleotyd jest oznaczony literą, od której zaczyna się nazwa zasady azotowej wchodzącej w skład jego cząsteczki: A (A) - adenina, G (G) - guanina, C (C) - cytozyna, T (T) - tymina ; w RNA zamiast tyminy uracyl to U (U). Każdy jest kodowany przez kombinację trzech nukleotydów - tryplet lub kodon. W skrócie sposób przekazywania informacji genetycznej streszcza się w tzw. centralny dogmat biologii molekularnej: DNA ` RNA f białko.

W szczególnych przypadkach informacja może być przenoszona z RNA do DNA, ale nigdy z białka do genów.

Realizacja informacji genetycznej odbywa się w dwóch etapach. W jądrze komórkowym, informacji lub macierzy, RNA (transkrypcja) jest syntetyzowany na DNA. W tym przypadku sekwencja nukleotydowa DNA jest „przepisywana” (przekodowana) na sekwencję nukleotydową mRNA. Następnie mRNA przechodzi do cytoplazmy, przyczepia się do rybosomu i na nim, jak na matrixie, syntetyzowany jest polipeptydowy łańcuch białkowy (translacja). Aminokwasy za pomocą transferu RNA są przyłączane do budowanego łańcucha w kolejności określonej przez kolejność nukleotydów w mRNA.

Z czterech „liter” można utworzyć 64 różne trzyliterowe „słowa” (kodony). Spośród 64 kodonów 61 koduje określone aminokwasy, a trzy są odpowiedzialne za zakończenie syntezy łańcucha polipeptydowego. Ponieważ istnieje 61 kodonów dla 20 aminokwasów tworzących białka, niektóre aminokwasy są kodowane przez więcej niż jeden kodon (tzw. degeneracja kodu). Taka redundancja zwiększa niezawodność kodu i całego mechanizmu biosyntezy białek. Inną właściwością kodu jest jego specyficzność (jednoznaczność): jeden kodon koduje tylko jeden aminokwas.

Ponadto kod nie zachodzi na siebie – informacje są odczytywane sekwencyjnie w jednym kierunku, trójka po trójce. Najbardziej zdumiewającą właściwością kodu jest jego uniwersalność: jest taki sam dla wszystkich istot żywych – od bakterii po człowieka (z wyjątkiem kodu genetycznego mitochondriów). Naukowcy widzą w tym potwierdzenie koncepcji pochodzenia wszystkich organizmów od jednego wspólnego przodka.

Rozszyfrowanie kodu genetycznego, czyli określenie „znaczenia” każdego kodonu i zasad odczytywania informacji, przeprowadzono w latach 1961–1965. i jest uważana za jedno z najbardziej uderzających osiągnięć biologii molekularnej.