top of page
1800-04_edited.jpg

NEXJENNER

우리의 유전자 코드는 어떻게 진화했나

최초의 생명체는 DNA에 다른 아미노산을 암호화했을 수도 있다.


유전 암호의 기원:

DNA의 기본 서열은 기본 구성 요소인 아미노산의 서열을 통해 단백질의 구성 지침을 암호화한다. 그러나 이러한 단백질 구성 요소에 대한 유전암호는 생명이 시작될 때 오늘날과 다르게 보였을 수 있다는 새로운 분석이 제시됐다. 이에 따르면 오늘날의 DNA 코드는 최초의 생명 코드가 아니었다. 일부 아미노산은 예상보다 일찍 유전자 코드에 들어가고 다른 아미노산은 나중에 발견됐다.


▲ 생명의 시작 부분에 있는 이 지구 그림은 화산과 물 웅덩이를 보여준다. 최초의 생명체가 그러한 환경에서 진화했을 가능성이 있다. © Joanna Masel이 생성한 AI


박테리아부터 고래까지 지구상의 거의 모든 생물은 동일한 유전암호를 사용한다. 그들은 모두 개인의 외모와 생활 방식을 결정하는 유전 정보를 아데닌, 시토신, 구아닌, 티민 또는 RNA에 있는 우라실의 4개 염기 서열을 통해 DNA나 RNA에 저장한다. 염기 서열은 세포 내에서 20개의 서로 다른 아미노산의 조합으로 번역되어 다양한 기능을 가진 단백질을 생성한다. 이 보편적인 과정은 약 40억 년 전에 지구에 살았던 모든 생명체의 최초 공통 조상(LUCA)에 이미 존재했다.


우리의 유전자 코드는 어떻게 진화했나?


“매우 복잡한 프로세스지만 우리 코드는 놀라울 정도로 훌륭하다. 애리조나 대학의 수석 저자인 Joanna Masel은 "모든 범위의 작업에 거의 최적이다"고 말했다. 지금까지 연구자들은 이 유전암호가 단계적으로 발달했다고 가정했다. 그러나 이러한 단계는 어떤 모습이었고 이 유전자 기본 코드가 현재 형태로 얼마나 오랫동안 존재했을까? 이 질문에 대한 답은 전문가들 사이에서 논란이 되고 있으며 아직 확실히 밝혀지지 않았다.


1952년 유명한 Urey-Miller 실험과 같은 이전 연구에서는 실험실에서 원시 지구의 생활 조건을 재현하여 유전암호의 발달을 시뮬레이션했다. 이 실험을 통해 원시 수프의 자발적인 화학 반응을 통해 무생물에서 여러 아미노산과 기타 생명의 구성 요소가 생성될 수 있음을 증명할 수 있었지만 이러한 구성 요소가 언제 어떻게 유전암호에 고정되었는지는 알 수 없었다.


아미노산 비교를 통해 되돌아볼 수 있다.


애리조나 대학의 Sawsan Wehbi가 이끄는 연구팀은 이제 새로운 통계 방법을 사용하여 유전자 코드의 기원을 추적했다. Webhi와 그녀의 동료들은 지구 역사상 서로 다른 시기에 살았던 생물체의 단백질의 아미노산 서열을 분석했다. 이를 통해 최초의 공통조상 LUCA는 물론 그 이전과 이후에 살았던 유기체의 아미노산과 유전암호에 대한 결론을 도출할 수 있었다. 연구자들은 데이터베이스에서 수천 개의 단백질 그룹을 조사했는데, 그중 약 400개는 LUCA 시대의 유기체에서 나온 것이었다.


Wehbi와 그의 동료들은 주로 기능을 결정하는 단백질의 핵심 부분을 비교했다. “단백질이 자동차라고 가정하면 도메인은 바퀴와 같다”고 Wehbi는 설명한다. "그것은 다양한 자동차에 사용될 수 있는 부품이며, 바퀴는 자동차보다 훨씬 오래전부터 사용됐다." 이 접근 방식은 어떤 아미노산이 언제 생성되었는지, 그리고 언제 유전 코드에 고정되어 있는지에 대한 정보를 제공한다.


작은 아미노산에 대한 코드는 큰 아미노산보다 오래돼


▲ 단백질 도메인의 진화적 역사는 그것이 속한 전체 유전자 오솔로그보다 더 오래 거슬러 올라갈 수 있다. 다중 도메인 유전자 3과 4는 거의 같은 시기에 시작되었다. 그러나 이들은 서로 다른 시점에서 출현하고 갈라진 두 개의 단백질 도메인(파란색과 주황색 상자)으로 구성되어 있다. 도메인 1은 도메인 2보다 오래되었다. (출처:관련논문 Order of amino acid recruitment into the genetic code resolved by last universal common ancestor’s protein domains / PNAS)


이는 LUCA와 같은 최초의 생명체의 단백질이 주로 더 작은 아미노산 분자로 구성되어 있음을 보여주었다. 철, 아연 또는 구리와 같은 촉매 활성 금속을 결합할 수 있는 아미노산 시스테인과 히스티딘도 이미 LUCA에 대량으로 존재했기 때문에 이전에 가정한 것보다 훨씬 더 일찍 존재했다. 메티오닌과 같은 황 함유 아미노산에 대해서도 마찬가지였다. 연구팀은 이러한 단백질 구성 요소가 당시 활성 황이나 산소 분자로부터 생명체를 보호했을 수 있다고 의심한다.


반면, 더 복잡한 측면 그룹을 가진 큰 아미노산은 처음에는 드물었고 나중에야 더 흔해졌다. 소수성 아미노산은 LUCA와 그의 동시대 사람들에게도 존재했지만, 후기 생명체에서는 더 큰 비율로 발견되었다고 팀은 보고했다. 크고 소수성인 아미노산은 초기에 발달했지만, 나중에 생명이 진화하면서 유전암호에 고정되었다.


이는 생성하기 어려운 아미노산이 자연적으로 생성될 수 있는 더 작은 아미노산보다 늦게 생성되는 경향이 있다는 초기 가정과 일치한다. 그러나 글루타민과 같은 개별 아미노산은 이전에 생각했던 것보다 훨씬 늦게 우리의 유전자 코드에 입력되었다.


우리의 DNA 코드는 다른 코드보다 오래 지속


Webhi와 그녀의 동료들은 또한 모든 생명체의 마지막 공통 조상 이전에 존재했던 단백질을 비교했다. 여기에는 LUCA보다 발린과 글루탐산이 적고 방향족 고리 구조를 지닌 아미노산(트립토판, 티로신, 페닐알라닌, 히스티딘)이 놀라울 정도로 많이 함유되어 있다. 그러나 이러한 아미노산은 크고 부피가 크며 훨씬 나중에 생명의 유전 암호에서 DNA 염기로 표현되는 것으로 밝혀졌다.


그러한 방향족 아미노산이 40억 년 전 LUCA 이전 시대에 이미 살아있는 유기체에 존재했다는 사실은 현재의 DNA 코드 이전에 다른 유전 코드가 있었다는 것을 암시한다. “이것은 우리 이전에 존재했지만 이후 지질학적 시간의 심연 속으로 사라진 다른 유전암호에 대한 증거를 제공한다”고 Masel은 말했다. 이 선사 시대 게놈에는 노르발린과 노르류신과 같은 다른 아미노산에 대한 코드도 포함되어 있을 수 있는데, 이는 더 오늘날 생명체의 표준 단백질 구성 요소의 일부가 아니다.


다시 쓰여진 원산지 역사


전반적으로, Wehbi와 그의 동료들에 따르면, 개별 아미노산이 유기체의 현재 유전자 코드에 통합되는 이전에 가정된 순서는 수정되어야 한다. 대신 그들은 다음과 같은 진화 순서를 제안했다.

Valin (V)-Glycin(G)-Isoleucin(I)-Methionen(M)-Alanin(A)-Threonin(T)-

Histidin(H)-Glutamat(E)-Cystein(C)-Prolin(P)-Lysin(K)-Serin(S)-Aspartat(D)-Leucin(L)-Asparagin(N)-Arginin(R)-Phenylalanin(F)-Tyrosin(Y)-Glutamin(Q)-Tryptophan(W).

이제 후속 연구를 통해 이 할당이 올바른지 확인해야 한다.

(Proceedings of the National Academy of Sciences, 2024; doi: 10.1073/pnas.2410311121)

출처: University of Arizona

bottom of page