세상은 끊임없이 변화하고 있습니다. 시장에도 시대의 흐름에 따라 다양하고 새로운 상품들이 만들어져 나오고, 어떤 상품은 그 흐름을 타고 살아남는 반면 어떤 상품은 그렇지 못하고 도태되게 됩니다. 생물에서도 마찬가지로 이와 비슷한 현상이 나타납니다. 세대를 거치며 다양한 형질을 가진 자손들이 탄생하게 되는데, 시대환경에 잘 적응한 자손만이 살아남아 세대를 이어 나가게 됩니다. 이렇게 자연적으로 선택된 생물학적 변이가 다음 세대로 전달되다 보면, 세대를 걸쳐 많은 변이가 쌓여 조상과는 다른 새로운 계통이 형성되게 됩니다. 이런 일련의 과정을 진화(evolution)라고 부릅니다. 이러한 진화의 역사를 그림으로 나타낼 수 있는 방법에는 어떤 것들이 있을까요? 진화학의 선구자인 찰스 다윈(Charles Darwin)은 하나의 공통조사에서 기원한 진화역사를 나무의 모양으로 표현하며 진화의 개념을 이해하고 설명하였습니다. 이러한 나무형태의 진화역사 표현은 하나의 공통조사에서 새로운 종이 발생, 분화하고 멸종하거나 현존하는 진화역사를 설명하고 보여주기에 아주 적절하였고, 계통수(phylogenetic tree)의 개념으로 발전하여 이어지게 됩니다.
지금에 이르러 계통수는 생물학 분야에 있어 전반적인 진화학적 연구 결과를 제시하고 다양한 생물학적 의미를 이끌어내기 위해 사용되고 있습니다. 좁게는 유전자 및 단백질의 진화부터 넓게는 생물 종 혹은 특정 분류군의 진화가 계통수로 표현됩니다. 하지만 계통수를 올바르게 이해하고 해석하지 못하면, 아무리 좋은 데이터와 분석 방법을 사용하더라도 잘못된 결과에 다다르게 될 수 있습니다. 계통수는 생물학적 진화 역사를 나타내기 위한 표현 방식이기 때문에, 올바른 계통수의 해석만이 그 안에 숨어있는 진화학적 의미를 이끌어낼 수 있습니다. 생물학 전반에 걸쳐서 사용되는 계통수인 만큼, 계통수의 기본 구성에서부터 읽고 해석하는 방법을 알아보고 몇 가지 흔히 착각하기 쉬운 점들을 살펴보며 계통수를 제대로 올바르게 해석해봅시다!
계통수의 형태와 해석
앞서 말씀드린 것과 같이 계통수는 공통 조상에서 기원한 진화 역사를 표현하기 위한 수단이므로, 해당 본질을 표현해 줄 수 있어야 합니다. 기본적으로 그 형태는 하나의 시작점, 즉 표현하고자 하는 분류군의 공통 조상에서부터 시작하여 현재 관찰되는 분류군들로 가지가 뻗어나가는 형태입니다. 이러한 계통수는 간단히 tree라고도 불리며, tree의 시작점을 계통수의 root, root에서 출발하여 뻗어나가는 것을 branch, branch가 갈라지는 부분을 node, tree의 가장 끝부분을 tip 혹은 leaf라고 부르며, 하나의 node 이후에 갈라져 나온 모든 계통을 하나로 묶어 clade라고 합니다(Fig. 2). 계통수는 root 방향으로 갈수록 기원한 조상을 향하게 되며, tip으로 갈수록 후손을 향하여 가장 끝 tip에는 현재 관찰되는 분류군들이 위치하게 됩니다. 이러한 구성요소와 기본 개념을 통해 진화 역사를 표현해줄 수만 있으면 되므로, tree의 형태는 다양하게 표현될 수 있습니다(Fig. 3).
Root에서 tip까지 이어지는 진화 과정은 시간에 따른 역사의 흐름을 담고 있으므로, tip에 위치하는 서로 다른 분류군들은 서로 간에 얼마나 진화 역사를 공유해왔는가에 따라 계통 관계가 가까운지 먼지를 판단할 수 있습니다. 최근까지 같은 진화 역사를 공유하다가 최근에 갈라져 나갔다면, 진화 역사를 얼마 공유하지 못하고 오래전에 갈라져 나간 것보다 가까운 계통 관계를 가질 것입니다. 따라서, 계통수에서 서로 다른 분류군 간의 계통 관계는 각각의 branch들이 가장 최근에 갈라져 나온 node, 즉 최근 공통 조상의 위치를 통해 판단할 수 있습니다. 즉, 최근에 공통 조상을 공유하는 분류군일수록 더 가까운 계통 관계를 가지는 것입니다. 예를 들어 [Fig. 4A]에서 A와 B는 A와 C, 혹은 B와 C보다 더 최근에 공통 조상을 공유하고 있으므로, A와 B의 계통 관계가 C보다 더 가까운 것입니다. 이처럼 계통수의 해석은 분류군 간의 최근 공통 조상의 위치에 의해 결정되므로, 이에 변화만 없다면 그 의미는 그대로 유지됩니다. [Fig. 4B]처럼 [Fig. 4A]의 계통수의 일부 tip을 가지치기하거나, 하나의 clade를 하나의 tip으로 합치더라도 남아있는 분류군 간의 계통 관계는 변하지 않으며, [Fig. 4C]처럼 하나의 clade를 통째로 회전시키더라도 분류군 간의 계통 관계는 역시 변하지 않습니다.
이번에는 계통수의 두 가지 종류에 대해 살펴보도록 하겠습니다. [Fig. 5A]와 [Fig. 5B]는 형태가 거의 똑같아 보이지만, 그 해석이 크게 달라질 수 있습니다. 그 차이는 바로 [Fig. 5B]는 [Fig. 5A]와 달리 root가 없다는 점입니다. [Fig. 5A]와 같이 root가 있는 계통수는 rooted tree, [Fig. 5B]와 같이 root가 없는 계통수를 unrooted tree라고 합니다. 얼핏 보면 비슷하게 해석할 수 있을 것으로 생각되지만, rooted tree와 달리 unrooted tree는 root가 없기 때문에 기원 조상의 위치를 알 수 없어, 조상에서 후손으로의 진화 역사 방향성 정보를 담을 수 없습니다. [Fig. 5C]는 [Fig. 5B]와 완전히 같은 계통수를 퍼져나가는 형태로 표현한 것인데, unrooted tree의 경우 진화 방향성이 포함되지 않음을 직관적으로 나타내고자 주로 이런 식으로 표현하게 됩니다. Unrooted tree의 경우 언제든 하나의 branch에 root를 냄으로써 rooted tree로 변환할 수 있으며, 이 과정에서 분자시계(molecular clock) 등을 통해 진화 역사 추론이 선행되어야 합니다(Fig. 6).
흔히 일어나는 잘못된 계통수 해석
1. Tip끼리 가까우면 가까운 계통 관계?
계통수에 대한 이해도가 부족한 상태에서 가장 흔히 일어나는 잘못된 해석은, 계통수 그림 상에서 가까운 간격으로 표현되면 가까운 계통 관계로 오인하는 것입니다. 아래 그림을 예로 들어봅시다. [Fig. 7A]에서 A, B, E 중에 더 가까운 두 분류군은 어떤 것일까요? 더 최근에 공통 조상을 공유할수록 가까운 계통 관계임을 알았으니, B와 E가 더 가까운 계통 관계임을 아실 수 있습니다. 하지만 흔히들 A와 B가 계통수 상에서 더 가까이 표현되었으므로 더 가까운 관계라고 착각하곤 합니다. 앞서 계통수에서 일부 tip을 가지치기하는 것은 계통 관계에 영향을 미치지 않는다고 했으므로, [Fig. 7A]에서 C와 D를 가지치기하여 제외하고 [Fig. 7B]와 같이 바꾸어 봅시다. B와 E가 하나의 clade로 나타난 지금도 A와 B가 가깝다고 생각할 수 있을까요? 이에서 파생되어 [Fig. 7C]에서 붉게 표시된 group A의 경우, 분류군들이 흔히 하나의 clade로 잘 묶였다고 판단하기 쉬우나, 그들의 공통 조상에서 갈라져 나온 계통인 group B를 포함하지 않아 하나의 clade로 정의할 수 없습니다. 또한 group A에 속하는 왼쪽에서 두 번째 tip의 분류군은 group A 내 다른 분류군보다도 group B와 더 가까우므로, group A는 가장 가까운 관계의 분류군들로 이루어진 group이라고도 할 수 없습니다.
2. 덜 갈라진 가지는 원시 분류군, 많이 갈라진 가지는 고등 분류군?
흔히 계통수에서 가지가 많이 갈라지지 않고 오래전에 길게 뻗어져 나온 분류군을 덜 진화한 원시 분류군으로, 가지가 많이 갈라져 나온 분류군은 더 많이 진화한 고등 분류군이라고 생각하곤 합니다. 이는 잘못된 해석일 뿐만 아니라, 적합하지 않은 용어 선택입니다. Tree 상에서 tip에 존재하는 모든 분류군은 하나의 공통 조상에서 파생되었으며 수직의 진화 역사를 겪으며 다양한 변이를 축적해 왔습니다(Fig. 8A). 진화가 현존 분류군들끼리 수평적으로 이루어지는 것이 아니기 때문에, 현존 분류군들이 원시 분류군이나 고등 분류군과 같은 식으로 분류될 수 없습니다. 이러한 오해는 가지가 갈라지는 것만이 진화를 의미하고, 가지 내에서는 진화가 일어나지 않는다는 착각에서 생기게 됩니다. 가지가 갈라지는 것은 계통수에 표현된 계통에 한해 공통 조상으로부터 갈라져 나오는 과정을 표현한 것이지, 이것이 표현되지 않았다고 변화도 진화도 일어나지 않은 채 조상의 모습을 간직하고 있는 것이 아닙니다. 단순히 계통수에 표현되지 않았을 뿐, 가지 내에서도 진화 역사는 흐르고 있으며 보이지 않는 수많은 가지가 갈라졌을 것입니다. 다시 말해, 계통수는 포함된 분류군에 따라 계통수의 형태가 계속해서 달라지기 때문에 절대적으로 덜 갈라진 가지와 많이 갈라진 가지를 정의할 수 없습니다. 예를 들어, [Fig. 8B]는 조류에 중점을 두고 진화계통학적 근거를 바탕으로 그려진 계통수입니다. 과연 이런 경우에도 마찬가지로 사람이 가장 원시종이며 덜 진화한 종이라고 해석할 수 있을까요?
3. 계통 관계가 가까울수록 비슷하다?
앞선 설명에서 최근에 공통 조상을 공유할수록 더 가까운 계통 관계를 가진다고 설명해 드렸습니다. 그러면 더 가까운 계통 관계를 가질수록 더 비슷한 분류군이라고 할 수 있을까요? 물론 더 최근까지 공통 조상을 공유했다면 공통 조상이 가졌던 특징들을 역시 더 오랫동안 공유해왔을 것이기에 여러 면에서 더 비슷할 수 있습니다. 하지만 계통 관계가 가깝다는 것이 반드시 비슷하다는 것을 의미하지는 않습니다. [Fig. 9]를 보시면 상어와 잉어, 사람의 진화 계통을 표현한 계통수가 있습니다. 상어와 잉어는 모두 어류로서 상당히 비슷한 면이 많으나, 사람은 영장류로 어류와는 큰 차이가 있습니다. 그런데도 잉어는 사람과 더 최근까지 공통 조상을 공유했으므로, 상어보다는 사람과 더 계통적으로 가까운 관계입니다. 이는 상어와 잉어, 사람의 공통 조상에서 기원한 특징들 중, 상어와 잉어에서는 잘 보전된 특징들 다수가 사람에서는 진화 역사상에서 크게 분화하여 달라졌기 때문입니다. 이처럼 겉보기에는 비슷해 보이는지가 가까운 계통 관계를 의미하지도, 가까운 계통 관계가 겉보기에 비슷한지를 의미하지도 않습니다. 따라서 계통 관계를 설명하기 위해서는 추상적인 개념인 비슷하다는 표현을 사용하지 말고 가깝다(혹은 멀다)는 표현을 사용해야 합니다. 계통 관계는 오직 조상으로부터의 계통에 의해서만 결정된다는 것을 명심하시기 바랍니다!
마치며
다양한 데이터 생산 기술과 분석 기술의 발달로 빅데이터 분석에 기반한 생물학적 연구가 나날이 발전하고 활발히 진행되고 있습니다. 이에 따라 다양한 생물학적 분야에서 빅데이터를 기반으로 한 생물정보 연구가 동반되고 있습니다. 빅데이터를 이용한 비교 분석 연구가 활발해지며 계통 분석도 점차 넓은 연구 범위에서 다양하게 활용되고 있습니다. 그만큼 계통수는 생물학 연구 전반에서 흔히 볼 수 있게 되었지만, 진화 계통에 대한 개념은 아직 낯설고 부족하여 계통수를 해석하는 데 어려움을 겪는 연구자가 늘어나고 있습니다. 앞서 말씀드린 바처럼 올바른 계통수의 해석이 제대로 된 진화계통학적 의미를 이끌어 낼 수 있는 만큼, 이번 포스팅을 통해 많은 생물학 연구자분들께서 계통수의 기초를 이해하고 올바르게 해석하는 법을 알아가셨으면 하는 바람입니다.
참고자료
- Baum, D. A., & Smith, S. D. 2013. Tree thinking. An Introduction to Phylogenetic Biology. Roberts and Company Publishers.
- Baum, D. 2008. Trait evolution on a phylogenetic tree: Relatedness, Similarity, and the Myth of Evolutionary Advancement. Nat. Educ. 1; 191.
- Understanding Evolution. 2021. University of California Museum of Paleontology. (https://evolution.berkeley.edu/)
EDITOR
전지현
RDC(R&D Center) · Researcher
'STORAGE' 카테고리의 다른 글
데이터 프로파일링(Data Profiling)의 모든 것! (1) | 2021.12.02 |
---|---|
인실리코젠 프로젝트 : 목조문화재 지키기 프로젝트 (0) | 2021.11.10 |
DTC 유전자 검사와 결과의 이해 (0) | 2021.11.03 |
인실리코젠 프로젝트 : 6.25 전사자 유해 발굴 (0) | 2021.10.19 |
2021년 가장 많은 사랑을 받았던 기존 인코 블로그의 Top 10 (0) | 2021.09.28 |
댓글