[유전학 중요개념 정리] Germline vs. Somatic mutation

가끔 임상 선생님들과 NGS 검사를 통해 발견된 변이에 대해서 이야기를 할 때, Germline과 Somatic mutation, 두 가지 개념의 차이를 잘 모르는 경우를 종종 보아와서, 이번 포스팅에서는 Germline mutation (생식 세포 돌연변이)Somatic mutation (체세포 돌연변이)의 개념과 임상적 중요성에 대해서 정리하려고 합니다. 생식 세포 돌연변이와 체세포 돌연변이는 크게 2가지 개념에서 구분할 수 있습니다.

somatic-vs-germline_med

  1. Inheritance: 부모로부터 물려받은 변이인가? 살아가면서 새로 발생하고 축적된 돌연변이 인가?
  2. Mosaicism: 개체의 모든 세포들이 공유하는 변이인가? 특정 세포에만 발생된 변이인가?

우리의 몸은 처음에는 하나의 세포에서 기원했지만, 장기나 조직 별로 각 세포를 구성하고 발현하는 유전체는 동일하지 않습니다. 임상적인 관점에서 위의 2가지 구분은 대상 질환의 검사 방법 및 분석 방법에도 차이를 발생시킵니다. 가령, 부모로 부터 물려받은 유전 질환에 대해서 검사하고 싶다면 Germline mutation을 target으로 해야하고, 어떤 암 환자 조직에서 발생한 mutation을 검사하고 싶다면 Somatic mutation을 target으로 해야 합니다. (물론 Cancer의 경우에도 생식세포에서 발생하는 Germline mutation이 기원이 되는 경우도 있긴 합니다만, 대부분의 일반 장기에서 발생하는 경우 Somatic mutation이 원인입니다.)

특히 암의 경우에는 조직을 구성하는 세포들이 정상 세포와 암세포간에 Mosaicism을 이루고, 같은 암세포라 하더라도 가지고 있는 돌연변이들이 모두 다릅니다. 이를 Tumor Heterogeneity (종양 이질성) 라고 부릅니다.

Screen-Shot-2016-11-11-at-17.27.01
같은 종양 조직 안에서도 무수히 많은 종양세포 군집이 뒤섞여 있습니다. 이를 Tumor Heterogeneity라고 부릅니다.

그렇다면, 위의 구분이 검사에서 왜 중요할까요? NGS 검사를 통해서, 암의 원인이 되는 변이를 찾고자 한다고 가정해보겠습니다. 그리고 암 환자의 조직을 수술을 통해서 검사를 보냈다고 가정해 봅시다. 보통은 조직에서 DNA를 추출하고, DNA 절편을 만들어서 NGS 검사를 진행합니다. 그리고 기기에서는 각 절편을 기준이 되는 Reference Genome에 Assembly를 구성해서, 환자의 Sequence를 읽게 됩니다.

이때 Depth of Coverage라는 개념이 있게 되는데, 어느 한 지역을 얼마나 많은 절편으로 읽었는가? 하는 개념이 됩니다. 즉, Depth가 깊을수록, 그 지역의 누클레오타이드는 더 확실하고 명확하게 됩니다. 그런데 간혹 기기에서 시퀀싱 에러가 발생하는 경우도 있게 됩니다. 만약 한번의 시퀀싱 에러가 발생했는데, 그 부위의 depth가 2라면, Error rate는 50%가 되지만, depth가 200이라면 Error rate는 0.5%가 됩니다. 그런데 암세포의 변이를 찾는 검사에서 돌연변이가 전체 조직 세포의 5%에만 존재한다고 생각해 봅시다. 이 변이를 검출하기 위해서는 적어도 depth가 20은 되어야 1개의 변이가 나타날 것입니다. 그런데 depth가 20일때, 이러한 변이가 검출되었다면 이것이 에러인지 진짜인지 어떻게 알 수 있을까요? 그래서 Somatic mutation을 검출하는 검사는 일반적으로 더 높은 Read Depth를 요구합니다. (이를 위해 Deep sequencing이 요구되며, 일반적으로 500~1,000X 이상으로 읽게 됩니다. 임상적으로 Germline 이 target인 경우는 더 적은 depth로도 충분하게 됩니다.)

F2.large
NGS 검사의 특성상 위치별로 Coverage 및 Depth가 다르게 되며, 이는 SNP 검사 결과의 신뢰도와 error rate 등에 영향을 주게 됩니다.

반대로 Germline mutation을 target으로 변이를 검출하려고 한다고 생각해봅시다. 그런데 어느 부위에서 A가 10번, T가 90번 읽혔습니다. 그러면 이 변이는 Somatic mutation 또는 시퀀싱 에러의 가능성이 매우 높기 때문에 분석에서 제외하는게 좋습니다. 왜냐하면 Germline은 부모로 부터 물려받았기 때문에 Homozygete 또는 Heterozygote의 2가지 경우만 있을 것이고, SNP을 읽었을 때 50:50으로 읽히거나 (Heterozygote), 100%로 동일하게 (Homozygote) 읽혀야 하기 때문입니다. 이렇듯 위 2개의 개념을 구분하는 것은, NGS 검사를 통해 해석할 때 매우 중요하고 기본적인 개념이 됩니다.

[참고 문헌]

Rizzo, Jason M., and Michael J. Buck. “Key principles and clinical applications of” next-generation” DNA sequencing.” Cancer prevention research (2012): canprevres-0432.

글쓴이: Jihoon Yoon

인체라는 소우주를 탐험하는 호기심 많은 연구자

답글 남기기

아래 항목을 채우거나 오른쪽 아이콘 중 하나를 클릭하여 로그 인 하세요:

WordPress.com 로고

WordPress.com의 계정을 사용하여 댓글을 남깁니다. 로그아웃 /  변경 )

Google photo

Google의 계정을 사용하여 댓글을 남깁니다. 로그아웃 /  변경 )

Twitter 사진

Twitter의 계정을 사용하여 댓글을 남깁니다. 로그아웃 /  변경 )

Facebook 사진

Facebook의 계정을 사용하여 댓글을 남깁니다. 로그아웃 /  변경 )

%s에 연결하는 중