Non-coding 영역의 GWAS 신호 해석: 3C, 4C, Hi-C technique

오늘은 최근에 읽었던 논문에 대해 정리할 겸, Chromosome Conformation Capture (CCC, 3C) 연구 방법에 대해 포스팅해보고자 합니다. 저희 연구실에서도 약물 반응에 대한 GWAS 연구를 종종 하고 있는데, GWAS 데이터 분석의 가장 큰 장애물은 데이터 결과를 적절히 해석하고 의미 있는 정보를 도출해 내는데 있다고 할 수 있습니다.

GWAS 연구 방법에 대한 포스팅 보기 -> 전장 유전체 연관 분석, GWAS란 무엇인가?

하지만 안타깝게도 많은 경우에 있어 GWAS 연구에서 얻어낸 신호를 적절히 해석하는 것은 다음과 같은 이유로 쉽지 않습니다.

  1. GWAS 연구는 연관 분석이기 때문에, 통계학적 분석 방법에 기반한다. 따라서, GWAS 신호는 분석 데이터에 의존하며, 얻어진 신호가 항상 생물학적으로 새로운 정보를 주지는 못한다. 다시 말하면, 분석에 사용된 데이터의 수와 데이터의 질이 중요하며, 신호 자체가 위양성 (false positive)일 가능성도 있기 때문에, 독립적인 validation cohort가 요구되는 이유입니다.
  2. 실제 유전학적으로 중요한 변이는 GWAS 신호를 보이는 동일 LD Block 내의 다른 위치에 존재할 수 있다. GWAS는 일종의 스캐닝 방법이기 때문에, 실제 유전 변이의 위치를 찾기 위해서는 신호를 보이는 LD block 내의 모든 변이들을 더 샅샅히 뒤져봐야 합니다.
  3. GWAS 신호가 non-coding 영역에 위치하는 경우, 해석이 어렵다. GWAS 신호가 특정 유전자와 관련된 변이에서 나타나는 경우에는 해석이 어렵지 않지만, 신호를 보이는 위치 주위에 전혀 유전자가 없는 경우 (inter-genic region) 또는 intron 영역에 위치하는 경우 등은 그 GWAS 신호를 해석하기가 쉽지 않습니다.

 

이번 포스팅은 위의 3번과 같은 경우에, 위에서 언급한 Chromosome Conformation Capture (CCC, 3C) 연구 방법을 이용하여 의미를 도출하는 것에 대해 알아보고자 합니다. 위의 GWAS 연구에서 얻어진 신호가 non-coding 영역에 위치하는 경우의 해석은, 해당 영역이 유전자 발현의 조절에 관련 (regulatory variant)되어 있다고 가정하는 데서 시작합니다. 또한 이러한 유전자 발현은 유전자가 위치한 염색체의 3차원적인 상호 작용에 의해서 일어난다는 개념입니다.

유전자 발현의 조절 eQTL의 개념 보기 -> 유전학 중요개념 정리: eQTL

 

3C_3

 

3C_1
[3C 연구 방법론의 개념 및 모식도] 염색체의 3차원적인 상호 작용을 보기 위해, 세포 주기 상의 간기 (interphase)에서 chromatin cross-linking 일어나는 시기에 포름알데히드 처리하여 고정(Fixation)시키고, 이를 여러 조각으로 나누어 (Fragmentation), 각 조각을 분석(Sequencing)함으로써 서로 상호 작용하는 위치를 확인하는 방법이 3C 연구 방법론의 기본 개념입니다. Chromosome Conformation Capture는 분석 대상 및 방법에 따라, 세부적으로 3C, 4C, Hi-C 등으로 구분됩니다.

위의 그림은 이러한 3C 연구 방법에 대해서 잘 보여주고 있습니다. 즉, 3C 연구 방법은 3차원 공간상의 상호 작용이 일어나는 세포 주기에서 염색체를 고정시켜서 분석함으로써, 실제로 해당 위치의 염색체가 어떤 부위와 상호 작용을 하는지를 알아보는 방법이라고 할 수 있습니다. 이러한 방법을 이용하면, GWAS 연구를 통해 얻어낸 신호가 어떤 부위와 상호 작용을 하는지, 상호 작용을 하는 유전자가 있는지를 확인할 수 있습니다. 또한 해당 위치가 실제 유전자 발현 조절에 관여되어 있다는 사실을 확인하면, 이전에는 알지 못했던 non-coding 영역의 변이에 대해서 더 폭넓은 해석이 가능해지게 됩니다.

3C_2
[Chromosome Conformation Capture를 통해 얻어진 데이터] 유전자가 Sequence 상에서 서로 가까이 위치할 경우, 서로 상호 작용할 확률이 높으나, 본 연구 방법은 3차원적인 염색체 구조 또한 고려하기 때문에, 실제 유전자 지도 상에서 서로 멀리 떨어져 있더라도 상호 작용을 하는 영역을 찾아내는데 유용한 방법입니다.

마지막으로 실제 위의 연구 방법론을 이용하여, 수행된 연구들을 소개하고 마치고자 합니다. [참고 문헌 3] 아래 연구에서는 위에서 소개한 Hi-C 연구 방법을 이용하여, 실제로 자가 면역 질환 발생의 위험도와 연관되었던 변이들에 대한 해석을 제공해주고 있습니다.

3C_4_00000

 

[참고 문헌]

Dekker, Job, Marc A. Marti-Renom, and Leonid A. Mirny. “Exploring the three-dimensional organization of genomes: interpreting chromatin interaction data.” Nature Reviews Genetics 14.6 (2013): 390-403.

Belton, Jon-Matthew, et al. “Hi–C: a comprehensive technique to capture the conformation of genomes.” Methods 58.3 (2012): 268-276.

McGovern, Amanda, et al. “Capture Hi-C identifies a novel causal gene, IL20RA, in the pan-autoimmune genetic susceptibility region 6q23.” Genome biology 17.1 (2016): 212.

글쓴이: Jihoon Yoon

인체라는 소우주를 탐험하는 호기심 많은 연구자

답글 남기기

아래 항목을 채우거나 오른쪽 아이콘 중 하나를 클릭하여 로그 인 하세요:

WordPress.com 로고

WordPress.com의 계정을 사용하여 댓글을 남깁니다. 로그아웃 /  변경 )

Google photo

Google의 계정을 사용하여 댓글을 남깁니다. 로그아웃 /  변경 )

Twitter 사진

Twitter의 계정을 사용하여 댓글을 남깁니다. 로그아웃 /  변경 )

Facebook 사진

Facebook의 계정을 사용하여 댓글을 남깁니다. 로그아웃 /  변경 )

%s에 연결하는 중