GTEx portal: eqtl, sqtl database

최근의 많은 연구는 Multi-omics data를 활용하여, 대부분 non-coding region에 존재하는 GWAS에서 발굴한 질환 관련 loci가 유전자 발현 수준 (Transcriptome) 또는 발현 조절 (Epigenome)과 관련된 곳임을 입증함으로써, 질병 메커니즘을 설명하려는 방향으로 나가고 있습니다. 특히, 그동안 설명이 되지 않았던 많은 Complex Trait Disease의 경우, 이러한 접근 방법이 추가적으로 많은 생물학적 이해를 가져왔습니다. [관련 포스팅 보기] [유전학 중요개념 정리] 오믹스 (Omics) 와 단일

더 보기

AlphaFold를 이용한 단백질 구조 예측

최근 Alphafold의 소스 코드와 전체 단백질 예측 구조 데이터 베이스가 공개되면서, 정말 다양한 방면에 활용이 가능할 것으로 생각되고 있습니다. 유전체 연구자의 입장에서는 Alphafold를 이용하면 수 많은 변이들의 in-silico structural prediction이 가능하기에, 과거에 존재하던 variant prediction tool들 보다 훨씬 강력하고 정확한 예측 도구가 나타날 것으로 생각됩니다. 이번 포스팅은 공개된 Alphafold2의 소스 코드와 데이터 베이스 자료를 정리해보고자 합니다. Alphafold2의 경우, 기존에 실험적으로

더 보기

Epigenomic profiling을 위한 ATAC-seq

최근 많은 연구들에서 유전자 자체의 염기 서열과 발현량 못지 않게, 유전자 발현을 조절하는 Epigenetics가 다양한 생물학적 메커니즘에 매우 중요하게 작용하는 것으로 밝혀지고 있습니다. 이번 포스팅은 지난 번 포스팅에 이어, Epigenetics 정보를 얻는데 널리 쓰이는 Assays for Transposase Accessible Chromatin with high-throughput sequencing (ATAC-seq)에 대해서 정리해 보고자 합니다. Epigenetics와 관련된 정보를 얻는 방법은 매우 다양합니다. 아래 그림과 같이, 일종의 표지자로 작동하는

더 보기

[스크랩] Writing a Review Article

연구 논문 못지 않게, 연구자들이 많이 보는 것이 그 동안의 연구 동향과 방향을 정리해 놓은 리뷰 논문인 것 같습니다. 이번에 좋은 기회에 미국의 PI의 제안으로 리뷰 논문을 준비하게 되어, 리뷰 논문 작성시 고려해야할 10가지를 정리한 논문 (논문을 정리하는 리뷰 논문을 위한 논문?)과 리뷰 논문 작성시 하게 되는 흔한 실수들에 대해 스크랩합니다. Ten Simple Rules for Writing a Literature Review Rule

더 보기

[유전학 중요개념 정리] 오믹스 (Omics) 와 단일 세포 시퀀싱 (Single cell sequencing)

현재 있는 미국의 연구실은 다양한 Omics 데이터를 종합적으로 분석하여, 소아 신증후군의 정밀 의료 실현을 위한 연구를 진행하고 있습니다. 아래의 관련 포스팅과 같이, 다양한 유전체 연구 결과 대부분의 복합질환 질병 발생은 유전체의 유전자 발현을 조절하는 부분, 그리고 non-coding 영역에 존재함을 확인하게 되었습니다. 이에 연구자들은 이러한 부분이 어떠한 기작을 통해서, 질병을 발생을 시키는지에 대한 연구를 진행하고 있으며, 이러한 연구 방법론의 하나로 다양한

더 보기

유전체 데이터 분석을 위한 서버 운영 (feat. harvard e2)

저는 현재 하버드 부속 연구기관 중 하나인 BCH (Boston Children’s Hospital)의 연구 서버 (Researching computing) “E2“를 이용하여, WGS 분석을 진행하고 있습니다. E2는 대략 1000개 이상의 연산용 cpu를 가지고, BCH 소속 많은 연구실의 연구자들의 Bioinformatics 관련 분석을 처리해주는 서버입니다. Genome sequencing 관련 분석은 Target 또는 Exome sequencing과 다르게 그 엄청난 데이터 사이즈로 인하여, 연구용 서버를 이용하여 많은 수의 샘플을 처리하는데 많은

더 보기

[NGS DNA-SEQ] Functional Equivalence pipeline: CROMWELL, WDL

gnomAD, TOPMed 등 대규모 유전체 코호트들이 만들어지면서, 여기서 생산된 데이터를 이용하는데 중요한 문제가 부각되었는데, 바로 분석 결과 간의 재현성과 호환성에 있었습니다. 즉, 연구자가 GATK Best practice를 이용하여 Exome 또는 Genome 시퀀싱 분석을 진행하더라도 어떤 설정과 파라미터 값을 넣느냐에 따라, 최종 검출 변이의 결과가 달라지고, 이것은 연구 결과 간의 재현성의 측면에서 매우 중요한 문제가 되었던 것이지요. 참고논문에서 진행한 실험 결과를 보면,

더 보기

유용한 VCF manipulation commands

시퀀싱 결과 최종 파일은 변이들에 대한 정보를 담고 있는 VCF 파일입니다. 여러 가지 조건에 맞게 변이들을 Filtering하고, 입맛에 맞게 관련 정보들을 Annotation하는 것은 후속 단계에서 의미 있는 변이들만 남기는데 있어서 거의 필수적이라고 할 수 있습니다. 이번 포스팅은 VCF 파일을 조작하는데 있어 유용한 bcftools의 명령어들을 정리하려고 합니다. [관련 포스팅 보기] NGS DNA-SEQ PIPELINE: GATK BEST PRACTICE CODE – PART3. VCF MANIPULATION [계속

더 보기

[Broad Institute] Medical and Population Genetics (MPG) seminar

[관련 링크 보기] https://www.broadinstitute.org/medical-population-genetics 매주 목요일에는 Broad Institute가 주관하는 Medical and Population Genetics 세미나가 있습니다. 세미나에 참석할 때마다, 매주 따끈 따끈하고 핫한 연구들을 마주할 수 있다는 게 감사하고 행복하기까지 합니다. 특히, 흔한 유전학 연구 내용 뿐 아니라 그에 따른 윤리적 문제 (ELSI), 어떻게 환자에게 유전 정보를 설명하고 임상 진료에 활용할 것인가? (Genetic Counselling), MIT의 공학자들과의 협업을 통한 인공 지능 (AI,

더 보기

[논문소개] 면역억제제 Tacrolimus의 약물 유전체 연구

작년부터 미국에 오기 전까지 부랴 부랴 동시에 4개의 논문을 쓰고 있었는데, 그중 2개 논문의 온라인 출판이 완료 되었습니다. 그래서 앞의 논문을 소개한 김에, 함께 출판된 다른 약물 유전체 연구도 소개를 해볼까 합니다. 이번 연구의 프로젝트도 약리학 교실에 처음 박사 과정으로 들어오면서 부터 시작했던 프로젝트인데, 장기 이식 후의 면역 억제제로 널리 사용하는 Tacrolimus와 관련된 약물 유전체 연구입니다. 개인적으로는 처음으로 본격적으로 NGS

더 보기
« 이전 엔트리