Notice04 ENCODE project2

From PGI

Jump to: navigation, search

인간 유전체의 염색질 주변을 접근하다!

 

 ENCODE 프로젝트의 결과 논문들이 연일 화제가 되고 있다. 인간 유전체의 모든 기능을 가진 요소들을 동정하는 것을 목표로 한 이번 프로젝트는 국립 인간 게놈 연구소에서 단백질과 RNA 수준의 모든 요소들을 포함하여 인간 게놈의 종합적인 백과사전을 만들었다.


  총 24편의 논문들 중 이번 리뷰에서는DNase I 과민성 지역(DHS; DNase I hypersensitive sites)에서 염색질의 접근성 패턴에 따라, 세포의 특정 기능 동작을 예측하고 기능 진화를 조절하는 능력에 관한 논문이다. 또한 DHS 지역의 염색질의 접근성과 전사, DNA methylation 및 조절 요소와 패턴 사이의 새로운 관계를 밝혀내었다. 세포간의 이동으로 DNase I 민감성은 특정 기능을 하는 세포의 유형을 예측할 수 있게 한다. 이로 인해, 분화 초기의 세포와 불멸의 세포에 있는 DHS 지역들은 돌연변이를 많이 일으킨다.


  연구에서 중점적으로 다룬 염색질의 DHS는 이미 30년 전에 발견되어, 현재까지 다양한 생물의 DNA 매핑을 조절하는 데 이용되어왔다. DHS는 Histone 3 Lysine 4 tri-methylation(H3K4me3) 과 인접한 DNA를 조절하기 위해 히스톤이 수정되어, 뉴클레오좀1)에 둘러싸인 형태로 존재한다.



DNase I과 염색질 접근성의 관계

 

  ENCODE 연구 센터인 워싱턴 대학과 듀크 대학에서 넓은 범위의 유전자 DNase I 민감성을 125명의 인간 세포와 조직(71개 정상 분화 세포, 16개 분화 초기 세포, 30개의 악성 종양 세포, 8개의 만능 줄기 세포)에서 시퀀싱하였다.


  DNase I 절단 부위의 염색질에 접근하는 정도를 측정하였고, 염색체 11번의 350Kb 지역에서 나타났다. Southern hybridization 방법2)으로 7,478개 DHS를 확인할 수 있었다. 또한 GENCODE에 의해 정의된 약 300만개의 DHS는 약 3%인 1Kb의 인트론(intron) 및 유전자 사이(intergenic) 영역에서 절단된다. 따라서 결과적으로 125개의 세포에서 세포 유형에 따라, DHS의 상대 빈도를 나타내어 염색질의 접근성을 확인하였다. 확인된 프로모터 영역 29개 세포와 대조적으로 말단 부위의 DHS는 높은 접근성을 나타내었고, miRNA가 진화 보존적인 조절위치이며, 염색질에 접근 정도가 강한 세포 선택성을 보여주었다.


 전사 요소의 DNase I 과민성으로 염색질의 접근성을 조절하는 것을 알아보기 위해, K562 세포를 ChIP-Seq하여 DNase I과의 상관 관계를 확인하였다. DHS의 높은 중복 패턴은 DNA 주형가닥에 접근할 때, 낮은 친화적 인식 서열과 약한 상호작용을 유발하였다. 결합 조절 위치와 관련이 있는 약 110만 개의 데이터에서 94.4%가 염색질 접근성을 보였다. 그 중 KRAB 단백질에 관련된 KAP1, ZNF274 단백질과 SETDB1 유전자는 염색질 저해제로 이종의 염색질(GATA1 유전자, c-Jun 단백질, NRF1 전사인자자 접근성 단백질)을 제한하였다.



한 방향 프로모터 염색질

 


  염색질 접근성 및 H3K4me3 패턴 사이의 관계와 전사 개시의 관계를 세포 유형을 암호화시키는 단계의 변이를 통해 방향 불변의 프로모터3) 염색질을 확인 할 수 있었다. RNA 분석뿐 아니라 전사개시 위치(TSS; Transcriptional Start Sites)를 알기 위해 56개 세포를 ChIP-Seq을 수행하였다. 


  ACTR3B 유전자와 DNase I의 전사개시위치 주변의 K562 세포에 대한 H3K4me3의 밀도에 대해 확인하였고, GENCODE4)에서 무작위로 선택된 10,000개의 TSS에서 59R39에서 H3K4me3의 밀도로 패턴의 불변성을 확인하였다. 또한 EST5)와 CAGE6)로 113,6115가지 프로모터 위치를 예측하였으며, K562 세포에서 새롭게 확인된 프로모터 위치를 주석 달았다. 이러한 결과는 체계적인 염색질 데이터를 이용하여 RNA의 전사체 분석을 할 수 있다는 것을 알려준다.



염색질 접근성과 DNA methylation 패턴

 


  CpG methylation은 유전자 침묵7)을 기반으로 유전자 조절과 긴밀한 연관성이 있지만, DNA methylation과 염색질 구조 사이의 관계는 명확하게 정의되지 않았다. CpG methylation을 측정하기 위해 Bisulfhite-Seq8)을 실시하여, 19가지 세포 유형의 DHS에서 243,037개 CpG를 확인하였다. 또 DNA methylation과 염색질 접근성 사이에 강한 역상관 관계가 있거나 상관관계에 변수가 있더라도 높은 메틸레이션이 있는 사람을 통해, 선형 회귀 분석하여 20%(6,987명)가 상당한 연관성이 있다고 보고했다.


  또한 유전자 침묵의 원인에 DNA methylation의 역할은 현재 명확히 밝혀지지 않았다. 메틸레이션은 전사 인자를 제한하거나, 수동적으로 전사인자를 채워서 염색질 접근성을 제한할 수 있는지에 대한 가설이 있을 수 있다. 이러한 가설이 사실이라면,제한 부위의 서열 메틸레이션은 전사 인자의 유전자 발현이 독립적이여야 한다.

 

  DHS 내에 메틸레이션에 전사 인자의 발현과 조절은 상당한 negative 상관관계를 보인다. 또한 DNA 조절 전사인자의 세포 선택적 염색질 접근성 결과를 확인하는 다른 보고서에서는 메틸레이션 연장 패턴을 확인 할 수 있었다. 예를 들어, MYB 유전자 및 LUN-1 효소(다른 말로 TOPORS라고도 함)과 조절 부위의 메틸레이션 사이에도 양의 상관관계를 보였다. 이에 관련된 급성 골수성 백혈병 세포에서 PML 세포의 메틸레이션으로 전사 인자가 증가하였다. 결과적으로 염색질 구조와 DNA 메틸레이션에 대해 전사 인자의 변형 때문에 특정 세포에서만 변이가 발현되었다.



DHS와 프로모터 연결부위 매핑

 


  DNase I 자료 수집으로 많은 세포 유형의 선택적 강화를 일으키는 유전자의 프로모터에서 DHS가 관찰되었다. 79개 다양한 세포 유형에서 140만 개 말단 DHS의 패턴을 분석하여 특정 유전자를 조절하는 광범위한 지도를 만들었다. 5C-seq에 의해 HindIII9)로 조각난 조각들은 프로모터를 포함하였다. 인간 게놈의 1% 이상을 수행한 DHS-프로모터가 'K562 세포에서 '특정 염색질의 상호작용을 풍부하게 하였다. 또한 DHS 부위를 왼쪽과 오른쪽에서 프로모터 영역의 위치를 확인한 비율로 방향을 확인하였고, DHS 말단 부위에서 특징에 따라 연결 지었다. 이 결과는 세포 전사 프로그램의 견고성을 강화할 때 이용될 수 있을 것이다.


  DHS-프로모터는 조절 인자를 체계적으로 반영하게 한다. 예를 들어KLF4SOX2, Oct4 유전자와 NANOG 단백질은 배아줄기 세포10)의 만능상태를 조절하는 특징을 가지고 전사 네트워크를 형성한다. 모티프11)를 포함하는 프로모터와 말단의 DHS에서 공통적으로 발생하여 조절이 가능하다.



조절 DNA의 변화와 변이 속도의 연관성

 


  DHS는 서로 다른 종과 위치 사이의 차이가 진화 조절에 있다는 사실에 기초하여, 53명의 관련이 없는 개인의 전장 유전체 시퀀싱 데이터를 이용하여 DHS의 97개 염기 다양성을 추정하였다. 생식 다양성의 분포가 확인 되었으며, 제한된 생식세포의 DHS 대부분에는 불멸의 세포보다 낮은 다양성이 보였다.


  또한 인간과 침팬지의 분기에 인간의 다형성의 비율은 DHS 돌연변이 속도 차이로 인한 경우,세포 유형에 따라 일정하게 유지되며, 원시 돌연변이 속도는 세포 유형에 따라 동일한 희귀 및 일반 유전자의 변형에 영향을 미칠 것으로 예상된다. 또한 지속적으로 파생된 대립유전자의 DHS에서 SNP의 62%가 염색질 접근성과 생식 가능성이 있는 세포 유형에, DHS가 증가하여 변이 속도가 높아진다.



맺음말

 

  본 연구는 30년 전 발견한 DNase I 과민성 위치를 통해, 인간과 다른 유전체의 다양한 cis 조절 요소를 밝혀낼 수 있었다. 우리의 연구 결과에 의해 서로 다른 세포 및 조직 유형의 다양한 스펙트럼이 체계적인 장거리 조절 패턴을 인식하고 DHS 부위의 활성화 및 돌연변이 속도 변화로 미확인 현상을 가능하게 한다. 또한 세포 선택 유전자 조절로 분석의 시야를 확대하였을 뿐만 아니라 정상 세포 대 불멸 세포를 통해 미래의 분석을 촉진하고, 조직과 인간 게놈의 조절 조사의 새로운 영역을 이끌 것이다.





  1. 뉴클레오좀 : 유전체를 감아서 저장하는 단계 중에서 히스톤 단백질 8개를 모아서 동태를 만들고 그 둘레를 DNA분자가 둘러 있는 한 개를 말한다. 이것은 DNA저장의 가장 작은 단위이다. 티모시 리치먼드에 의해 그 구조가 2000년대 초에 규명되었다.
  2. Southern hybridization : 재조합 DNA 분자 내에 조작된 유전자의 정확한 위치를 결정하기 위해 이용되는 방법
  3. 프로모터 : 일반적으로 프로모터는 전사를 조절할 대상이 되는 유전자의 유전정보를 지니고 있는 DNA염기서열 앞부분에 위치. 진핵 생물에서는 전사조절인자(transcription factor)라고 하는 단백질들이 프로모터부분에 결합함으로써 RNA중합효소를 이곳으로 이끌고 오는 일에 관여한다. 프로모터는 이러한 전사조절인자들이 결합하는 모든 DNA염기서열부위를 지칭한다고도 할 수 있다. 그에 비해 원핵 생물에서의 프로모터는 대개 RNA중합효소가 결합하는 전사시작지점(Transcription Start Site) 바로 근처의 결합부위로 정의된다. 전사를 조절하는 DNA염기서열은 프로모터 외에도 인핸서(enhancer)가 존재하나 프로모터가 전사시작지점으로부터 바로 앞쪽으로 수백 염기쌍 내에 위치하는데 비해 인핸서는 프로모터로부터 수천 염기쌍 이상 떨어져 있다는 점에서 구별될 수 있다.
  4. GENCODE : 게놈 연구와 인코딩(DNA 요소의 백과사전) 규모의 과학 프로젝트. 유전자 전체의 기능을 높은 정확도로 단백질 등의 결과를 확인 할 수 있는 프로젝트
  5. EST : expressed sequence tag. 유전자 분석에서 특정 유전자를 확인하고 분류할 수 있는 유전자 특이 염기 서열의 일부.
  6. CAGE : Cap Analysis of Gene Expression. Tag-profiling 중 하나.
  7. 유전자 침묵 : 특정 유전자가 발현하지 않도록 하는 기술. 기존에는 Antisense RNA를 이용하여 mRNA에 상보적인 RNA가닥을 넣어줌으로 특정유전자의 발현을 억제하였는데, 최근에는 siRNA라고하여 21-23개의 작은 double strand의 RNA를 이용하는 것이 더 효과적임이 밝혀졌다. 이렇게 특정유전자를 발현을 억제하면 그 유전자의 기능을 이해하는 데 도움이 됨은 물론 치료목적으로 이용될 수 있다(siRNA기술을 이용하면 base 한 두개의 차이의 mutant gene의 발현도 정상유전자의 발현을 방해하지 않으면서 억제될 수 있다).
  8. Bisulfhite-Seq : DNA methylation 패턴을 발견하는 시퀀싱 방법. Bisulfite를 이용한 CpG 부위를 감지한다.
  9. HindIII : Haemophilus influenzae Rd균이 합성하는 제한효소의 하나. 5‘-AAGCTT-3‘의 6염기쌍을 인식하여 A와A의 사이를 절단한다.
  10. 배아줄기 세포 : 다분화 능력이 있는 세포. 주로 배양접시에서 배양할 수 있지만 다른 배반포강 내에 주입하면 생식세포를 포함하여 여러 가지 세포로 분화할 수 있는 세포. 마우스 배반포를 배양함으로써 직접 수립한 세포이고, 일단 기형종을 경과해 수립한 배성 암세포(EC세포)와 구별하기 위하여 그러한 명칭이 붙여졌다. 모든 마우스계통에서 수립할 수 있을 뿐 아니라 현재는129계통유래의 CCE, E14, D3, R1이나 BCF1유래의 TT2가널리 사용되고 있다. 분화능력을 유지한 채로 배양하기 위해서는 미리 선택한 소의 태아혈청이나 백혈병 저지인자를 첨가해야 한다. 배양 중에 상동적 유전자재조합을 통하여 특정 유전자파괴, 아미노산 치환, 유전자 전(全) 치환 등이 일어날 수 있다.상동적 재조합을 한ES세포를 다른 배반포강 내에 주입함으로써 키메라마우스를 제작하고, 이를 다시 교배시킴으로써 특정한 유전자를 개변시킨 마우스를 만들 수 있다.
  11. 모티프(Motif) : 단백질의 기능이 특정 모티프(motif)의 구조 및 특성에 따라 결정




참고문헌

The accessible chromatin landscape of the human genome

http://www.nature.com/nature/journal/v489/n7414/full/nature11232.html

Extensive promoter-centered chromatin interactions provide a topological basis for transcription regulation.

http://groups.molbiosci.northwestern.edu/horvath/journClubArticles/JC%20for%20February%2017,%202012.pdf

Chromatin accessibility pre-determines glucocorticoid receptor binding patterns.

http://www.ncbi.nlm.nih.gov/pubmed/21258342



저자

글 : hjpark

편집 : Thkim

글 오류 신고는 hyeonji.park@pgi.re.kr으로 보내주세요.

키워드 : ENCODE project, DNase I, DHS, H3K4me3, chromatin, Southern hybridization, KARB 단백질,KAP1, SETDB1, ZNF274, GATA1, c-jun, NRF1, ChIP-seq, CpG methylation, bisulphite-seq 등