Notice04 Barley and Beer

From PGI

Revision as of 07:08, 6 October 2022 by S (talk | contribs) (Created page with "= 보리게놈의 해독으로 맛있는 맥주를? = center|450px|Barley1.jpg <br>   '''보리(''Hordeum vulgare L.'')'''는 세계의 초창...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to: navigation, search

보리게놈의 해독으로 맛있는 맥주를?

Barley1.jpg


  보리(Hordeum vulgare L.)는 세계의 초창기 가장 중요한 작물 중 하나이다. Hordeum vulgare 종의 야생 재배종인 spontaneum의 경우 세계 최초의 재배 작물 종 중 하나이며, 세계에서 네 번째로 풍부한 작물이다. 보리는 대부분 동물의 사료, 알코올 및 비 알코올 음료에 이용된다. 뿐만 아니라 다양한 환경 조건에 적응하며 유사 작물 중 하나인 밀보다 많은 스트레스 저항성을 지녀, 가난한 나라의 주요 식량 자원으로 오랜 시간 자리매김 하였다. 최근에는 제2형 당뇨나 심혈관 질환 및 대장암 등의 심각한 질병의 위험을 감소시키는, 수용성 식이섬유가 많이 함유되었다는 연구도 보고되고 있다. 이에 미국 식품 의약품 관리청에서는 보리의 곡물 세포 벽에 있는 다당류에 대한 연구를 진행하고 있다.


  보리는 이배체 식물 유전자 연구의 모델로 이전의 연구에서 5.1Gb의 큰 반수체1) 게놈으로 이루어져있다는 게 밝혀졌다. 이번 연구에서는 보리의 전장 유전체를 샷건시퀀싱2)(Shotgun sequencing)하여, BAC 라이브러리3)를 NGS(Next Generation Sequencing)로 어셈블리 하였고, 추가로 RNA시퀀싱(RNA-sequencing)을 하였다. 이러한 보리의 전장 유전체에서 구조적, 유전적 기능 서열을 발견하여 3.9~4.98Gb의 유전적 지도를 구축하였다. 보리의 유전자 지도는 다른 식물의 게놈과 유사성을 비교하여 SNP의 차이를 확인할 수 있었고, 곡물의 식이 섬유를 향상 시킬 수 있는 대립 유전자4)가 발견되었다. 세계 보리 커뮤니티에 참조 서열의 부재로 시퀀싱을 진행하는 것에 장애가 되었으나, 이번 연구를 통해 유전적으로 보리 유전자가 구조화되었고, 전사체 데이터를 이용한 새로운 분자 및 세포 분석을 통해, 현대 작물의 생산성 향상 및 개선이 가능하게 되었다.


보리 게놈의 전장 유전체 해독

보리 유전체 시퀀싱


  연구에는 Barke, Bowman, Igri, Haruna Nijo, H. spontaneum B1K-04-12, Morex 총 6종의 유전체를 이용하였다. 이미 진행된 연구는 BAC 끝부분을 생어시퀀싱(Sanger sequencing)하여 LUCY50을 이용하여 서열을 추적하여 BLASTN(Nucleotide-nucleotide BLAST) 비교하여 조립했었다. 4,095개 BAC 클론은 로슈의 454 GS-FLX 플렛폼으로 시퀀싱 하였으며, 드노보는 MIRA(v3.2.0)을 이용하여 조립했었다. 또한 추가로 진행한 2,183개 유전자 전사체는 일루미나 HiSeq2000 플랫폼으로 시퀀싱 하였으며, 드노보는 벨벳을 이용하여 조립했었다. 그러나 이번 연구는 전장 유전체를 일루미나로 350bp씩 샷건시퀀싱하고 다른 보리 품종의 조각 유전체 DNA와 비교하여 어셈블리를 하였다. 또한 BWA를 이용하여 보리의 엽록체 순서를 정했으며, 드노보는 CLC(v3.2.2)로 조립하였다.


  또한 이번 연구는 보리 유전체에 대해서 RNA-seq을 진행하여 전사체를 분석하였다. 개량종 Morex의 8개 조직을 샘플로 식물의 성장에 관련된 보충 정보를 발견하였다. 또한 샘플을 이용하여 서열의 다양성을 분석하였다.


  단일 염기 변화를 확인하기 위해 사용된 보리의 이전 세대의 유전자 마커 지도와 비교하여 정렬하였다. 완성된 유전자 지도는 고밀도의 SNV(Singel Nucleotide Variant)를 포함할 뿐만 아니라 SNP(Single Nucleotide Polymorphism)의 존재유무도 확인할 수 있었다. 또한 반복되는 DNA 서열을 감지하여 구조적 유전자의 진화 분석에 이용되었다.


  또한 유전체 계통분석을 통해 Oryza sativa (RAP2), Sorghumbicolor, Brachypodium distachyon (v1.4)와 Arabidopsis thaliana (TAIR10)와 비교하였다. 품종간의 단일 염기 변이 분석을 위해 드노보는 지노타이핑으로 읽고, RNA-seq으로 Morex 어셈블리를 매핑하였다.


구조적 보리 유전자 지도 구축

  보리의 유전자지도를 구축하기 위해, 여섯 개의 독립적인 BAC에서 발생하는 571,000가지 박테리아 염색체의 contig5)를 조립하였다. 개량 품종인 Morex의 14배의 반수체 게놈에 대한 구조적 지도를 구축하였고, 조립과 수정 후 904kb임을 예상할 수 있었다. 이는 5.1Gb의 게놈 크기를 감안할 때, 보리 게놈의 95% 이상이 밀 염색체 3GB의 80 %를 대표하는 1,036개 contigs와 유사하다는 것을 의미한다. 또한 전장유전체 샷건시퀀싱 서열데이터와 통합하여 0.5배 반수체 게놈을 Illumina GAIIx로 드노보 어셈블리하였다. contigs는 1.9Gb이고, 반복적인 DNA 서열의 높은 비율로 다른 종에 비해 큰 contig를 가졌다. 이 결과는 다른 잔디 종의 유전자 서열과 일치하는 보리 염색체의 동원체 주변(pericentromeric)과 동원체(centromeric) 부위가 크게 감소하여, 유전적 다양성을 떨어뜨리고 식물 번식에 영향을 준다는 것을 의미하였다.


보리의 중복 유전체 서열


  보리 유전체의 특징은 반복적인 DNA 서열이 풍부하다는 것이다. 대부분은 LTR(long terminal repeat) retrotransposon6)에 위치하지만 LTR이 아닌 부위나 무작위 BAC 서열에서도 나타난다. 특히 Brachypodium 품종에서 반복서열이 많이 발견되었고, Copia 품종은 쌀과 대조적으로 1.5배나 많이 발견되었다. 결과적으로 보리 염색체의 구조적 지도의 10%가 반복적인 DNA 서열이였고, 이 서열은 잔디 유전체와 유사부위의 매핑을 형광으로 그림에 표시하였다. 또한 진드기와의 SINE7)(Short interspersed elements)의 1.5~2배는 유전자지도에서 유전자가 풍부한 지역에 통합되었다.


보리 게놈의 전사체 해독

보리 게놈의 전사부위


  보리 전사체는 RNA-seq'으로 cDNA에서 얻은 167Gb를 읽었고, 전장 유전체를 샷건시퀀싱하여 엑손 75,258(95%)가 탐지되었다. 또한 수수, 쌀,BrachypodiumArabidopsis의 전사 loci는 참조 게놈과 유사성과 차이성을 비교하기 위해 사용되었다. 비교 품종 중 Arabidopsis thaliana는 신진 대사 유전자 데이터에 대한 비교가 이루어졌고, 신뢰성 유전자 15,719개와 구조적 지도와의 연관성을 확인하였다 또한 보리 유전자는 92.3%가 Mb당 최대 5개의 유전자가 밀집되어 있고약 '30,400개 유전자로 추정되었다. 또한 유전자 온톨로지(GO)8)와 PFAM 단백질 모티브를 이용하여 베타 글루칸의 합성효소, 단백 분해 효소 억제제, 당 결합 단백질과 운송에 관여하는 부위를 확인하였다. 방어 반응에 관여하는 것으로 알려진 NB-ARC(염기에 결합하는 APAF-1 유전자에 의해 어댑터와 CED-427 유전자 결합 반응으로 방어 반응) 유전자의 도메인 단백질은 NBS-LRR형 유전자이며, 재조합이 풍부한 지역에 편중되어 위치하므로 이동하는 병원체의 일련의 다양성을 생성한다고 밝혀냈다.


보리 유전자의 발현 조절



  RNA-seq는 유전자 발현 조절에 통찰력을 제공하는 방법이다. 결과의 95%가 하나 이상의 발달이나 조직 샘플에서 발견되는 시퀀싱으로, 샘플에서 발현되는 유전자의 72-84%을 발견하였다. 위 [그림 a]에서는 RNA-seq 샘플에서 높은 신뢰성의 참조 유전자를 표시하였다. [그림 b]에서는 보리 유전자 36~55%의 고유한 발현 유사성을 강조하며, 중복 유전자의 수를 클러스터로 표현하였다.


  연구를 통해 인트론에 함유된 보리 유전자의 73%가 광범위한 Alternative splicing9)의 증거로 밝혀졌다. 이는 서로 다른 조직에서 발생해야 하는 것이 서로 연관되는 등의 이탈 경로를 보인 [그림 c]에서 볼 수 있다. 또한 [그림 d]에서는 조기 종결코돈을 함유한 PTC1 제어 유전자를 발견하였고, PTC1 유전자의 감소로 NMD 경로를 활성화가 일어나는 것을 확인하였다(PTC1 유전자는 인간과 Arabidopsis, 각각의 질환과 스트레스 반응 중 전사 조절과 관련된 유전자). 또한 최근 보리가 쌀과 새로운 전사체 활성 영역의 풍부한 단백질을 암호화하는 유전자 또는 ORF(open reading frames)10)의 유사성 부족하다는 연구 결과가 발표되어, 본 연구에서는 진화 발산의 50-30백만 년을 대표하는 쌀과 Brachypodium 게놈과 보리의 새로운 전사체 활성 영역의 유사성을 비교하였다. 그 결과 pre mRNA 처리 또는 다른 RNA 조절 반응의 기능을 나타내는 새로운 전사체 활성 영역은 각각 Brachypodium, 쌀 게놈과 유사하였다.


보리 게놈의 자연 다양성


  폭 넓은 유전형 분석으로 동원체 주변 부위에서 낮은 재조합과 교차 결합(0-1.8%)이 발견되었고, 4개의 다양한 보리 종과 H.spontaneum 품종의 증가에 의해 게놈 다양성의 분포를 조사하였다. 연구 결과, 1,500만 개 이상의 SNV을 확인하였고, H. spontaneum 품종은 두 배로 더 많은 SNV를 보유하였으며, 최대 6백만 SNV에 엑손과 연관된 35만을 포함한 염색체를 확인하였다.


  Morex 품종의 유전체 조립에 이용된 여섯 가지 품종의 RNA-seq 데이터를 확인하였고, 그 결과단상형(haplotype) 다양성을 감소하는 동원체 주변 부위에서 낮은 재조합과 유전 다양성의 패턴을 지정하였다. 또한 재조합을 조절하는 바람직하고 해로운 대립 유전자 사이의 긴밀한 관계를 규명하였다.


맺음말

  반복된 DNA 서열로 인해 보리의 게놈의 크기는, 심각하게 전장 유전체 샷건시퀀싱 서열의 어셈블리를 손상시키고 참조게놈의 생성이 원활하지 못한다. 그러나 유전자 데이터 세트를 통합하여 이러한 문제를 해결할 수 있었다. cDNA와 RNA 데이터(고밀도 유전자지도, 중첩되는 NGS 전장 유전체 샷건시퀀싱 및 어셈블리 및 구조적 지도 생성)를 통해, 유전자의 90%이상의 발현을 포함하여 게놈의 약 4GB(80%)를 확인할 수 있게 되었다.


  게놈 프레임 워크는 유전자와 반복 DNA 서열의 물리적 분포와 재조합 빈도, 유전자 발현과 변형의 패턴으로 유전 특성에 관한 상세한 분석을 제공한다. 또한 유전자의 분포는 개별 염색체의 물리적 길이에서 보존된 유전자 상동성을 감안할 때, 드문 재조합은 진화적으로 선택하고 공동으로 적응한 유전자를 유지하게 한다. 해로운 대립 유전자, 유전자 이득을 향상시키고 잠재적으로 유리한 분리에 필요한 유전적 다양성을 조절한다(작물 개선을 위한 중요한 결과).


  유전적 다양성은 자연 또는 유도 돌연변이 대립 유전자의 resequencing11) 기술을 결합하여 존재하며, 유전이나 환경의 개입에 의해 재조합의 패턴을 조작한다. 또한 전사 조절의 복잡한 희귀 기능에 보리 유전자와의 연관성을 고려하여, Alternative splicing 및 생물학 기능의 결과를 유추한다. 결론적으로, 보리 유전자는 유전자 연구와 번식을 위한 필수적인 참조를 제공하였고, 자연 유전적 다양성을 이용하여 고유 생물과 세계 최초의 가정적인 작물 중 하나의 진화를 조사하였으며, 진화 네트워크를 구축하였다.




  1. 반수체(haploid) : 2배성세대가 생활의 대부분을 차지하는 식물로서 체세포 염색체가 2배성의 반수로 되어있는 개체.
  2. 샷건시퀀싱 : 유전체 서열 분석 방식의 하나. DNA를 잘게 토막낸 후 염기서열을 분석한 뒤, 이 서열 자료들을 컴퓨터에 넣으면 서로 겹치는 부분을 컴퓨터가 찾아내어 순서를 짜맞춰주는 방식
  3. BAC(bacterial artificial chromosome) 라이브러리 : 생어시퀀싱에서 주로 이용하는 방식으로 박테리아의 크로모좀을 이용하여 거대 DNA를 포함한 유전자 은행과 같은 역할
  4. 대립유전자(Allele) : 상동염색체에 서로 대응하는 부위, 즉 상동하는 유전자 자리에 위치하는 대립 형질에 대응하는 유전자, 복대립형질에 대해서는 거기에 대응한 유전자군, 즉 복대립유전자가 존재한다.
  5. Contig : 중복되면서 연속하는 클론화 DNA의 집합체. 염색체 전체 또는 특이적 영역을 빠짐없이 커버하기 위해서는 상호간에 일부 중복되면서 연속하는 클론 집합체가 필요하다.
  6. Retrotransposon : 레트로포존. 역전사효소를 코드하는 RNA형 전이인자. 긴 말단 반복 순서(LTR)을 갖는 것과 갖지 않는 것으로 구분된다. LTR형 RNA유래전이인자에는 초파리의 코피아(copia)나 효모의 Ty요소가 있고, 비LTR형 RNA유래전이인자에는 사람의 L1이나 누에의 R2Bm이 있다. LTR과 env유전자를 모두 갖는 것은 감염성이 있으며LTR형 RNA유래전이인자와 구별하여 레트로바이러스로 불리고 있다.
  7. SINE(Short interspersed elements) : 유전자의 짧은 사이사이 요소들
  8. GO(Gene Ontology) : 세포의 부분적이거나 세포 환경에 대한 세포 구성요소, 분자 기능과 같은 조절 또는 분자 수준에서 유전자의 촉매활동, 생물학적 과정 등 유전자의 생물정보
  9. Alternative splicing : 선택적 이어맞추기. DNA로부터 단백질이 만들어지는 과정에서 1차적으로 DNA가 복제되어 만들어진 pre-mRNA 내의 비발현 부위(intron)가 제거되고 발현부위(exon)끼리 연결되는 과정. 결과적으로 하나의 유전자로부터 다양한mRNA가 만들어질 수 있는 것이다.
  10. ORF(open reading frames) : 시작과 정지코돈을 가지 구간.
  11. Resequencing : 데이터베이스로 공개되어 있는 게놈 서열을 기본으로 놓고 거기에 지금 시퀀싱하는 서열의 단편들을 맞추어서 길게 이어나가는 방식.

참고문헌

A physical, genetic and functional sequence assembly of the barley genome http://www.nature.com/nature/journal/vaop/ncurrent/full/nature11543.html

Evolution of wild cereals during 28 years of global warming in Israel

http://www.pnas.org/content/109/9/3412.abstract

Development of highdensity genetic maps for barley and wheat using a novel two-enzyme genotypingby-sequencing approach.

http://www.plosone.org/article/info%3Adoi%2F10.1371%2Fjournal.pone.0032253

저자

글 : hjpark

편집 : Thkim

글 오류 신고는 hyeonji.park@pgi.re.kr으로 보내주세요.

키워드 : barley, beer, Brachypodium, Morex, RNA-seq, Arabidopsis, de novo, NGS, shotgun sequencing, whole genome sequencing, Hordeum vulgare, spontaneum