Notice01 NGS TREND 2013년 03월호

From PGI

Jump to: navigation, search

NGS 수행하는 우리들의 자세, 10계명

 

  최근, 세인트루이스 워싱턴 대학, 게놈연구소의 유전학자 Dan Koboldt는 차세대 시퀀싱을 수행하는 10계명을 내놓아 화제가 되고 있다. 차세대 시퀀싱(Next Generation Sequencing)은 연구와 임상 영역 모두에서 NGS 사용자들의 커뮤니티가 형성될 만큼 성장하고 있으며, 그 동안 454와 Solexa 시퀀싱 플랫폼은 놀라운 속도로 발달되었다. 그러나, 급격한 성장에는 성장통이 따르는 것처럼, 인류의 유전데이터 생성에도 책임이 뒤따르기 때문에, NGS를 위한 10계명을 내놓았다.


NGS analysis

 

1. Thou shalt not reinvent the wheel.

 

  급속한 기술 발전으로, NGS의 주력 기술의 대부분은 새로운 분야가 없을 만큼 발달되었다. 짧은 read aligner, 새로운 assembler, variant caller와 다른 도구들은 이미 과잉 상태이지만, 생명정보학적 작업을 수행하기 위해서는 사용자 정의의 스크립트를 작성할 수 있는 더 나은 뭔가를 갈망한다. BWA보다 더 나은 aligner을 작성할 수 있을까? 중요한 것은 SomaticSniper과 VarScan을 개발했을 때처럼 뭔가 새로운 것을 개발할 강력한 이유가 없다면 어떤 이점이 있을지를 생각해야 한다.


2. Thou shalt not coin any new term ending with “ome” or “omics”.

 

  “ome”나 “omics”로 끝나는 용어들을 이미 너무 터무니 없이 사용해 왔으며, 더 이상 사용하지 말라는 것이다. 게놈(genome), 전사체(transcriptome), 단백질체(proteome)는 명백한 명명법에 적용된 것이다. 후성유전체(epigenome) 또한 그렇다. 그러나, 대사체(metabolome), 상호작용체(interactome)와 같은 다른 변형된 “ome” 단어들은 명명법에 적용되지 않은 것이다.


3. Thou shall follow thy field’s conventions for jargon.

 

  전문 용어에 대한 규칙을 따라야 한다. 기술 용어나 두문자어(acronym), 약어는 조사에 내재되어 있으며, 이러한 것들은 정밀도와 간결성 모두에서 필요하다. 이미 존재하는 단어가 있어도, 문제가 생기면 자신들만의 약어를 만들 필요가 있다.

 

  차세대 시퀀싱(NGS), 높은 처리량 시퀀싱(HTS; High-Throughput Sequencing), 대량 병렬 시퀀싱(MPS; Massively Parallel sequencing)이 큰 차이가 있는가? 표준 조건이 널리 이용되며, 때마다 사용이 가능하게 되어야 한다. 예를 들어, 삽입과 결실의 변이는 INDEL이나 InDel이 아니라 indel이다. 구조변이는 SVars나 GVs가 아니라 SVs이다.

 

 

NGS publications  

 
 

4. Thou shalt not publish by press release.

 

  보도자료에 의해 공개하지 말아야 한다. 유전체에 대한 대상의 공개가 허용되기 전에 새로운 유전자가 발견되면 발표를 하는 것이, 최근 자주 일어나고 있다. 동료들의 평가는 과학적 조사를 위해 요구된 것이지만, 같은 시기에 같은 발견을 한 당신의 경쟁자와 결과가 합쳐지기도 한다. 그렇지만, 당신이 앞서 보도하였다고 해서, 본인의 결과임을 주장할 수 있다는 것을 의미하지는 않는다.


5. Thou shalt not rely only on simulated data.

 

  가상 데이터에 의존하지 말아야 한다. 새로운 방법이나 알고리즘에 대한 글을 읽을 때는 가상 데이터를 예를 들어 보여주는데, 이는 해답을 알고 접근 방법을 시연하는 목적으로 제공되는 것이다. 그럼에도 불구하고, 실제 데이터에 적용시켜 차세대 시퀀싱으로 임의적 쓸모없는 데이터를 복제할 가능성이 있다.

 
6. Thou shalt obtain enough samples.

 

  충분한 샘플을 얻어야 한다. 비용이 감소하며 빠르게 성장하는 현장에서 관심사는 샘플의 양이다. 엑솜(exome)과 전장유전체(whole genome)의 상위 통계 값으로는 더 이상 참신하지 않으며, 수백(또는 수천)명의 환자에서 발견한 통계적 유의 결과값을 이용한다. 개인별 차이로 인한 것이 아니라, 집단 간의 결과값을 이용하기 때문에 잘못된 결과를 유도하지 않는다.

 

 

Data sharing and submissions

 

7. Thou shalt withhold no data.

 

  데이터를 보류하지 말아야 한다. 일부를 제외하고, 시퀀싱 데이터는 공유되어야 한다. 미국의 대규모 시퀀싱 센터와 같은 특정 기관의 경우, 공적 자금을 사용하여 생성된 데이터는 자신들의 기관에 위임한다. 일반적인 dbGaP 사이트는 데이터를 위임 받기 전, IRB 승인을 받았다. 시퀀싱 데이터에서 발견한 것을 발표할 계획인 모든 연구자들은 발표 전, 공공 데이터를 제출해야 한다. 이는 선택사항이 아니며, 발표물을 재현하는 데 필요하기 때문에 원고를 제출하기 전 수행되어야 한다.

 

  예) Nature 지의 매뉴얼;

 

  데이터는 게시한 날로부터 독자들이 자유롭게 사용할 수 있어야 하며, 원고를 평가 목적을 위해 동료 평가자들과 편집자에게 제출해야 한다. 데이터는 지역사회의 승인을 받아야 하고, 공공의 저장소에 제출하는 것을 원칙으로 한다. 제출할 데이터는 다음과 같다.


    • DNA와 RNA 시퀀스
    • DNA 시퀀싱 데이터
    • Deep 시퀀싱 데이터
    • epitope, 기능 도메인, 유전자 마커, haplotype

 

  모든 저널은 비슷한 정책을 가지고 있어야 하며, 편집자에게 제출하지 않은 원고는 거부하여 제출 요구 사항을 모두에게 적용시켜야 한다.

 
8. Thou shalt not take unfair advantage of submitted data.

 

  제출 데이터의 불공정이 있어서는 안 된다. 대부분의 데이터가 공개되면 위험하다는 우려를 하는 것이 최대 관심사이다. 공개된 저장소에 데이터를 제출하면, 다른 누군가가 찾아서 사용할 수 있게 된다.


  암 게놈 아틀라스로 형성된 것처럼, 상당한 데이터를 형성하기 위해서는 대규모 장소에 보안장치를 설정해야 한다. 보안 정책은 마커가 발견되었다는 논문이 발표될 때까지, 특정 암 유형에 대한 데이터를 사용할 수 없게 하는것이다. 이것은 NGS 커뮤니티 및 저널의 편집자가 항상 적용시키는 가장 좋은 보안 장치이다.

 

 

Research ethics and cost

 

9. Thou shalt not discount the cost of analysis.

 

  분석 비용을 낮추지 말아야 한다. NGS 기술이 출현된 이후, 시퀀싱 비용이 급격히 하락했지만, 분석 비용은 그렇지 않았다. 게놈 데이터의 alignment, 품질관리, 변이 발견, annotation, 해석하는 일은 기계적인 자원뿐만 아니라 전문적인 지식을 필요로 한다. 이러한 인프라는 사실 시퀀싱보다 비용이 더 많이 들 수도 있다. 해독 데이터를 분석하지 않으면, 초콜릿을 생성하기 전에 주전자에 담긴 것처럼 1,000달러 게놈의 가치가 무의미할 수도 있는 것이다.

 

10. Thou shalt honour thy patients and their samples.

 

  환자들과 그들의 샘플에 의무감을 가져야 한다. 2013년 2월초, CEPH 수집에서 유전자 마커 및 온라인에 공개된 데이터베이스 조합을 이용하여 익명의 개인을 식별하는 방법을 이용하였다. 식별하는 방법은 Yaniv Erlich가 개발한 방법으로, 남성 참가자의 Y 염색체에서 짧은 반복 구간과 데이터베이스의 나이, 거주지역 등을 종합하여 익명의 개인을 식별할 수 있게 하는 것이다.

 

  더 이상 샘플의 익명성을 보장할 수 없는 것은 사실이다. 개인 게놈의 결과를 해석하기 위해 분석 도구들이 발달하였으며, 학습에 의해 가능하다는 것을 의미한다. 그러므로, 연구 참가자들의 개인 정보를 보호해야 한다. 지속적인 데이터 제공을 원하는 경우, 개인 정보의 침해 또는 차별에서 보호할 방법을 찾아야 한다. 정보 제공 동의 문서를 시퀀싱 전에 받아야 하며, 이러한 동의는 데이터 사용 정책을 준수한다는 것을 의미한다.

 

참고 사이트

 

http://lifescientist.com.au/content/molecular-biology/article/ten-commandments-for-next-gen-sequencing-199683042

http://www.nature.com/authors/policies/availability.html

http://massgenomics.org/

  

저자

 

글 : Park.HyeonJi

편집 : Lee.SeungYoun

키워드 : NGS(Next Generation Sequencing), HTS(High-Throughput Sequencing), MPS(Massively Parallel sequencing) 등