그림1. Long Read RNA Sequencing과 Short Read RNA Sequencing의 차이점
오늘 설명드릴 Long Read RNA Sequencing은 많은 분들에게 익숙한 Short Read RNA Sequencing과 많은 부분이 비교되고는 합니다. 전통적인 Short Read RNA Sequencing은 mRNA를 약 150bp의 짧은 조각들로 분해하여 맵핑합니다. 이 방법은 저렴한 비용으로 대량의 염기 서열을 읽어낼 수 있어 차별 유전자 발현 분석 등에서 널리 사용되어 왔습니다.
그러나 이 접근 방식은 Alternative Splicing으로 인해 형성된 Novel한 Isoform에 대한 정보를 얻기 힘들다는 한계점이 존재합니다. 이러한 정보를 얻기 위해서는 Exon과 Exon 사이를 연결하는 Splice Junction에 대한 정보가 필요한데, Short Read Sequencing 기법으로는 이러한 정보를 포함하는 Reads를 확보하는 데 있어 한계점이 존재하기 때문입니다.
그림2. Alternative Splicing 과정
생체 시스템의 전체적이고 정확한 정보를 얻기 위한 노력으로 서열을 길게 읽어 온전한 정보를 얻고자 하는 시도는 계속되어 왔습니다. 그 결과 고안된 Long Read RNA Sequencing 기법은 이러한 정보를 얻는데 훌륭한 대안이 될 수 있습니다. Short Read Sequencing과는 달리, Long Read RNA Sequencing 기법은 15-20kb가량의 mRNA 서열을 처음부터 끝까지(Full-Length) 읽을 수 있어, 하나의 RNA 분자 내에 존재하는 Splice Junction에 대한 정보를 모두 보존한 채로 읽어들일 수 있기 때문입니다.
그러나 그 동안의 노력에도 불구하고 Long Read Sequencing은 실험 비용이 높고 분석 방법이 복잡하여 많은 연구자들의 요구를 충족하기 힘들었습니다. 이러한 이유로 Long Read Sequencing은 대체제로써 널리 사용되지 못했지만, 최근 기술의 발달로 Pacbio사의 Revio System을 통해 생산량이 크게 늘어나고 가격이 감소되었으며, 퀄리티 또한 대폭 향상되었습니다. 이와 같은 발전으로 인해 Long Read Sequencing에 대한 수요가 점점 늘어나고 있습니다.
Long Read RNA Sequencing 적용
Long Read RNA Sequencing의 유용성은 다양한 연구를 통해 확인되고 있습니다. 그 중 하나인 예시 연구를 소개드리고자 합니다.
이 연구는 Human Fetal, Adult / Mouse Cortex 샘플에 대해 Long Read RNA Sequencing을 진행하여 다음와 같은 3가지 결과를 도출하였습니다.
다양한 Isoform과 novel Isoform 존재: Human Cortex에서 Isoform 형태를 조사한 결과, MEG3 (maternally expressed imprinted long non-coding RNA)가 높은 diversity를 나타냈습니다.
종 간 ortholog gene의 isoform diversity: 같은 조직의 같은 기능을 하는 유전자도 isoform diversity가 크게 차이 날 수 있음을 확인했습니다.
발달 단계에 따른 Isoform Diversity: Human 태아와 성인의 Cortex가 발달 단계에 따라 Isoform에서 차이를 보였습니다.
이와 같은 연구 결과는 Short Read Sequencing에서는 관찰되지 않는 다양한 Isoform의 발현과 존재 여부가 여러 생리적 상태에 따라 달라질 수 있음을 보여줍니다. 이는 단순히 유전자 수준에서의 발현 차이가 없더라도, Isoform 수준에서의 변이가 생물학적 기능과 표현형에 중요한 영향을 미칠 수 있음을 시사합니다.
그림3. Human Cortex와 Mouse Cortex 샘플을 이용한 Long-read Isoform Sequencing 연구 과정
Theragen Bio Long Read RNA Sequencing 서비스
활용 사례를 통해 뇌 연구에서 Long Read RNA Sequencing을 활용하여 더 깊고 많은 정보를 얻을 수 있는 것을 확인하였습니다. 또한, 발표되는 최근 연구들을 확인해본 결과 많은 종과 다양한 조직의 세부적인 연구가 더 활발히 진행될 것으로 예상됩니다. 그러나 Long Read RNA Sequencing의 생명정보학적 분석 방식의 표준 방식이 정립되지 않아 의미 있는 결과를 얻기에는 어려움이 따르고 있습니다
이에 따라, 테라젠바이오는 이와 같은 시장의 요구에 맞춰 발표되고 있는 수많은 분석 방법론을 자체 검증하여 In-house 파이프라인을 개발하였습니다. 자체 개발된 파이프라인을 통해 연구자분들께 더욱 신뢰할 수 있는 다양한 분석 결과를 제공하고 있습니다. 이어서 테라젠바이오의 LongRead RNA Sequencing 서비스를 통해 얻을 수 있는 대표적인 결과 항목들을 소개하고자 합니다.
Isoform 분류 SQANTI (Structural and Quality Annotation of Novel Transcript Isoforms) 분류 체계에 따라 Isoform 를 분류합니다. 이를 통해 기존에 보고된 Isoform과 밝혀지지 않았던 Novel Isoform을 발견할 수 있습니다.
Alternative Splicing Events 식별 Alternative Splicing Events(SE, MX, RI, A5’, A3’, AF, AL)의 분류에 따라 각각의 Isoform이 어떻게 형성되었는지 분류와 비율을 직관적으로 확인할 수 있습니다.
Isoform의 발현 값 정량 유전자 수준에서 한 단계 더 들어가 개별 유전자의 Isoform의 발현 정보를 얻을 수 있습니다.
샘플 또는 조건 간의 Isoform 차등 발현 분석 발현 정량 기준으로 Isoform들의 발현 차이를 분석 할 수 있습니다.
Gene Fusion Short Read RNA Sequencing에서 Isoform 만큼 분석하기 어려웠던 Gene Fusion에 대해 더 긴 길이의 시퀀싱을 기반으로 Gene Fusion을 명확하게 식별 할 수 있습니다.
그림4. TheragenBio Gene Fusion Analysis 예시 결과
테라젠바이오의 서비스에 대해 더 자세히 알고 싶다면 아래 브로셔를 참고 부탁드리며, 서비스 관련한 문의가 있으시면 아래 서비스 문의하기 버튼을 통해 언제든 편하게 문의 부탁드립니다.