HOME 알림소식 기술동향

기술동향

[생물학연구정보센터(BRIC)] 현상학부터 메커니즘까지 단일 세포 유전체학의 확장
이름 : 표준성과학산팀 | 작성일 : 2018.01.25 | 조회수 : 22804
링크 :
기관 : 생물학연구정보센터(BRIC)
  • bookmark
  • facebook
  • twitter
  • clog
  • 링크복사


현상학부터 메커니즘까지 단일 세포 유전체학의 확장

 

[요약문]

 

생물학에서 가장 기본적인 세 가지 궁금증은 첫째, 어떻게 개별 세포들이 분화하여 조직을 형성하는지, 둘째, 어떠한 방식으로 조직이 기능을 수행하는지, 셋째, 어떤 유전자 조절 메커니즘이 이러한 과정들을 뒷받침하는지 이다. 이러한 궁금 점들을 해결하기 위해, 단일 세포 유전체학(single-cell genomics)이 새로운 길을 열어주고 있다. 이는 유전체학의 종합적인 특성과 현미경적 해상도(resolution)를 결합함으로써, 복잡한 다세포 시스템을 설명하기 위해 필수적이다. 초기의 단일 세포 유전체 연구들은 이질적인 세포 상태에 대한 현상들을 다수 제시해왔다. 그러나 기존의 조직 관찰적 연구에서, 보다 역동적, 인과적 메커니즘 모델 연구의 필요성이 제기되고 있으며, 이를 위해서는 이론적, 계산적, 실험적 체제의 강력한 통합 연구가 요구된다.

 

[목 차]

 

1. 서론


2. 최근의 단일 세포 유전체학


3. 시간적 축 및 역학의 추론


4. 공간축의 추론


5. 메카니즘 축과 유전자 조절 모델링


6. 관점


1. 서론

 

 다세포 생물체들은 세포 간의 협동을 위한 전략들을 발전시켜왔다. 하나의 단일 유전체의 경우, 함께 일할 때 적합성을 극대화시킬 수 있도록 전문적이고 상호보완적인 기능 프로그램을 암호화한다. 세포, 조직 및 장기와 같은 여러 단계에서의 구획화(compartmentalization)는 세포와 시스템들의 기능적 다양성을 야기한다. 유전체의 세포질 및 핵 구획에서 소분자(small-molecule), RNA 및 단백질 농도의 선택적 관리를 통한 반자동 의사 결정 프로세스를 유지하기 위해, 물리적 복제수가 세포 내에 내장되어 있다. 특정 세포 내의(intracellular) 분자 구성물의 점진적 획득을 통해, 세포의 분화가 가능하며, 세포의 기억을 나타내고 수행하기 위한 후성유전체 메커니즘이 가능하게 한다. 더 높은 단계의 장기, 세포들 사이의(intercellular) 신호 전달, 세포 밖의 구조 및 환경적 신호들은, 세포들이(그리고 그들의 유전체들이) 물리적으로 내장된 복잡한 공간적(spatial) 구조를 형성하는데 사용된다. 나아가 이는 복잡하고 구조화된 조직을 암호화하는 구획화(compartmentalization)의 이후 단계를 만든다.

 

린네식 생물 분류법(Linnaean)은 세포의 이질성에 대한 현재 이론적 기반을 이루는 중요한 부분이다. 이는 세포 유형의 분류법(taxonomy)을 정의하고, 계층적 분류를 생물체의 발생(ontogeny)에 맞추어 지도를 그리기 위한 목적을 가진다. 이와 관련해 현미경 및 FACS (fluorescence-activated cell sorting)를 사용하여 조직 및 구획 내의 단일 세포 구성을 특징지어진다. 이러한 기술들은 높은 공간적(spatial) 또는 세포의 해상도(resolution)를 가지고 있지만, 전체적 그리고 정량적으로 연구하기 어려운 분류 체계가 생겨나고 있다. 이에 따라 이미지 및 유전자 발현 데이터의 대형저장소의 축적을 통해 많은 분자적 분류법(molecular taxonomy)들이 구축되고 있다. 이러한 분류법들은 성인에서 최소 세포 분화를 하는 몇몇 체세포 조직(예, 망막), 그리고 생물체의 수명 내내 역동적이고 지속적으로 재분화하는 조직(예, 조혈 시스템)에서 성공적으로 입증되었다.

 

이용 가능한 마커들의 팔레트, 현미경 및 분자적 조직 프로파일링의 처리량의 지속적인 질적 향상에도 불구하고, 린네식 생물 분류법은 전체 조직 및 생명체까지 확장될 때 본질적으로 부적절할 수 있다. 특히, 분자적 행동(molecular behavior)의 복합 혼합물(complex mixture)이 공간적 및 물리적으로 단단히 결합될 때마다 접근법은 모호해진다. 분자적 메커니즘들이 지속적인 결과들을 만들어 낼 때, 계층적 분류 또한 자연스럽게 적용할 수 없다(예, 발달상의 연속체(developmental continuum), 분화에서의 분기(branching), 몇몇 세포 유형 간 플라스틱 전환(plastic transition), 형태 발생적 변화(morphogen gradients)의 확산, 세포 프로그램의 병인적, 불규칙한 악화). 실제로, 발달 생물학, 특히 배아 분화에서, 지속적인 변화에 대한 모델이 잘 발달되어 있다. 그러나 이러한 과정이 어떻게 갈라져 안정된 상태로 분화되는지를 이해하는 것은 상당한 도전과제이다. 심지어 세포 유형의 정확한 정의조차도 합의점에서 멀어지고 있으며, 다양한 분야에서 이런 중요한 개념들을 서로 다르게 묘사하고 있다.

 

계속 늘어나는 개별 세포들 수의 유전적 및 분자적 상태 프로파일링이 가능해짐에 따라, 단일 세포 유전체학의 출현은 세포의 정체(identity) 및 기능의 새로운 데이터 기반 정의 방법일 수 있으며, 선엄적 계층(priori hierarchies) 또는 이전에 정의된 마커들에 덜 의존적이다. 따라서 단일 세포에서 궁극적으로 발생하는 복잡한 유전체 기능들을 다루기 위해, 유전체학의 용도가 빠르게 변경되고 있다. 이는 시간적 역학(temporal dynamics), 공간적 구성(spatial organization) 및 분자적 메커니즘과 같은, 주요 축(axis)을 재구성하는 것을 도울 수 있다. 단일 세포 유전체 분야의 주된 도전 과제는, 양적 및 포괄적인 유전체의 힘을 현미경적 해상도와 결합하여, 세포 및 조직 기능에 대한 모델을 보다 정량적이며 예측 가능한 모델로 대체하는 것이다.

 

2. 최근의 단일 세포 유전체학

 

 유전체 전장의 전사체 프로파일링 및 후성유전체학은 세포의 분자 상태를 종합적으로 측정하기 위한 길을 열었다. 최근까지 유전체분석은 세포들의 이질적인 혼합물을 풀링(pooling) 하거나 분류 한 후, 부분 집단을 프로파일링하는 방식에 의존하였다. 벌크(bulk) 프로파일링은 혼합물의 평균을 제공하여, 조절되는 유전자에 대한 유전체 스크리닝과 실험 간의 구성적 변화는 감지할 수 있지만, 본질적인 세포의 프로그램은 직접 구별할 수 없으며, 분류 집단(sorted population) 분석은 알려진 하위 집단 및 분류 패널에 한정적이다.

 

지난 몇 년 동안, 단일 세포 분석을 위해 유전체, 전사체 및 후성유전체 분석 검정들이 재구성되었다. 현재 단일 세포의 RNA, DNA, 히스톤 변형, 염색질 접근성(chromatin accessibility), DNA 메틸화, 핵막하층(nuclear lamina) 상호작용 및 염색체의 수축(chromosomal contract)뿐만 아니라 단백질 시그니쳐 등에 대한 유전체 전장의 프로파일을 수집할 수 있다. 초기 연구들은 처리량(throughput; 세포의 수), 견고성(robustness; 다양한 퀄리티 샘플에서의 성능), 복잡성(com-plexity, 각 세포에서 캡처할 수 있는 뚜렷한 분자들) 및 정확성(accuracy, 노이즈 수준)을 향상시키는데 중점을 두었었다.

 

단일 세포 RNA 시퀀싱(RNA-seq)은 이러한 방법들의 선두에 있다(특히 처리량). 초기 연구들은 소수의 세포들을 대상으로 분석되었지만, 로봇 공학(robotics), 미세유체역학(microfluidics) 및 역유화액(reverse emulsion) 및 하이드로겔 방울(hydrogel droplets)을 포함한 일련의 기술적 진보는 실험당 수만 또는 수십만 세포들로 분석 처리량을 증가시켰다. 세포를 획득하고 극소량의 RNA를 처리하는 기술 또한 발전했다. 이는 생검(biopsy)이나 고정된 세포(fixed cell)와 같은 작은 샘플에서의 단일 세포 RNA-seq의 견고성을 향상시켰다. 아직 단일 세포 RNA-seq을 임상 샘플에 적용하기에는 이르지만, 이후 분명히 가능할 것으로 보인다.

 

처리량, 견고성과는 달리, 단일 세포 RNA-seq의 복잡성과 정확성은 최적화하는데 어려움이 있다. 단일 세포 RNA-seq은 최소한의 오류로 각 세포 내의 전령 RNA 분자(messenger RNA molecule)의 완전한 조사(census)를 목표로 한다. 그러나 각각의 세포는 이전에 알려지지 않은 가변적인 mRNA 함량(content)을 가지고 있고, 다른 세포적 특성들이 mRNA의 회복에 영향을 줄 수 있기 때문에, 현재의 반복 실험을 통해서는 분석(assay) 성능을 평가하는 것은 불가능하다. 복잡성 평가는 세포당 105-106 분자로 예측된 세포의 mRNA 함량 가정에 기반한다. Noise 평가는 낮은 변동성을 갖는 전사체의 분산(variance) 분석 또는 스파이크 인 컨트롤(spike-in control)를 사용하여 수행된다. 오류 보정( correction)을 위한 고유한 분자적 식별자(molecular identifier) 및 기술들은 PCR 중복을 처리하고, 세포간 오염(cross-cell contamination)을 탐지하고, 다운스트림 통계 모델에 대한 분자수 정의를 함으로써 기술적 노이즈를 크게 줄인다. 그럼에도 불구하고 단일 세포 RNA-seq은 한 집단의 세포들 중 일부만을 직접 측정하는 샘플링 전략을 그대로 한다.

 

샘플링은 정확하게 적용될 때 효율적인 실험디자인을 위한 강력한 접근방식이 될 수 있다. 세포 집단 또는 조직에 대한 최적의 단일 세포 RNA-seq 샘플링 전략은 연구의 목적에 달려 있다. 단일 세포 RNA-seq 라이브러리 시퀀싱의 한계 효용은 시퀀싱 깊이(depth)에 따라 급격히 감소한다. 때문에 적합한 세포 유형의 식별 및 분류를 위해서는 세포당 더 적은 수의 리드(read)로 더 많은 수의 세포를 연구해야함이 다양한 분석결과들로부터 제시되고 있다. 대량의 세포 프로파일링을 통해 유사한 RNA 분포를 갖는 세포의 클러스터를 확인할 수 있으며, 세포의 수에 의해 제한되었던 단일 세포 전사의 이상화된 모델을 형성할 수 있다. 반면에, 각 세포로부터 최소량의 RNA를 얻지 못하면 샘플링된 세포들을 하위 클러스터로 그룹화하는 것은 불가능하다. 단일 세포 내의 유전자들 간의 조절 관계를 분석하기 위해서는 보다 큰 샘플링 깊이가 필요할 것이다.

 

처리량, 견고성 및 복잡성은 단일 세포 후성유전체 분석들(assay)에도 최적화되어 있다. 현재 이러한 분석(assay)들은 수십에서 수백 개의 세포를 부분 자동화로 분석한다. 복잡성은 특히 단일 세포 후성유전체 분석의 도전과제이다. 단일 세포 RNA-seq과는 달리, 후성유전체 분석은 단일 복제수(single-) 분자를 타겟해야 하며, 높은 복제 수 (high-) 분자 분석을 통한 부분적 샘플링으로는 보완할 수 없다. 저복잡성 데이터를 피하기 위해 두 가지 풀링 전략이 적용되었다. 첫 번째 전략은 분자 회수율(molecule recovery rate)이 1-10%일 때에도 효과적인 분석을 가능하게 하기 위해 단일 세포를 모으는 것이다. 두 번째 전략은 여러 연관된 영역들 간의 같은 세포 내에 신호들을 모으는 것이다(예. 같은 전사 인자에 의한 결합 영역들). 이는, 영역별 coverage가 낮더라도 세포의 후성 상태(epigenetic state)를 회복(recovery) 하는데 효과적이다.

 

DNA 메틸화, 히스톤 변형, 염색질 접근성 및 3D 염색체 구성(3D chromosome organization)들은 모두 고유한 정보를 가지고 있으며, 이는 최대의 복잡성과 처리량의 단일 세포 RNA-seq으로도 얻을 수 없다. 예를 들어, 염색질 구성 내의 변화는 RNA 발현 단계에서 알기 전에 분화 현상을 예견할 수 있으며, 세포의 유형 및 안정성에 대한 신뢰할 수 있는 지문(fingerprint)이 될 수 있다. DNA 메틸화 landscape는 세포의 발달 가능성(developmental potential)과 조절 인자의 활성을 RNA 수준에서는 추론할 수 없는 방식으로 반영할 수 있다. 최근의 전략들은 동일한 세포 내의 여러 유형의 프로파일을 동시에 측정할 수 있다. 이에 어떻게 DNA에서 RNA, 단백질 및 세포의 표현형까지 발생하는 조절 이벤트들이 발생하는지 파악하는데 도움이 된다. 많은 연구가 이미 DNA와 RNA, RNA와 다양한 단백질 시그니쳐, RNA와 DNA 메틸화의 측정을 결합시켰으며, 더 나아가 쌍(pairwise) 및 다중(multiway) 조합들의 연구가 곧 이루어 질 것이다.

 

그러므로, 단일 세포 유전체 데이터는 같은 세포에 대한 수천 개의 고품질 단일 세포 RNA-seq 프로파일과 단일 세포 후성유전체 프로파일을 포괄할 수 있다. 이러한 데이터는 세포를 편향되지 않고 포괄적으로 부분 집단을 분류하는 동시에 각 세포 유형에 대해 유전체 전장의 전사 및 후성유전체 상태를 정의한다. 그러나 이러한 데이터와 그 분류를 유전체와 조직 조절(tissue reg-ulation)의 기계론적 모델로 분류하기 위해서는, 단일 세포들이 시간적(temporal), 공간적(spatial) 상황에서 우선 측정되고 해석되어야 한다.

 

3. 시간적 축 및 역학의 추론

 

 생물학적 프로세스(biological process)는 몇 분에서 몇 시간(환경적 자극에 대한 빠른 반응), 몇 시간에서 며칠(세포 분화) 및 몇 년(발병) 등의 동적인 기간을 보인다. 세포는 완벽한 동기화(synchrony)가 좀처럼 어렵고 그들의 역동성이 비 결정적이기 때문에, 동적 과정의 기초가 되는 조절 이벤트들을 특성화하는 것은 어려울 수 있다(그림 1).

 

111111111.jpg

 

그림 1. 시간적 축. 계속해서 동시성을 잃어버리는 세포의 벌크 분석 샘플 집단은 시간적 역동성의 정확한 추론에 한계가 있다.

 


벌크 샘플의 조절 역학에 대한 유전체 규모의 연구는 성공적인 동기화 또는 과정 내의 뚜렷한 기능적 지점(functional point)에서 세포의 특정 하위 집단을 분리할 수 있는 능력을 필요로 한다(그림 1). 그러나 세포 주기와 같은 과정의 유전체 프로파일링은 여전히 과제로 남아 있다.

 

단일 세포 유전체학은 이러한 한계점들을 부분적으로 완화해준다. 현재 대부분의 유전체 기술들은 살아있는 세포 추적과 양립할 수 없지만, 원칙적으로 비동기(asynchronous) 집단에서의 세포 샘플링은 연구중인 세포 집단에서 나타나는 어느 시점에서도 세포의 역학(cellular dynamics)에 대한 계산 모델을 개발할 수 있다. 따라서 단일 세포 유전체학은 유전체 기능 및 조절 내의 역학을 추론하기 위한 보편적이고 계산적인 접근방식을 제안한다.

 

단일 세포 데이터로부터 세포의 역학 추론의 근간을 이루는 기본원리는 최대의 절약(maximum parsimony)이다. 이는 관찰된 세포의 상태를 연결하는 모든 가능한 역학 모델을 제안하며, 전사에서 최소의 변화인 것을 선호한다. 이 원리는 유전자 발현에서 조정된 변화의 일련의 초점(focal point)을 통해 방향성 및 비가역적으로 진행하는 세포 역학을 추론하는데 효과적이다. 이러한 경우에, 세포의 'ordering’(세포가 존재하는 이상적인 시간적 과정의 지점)과 주요 분화 또는 분화 지점에서 세포와 관련된 분자 상태를 추론할 수 있어야 한다. 또한, 샘플링된 모든 단일 세포는 기능적 프로세스(functional process)의 어딘가에 위치하기 때문에, 그 과정의 특정 간격에서의 '체류 시간(residence time)'은 샘플링된 세포의 비율과 관련이 있다. 샘플링된 세포 수가 상당하면, 극도로 일시적인 상태이더라도 추측된 궤적에 확실히 위치 할 수 있다. 그러므로 생물학적 비동기 (biological asynchrony)는 자산이며, 단기간에 반복적으로 발생하는 과정(예. 조혈; haematopoiesis)에 대한 전체 동적 과정을 단일 세포의 매우 깊은 샘플링을 통해 한 번에 효과적인 샘플링을 할 수 있다.


 

2222222222.jpg
그림 2. 시간적 역동성 추론. 다양한 상태 내의 단일 세포들의 이질적 혼합물의 샘플링은 maximum parsimony principle 기반으로 시간적 역동성 추론을 위해 사용된다. 샘플링된 세포들은 선형 추세 (I, II) 또는 분기형 (III) 프로세스로 정렬된다.
 
 

일련의 연구들은 현재 선형(linear), 주기(cyclic) 또는 분기 궤도(bifurcating trajectory)를 가정하면서, 단일 세포들의 프로파일로부터 역학을 추론하기 위해 maximum parsimony를 이용했다. 예를 들어, Wanderlust라고 불리는 초기 방법은 B 세포 분화의 궤적을 만들기 위해 질량 세포 측정(mass cytometry) 데이터로부터 단일 세포 복합 단백질 측정을 하였다. 관련된 접근법들은 체외 근육형성(myogenesis in vitro) 또는 체내 신경 발생(neurogenesis in vivo)의 여러 시점에서 샘플링된 단일 세포 RNA-seq 데이터로부터 성공적으로 세포를 정렬했다. 세포주기동안 동기화 된 세포 집단의 벌크 프로파일을 비교하는 것은 어렵지만, 단일 세포의 주기는 쉽게 재구성 될 수 있다. 가장 최근의 방법들 또한 분기를 재구성하는 것에 대해 고무적인 진전을 보였으며, 세포의 역학은 후성유전체 데이터로부터도 추론 되어왔다.

 

그러나, 일련의 이벤트 또는 동적 과정의 분기 구조에 대한 새로운 추론은 깊게 샘플링된 프로세스의 경우에도 계산적으로 어렵다. 특히, 기준점(anchor point) 결정을 위한 사전 지식이 거의 없는 경우, 데이터에 의해 불충분한 결정이 이루어질 수 있다. 특히 maximum parsimony 원칙이 항상 적절한 것은 아니다. 유전자의 측면 전이(lateral transfer)를 고려한 모델의 계통 발생 재구성의 어려움과 유사하게, 재분화(transdifferentiaion), 가소성(plasticity) 또는 불완전한 세포 계통 분류를 위해서는 현재의 parsimony 기반의 재구성 알고리즘과 새로운 계산 및 실험적 접근법의 통합이 요구된다. 게다가 세포는 동시에 여러 동적 과정(예. 영양 물질에 반응하고 분화의 특정 지점에서 세포 분열을 겪는 경우)을 거치기 때문에, 이러한 과정을 설명하고 구별하기 위한 방법이 필요하다. 추론된 역학적 모델을 형태학적 또는 유전적 특징과 같은 다른 독립적인 측정 방법과 연결하는 것이 중요할 것이다. 예를 들어, B 세포에서의 궤적 분석을 통해, 모든 세포의 0.007%만으로 구성된 초기의 추정 군집 임을 확인하였을 때, 이 새로운 군집의 시간적 위치는 면역 글로불린 중쇄 영역(immunoglobulin heavy chain locus)의 상태를 조사함으로써 확인 가능하다. 실제로, T 세포 및 B 세포의 경우 T 세포 항원 수용체 및 B 세포 수용체 면역 글로불린의 단일 세포 RNA-seq 데이터를 통해 그들의 유전체 상태를 직접적으로 알아낼 수 있다.

 

또한, 세포의 역학 추론은 동일 세포에서 DNA와 RNA를 모두 측정하는 기법의 진보에 따라 크게 향상 될 것이다. 샘플링된 세포와 공통 조상 세포(progenitor cell)를 계층적으로 연관시키는 세포 계통 지도(cell-lineage map)는 유전체 정보로부터 추론 가능하다. 예를 들어, 단일 세포 RNA-seq을 통해 얻은 세포의 기능적 동일성(functional identity)에 대한 지식과의 연결을 통해, 세포-운명 지도(cell-fate map, 초기의 세포 유형이 이후의 세포 유형을 일으킴을 밝혀낸)를 얻어내는 것이 가능할 것이다. 단일 세포의 시간적 역학을 이해하는 것은 인간의 질병(특히 암)을 밝히는데 중요하다. 종양 형성은 매우 역동적이며 이질적인 환경적 상황에서 유전체 및 후성유전체의 변화를 모두 수반한다. 그러나 현재의 방법으로는 환자의 종양에서 단 하나 또는 몇 개의 시료 만을 얻을 수 있다. 종양 생검 내의 각 악성 세포의 유전체 및 기능적 상태의 동시 측정은 종양의 진화 추적, 전이의 이해, 치료 반응의 모니터링 및 예측 등을 할 수 있는 놀라운 기회를 제공 할 것이다. 최근의 연구는 흑색종(melanoma), 교모세포종(glioblastoma), 유방암(breast cancer), 희소 돌기 아형 (oligodendroglioma) 및 백혈병(leukaemia)에서 이러한 접근법의 가능성을 보여주었다.

 

4. 공간적 축의 추론

 생리학적 프로세스들은 조직 내에서 일어나며, 공간적 구성은 조직의 기능에 중요하지만, 현재 단일 세포 유전체 접근법들은 조직 샘플들을 해체하며, 세포의 3D 구성 등록소(registry)를 유지하지 못한다. 하지만 몇 가지 해결책이 발달되고 있으며, 하나의 접근법은 공간적 해결 문제를 계산적 모델로 격하시키는 것이다(그림 2). 세포의 전사체는 흔히 고유의 위치를 지니고 있다. 단일 세포의 프로파일과 몇몇 마커 유전자(marker gene)의 참조 지도(reference map)를 결합을 통해, 여러 연구들은 단일 세포를 그들의 공간적 위치로 돌려놓았다. 예를 들어, 초기 생선 배아에 대한 연구는 최대 100개의 세포들을 공간적 'bins'에 할당하기 위해, 동일한 발달 단계의 단일 세포 RNA-seq 데이터와 수십 개의 마커에 대한 in-situ 발현 데이터의 참조 지도를 결합하였다. 이는 공간적으로 독립적인 세포 유형 지정 프로세스(cell-type specification process)로부터 구별을 위해 공간적 변화와 강하게 연결된 유전자 발현 시그니처를 가능하게 했다. 비슷한 전략으로 벌레 뇌에서 점 모양의 패턴으로 분포된 세포들을 매핑하였으며, 다른 연구들은 초기 마우스 배아 및 성체 마우스 해마로부터의 단일 세포 프로파일에서 별개의 영역 및 형태 발생적 변화(morphogen gradient)를 보였다.


 

3333333.jpg

 

그림 3. 공간적 축. 공간적 맵핑은 단일 세포 유전자 발현 프로파일링(왼쪽)과, 소수의 랜드마크 유전자들의 공간적 발현 패턴에 대한 참조 지도를 입력값으로 사용한다.

 

 

이러한 예들은 대강의 정보에서 실험적 디자인(예. 현미해부로부터)과 단일 세포 프로파일과의 결합이 공간적 유전체에 대한 풍부한 정보를 제공하는데 도움이 될 수 있음을 시사한다. 그러나 배치 편향(batch bias)을 최소화하고 조직 절편들 간의 일관성을 높이기 위해, 단일 세포 유전체 방법과 이러한 해부학적 방법의 호환성은 개선되어야 한다. 보다 근본적으로, 현재 구현된 계산적(computational) 공간적 재구성은 배아 발생 또는 기관 형성(organogenesis)에 있어서 표준 조직 구성의 아이디어에 의존한다. 따라서 복합적인 실험들을 통해 동일한 구조를 정확히 재현 할 수 있다. 덜 제한적인 발달, 분화 또는 병리학적 시나리오에 대한 전산 분석을 위해, 재현성 있는 공간적 구조가 사용될 수 있다. 예를 들어, 조직 병리학(histopathology)은 임상 병리학 (clinical pathology)의 근거를 형성하는 샘플들 간에 보존되는 고차원 특성들이 있음을 보였다. 단일 세포 유전체학에서 공간 분석을 위한 보편적인 전략을 강구하기 위해서는, 여러 규모에서 사용할 수 있는 새롭고 유연한 전산 방법을 공간 구조를 직접적으로 조사하는 향상된 실험 기법과 함께 통합해야 한다.

 

이러한 문제를 해결하기 위해 조직 절편에서 단일 세포의 in situ 유전체 분석을 위한 기술들이 빠르게 진화하고 있다. MERFISH와 같은 다중 RNA 형광 in situ hybridization (FISH) 기술은 수천 개의 다른 전사체의 발현 및 공간적 위치를 동시에 안정적으로 측정한다. 다른 기술은 보존된 조직 절편과 세포에서 in situ RNA-seq을 위한 개념 증명 (proof-of-concept) 데이터를 만들어 냈다. 또한 각 제거된 'pixel'의 mass-cytometry 측정과 함께 조직의 레이저 또는 이온 빔 제거의 결합으로 멀티플렉스에서 수십 개 단백질의 공간적 발현을 알아내는 것이 가능하다. 최근 연구에서는 유방암 조직을 분석하고, 세포 고유의 프로파일보다 주변 세포에 의한 유형을 분류하기 위해 imaging mass-cytometry를 사용했다. 이러한 방법들을 사용할 때, 세포 유형의 개념을 공간적 상황을 포함하도록 일반화할 수 있으며, 혼합된 유전자 조절 메커니즘과 프로그램을 공간적 특징으로 완전히 재정의 할 수도 있다.

 

조직의 공간적 구조의 중요한 의미는 특정 세포 유형의 상대적인 위치와 그것들 사이의 물리적 접촉의 분자적 구성(molecular composition)이다. 직접적인 세포의 접촉은 세포 간 조절 메커니즘을 모델링 할 때 특히 중요하다. 이론적으로, 조직의 완전한 3D 지도는 모든 세포-세포 접합(cell-cell junction)을 특성화할 수 있지만, 접근법들 또한 이들을 직접 측정할 수 있게 발전되어 왔다(예, 두 세포의 작고 단단히 결합된 골수의 microniches를 평가). 공간적 조직(organization) 문제를 세포 유형 간의 접촉의 분포로 제한 할 때, 많은 표본에서 특정 세포 유형의 존재와 비율 사이의 상관관계를 분석하기 위한 계산적 전략을 강구할 수 있으며, 이에 대한 결과는 복잡한 틈새 (niche)에서 상호의존성과 세포의 상호 작용에 관한 가설을 생성하는데 사용될 수 있다.

 

5. 메카니즘 축과 유전자 조절 모델링

 

 현상학을 뛰어 넘어, 세포의 행동(cellular behavior)의 레퍼토리의 기초가 되는 조절 메커니즘을 모델링하기 위한 새로운 접근이 필요하다. 집중적인 연구에도 불구하고, 그러한 메커니즘의 체계적인 분석은 여전히 상당한 도전 과제로 남아있다. 단일 세포 유전체학은 세포 안과 밖의 조절 메카니즘에 모델링 추론을 위한 관측적(observational), 기계론적(mechanistic) 및 섭동적 (perturbational) 접근을 결합할 수 있는 새로운 기회를 제공한다. 데이터 본연의 세포의 해상도 (cellular resolution)를 고려해볼 때, 초기 연구들은 세포 내(intracellular) 단계에 초점을 맞추었으며, 전사 조절에 국한되었으나, 이후 연구들은 아마도 세포 간(intercellular) 및 조직 단계에서의 통합에 중점을 둘 것이다.

 

유전자 조절 메커니즘을 추론하는 관측적 접근법은, 고전적으로 다양한 일련의 벌크 샘플들(예, 서로 다른 조직 유형, 세포 유형 또는 자극들)의 mRNA 단계의 분자적 프로파일 또는 후성 표식들 사이의 상관성 추론을 통해 적용되었다. 이러한 분석들은 간접적인 상관관계를 발생시키거나 다른 중요한 조절 상호작용을 숨길 수 있기 때문에, 세포 앙상블 프로파일의 혼합된 상태에 의해 혼돈(confound)된다. 반면에, 단일 세포 분석은 세포 내 수준의 공변량(covariation) 분석에 대한 더 많은 힘을 가진다. 가장 기본적인 접근법은 대량의 단일 세포 프로파일을 수행하여, 다양한 전사 상태를 포착하고 유전자-유전자 상관관계 계산을 통해 후보 조절 상호관계를 얻어내는 것이다. 따라서 이러한 분석들은, 세포 유형들의 전사적 시그니처(tranional signature)를 정의하는 유전자들의 프로파일과 발현 패턴 사이의 상관관계를 통해, 세포 유형의 조절 인자(regulator)를 밝혀낸다. 고해상도의 단일 세포 분석은 세포 유형 및 아형(subtype)의 정의를 개선하고, 작은 세포 틈새 내의 상관 관계의 확인을 가능하게 하여, 가짜로 추정된 유전자-유전자 상호작용을 점차적으로 제외할 수 있게 한다. 이러한 분석은 면역 세포, 상피 세포 및 뉴런의 세포 유형을 조절 (control)하는 조절 인자를 예측하는데 도움이 된다.

 

그러나 단일 세포 수준에서도 상관관계는 인과관계(causation)를 의미하지 않으며, 유전자 조절의 예측 모델링은 섭동(perturbation) 시스템과 기계론적 제약 조건의 통합에 의존해야 한다. 겉보기에 균질한 집단에서도, 외적인 노이즈 또는 비동기 반응으로 인해 셀간 고유의 편차가 있기 때문에, 각 셀을 자체 섭동 시스템으로 볼 수 있다. 이러한 경우, 상관관계와 같은 관측적 전략은 이론적으로 가능하지만, 실제적으로는 인과추론을 지지한다. 예를 들어, 초기 연구는 동시에 발현하는 항-바이러스 유전자 모듈을 회수하고 조절 인자로서 STAT2와 IRF7 단백질을 정확히 연관짓기 위해, 지질다당류(lipopolysaccharide)와 함께 자극한 이후에 15개의 수지상세포(dendritic cell)들의 공변 분석을 사용했다. 비슷한 접근법으로 여러 수지상세포 아형에서 지질다당류에 대한 in vivo 반응의 조절자로 IRF7을 발견하였다.

 

안정적인 상태를 포함한 시스템들에서 하나의 개체군 내의 세포들은 몇몇 표현형 변이에 상응하는 소수의 개별 모드보다는, 본질적인 전사 상태의 스펙트럼에 걸쳐 있을 것이다. 예를 들어, 세포주기 조절 유전자 모듈은 세포 분화 제어 프로그램으로부터 별도로 밝혀지거나 모델링 될 수 있다. 단일 세포 프로파일링은, IL-17을 발현시키는 T-helper 세포의 병원성(pathogenicity) 및 자가면역원성(autoimmunogenic) 잠재력에 상응하는 전사 상태 스펙트럼을 회수하고, 스펙트럼과 연관된 유전자 모듈 및 추정 조절 인자를 발굴하는 데에도 사용되었다. 단일 세포 데이터로부터 조절 모델 추론을 위해 사용된 기술의 계산적인 정교함은 데이터 셋(set)의 크기와 판독의 신뢰성에 의한 한계가 있다. 대량의 단일 세포들이 mass cytometry 데이터에서 보다 정량적인 모델링을 지지함을 보였으며, 이는 이러한 접근법이 곧 단일 세포 유전체학에 적용될 수 있음을 시사한다.

 

시간적 해상도(temporal resolution)는 관측 자료로부터 조절 메커니즘을 추론하는 데 중요한 역할을 할 수 있다. 전사보다 긴 시간 동안 발생하는 동적 프로세스의 경우(예. 세포 유형 특이 전사 인자의 안정적인 유도), 시간적 궤적을 따라 정렬된 데이터 셋을 사용하여, 특정 이행(transition)과 관련된 초기 및 후기 조절자의 활동 프로파일 간의 시간 지연을 확인함으로써 인과 추론의 힘을 상당히 향상시킬 수 있다. 이 접근법은 생체 내 초기 B 세포 발달에서 IL7/STAT5 경로의 역할, in vitro 근아세포 분화(myoblast differentiation)의 다양한 전사 조절자, 배아 발달 동안 그리고 성체에서의 신경 발생 대한 예측 및 검증을 하는데 적용되었다. 그러나 많은 조절 프로세스들은 훨씬 짧은 시간에 걸쳐 발생하거나 전사 수준에서 관찰되지 않는 전사 후 및 번역 메커니즘을 수반한다. 때문에 시간 단위의(time-resolved) 단일 세포 데이터 셋에서도 조절 관계들을 추론하기 위한 능력은 제한적이다.

 

후성유전체 데이터, 특히 단일 세포 수준에서의 유전자 조절 모델의 통합은 전사 상태의 관측에서 나타나지 않는 부분을 더함으로써 인과 추론의 힘을 증가시킬 수 있다. 개체군 및 참조 후성유전체는 전사 인자를 결합 영역(binding site), 또는 표적 유전자를 갖는 인핸서(enhancer) 요소와 연결시킴으로써, 잠재적 조절 상호작용의 제한적인 발견에 도움이 될 것이다. RNA 프로파일링과 독립적 또는 동시에 수행되는 단일 세포 후성유전체학은, 특정 조절 요소에서 후성적 활동을 다른 요소의 활동 또는 표적 유전자의 RNA 양과 연결하여, 더 나은 해상도의 유전체에서 조절 환경을 정의 할 수 있다. 이러한 후성적 활동은 염색체 접근성 또는 DNA 하이포메틸화 (hy-pomethylation)를 평가하는 방법으로 확인할 수 있다. 단일 세포 후성유전체로부터 유전자 조절에 대한 추론은 여전히 데이터의 깊이와 폭, 그리고 전산 접근 방식에 의해 제한된다. 탄탄한 (robust) 상관관계 계산을 위한 다수의 후성유전체 프로파일을 통합(pooling)하는 방법이 이후에 개발되어야 하며, 이러한 접근법은 전사의 정량적, 기계적 모델을 개발하고, 전사 내의 변동성과 노이즈를 유도하는 내외적 요인의 분자적 근거를 밝히는데 도움이 될 수 있을 것이다.

 

단일 세포 유전체학과 실험적 섭동의 결합은 인과 추론을 위한 가장 직접적인 방법을 제공한다. ex vivo 또는 in vivo 에서 고전적인 녹아웃(knockout) 모델의 분석은 인자들(factors) 간의 조절 상호작용의 검증 및 개선을 가능하게 했다(예, 골수 세포 분화 동안의 CCAAT/인핸서 결합 단백질 C/EBPα와 C/EBPε). 현대의 높은 처리량(high-throughput) 섭동 방법, 특히 CRISPR (clustered regularly interspaced short palindromic repeat) 기술을 기반한 방법들은 단일 세포 유전체학과 결합하여 전례 없는 규모와 해상도로 인과 분석을 수행 할 수 있다. 이는 기존의 CRISPR 스크린을 단일 세포 RNA-seq 판독과의 결합을 통해 달성될 수 있으며, 단일 발현 마커의 저함량 판독(low-content readout) 값 대신에, 발현 프로파일에 의해 제공되는 고 함량 표현형(high-content phenotype)을 사용하여 섭동에 대한 분자적 반응의 밀접한 분석을 제공한다. 이러한 결합은 단일 세포 RNA-seq 기술로부터 대량의 처리량을 필요로 하며, 분석된 단일 세포 각각으로부터 하나 이상의 섭동을 판독하는 전략을 필요로 한다. 또한 섭동 스크린은 조절 시스템을 교란하고 단일 세포 유전자 조절의 기계론적 모델에 의해 유도된 가설을 검증하기 위해 설계될 수 있다.

 

6. 관점

 

 인간 및 모델 생물체에서의 세포 프로그램의 매핑 및 분류에 대한 노력은, 장기(organ) 및 전체 유기체 내의 세포 유형 및 아형의 포괄적인 지도를 제공하기 위해 점점 더 증가하고 있다. 이는 세포 유형과 상태에 대한 기술적 연구를 넘어 조절 프로그램의 기계론적 예측 모델을 개발할 수 있는 놀라운 기회를 열어준다. 참조 지도는 예측 모델의 추론과 테스트를 위한 필수 출발점이다. 기계론적 모델은 차례로 큰 참조 지도 분석하고, 주석을 달고, 이해할 수 있게 한다. 따라서 인간이나 쥐의 정상 세포 상태의 포괄적인 지도를 위해 기계론적 모델이 필요하다. 각 질병은 참조 상태에서 새로운 변이를 야기할 수 있고, 각 유전자 변이가 그것을 더 변형시키기 때문에, 단일 세포 지도(atlas)는 세포 집단에서 상태를 계산하기 위한 기초가 될 수 있다. 광범위한 참조 지도의 상황에서, 유전자 조절 모델링은 서열 또는 후성유전체로부터 상태를 완전히 새롭게 추론할 필요는 없다. 대신 매우 유사한 특성으로 측정된 상태를 이용하기 위해, 작은 섭동의 영향을 추론하는 것에 초점을 맞추어야 한다. 따라서 알려진 세포 상태가 어떻게 섭동 되는지 모델링하는 것은, 질병의 기전을 밝히면서 세포 기능의 예측 모델을 다루기 용이한 경로를 제공한다.

 

단일 세포 유전체학이 세포 상태를 맵핑하고 세포 내 유전자 조절 메커니즘을 추론하는 우리의 능력에 혁명을 일으키고 있기 때문에, 또 다른 중요한 도전은 개별 세포 상태를 어떻게 기능하는 조직(functioning tissue)의 모델로 통합 시키는가 이다. 세포는 조직의 빌딩 블록(building block)이며, 우리가 논의한 새로운 기술은 3D, 인접한 지역에서의 맵핑, 또는 계통 트리(lineage tree)의 추적을 가능하게 할 수 있다. 대사 물질, 신호 분자 및 세포 밖 매트릭스(extracellular matrix)의 구성 요소와 같은 핵심적인 세포 간 분자 마커를 측정하고 모델링하는 방법은, 단일 세포를 조직의 결합 모델로 모으기 위해 중요하다. 세포 상태의 모델과 비슷하게, 묘사한 조직 모델은 조직의 고차원 구성과 기능을 이해하고 예측하기 위한 출발점일 뿐이다. 상호 작용하는 세포의 공동체에 의해 수행되는 프로세스의 복잡성과 분자적 결정(molecular decision)은 힘들어 보이지만, 독특한 기능을 가진 '조직 모듈'의 분자-해부학 상의 매개 단계가 존재할 가능성이 있다. 그러므로, 우리는 세포간의 공간 근접성 및 분자적 소통(communication)에 대한 정보를 세포 상태에서 상호 작용의 기능적 영향과 결합하여, 조직에서 재발성 다중 세포 모듈을 규명하고 연구하는 프레임워크를 구상한다. 이러한 모듈은 이전에 제안된 바와 같이, 중요한 상보 기능이 있는 세포와, 중요한 지원 기능(support function)을 제공하는 조직으로 구성 될 수 있다(예. 지방의 지방(adipocyte) 세포, 근육의 근세포(myocyte) 또는 장의 점막의 상피 세포(epithelial cell)). 이러한 모듈이 실험적으로 특성화되고 연구될 수 있을 때, 단일 세포 유전체학은 생물학의 근본적인 이해에서 실제 혁명으로 이끌 수 있다.

 

 

 

...................(계속)

 

 

출처 : 생물학연구정보센터(BRIC) (바로가기)

 

IP : 192.168.31.*** share
https://yesme.kiom.re.kr/Trend/articles/view/tableid/tech/id/1403
 
List Gallery Webzine RSS FEED

기술동향 번호, 파일, 제목, 이름, 작성일, 조회수 표
번호 파일 제목 이름 작성일 조회수
455 pdf 기술사업화팀 2020.01.02 12,456
454 첨부파일 없음 기술사업화팀 2019.10.14 27,594
453 첨부파일 없음 기술사업화팀 2019.08.28 13,623
452 첨부파일 없음 기술사업화팀 2019.08.28 11,776
451 pdf 기술사업화팀 2019.08.08 13,080
450 pdf 기술사업화팀 2019.08.08 13,650
449 첨부파일 없음 기술사업화팀 2019.08.08 12,528
448 pdf 기술사업화팀 2019.07.25 13,036
447 첨부파일 없음 기술사업화팀 2019.07.25 13,269
446 pdf 기술사업화팀 2019.07.25 11,949
445 pdf 기술사업화팀 2019.06.03 16,051
444 pdf 기술사업화팀 2019.05.29 17,073
443 첨부파일 없음 기술사업화팀 2019.05.22 16,537
442 pdf 기술사업화팀 2019.05.22 16,232
441 pdf 기술사업화팀 2019.04.01 16,687
440 pdf 기술사업화팀 2019.04.01 17,687
439 첨부파일 없음 기술사업화팀 2018.05.23 29,638
438 첨부파일 없음 기술사업화팀 2018.05.23 18,230
437 첨부파일 없음 기술사업화팀 2018.05.21 21,575
436 pdf 기술사업화팀 2018.05.09 17,149
  • 담당부서 기술사업화팀
  • 담당자 고예지
  • 연락처 042-869-2772