KR20200078558A - 고 처리량 게놈 제조 작업을 계획하고 수행하기 위한 장치-애그노스틱 시스템 - Google Patents

고 처리량 게놈 제조 작업을 계획하고 수행하기 위한 장치-애그노스틱 시스템 Download PDF

Info

Publication number
KR20200078558A
KR20200078558A KR1020207014493A KR20207014493A KR20200078558A KR 20200078558 A KR20200078558 A KR 20200078558A KR 1020207014493 A KR1020207014493 A KR 1020207014493A KR 20207014493 A KR20207014493 A KR 20207014493A KR 20200078558 A KR20200078558 A KR 20200078558A
Authority
KR
South Korea
Prior art keywords
biological
level
reaction
physical
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
KR1020207014493A
Other languages
English (en)
Inventor
키얀 아마디자데
테사 알렉사니안
바바라 프레웬
프라사드 가네산
프라사드 가네산
애론 킴볼
윌리엄 제이. 매니아
재커리 팰치크
에린 로데
딜란 웹스터
Original Assignee
지머젠 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 지머젠 인코포레이티드 filed Critical 지머젠 인코포레이티드
Publication of KR20200078558A publication Critical patent/KR20200078558A/ko
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

변형된 미생물의 고 처리량 생산은 생물학적 워크플로우를 나타내는 지향 빌드 그래프 데이터 구조의 최적화를 통해 달성된다. 이와 관련이 없는 워크플로우의 일부는 공통 생물학적 반응 단계를 공유하는 경우 결합될 수 있으며, 운영 효율성을 활용하기 위해 유전자 제조 시설에서 처리될 수 있다. 워크플로우는 재료 전달을 최적화하는 방식으로 실제 실험실 장비에 매핑될 수 있다. 상이한 언어로 상이한 기계를 작동시키는 상이한 자동화 플랫폼은 장치 애그노스틱 및 언어 애그노스틱 방식으로 조정된다.

Description

고 처리량 게놈 제조 작업을 계획하고 수행하기 위한 장치-애그노스틱 시스템
본 출원은 2017년 10월 26일에 출원된 미국 가출원 제62/577,615호에 대해 우선권의 이점을 주장하며, 2016년 4월 27일에 출원된 미국 비가출원 제15/140,296호에 대해 우선권의 이점을 주장하는 2017년 4월 26일("코돈" 출원)에 출원된 국제 출원 번호 PCT/US2017/029725(미국 특허 공개 번호 US2017/0316353)에 관한 것이며, 이들 모두는 그 전문이 본 발명에 참조로 포함된다.
본 발명은 일반적으로 고 처리량 미생물 게놈 공학에 관한 것으로, 보다 상세하게는 유전자 변형을 포함하는 관심 생성물의 유전자 제조 시스템에서 생성을 제어하기 위한 빌드 그래프 데이터 구조를 생성 및 처리, 고 처리량 시스템에서 생물학적 성분의 품질 관리를 위한 데이터 구조를 생성 및 처리하는 것에 관한 것이다.
배경 섹션에서 논의된 주제는 단지 배경 섹션에서의 언급의 결과로서 종래 기술인 것으로 가정되어서는 안 된다. 유사하게, 배경 섹션에서 언급되거나 배경 섹션의 주제와 관련된 문제는 종래 기술에서 이전에 인식된 것으로 가정되어서는 안 된다. 배경 섹션의 주제는 단지 상이한 접근법을 나타내며, 그 자체로 또한 청구된 기술의 구현에 상응할 수 있다.
미생물 공학은 신규한 화학 물질, 첨단 재료 및 의약품의 생성을 가능하게 한다. 자체 또는 제3자를 대신하여, 균주 디자인 회사는 수율, 생산성, 최적 성장 온도, 성장률 또는 역가와 같은 생산 특성을 개선하여 미생물 숙주의 대사 생성을 향상시키기 위해 이전에 기술된 DNA 단편을 수정할 수 있다.
변형된 미생물의 고 처리량 생산은 고 처리량 균주 디자인을 필요로 한다. 로봇은 한 번에 수십에서 수천 개의 균주를 만들 수 있으며, 디자인 도구는 이 용량을 충족시킬 수 있어야 한다. 큰 실험은 게놈의 상이한 부분에 적용된 유전자 변형의 여러 상이한 조합을 연구할 수 있다.
종래 시스템은 제조될 뉴클레오타이드 서열을 확인시키는 정보를 유전자 제조 공정 대한 입력으로서 제공한다. 이 정보로부터, 게놈의 어셈블러가 대규모 연산으로 서열을 제조하는 최고의 뉴클레오타이드 부분 및 워크플로우를 결정하며, 수천 개의 서열이 유진과 같은 게놈 디자인 프로그램에 의해 생성될 수 있다. 예를 들어, 프로그램은 약 50-100GB의 저장 공간을 차지할 수 있는 10,000개의 변형된 게놈을 생성할 수 있다. 이 정보는 이 때에는 일반 메모리에 적합하지 않으며, 대신에, 예를 들어, 더 느린 디스크 기반 접근법을 필요로 할 것이다.
실시태양은 출력 DNA 구성요소를 나타내기 위해, 예를 들어, SBOL을 사용할 수 있다. 현재 상용 컴퓨터 시스템은 50-100GB SBOL 파일에서 효율적으로 저장하고연산할 수 없다. 이러한 연산은 실패하거나 프로세싱에 예상치 못한 지연을 유발할 수 있다.
본 발명의 양수인에게 양도된 국제 출원 PCT/US2017/029725("코돈 출원")은 컴퓨터 시스템에서 대규모 서열 디자인을 구현할 때 컴퓨터 기술에 뿌리를 둔 문제를 극복하는 실시태양을 기술한다. 이 출원은 다수의 부모 뉴클레오티드 서열에 다수의 돌연변이를 동시에 도입하여 이들을 다수의 돌연변이된 서열 세트로 형질 전환시키기 위한 공정, 시스템 및 데이터 구조를 제공한다. 더욱이, 이러한 많은 출력 시퀀스를 처리하는 것은 처리 시간을 허용할 수 없을 정도로 느리게 하거나 심지어 처리 실패를 초래할 수 있다. 코돈 출원에 기술된 실시태양은, 예를 들어, 뉴클레오티드 서열의 디자인 및 구축에 대한 시간 및 복잡성을 감소시킴으로써 산업 규모의 게놈 디자인 및 제조를 개선시킨다.
고 처리량으로 유전자 변형 유기체를 구축하는 것은 소프트웨어 및 로봇 공학을 이용하는 생물학적 워크플로우의 실행을 필요로 한다. 자동화(로봇 공학)는 유전 공학의 물리적 노동을 수행하는 데 사용될 수 있는 반면, 소프트웨어는 물리적 작업을 수행하는 동안 수집된 데이터의 세부적인 세부 사항을 계획하고 기록하는 데 사용될 수 있다.
생산성을 향상시키기 위해, 일부 시스템은 생물학적 공정을 워크플로우(미국 실험실의 LEVIS-BPM 커플링 포함)로서 모델화하며; 그러나, 이러한 소프트웨어 시스템은 프로토콜의 개별 단계를 수행하는 특정 자동화 플랫폼에 연결하지 않는다.
자동화 측면에서, 과학자에 의한 생물학적 프로토콜 또는 워크플로우를 설명하는 데 사용되는 언어는 프로토콜의 특정 단계를 수행하는 자동화 플랫폼에 대한 기계 명령으로 직접 번역되지 않는다. 또한, 여러 기계가 단일 프로토콜을 실행하는 데 사용될 수 있으며, 이의 각각은 약간 상이한 기계 언어를 사용한다.
종래의 접근법은 이러한 문제를 부분적으로 해결하려고 시도한다. 오토프로토콜(Autoprotocol)은 고급 프로토콜 설명을 특정 기계 명령어로 변환하기 위한 공통 프레임워크로서 사용될 트랜스크립틱(Transcriptic)에서 개발한 언어이다. 그러나, 오토프로토콜은 여러 유형의 플랫폼의 분산 시스템에서 명령을 전송하는 방법을 정의하지 않는다. 마찬가지로, 안타(Antha)는 오토프로토콜과 유사한 문제를 해결하려고 시도하는 생물학적 공정을 위한 고급 프로그래밍 언어이며 또한 장치 애그노스틱이다. 그러나, 새로운 플랫폼으로 얼마나 쉽게 확장할 수 있는지는 확실하지 않으며 언어 애그노스틱인 것으로 보이지 않는다.
고 처리량 변형 디자인 시스템에서의 품질 관리
코돈 출원은 DNA 서열의 디자인, 구축, 테스팅 및 분석을 위한 실험실 정보 관리 시스템(LIMS)을 기술한다. 테스트 동안, 미생물 균주는 예를 들어 크기 및 시퀀싱 방법에 기초하여 품질 테스트(예를 들어, 품질 관리(QC) 평가)될 수 있다. 그런 후에, QC를 통과하는 생성된 균주는, 예를 들어 액체 또는 콜로니 배양물로부터 플레이트 상으로 이동되는 관심 생성물을 생성하는 것을 더 처리할 수 있다.
코돈 출원에 기재된 것과 같은 고 처리량 변형 디자인 시스템은 관심 생성물을 생성하는 방식에 따라 워크플로우의 모든 단계 또는 거의 모든 단계에서 인 실리코 품질 관리에서 수행해야 하는 과제를 야기한다. 이러한 고 처리량 변형 디자인 시스템은 여러(예를 들어, 100 또는 1000) 인 실리코 중간 생성물을 생산할 수 있다. 더욱이, 하나의 중간 생성물의 인 실리코 처리는 다수의 중간 생성물을 생성할 수 있어, 실리코 QC 절차의 수의 기하급수적인 증가를 초래한다. 따라서, 이러한 고 처리량 변형 디자인 시스템에서 각 중간 생성물에 대해 인 실리코 QC에서 수행하면 QC 테스트 디자인 단계에서 인간이 수행할 경우 특히 어려울 수 있는 계산상의 문제가 발생한다. 또한, 실제 고 처리량 유전자 제조 시스템에서 각 중간 생성물에 대해 QC 테스트를 수행하면 QC 테스트를 위한 반응물 및 장비를 효율적으로 할당하는 데 어려움을 제공한다.
본 발명의 실시태양은 제조시 생성될 수 있는 지향성 빌드 그래프에서 제조 활동의 생물학적 워크플로우를 모델링하는 소프트웨어 시스템을 제공한다. 그래프는 알려진 데이터 구조이며 그래프를 저장하고 쿼리하기 위한 일반적인 메커니즘이 있다. 그러나, 본 발명자들은 생물학적 성분의 유전자 변형의 워크플로우의 임의의 통상적인 그래프 표현을 알지 못한다. 본 발명의 실시태양은 기존 라이브러리를 사용한다. 다음을 포함한 다른 것들이 평가되었다: NetworkX, JUNG, JgraphT, Neo4J, Dagre. 이들은 일반적인 그래프 데이터베이스이지만, 이들은 제조 프로세스, 생물학적 워크플로우 또는 DNA를 데이터로 사용하는 데 특화되어 있지 않다.
생물학자들은 본 발명의 실시태양의 시스템을 사용하여 투입물 및 최종 생성물을 포함하는 높은 레벨의 생물학적 워크플로우를 상술한다. 시스템은 필요한 중간 투입물과 해당 구성 요소 간의 관계를 결정한다. 워크플로우는 모듈식이며 구성 가능하다. 이것이 단순한 워크플로우에서보다 복잡한 워크플로우를 구축할 수 있으며 관련성이 없는 워크플로우의 일부를 조합하여 운영 효율성을 활용할 수 있다.
시스템은 워크플로우의 각 입력 및 출력 세트를 (a) 워크플로우에 기술된 관계에 기초한 물리적 실험실 장비 및 (b) 워크플로우의 각 단계에 대한 생물학적 프로토콜의 설명에 매핑한다. 시스템은 여러 독립적인 소프트웨어 및 하드웨어 플랫폼을 연결하여 이러한 활동을 관리하고 실행한다.
본 발명의 실시태양은 유사한 생물학적 워크플로우의 공통 양태를 특정 상황에서 취하고 함께 수행함으로써 고 처리량 워크플로우의 실행을 개선시킨다. 본 발명의 실시태양은 워크플로우가 동일한 단계를 공유하는 많은 상이한 워크플로우에 대한 단계의 공통 처리를 허용한다.
소프트웨어 측면에서, 운영 효율을 생성하기 위해 이종 제조 공정의 공통 단계를 그룹화하는 것이 공지된 관행이다. 그러나, 생물학적 성분의 고 처리량 유전자 변형과 관련하여 그렇게 하는 것은 발명자들에게 알려져 있지 않다. 본 발명의 실시태양은 생물학적 성분과 빌드 생성물 사이의 역할 및 관계에 기초한 제조 공정으로서 생물학적 워크플로우를 모델링한다. 이 모델링은 본 발명의 실시태양이 상이한 생물학적 공정의 공통 부분을 식별하고 이를 팩토리 오더(factory order) 규모로 그룹화할 수 있게 한다.
본 발명의 실시태양은 또한 상이한 언어로 상이한 기계를 실행하는 상이한 자동화된 플랫폼을 제어하는 단점을 극복한다. 이러한 실시태양은 과학자의 더 높은 레벨의 프로토콜 워크플로우를 호스팅하는 소프트웨어 서비스와 프로토콜을 구성하는 다양한 작업을 수행하는 개별 자동화 플랫폼 간의 통신을 가능하게 하기 위해 분산 방식으로 동작한다. 또한, 본 발명의 실시태양은 장치-애그노스틱(임의의 유형의 자동화 플랫폼과도 작동할 수 있음) 및 언어-애그노스틱(통신의 어느 쪽 끝에서든 많은 다른 소프트웨어 언어와 작동할 수 있음)이다. 이는 생물학적 프로토콜을 구현하기 위해 설치해야 하는 새로운 소프트웨어 및 하드웨어의 양을 감소시킨다.
빌드 그래프 생성
본 발명의 실시태양은 유전자 변형을 포함하는 하나 이상의 관심 생성물의 유전자 제조 시스템에서의 생산을 제어하기 위한 빌드 그래프 데이터 구조를 생성하기 위한 실행 가능한 지시를 저장하는 시스템, 방법 및 컴퓨터 판독 가능 매체를 제공한다.
본 발명의 실시태양에 따르면, 팩토리 주문 배치 엔진(또는 "오더 플레이서"라고도 함)은 생물학적 워크플로우의 설명(예를 들어, 이하에 상세히 설명되는 DNA 사양과 같은 서열 사양)에 접근하고, 상기 설명은 생물학적 성분의 표현을 포함한다. 본 발명의 대안적인 실시태양에 따르면, 워크플로우 엔진은 하나 이상의 생물학적 워크플로우의 설명에 접근하고, 여기서 각각의 설명은 팩토리 오더(예를 들어, 오더 플레이서에 의해 생산됨)로 표현될 수 있고 생물학적 성분의 표현을 포함할 수 있다.
본 발명의 실시태양에 따르면, 워크플로우 엔진은 워크플로우 설명에 적어도 부분적으로 기초하여 빌드 그래프 데이터 구조를 조립한다. 빌드 그래프 데이터 구조에서, 각각의 생물학적 성분은 복수의 레벨의 한 레벨에 상주하는 노드로 표현되고, 2개의 생물학적 성분 사이의 각각의 관계는 소스 노드와 목적 노드를 연결하는 에지에 의해 표현된다. 에지 주석은 소스 노드에 상응하는 성분의 역할을 나타낼 수 있다.
하나 이상의 소스 노드(복수의 레벨의 소정의 레벨에서) 및 하나 이상의 소스 노드에 연결된 단일 목적 노드(소정의 레벨의 자식 레벨에서)는 자식 레벨에 상응하는 하나 이상의 반응 그룹을 구성할 수 있다. 본 발명의 실시태양에 따르면, 반응 그룹 내의 소정의 레벨의 소스 노드는 복수의 생물학적 성분을 나타낼 수 있고, 자식 레벨의 반응 그룹 내의 목적 노드는 또한 복수의 생물학적 성분을 나타낼 수 있다. 각각의 반응 그룹은 소정의 레벨에서 하나 이상의 소스 노드에 의해 그들 자신이 표현되는 하나 이상의 생물학적 성분 사이의 반응을 나타내어 자식 레벨에서 반응 그룹의 단일 목적 노드에 의해 표현되는 생물학적 성분을 생성한다. 자식 레벨에서 하나 이상의 목적 노드는 소정의 레벨의 손자 레벨에서 하나 이상의 반응 그룹의 반응 그룹에서 하나 이상의 소스 노드로서 작용할 수 있다. 본 발명의 실시태양에 따르면, 소정의 레벨에서 하나 이상의 소스 노드들 중 적어도 하나는 자식 레벨에서 둘 이상의 목적 노드에 연결되고 자식 레벨에서 상응하는 연결된 둘 이상의 목적 노드의 각각과 상응하는 관계를 갖는다.
복수의 레벨의 최종 레벨에서 적어도 하나의 목적 노드는 적어도 하나의 관심 생성물을 나타낼 수 있으며, 이는 상이한 레벨에서 생물학적 성분 사이의 반응에 의해 야기된 유전자 변형을 포함한다. 빌드 그래프 데이터 구조를 처리하는 것은 적어도 하나의 관심 생성물의 생산을 초래한다. 관심 생성물은 뉴클레오타이드 또는 미생물 균주를 포함할 수 있다.
본 발명의 실시태양에 따르면, 워크플로우 엔진은 상이한 팩토리 오더에 대한 2개 이상의 워크플로우 단계가 공통 워크플로우 단계의 공통 반응 단계의 공통성에 적어도 부분적으로 기초하여 함께 처리될 수 있는 공통 워크플로우 단계인 것을 결정할 수 있다. 그렇다면, 워크플로우 엔진은 공통 워크플로우 단계에 적어도 부분적으로 기초하여 빌드 그래프 데이터 구조를 생성할 수 있다. 본 발명의 실시태양에 따르면, 공통 워크플로우 단계는 동일한 반응 그룹에 속할 수 있다.
본 발명의 실시태양은 유전자 변형을 포함하는 하나 이상의 관심 생성물의 유전자 제조 시스템에서의 생산을 제어하기 위해 팩토리 오더를 처리하기 위한 워크플로우 엔진을 제공한다. 본 발명의 실시태양에 따르면, 워크플로우 엔진은 복수의 팩토리 오더에 접근하고, 여기서 각 팩토리 오더는 하나 이상의 관심 생성물을 구축하기 위한 하나 이상의 유전자 디자인 기술(예를 들어, 프로모터 스왑)을 나타낸다. 본 발명의 실시태양에 따르면, 각각의 워크플로우 단계는 하나 이상의 반응 단계(예를 들어, 전기 천공 또는 접합)를 포함한다.
본 발명의 실시태양에 따르면, 워크플로우 엔진은 복수의 팩토리 오더의 상이한 팩토리 오더에 대한 2개 이상의 워크플로우 단계가 공통 워크플로우 단계의 공통 반응 단계의 공통성에 적어도 부분적으로 기초하여 함께 처리될 수 있는 공통 워크플로우 단계인 것을 결정할 수 있다. 본 발명의 실시태양에 따르면, 워크플로우 엔진은 공통 워크플로우 단계에 적어도 부분적으로 기초하여 빌드 그래프 데이터 구조를 생성한다. 본 발명의 실시태양에 따르면, 워크플로우 엔진은 상이한 팩토리 오더로부터의 정보에 적어도 부분적으로 기초하여 2개 이상의 워크플로우 단계들 또는 반응 단계들을 결정할 수 있다.
본 발명의 실시태양에 따르면, 공통 워크플로우 단계들의 처리를 나타내는, 빌드 그래프 데이터 구조의 소정의 레벨에서 목적 노드는, 소정의 레벨의 자식 레벨에서 2개 이상의 목적 노드에 연결되는 소스 노드로서 작용할 수 있다.
본 발명의 실시태양에 따르면, 워크플로우 엔진에 의해 수행되는 일부 작업은, 특히 오더 플레이서가 공장에서 사용 가능한 장비의 유형, 플레이트 레이아웃 및 생물학적 성분을 포함하는 팩토리의 물리적 속성에 관한 정보를 보유하는 시스템에서 오더 플레이서에 의해 대신 실행될 수 있다.
빌드 그래프 처리
본 발명의 실시태양은 유전자 변형을 포함하는 관심 생성물의 유전자 제조 시스템에서의 생산을 제어하기 위해 빌드 그래프 데이터 구조를 처리하기 위한 워크플로우 엔진을 제공한다. 본 발명의 실시태양에 따르면, 워크플로우 엔진은 노드 및 에지를 포함하는 빌드 그래프 데이터 구조에 접근한다. 본 발명의 실시태양에 따르면, 각각의 노드는 생물학적 성분을 나타내며 복수의 레벨의 한 레벨에 상주하며, 각각의 에지는 소스 노드와 목적 노드를 연결하여 이들 사이의 빌드 관계를 나타낸다.
복수의 레벨의 소정의 레벨에서 하나 이상의 소스 노드, 및 소정의 레벨의 자식 레벨에서, 하나 이상의 소스 노드에 연결된 단일 목적 노드는 자식 레벨에 상응하는 하나 이상의 반응 그룹의 반응 그룹을 구성할 수 있다. 각각의 반응 그룹은 소정의 레벨에서 하나 이상의 소스 노드에 의해 표현된 하나 이상의 생물학적 성분 사이의 반응을 나타내어 자식 레벨에서 반응 그룹의 단일 목적 노드에 의해 표현되는 생물학적 성분을 생성한다. 본 발명의 실시태양에 따르면, 워크플로우 엔진은 복수의 레벨에서 빌드 그래프 데이터 구조를 가로 질러 복수의 레벨에서 노드에 상응하는 생물학적 성분을 관심 생성물을 생성하기 위한 물리적 실험실 장비에 맵핑한다. 본 발명의 실시태양에 따르면, 생물학적 성분을 맵핑하는 단계는 복수의 레벨에서 노드에 상응하는 생물학적 성분을 생물학적 성분 사이의 반응에 맵핑하는 단계를 포함한다.
본 발명의 실시태양에 따르면, 빌드 그래프 데이터 구조를 가로지르는 것은 하나 이상의 각각의 물리적 캐리어의 물리적 매체상의 생물학적 성분의 하나 이상의 레이아웃을 결정하는 단계를 포함한다. 물리적 캐리어의 물리적 매체상의 노드에 의해 표현된 생물학적 성분의 레이아웃은 플레이트 마스크를 포함할 수 있다.
물리적 매체상의 생물학적 성분의 하나 이상의 레이아웃을 결정하는 것은 하나 이상의 공정 변형에 적어도 부분적으로 기초할 수 있다. 하나 이상의 공정 변형은 물리적 캐리어 상의 물리적 매체의 위치와 관련될 수 있다. 물리적 매체상의 생물학적 성분의 하나 이상의 레이아웃을 결정하는 것은 생물학적 성분을 소스 물리적 매체로부터 목적지 물리적 매체로 효율적으로 전달하기 위한 하나 이상의 레이아웃을 최적화하는 것에 적어도 부분적으로 기초할 수 있다. 전달은 스탬프 액체 전달 작업일 수 있다.
본 발명의 실시태양에 따르면, 워크플로우 엔진은 최종 물리적 캐리어의 물리적 매체상의 생물학적 성분들의 최종 레이아웃을 수신하며, 여기서 최종 레이아웃의 각각의 생물학적 성분은 빌드 그래프 데이터 구조의 최종 레벨에서 목적 노드에 의해 표현되며, 및 워크플로우 엔진은 복수의 레벨의 상응하는 하나 이상의 비 최종 레벨에서 하나 이상의 각각의 물리적 캐리어의 물리적 매체상의 생물학적 성분의 하나 이상의 레이아웃을 결정한다.
본 발명의 실시태양에 따르면, 워크플로우 엔진은 소스 물리적 매체 내의 생물학적 성분의 양에 적어도 부분적으로 기초하여 자식 레벨에서 각 반응 그룹 내에서 목적지 성분을 생성하기 위해 상응하는 생물학적 성분의 전달을 소싱하기 위한 소스 물리적 매체의 수를 결정한다.
본 발명의 실시태양에 따르면, 워크플로우 엔진은 빌드 그래프 데이터 구조의 소정의 레벨에서 하나 이상의 반응 그룹의 각 반응 그룹 내의 하나 이상의 소스 노드 및 에지로부터 소정의 레벨에서 하나 이상의 반응 그룹 내에서 하나 이상의 목적 노드에 상응하는 하나 이상의 목적지 성분을 생성하는데 사용되는 소정의 레벨에서 모든 반응 그룹에 대한 하나 이상의 소스 노드에 상응하는 각각의 생물학적 성분의 각각의 예의 수를 결정한다.
이어서, 워크플로우 엔진은 상응하는 생물학적 성분의 전달을 소싱하기 위한 소스 물리적 매체의 수를 결정하여 상응하는 생물학적 성분의 예의 수에 적어도 부분적으로 기초하여 소정의 레벨에서 각각의 반응 그룹 내에서 목적지 성분을 생성할 수 있다. 상응하는 생물학적 성분의 전달을 소싱하기 위해 결정된 소스 물리적 매체의 수는 소스 물리적 매체 내의 생물학적 성분의 양과 같은 소스 물리적 매체의 적어도 하나의 물리적 제약에 적어도 부분적으로 기초할 수 있다.
본 발명의 실시태양에 따르면, 물리적 캐리어는 플레이트이고 물리적 캐리어의 물리적 매체는 플레이트 상에 다수의 웰을 포함한다. 본 발명의 실시태양에 따르면, 복수의 레벨의 최종 레벨에서 물리적 캐리어의 물리적 매체는 관심 생성물을 지원한다. 관심 생성물은 뉴클레오타이드 서열 또는 미생물 균주를 포함할 수 있다.
생물학적 프로토콜 실행
본 발명의 실시태양은 복수의 자동화된 장비 상에 생물학적 프로토콜을 구현하기 위한 팩토리 장비 서비스 인터페이스("FESI")를 구현하기 위한 실행 가능한 명령을 저장하는 시스템, 방법 및 컴퓨터 판독 가능 매체를 제공하여, 유전자 변형을 포함하는 관심 생성물을 생성한다. 자동화된 장치의 상이한 부분은 각각의 상이한 기계-특정 언어로 기계-특정 명령에 따라 생물학적 프로토콜을 구현할 수 있다.
본 발명의 실시태양에 따르면, 워크플로우 엔진은 하나 이상의 팩토리 오더에 적어도 부분적으로 기초하여 객체 명령을 발행하며, 여기서 객체 명령은 자동화 된 장비가 생물학적 프로토콜을 실행하도록 지시한다. 본 발명의 실시태양에 따르면, 워크플로우 엔진은 상이한 팩토리 오더에 대한 공통 워크플로우 단계를 나타내는 빌드 그래프 데이터 구조를 생성한다.
팩토리 작업자 엔진은 각각 객체 명령을 복수의 기계 특정 언어의 기계 특정 언어로 기계 특정 명령으로 변환한다. 자동화 장비의 각 부분은 관심 생성물을 생성하기 위한 경로를 따라 생물학적 성분을 생성하기 위한 생물학적 프로토콜을 구현하기 위해 각각의 기계-특정 언어로 기계-특정 명령어를 실행하도록 작동 가능하다. 프로토콜은, 예를 들어, 생물학적 성분을 소스 물리적 캐리어에서 목적지 물리적 캐리어로 전달하는 것을 포함할 수 있다. 자동화 장비의 적어도 두 부분은 상이한 기계 특정 언어에 따라 작동한다.
본 발명의 실시태양에 따르면, 프로토콜 브로커는 하나 이상의 자동화 장비와 관련된 메시지에 적어도 부분적으로 기초하여 생물학적 프로토콜을 실행할 수 있는 하나 이상의 자동화 장비를 결정한다. 이 프로토콜은 워크플로우 엔진으로부터 사용 가능한 자동화 장비를 위한 상응하는 공장 작업자에게 객체 명령을 지시할 수 있다.
고 처리량 균주 디자인 시스템에서의 품질 관리
QC 테스트 디자인
본 발명의 실시태양은 복수의 생물학적 성분에 대한 품질 관리 테스팅을 디자인하기 위한 시스템, 방법 및 비 일시적 컴퓨터 판독 가능 매체를 제공한다. 실시태양은 (1) 하나 이상의 표적 생물학적 성분에 대해 하나 이상의 검정을 수행하는 단계, 여기서 하나 이상의 생물학적 성분 중 하나에 대한 각각의 분석의 인 실리코 성능은 하나 이상의 표적 생물학적 성분(예를 들어, 플라스미드)의 하나를 필요로 하는 분석 반응(예를 들어, 분해)으로부터 얻은 하나 이상의 분석 반응 생성물(예를 들어, 다중 플라스미드 단편)을 생산한다, (2) 각각의 분석의 둘 이상의 예상 결과를 분석에 관한 실험적 정보를 적어도 부분적으로 기초하여 적어도 하나의 성공 모드 또는 적어도 하나의 실패 모드로 분류하는 단계; 및 (3) 하나 이상의 분석 반응 생성물에 대해, (a) 하나 이상의 분석 반응 생성물의 속성, 및 (b) 두 개 이상의 예상 결과의 분류를 포함하는 참조 정보를 분석 데이터 구조로 저장하는 단계.
본 발명의 실시태양에 따르면, 분석 데이터 구조의 처리는 (a) 물리적 실험실 장비를 사용하여 하나 이상의 표적 생물학적 성분에 대해 하나 이상의 인 실리코 분석에 상응하는 하나 이상의 물리적 분석을 수행하여 각각의 물리적 분석에 대해 하나 이상의 물리적 분석 반응 생성물을 생성하고, (b) 각각의 물리적 분석에 대해, 하나 이상의 물리적 분석 반응 생성물을 상응하는 참조 정보와 비교하여 표적 생물학적 성분을 적어도 하나의 성공 모드 또는 적어도 하나의 실패 모드에 상응하도록 분류하는 것을 초래한다.
표적 생물학적 성분은 플라스미드를 포함할 수 있고, 하나 이상의 반응 생성물은 플라스미드 단편을 포함할 수 있다. 각각의 표적 생물학적 성분은 뉴클레오타이드 서열 또는 미생물 균주를 포함할 수 있다.
분석에 관한 실험 정보는 하나 이상의 분석 반응 생성물에 관한 실험 정보를 포함할 수 있다. 분류는 분석 반응, 분석 반응에 관여하는 분석 반응물 및 하나 이상의 표적 생물학적 성분 중 하나에 적어도 부분적으로 기초할 수 있다. 하나 이상의 표적 생물학적 성분에 대한 하나 이상의 분석을 인 실리코로 수행하는 단계는 하나 이상의 표적 생물학적 성분의 제 1 표적 생물학적 성분에 하나 이상의 분석의 적어도 둘을 인 실리코로 수행하는 단계를 포함할 수 있다.
분석 데이터 구조는 하나 이상의 표적 생물학적 성분에 대한 하나 이상의 분석에 대해, 복수의 분석 노드를 포함하는 복수의 레벨을 포함하는 지향 그래프일 수 있다. 본 발명의 실시태양에 따르면, 지향 그래프에서, 복수의 레벨의 한 레벨에 상주하는 각각의 분석 노드는 하나 이상의 표적 생물학적 성분, 하나 이상의 분석 반응물, 또는 분석 반응 생성물 중 하나를 나타내며; 복수의 분석 노드의 표적 분석 노드는 소정의 레벨에서 하나 이상의 표적 생물학적 성분의 표적 생물학적 성분을 나타내고; 및 표적 분석 노드와 관련된 복수의 분석 노드의 분석 반응 생성물 노드는, 소정의 레벨의 자식 레벨에서, 하나 이상의 분석 반응 생성물 및 참조 정보를 나타낸다. 본 발명의 실시태양에 따르면, 소정의 레벨은 인 실리코에서 소정의 레벨에서 표적 생물학적 성분과 반응하는 적어도 하나의 분석 반응물을 나타내는 적어도 하나의 분석 반응물 노드를 포함한다. 본 발명의 실시태양에 따르면, 소정의 레벨의 표적 분석 노드 및 분석 반응물 노드 및 자식 레벨의 분석 반응 생성물 노드는 자식 레벨에 상응하는 하나 이상의 분석 반응 그룹의 분석 반응 그룹을 구성한다.
본 발명의 실시태양은 특정 내용으로부터 유사한 QC 테스트의 공통적인 양상을 취하고 함께 수행함으로써 고 처리량 균주 디자인 시스템에 대한 QC 테스트를 디자인하는 어려움을 완화시킨다. 본 발명의 실시태양은 본 발명의 다른 실시태양이 상이한 생물학적 공정의 공통 부분을 분별하여 팩토리 오더 스케일로 함께 그룹화하는 방식과 유사하게, 동일한 분석 반응 단계를 공유하는 많은 상이한 QC 분석에 대한 단계의 공통 처리를 허용한다. 본 발명의 실시태양에 따르면, 각각의 분석은 하나 이상의 분석 단계를 포함하고, 각각의 분석 단계는 복수의 분석 반응 단계의 분석 반응 단계를 포함한다. 본 발명의 실시태양은 상이한 분석의 하나 이상의 분석 단계가 공통 분석 단계의 하나 이상의 분석 반응 단계의 공통성에 적어도 부분적으로 기초하여 함께 처리될 수 있는 공통 분석 단계인 것을 결정하고, 공통 분석 단계에 적어도 부분적으로 기초한 분석 데이터 구조를 생성한다. 공통 분석 단계는 동일한 분석 반응물과 연관될 수 있다. 본 발명의 실시태양은 일반적인 분석 단계에 필요한 분석 반응물의 양을 결정한다. 예를 들어, 2개의 공통 분석 단계가 2개의 상이한 생물학적 성분에 대해 동일한 분석 반응 단계를 수행하는 경우, 본 발명의 실시태양은 공통 분석 단계에 필요한 총 분석 반응물의 양을 계산하고, 공통 분석 단계의 성능을 효율적인 방식으로 적절한 실험실 장비로 할당할 수 있다. 물리적 세계에서의 품질 관리 테스트의 수행 동안, 본 발명의 실시태양은 QC 테스트 데이터 구조(예를 들어, 데이터 구조의 지향 그래프)를 가로 질러 QC 분석에 대한 물리적 실험실 장비의 각 부분에 사용되는 반응물의 양을 결정한다.
본 발명의 실시태양에 따르면, 분류하는 것은 분석에 관한 실험적 정보에 적어도 부분적으로 기초하여 각각의 분석의 예상 결과를 적어도 2개의 실패 모드로 분류하는 것을 포함한다. 본 발명의 실시태양에 따르면, 실패 모드는 표적 생물학적 성분의 결함을 나타낸다. 본 발명의 실시태양에 따르면, 실패 모드는 분석의 실패를 나타낸다. 본 발명의 실시태양에 따르면, 제 1 실패 모드는 제 1 구축 오류에 따라 부적절하게 구성된 표적 생물학적 성분을 나타내고, 제 2 실패 모드는 제 2 구축 오류에 따라 부적절하게 구성된 표적 생물학적 성분을 나타낸다. 본 발명의 실시태양에 따르면, 실패 모드는 결함 분석 반응물을 나타낸다. 본 발명의 실시태양은 상기 성공 및 실패 모드의 임의의 조합에 따라 예상 분석 결과를 분류할 수 있다.
본 발명의 실시태양에 따르면, 분석 반응의 하나 이상의 분석 반응 생성물에 대해, 참조 정보는 분석 반응, 하나 이상의 분석 반응 생성물 또는 분석 반응물의 확인을 추가로 포함한다. 참조 정보 속성은 하나 이상의 분석 반응 생성물의 예상 길이, 서열 또는 성장 능력을 포함할 수 있다.
본 발명의 실시태양에 따르면, 하나 이상의 표적 생물학적 성분 각각은 빌드 그래프 데이터 구조의 적어도 일부에 따라 생성되며, 여기서 빌드 그래프 데이터 구조의 복수의 레벨의 한 레벨에 상주하는 각각의 노드는 복수의 레벨의 한 레벨에 상주하는 하나 이상의 생물학적 성분 중 적어도 하나를 나타낸다. 본 발명의 실시 태양에 따르면, 빌드 그래프 데이터 구조는 관심 생성물의 유전자 제조 시스템에서의 생산을 제어하고, 여기서 관심 생성물은 빌드 그래프에 의해 표현되는 유전자 변형을 포함한다.
본 발명의 실시태양에 따르면, 빌드 그래프 데이터 구조의 복수 레벨의 소정의 레벨에서 하나 이상의 소스 노드, 및 하나 이상의 소스 노드와 관련되는 빌드 그래프 데이터 구조의 소정의 레벨의 자식 레벨에서 목적 노드는 빌드 그래프 데이터 구조의 자식 레벨에 상응하는 하나 이상의 반응 그룹의 한 반응 그룹을 구성한다. 본 발명의 실시태양에 따르면, 각각의 반응 그룹은 소정의 레벨에서 하나 이상의 소스 노드에 의해 그들 자신이 표현되는 하나 이상의 생물학적 성분 사이의 반응을 나타내어, 빌드 그래프 데이터 구조의 자식 레벨에서 반응 그룹의 목적 노드에 의해 표현되는 하나 이상의 표적 생물학적 성분을 생성한다.
QC 테스트 구현
본 발명의 실시태양은 표적 생물학적 성분의 물리적 분석으로부터 생성된 하나 이상의 물리적 분석 반응 생성물에 관한 정보를 얻고 하나 이상의 물리적 분석 반응 생성물을 상응하는 참조 정보와 비교함으로써 표적 생물학적 성분에 대한 품질 관리 테스트를 수행하여 적어도 하나의 성공 모드, 적어도 하나의 실패 모드 또는 불확정 모드에 상응하는 것으로 표적 생물학적 성분을 분류하고, 여기서 참조 정보는 성공 및 실패 모드에 상응하는 하나 이상의 물리적 분석 반응 생성물의 예상 특성을 포함한다.
표적 생물학적 성분이 불확정 모드에 상응하는 것으로 분류되는 경우, 본 발명의 실시태양은 물리적 분석이 다시 수행되어야 함을 나타낸다. 표적 생물학적 성분이 적어도 하나의 성공 모드에 상응하는 것으로 분류되는 경우, 본 발명의 실시태양은 관심 생성물을 생성하는 것을 더욱 촉진하기 위해 표적 생물학적 성분의 추가 처리를 위한 지침을 제공한다. 실패 모드는 표적 생물학적 성분의 결함을 나타낼 수 있다. 실패 모드는 물리적 분석의 실패를 나타낼 수 있다. 본 발명의 실시태양에 따르면, 제 1 실패 모드는 제 1 구축 오류에 따라 부적절하게 구축된 표적 생물학적 성분을 나타내고, 제 2 실패 모드는 제 2 구축 오류에 따라 부적절하게 구축된 표적 생물학적 성분을 나타낸다. 본 발명의 실시태양에 따르면, 실패 모드는 물리적 분석의 물리적 분석 반응에 사용되는 결함 분석 반응물을 나타낸다. 본 발명의 실시태양은 상기 성공, 실패 및 불확정 모드의 임의의 조합에 따라 표적 생물학적 성분을 분류할 수 있다. 본 발명의 실시태양은 본 발명에 기술된 임의의 적용 가능한 실시태양의 품질 관리 테스트를 사용하여 미생물 균주를 생성한다.
빌드 그래프 확장
본 발명의 실시태양은 유전자 변형을 포함하는 하나 이상의 관심 생성물의 유전자 제조 시스템에서 생산을 제어하기 위한 빌드 그래프 데이터 구조를 생성하기 위한 시스템, 방법 및 비 일시적 컴퓨터 판독 가능 매체를 제공한다. 본 발명의 실시태양은 생물학적 워크플로우의 설명을 이용하며, 여기서 설명은 생물학적 성분의 표현을 포함하고; 워크플로우 설명에 적어도 부분적으로 기초하여 빌드 그래프 데이터 구조를 제작한다. 본 발명의 실시태양에 따르면, 빌드 그래프 데이터 구조에서, 복수의 레벨의 한 레벨에 상주하는 각각의 노드는 하나 이상의 생물학적 성분을 나타낸다. 본 발명의 실시태양에 따르면, 각각의 생물학적 성분은 뉴클레오타이드, 뉴클레오타이드 서열 또는 미생물 균주이다. 본 발명의 실시태양에 따르면, 복수의 레벨의 소정의 레벨에서 하나 이상의 소스 노드, 및 하나 이상의 소스 노드와 연관된 소정의 레벨의 자식 레벨에서 목적 노드는 자식 레벨에서 상응하는 하나 이상의 반응 그룹의 한 반응 그룹을 구성한다. 본 발명의 실시태양에 따르면, 각각의 반응 그룹은 소정의 레벨에서 하나 이상의 소스 노드에 의해 그들 자신이 표현되는 하나 이상의 생물학적 성분 사이의 반응을 나타내어, 자식 레벨에서 반응 그룹의 목적 노드에 의해 표현되는 하나 이상의 생물학적 성분을 생성한다. 본 발명의 실시태양에 따르면, 자식 레벨에서 하나 이상의 목적 노드는 소정의 레벨의 손자 레벨에서 하나 이상의 반응 그룹에서 하나 이상의 소스 노드로서 작용한다. 본 발명의 실시태양에 따르면, 복수의 레벨의 최종 레벨에서 적어도 하나의 목적 노드는 하나 이상의 상이한 레벨에서 생물학적 성분 사이의 반응에 의해 유발된 유전자 변형을 포함하는 적어도 하나의 관심 생성물을 나타낸다. 본 발명의 실시태양에 따라, 빌드 그래프 데이터 구조를 처리하는 것은 적어도 하나의 관심 생성물의 생산을 초래한다.
생물학적 성분에 대한 비 결정적 작업
본 발명의 실시태양에 따라, 하나 이상의 반응 그룹의 제 1 반응 그룹의 목적 노드는 제 1 반응 그룹에서 하나 이상의 소스 노드에 의해 표현된 하나 이상의 생물학적 성분에 적용된 하나 이상의 반응으로부터 생성되도록 계산된 비 결정적 생물학적 성분 세트를 나타낸다. 본 발명의 실시태양에 따르면, 목적 노드는 제 2 생물학적 성분의 하나 이상의 비 결정적 위치에 하나 이상의 제 1 생물학적 성분의 하나의 삽입으로부터 생성하도록 계산된 비 결정적 생물학적 성분 세트를 나타내며, 여기서 제 2 생물학적 성분은 생물학적 서열이다. 본 발명의 실시태양에 따르면, 목적 노드는 제 2 생물학적 성분 내의 하나 이상의 상응하는 특정된 위치에서 하나 이상의 생물학적 성분에 대한 비 결정적 변화로부터 생성하도록 계산된 비 결정적 생물학적 성분 세트를 나타내며, 여기서 제 2 생물학적 성분은 생물학적 서열이다. 본 발명의 실시태양에 따르면, 비 결정적 변화는 제 2 생물학적 성분 내의 하나 이상의 특정 위치의 각각에서 하나 이상의 제 1 생물학적 성분의 하나로 대체되는 것으로 제한된다. 본 발명의 실시태양에 따르면, 각각의 제 1 생물학적 성분은 뉴클레오타이드이고 제 2 생물학적 성분은 뉴클레오타이드 서열이다. 본 발명의 실시태양에 따르면, 생물학적 성분의 제 1 생물학적 성분은 플라스미드 페이로드이고 생물학적 성분의 제 2 생물학적 성분은 플라스미드 골격이다.
본 발명의 실시태양에 따르면, 빌드 그래프 데이터 구조의 소정의 레벨에서 하나 이상의 소스 노드에 의해 표현되는 하나 이상의 생물학적 성분은 미생물 균주이고, 균주 사이의 반응은 균주 사이의 수평 유전자 전달을 포함한다.
본 발명의 실시태양은 유전자 제조 시스템에 의한 생물학적 서열의 생산을 제어하기 위한 팩토리 오더를 생성하기 위한 명령을 저장하는 시스템, 방법 및 비 일시적 매체를 제공한다. 본 발명의 실시태양은 (1) 제 1 서열 피연산자에 대한 제 1 비 결정적 연산을 나타내는 표현을 수신하는데, 여기서 서열 피연산자는 생물학적 서열 부분을 나타내고, 제 1 서열 피연산자는 하나 이상의 생물학적 서열 부분을 나타내고; (2) 서열 명세서에 대한 표현을 평가하기 위한 명령을 실행하며, 서열 명세서는 (a) 제 1 서열 피연산자를 포함하는 하나 이상의 제 1 레벨 서열 피연산자에 대해 실행된 제 1 비 결정적 연산을 포함하는 하나 이상의 제 1 레벨 비 결정적 연산 및 (b) 이의 실행이 하나 이상의 제 1 레벨 서열 피연산자의 하나 이상의 값을 결정하는 하나 이상의 제 2 레벨 연산; 및 (3) 하나 이상의 제 1 레벨 연산과 하나 이상의 제 2 레벨 연산의 실행에 기초하여 팩토리 오더를 생성하며, 팩토리 오더는 생물학적 서열 부분을 생성하기 위해 유전자 제조 시스템에 의해 사용되며, 하나 이상의 제 1 레벨 비 결정적 연산은 생물학적 서열 부분을 생성하기 위한 프로토콜에 해당한다.
본 발명의 실시태양에 따르면, 하나 이상의 제 1 레벨 비 결정적 연산은 또한 생물학적 서열 부분을 생성하기 위한 물리적 실험실 장비에 해당한다. 본 발명의 실시태양은 팩토리 오더를 생성하기 위해 유향 빌드 그래프 데이터 구조를 사용하고, 상이한 팩토리 오더에 대한 2개 이상의 워크플로우 단계가 공통 워크플로우 단계의 반응 단계의 공통성에 적어도 부분적으로 기초하여 함께 처리될 수 있는 공통 워크플로우 단계인 것을 결정하고 공통 워크플로우 단계에 적어도 부분적으로 기초하여 빌드 그래프 데이터 구조를 조립한다.
본 발명의 실시태양은 상기 본 발명의 실시태양의 임의의 선행 방법에 의해 미생물 균주를 생성한다.
이들 및 다른 실시태양은 아래에 더 상세히 설명된다.
본 발명의 내용 중에 포함되어 있다.
도 1은 뉴클레오타이드 서열의 디자인, 구축, 테스트 및 분석을 위한 본 발명의 실시태양의 실험실 정보 관리 시스템을 예시한다.
도 2는 본 발명의 실시태양에 따른 뉴클레오타이드 서열을 디자인하고 구축하기 위한 공정을 예시하는 흐름도이다
도 3은 본 발명의 실시태양에 의해 가능한 재귀적 연계 함수의 한 예를 예시한다.
도 4는 본 발명의 실시태양에 따른 프로모터, 유전자 및 터미네이터의 2개의 세트를 포함하는 주석된 DNA 서열의 예를 예시한다.
도 5는 본 발명의 실시태양에 따른 도 4의 서열에 적용된 프로모터 스왑 연산을 예시한다.
도 6은 본 발명의 실시태양에 따른 대체-위치 외적 함수의 DNA 명세서의 그래픽 표현을 제공한다.
도 7은 본 발명의 실시태양을 구현하는데 사용될 수 있는 컴퓨터 시스템의 한 예를 예시한다.
도 8은 본 발명의 실시태양에 따른 팩토리 빌드 그래프의 한 예를 예시한다.
도 9는 본 발명의 실시태양에 따른 팩토리 블드 그래프의 다른 예를 예시한다.
도 10은 본 발명의 실시태양에 따른 팩토리 장비 서비스 인터페이스를 예시한다.
도 11은 본 발명의 실시태양에 따른 클라우드 컴퓨팅 환경을 예시한다.
도 12는 본 발명의 실시태양에 따른 품질 관리 테스트를 나타내는 지향 그래프를 예시한다.
도 13은 본 발명의 실시태양이 상이한 분석 반응에서 동일한 분석 반응물을 효율적으로 사용하는 QC 테스트의 디자인을 가능하게 하는 방법을 예시하는 예시적인 QC 그래프이다.
본 설명은 다양한 예시적인 실시태양이 도시된 첨부 도면을 참조하여 이루어진다. 그러나, 많은 다른 예시적인 실시태양이 사용될 수 있으므로, 설명은 본 발명에 설명된 예시적인 실시태양에 제한되는 것으로 해석되어서는 안 된다. 오히려, 이러한 예시적인 실시태양은 본 발명이 완전하고 완전할 수 있도록 제공된다. 예시적 실시태양에 대한 다양한 변형은 당업자에게 용이하게 명백할 것이며, 본 발명에 정의된 일반적인 원리는 본 발명의 취지 및 범위를 벗어나지 않고 다른 실시태양 및 응용분야에 적용될 수 있다. 따라서, 본 발명은 도시된 실시태양에 제한되는 것이 아니라, 본 발명에 개시된 원리들 및 특징들과 일치하는 가장 넓은 범위에 따른다.
코돈 출원의 실시태양(이의 많은 부분이 본 발명에 직접 인용된다)은 유전자 제조 시스템에 의한 뉴클레오타이드 서열의 생산을 제어하기 위한 팩토리 오더의 생성을 포함한다. 각각이 적어도 하나의 뉴클레오티드 서열 부분을 나타내는 서열 피연산자에 대한 연산을 나타내는 표현을 수신하고; 서열 명세서에 대한 표현을 평가하며, 여기서 서열 명세서는 하나 이상의 제 1 레벨 연산 및 하나 이상의 제 2 레벨 연산을 포함하는 데이터 구조를 포함한다; 및 하나 이상의 제 1 레벨 연산 및 하나 이상의 제 2 레벨 연산의 실행에 기초하여 팩토리 오더를 생성하는 시스템, 방법 및 컴퓨터 판독가능한 매체가 본 발명에서 기술된다. 재귀적 방식으로, 하나 이상의 제 1 레벨 연산은 적어도 하나의 제 1 레벨 서열 피연산자에 대해 연산하며, 그 값은 하나 이상의 제 2 레벨 연산의 실행에 의해 결정된다. 이어서, 팩토리 오더가 유전자 제조 시스템에 제공되어 서열 부분을 서열 명세서에 제공된 뉴클레오타이드 서열로 조립할 수 있다.
본 발명의 실시태양에서, 팩토리 오더는 어떻게 하나 이상의 제 1 레벨 연산 또는 하나 이상의 제 2 레벨 연산이 유전자 제조 시스템에 의해 구체화되는지(물리적으로 성취되는지)에 관한 명세서 데이터 구조에 포함된 매개 변수에 기초할 수 있다. 일부 실시태양에서, 매개 변수는 하나 이상의 제 2 레벨 연산의 첫 번째 제 2 레벨 연산의 구체화에서 유전자 제조 시스템에 의해 사용될 제 1 매개 변수 및 제 1 매개 변수와 상이하고 제 1 매개 변수와 동일한 항목의 매개 변수를 나타내며, 하나 이상의 제 2 레벨 연산의 두 번째 제 2 레벨 연산의 구체화에서 상기 유전자 제조 시스템에 의해 사용될 제 2 매개 변수를 포함할 수 있다. 예로서, 제 1 매개 변수는 제 1 조립 방법, 온도, 서열 부분 소스 또는 프라이머 소스를 나타낼 수 있고 제 2 매개 변수는 각각 제 2의 상이한 조립 방법, 온도, 서열 부분 소스 또는 프라이머 소스를 나타낼 수 있다.
팩토리 오더를 생성하는 과정에서, 코돈 출원에 기술된 재귀적 데이터 구조는 이들 디자인의 구성에 사용될 수 있는 입력 및 중간 부분과 함께 출력 균주 또는 DNA 디자인의 집합을 추출하도록 횡단될 수 있다. 코돈 출원의 실시태양에서, 이들 입력, 중간 및 최종 DNA 서열을 보유하는 데이터 구조는 "팩토리 빌드 그래프"로 표시된다. 이 팩토리 빌드 그래프(이하에서 선택적으로 "빌드 그래프"라고 함)는 DNA 서열 조립 작업을 수행하여, 물리적 형태로 원하는 출력 디자인을 생산하는 미리 정의된 워크플로우과 함께 사용될 수 있다.
시스템 개요
도 1은 DNA 서열의 디자인, 구축, 테스트 및 분석을 위한 본 발명의 실시태양의 실험실 정보 관리 시스템(LIMS)(200)의 시스템도이다. 도 2는 해당 흐름도이다. LIMS의 실시태양에서, 한 번에 하나 이상의 변화가 입력 DNA 서열에 가해져서, 각 변화 또는 변화 세트에 대한 단일 출력 서열을 생성한다. 균주를 최적화하기 위해 (예를 들어, 높은 수율로 유기 화합물을 효율적으로 생산하는 미생물을 제조하기 위해), LIMS는 한 번에 많은 DNA 출력 서열을 생산하여, 동일한 시간대 내에서 분석되어 어느 숙주 세포 및 입력 서열에 대한 어떤 변형이 원하는 특성을 가장 잘 얻을 수 있는지를 측정할 수 있다. 하기에서 볼 수 있듯이, 본 발명의 실시태양의 게놈 디자인 언어는 병렬로 많은 게놈 디자인을 생성하기 위한 컴팩트하고, 인간이 읽을 수 있는 표현을 제공한다.
일부 실시태양에서, 시스템은 각각 하나 이상의 변화를 갖는 다중 뉴클레오티드 서열 구조체(프로모터, 코돈 또는 유전자와 같은 DNA 구조체)의 디자인을 가능하게 하며 유전자 발현 시스템 또는 팩토리(210)가 구조체를 지니는 미생물 형태로 뉴클레오타이드 서열 구조체를 제작하도록 지시하는 작업 오더(즉, "팩토리 오더")를 생성한다. 본 발명의 실시태양에 따르면, 팩토리 오더는 미리 정의된 제조 실행 워크플로우과 함께 팩토리 빌드 그래프에서 구체화될 수 있다. 제작될 수 있는 미생물의 예는 박테리아, 진균 및 효모와 같은 숙주를 제한없이 포함한다. 이 시스템에 따라, 미생물의 특성(예를 들어, 수율, 역가)을 테스트한다. 피드백 루프 방식에서, 결과를 분석하여 이전 세대의 디자인을 반복적으로 개선하여 더욱 최적의 미생물 성능을 얻는다.
본 발명은 주로 DNA 구조체를 언급하지만, 당업자는 본 발명의 실시태양이 임의의 뉴클레오타이드 서열/핵산 서열(예를 들어, 메신저 RNA, IUPAC 알파벳의 임의의 이런 서열)을 포함하며 DNA 서열에만 제한되지 않는다. 더욱이, 디자인, 구축, 테스트 및 분석 공정이 본 발명에서 주로 미생물 게놈 변형의 내용에서 기술되었지만, 당업자는 이 공정이 임의의 유형의 숙주 세포에서 원하는 유전자 변형 및 발현 목표에 사용될 수 있다는 것을 인식할 것이다 .
도 1 및 도 2를 보다 상세히 참조하면, 프로그램 편집기를 실행하는 컴퓨터와 같은 입력 인터페이스(202)는 하나 이상의 DNA 출력 서열의 디자인을 개발하는데 사용되는 프로그램/스크립트의 진술을 수신한다(도 2의 302 참조). 이러한 게놈 디자인 프로그램 언어는 본 발명의 양수인에 의해 개발된 "코돈(Codon)" 프로그래밍 언어로서 본 발명에서 지칭될 수 있다. 본 발명의 실시태양의 강력한 특징은 단지 몇 개의 절차적 진술로 동일한 프로그램 내에서 매우 많은 수의 DNA 서열(예를 들어, 미생물 균주, 플라스미드)에 대한 디자인을 개발할 수 있는 능력이다.
프로그램 진술은 연산을 지정하는 키워드, 적어도 하나의 독립 변수, 0 이상의 독립 변수에 이어지는 호출할 함수 이름에 의해 지정된 함수 호출(이의 반환 값은 평가시에 버려진다) 또는 표현 또는 값의 변수 이름으로 후속 표현에 포함될 수 있는 변수로의 할당을 포함할 수 있다. 표현은 값으로 평가(결정)될 수 있는 기호의 모음이다. 함수 호출은 진술이나 표현으로 사용될 수 있다.
여기서, 편집기는 사용자가 도 7과 관련하여 설명된 바와 같이, 예를 들어 그래픽 또는 텍스트 입력을 통해 또는 컴퓨팅 장치 상의 키보드 및 마우스를 사용하는 메뉴 또는 형태를 통해 프로그램을 입력 및 편집할 수 있게 한다. 당업자는 직접 사용자 입력을 필요로 하지 않고 다른 입력 인터페이스(202)가 사용될 수 있음을 인식할 것인데, 예를 들어, 입력 인터페이스(202)는 애플리케이션 프로그래밍 인터페이스(API)를 사용할 수 있고, 다른 컴퓨팅 장치로부터의 프로그램을 포함하는 파일로 진술을 수신한다. 입력 인터페이스(202)는 로컬 또는 원격 접속을 통해 시스템의 다른 요소와 통신할 수 있다.
인터프리터 또는 컴파일러/실행 유닛(204)은 프로그램 진술을 본 발명의 실시태양의 신규한 DNA 명세서 데이터 구조로 평가한다(304). 데이터 구조 세부 사항은 아래에 설명될 것이다. (또한, "DNA 명세서"는 이의 데이터 형식 "DnaSpecification"에 따라 본 발명에서 언급될 수 있다. 더욱이, "DNA 명세서"라는 용어는 단지 DNA 서열에 한정되지 않고 임의의 뉴클레오타이드 서열에 적용된다. 본 발명에 사용된 바와 같이 "DNA 명세서"는 어떻게 입력 독립 변수 및 "연결"과 같은 지시로부터 하나 이상의 DNA/뉴클레오타이드 서열(들)을 생성하는지의 명세서를 의미한다. DNA의 명세서가 평가되는 경우, 아래에 설명된 대로 출력 서열을 기록할 수 있다.
용어 "인터프리터" 및 "컴파일러/실행 유닛"은 서로 교환 가능하게 사용되어야 하는데, 이는 본 발명의 실시태양이 인터프리터 또는 컴파일러 중 어느 하나로 구현될 수 있기 때문이다; 프로그램 진술은 해석되거나 컴파일될 수 있다. 컴파일러가 사용되는 경우, 본 발명의 시스템에서 실행 유닛이 뒤따른다.
통상적으로, 결국, 프로그램 스크립트는 "디자인 캠페인(design campaign)"에 포함될 프로그램의 최종 출력을 나타내는 DnaSpecification을 식별하는 "크리에이트(create)" 진술을 포함할 것이다. 디자인 캠페인 자체는 아래에서 기술될 것처럼, DNA 서열 생산을 위한 팩토리 오더의 선구자이다. 하나 이상의 크리에이트 진술이 제공될 수 있다; 다수의 이런 진술이 사용되면, DNA 명세서의 모음은 최상위 "리스트(list)" 명세서에 함께 유지된다.
인터프리터(204)는 DnaSpecification 데이터 형식을 통해 표현된 디자인 캠페인 속에서 크리에이트 진술의 DNA 명세서 독립 변수를 평가한다. 크리에이트 진술 자체는 크리에이트 진술의 독립 변수가 독립 변수에 의해 식별된 서열을 생산하기 위한 팩토리 오더를 생성하는데 사용되어야 함을 나타내는 오더 배치 엔진(208)에 의해 판독되는 식별자(예를 들어, 플래그 또는 다른 식별자)를 포함할 수 있다.
본 발명의 실시태양에서, 이 단계에서, 인터프리터(204)는 DNA 명세서에 의해 지정된 연산을 실행하여 이의 데이터 구조가 해석된 출력을 포함할 수 있다. 그러나, 다른 실시태양에서, 인터프리터(204)는 이런 연산을 실행하지 않을 것이고 출력 DNA 명세서 데이터 구조는 해석된 어떠한 출력도 포함하지 않을 것이다. 그 대신에, 이하에서 설명되는 바와 같이, 실행 엔진(207)은 출력을 해석할 것이다.
표현을 평가할 때, 인터프리터(204)는 커스텀/로컬 데이터베이스, 퍼블릭 데이터베이스, 또는 사용자 제공 파일(편의를 위해 본 발명에서 총칭하여 "라이브러리"로 지칭됨)과 같은 DNA 서열 데이터의 하나 이상의 소스를 의미할 수 있다. 전자 회로 디자인와 유사하게, 합성 생물학 디자인은 재사용 가능한 구성요소의 라이브러리로부터 계층적으로 구성될 수 있다. 라이브러리(206)는 DNA 서열 및 미생물의 특성을 반영하는 데이터(예를 들어, 주석)를 포함할 수 있다. 예를 들어, 라이브러리는 대장균의 상이한 균주에 대한 DNA 서열, 공지된 DNA 서열 내의 프로모터 및 터미네이터의 위치 및 미생물 균주 내의 유전자의 위치를 나타내는 데이터를 포함할 수 있다. 라이브러리는, 예를 들어, 수천 가지의 DNA 구성요소를 함유하는 데이터베이스를 포함할 수 있는데-이의 일부는 전체 미생물 균주 게놈이며, 일부는 작은 유전자 부분이다. 코돈 진술은 고유 ID에 의해 이들 중 하나를 의미할 수 있다. 라이브러리(206)는 이전 코돈 평가 실행의 출력-디자인 캠페인 또는 팩토리 오더를 의미할 수 있으며, 둘 다는 DnaSpecification 데이터 유형으로 구현될 수 있다. 특히, 라이브러리(206)는 본 발명에서 기술된 분석 단계로부터 유래된 유전자형-표현형 상관관계 데이터의 "라이브러리"를 저장할 수 있어, 새로운 팩토리 가동을 위해 바람직한 표현형 특성을 얻기 위한 기본 균주 및 유전적 변형의 선택을 가능하게 한다.
DnaSpecifications는 ID에 의해 지칭될 수 있다. 본 발명의 실시태양에 따르면, ID는 DnaComponents 및 DnaSpecifications에 대한 비 중첩 서열로 인터프리터(204)에 의해 발행될 수 있으므로, 라이브러리 내에서 입력으로 교환 가능하게 사용될 수 있다. 그러나 DnaComponents 및 DnaSpecifications에 대해 별도의 조회 기능을 사용함으로써, 시스템과 사용자는 동일한 ID가 각 유형의 모임 내의 DnaComponent 또는 DnaSpecification에 대한 유효한 식별자가 되더라도 DnaComponents와 DnaSpecifications를 식별할 수 있다. 또한, 라이브러리는 Codon 스크립트에서 사용될 수 있는 파일(통상적으로 FASTA 또는 genbank 포맷)에 DNA 서열을 저장할 수 있다.
실시태양에서, 인터프리터(204) 대신에, 실행 엔진(207)이 DNA 명세서(307)를 실행할 수 있다. 예를 들어, 실행 엔진(207)은 DNA 명세서에 의해 특정된 하나 이상의 오퍼레이터를 실행하여, 오퍼레이터를 DNA 명세서에 의해 지정된 적절한 입력에 적용할 수 있다. 이 시점에서, DNA 명세서 데이터 구조는 하나 이상의 오퍼레이터와 입력(및 매개 변수, 아래에서 설명함)뿐만 아니라 얻은 해석된 출력을 포함한다. 이러한 출력은 DNA 구성요소(예를 들어, 아래 실시예에 설명된 교차 생성물 요소)의 순서 목록으로 표현될 수 있다.
실시태양에서, 오더 배치 엔진(선택적으로 명세서/캠페인 인터프리터 또는 팩토리 오더 플레이서라 불림)(208)은 디자인 캠페인을 나타내는 DNA 명세서를 해석하고 어떤 중간 DNA 부분이 생산될지 또는 팩토리(210)에 대한 입력으로 필요할지를 결정한다(308). 일반적으로, 일부 실시태양에서, 팩토리 오더 플레이서(208)는 두 입력: 무엇이 제작되고(DnaSpec) 및 어떻게 사용자가 이를 제작하는지(workflow)를 나타내는 DnaSpecification 및 워크플로우 정보를 필요로 한다. 이에 기초하여, 팩토리 오더 플레이서(208)는 공지된 파라미터의 라이브러리 및 공지된 발견적 학습 및 다른 특성(예를 들어, 일반 장비에서 작동하는 최적 용융 온도)에 따르는 공지된 알고리즘을 사용하는 워크플로우 공정에 필요할 중간 부분을 계산할 수 있다. 본 발명의 실시태양에서, 서열 명세서 그 자체는 시작, 중간 및 최종 연산에 대한 워크플로우 및 특성을 나타내는 매개 변수뿐만 아니라 중간 입력을 지정할 수 있다.
팩토리 빌드 그래프를 통해, 오더 배치 엔진(208)은 DNA 명세서를 논리적 명세서로부터 물리적 제조 공정으로 변환한다. 위에 기술된 방식으로 오더 배치 엔진(208)에 의해 식별된 바와 같이, 실행된 DnaSpecification에서 식별된 출력과 함께, 워크플로우 공정에 요구되는 전구 및 중간 부분은 팩토리 빌드 그래프 데이터 구조에 오더 배치 엔진(208)에 의해 기록된다. (프라이머와 같은 전구 뉴클레오타이드 서열 부분은 뉴클레오타이드 서열 조립 공정의 시작 부분이다 - 중간 부분/조립체 또는 최종 부분/균주와는 다른 부분이며 빌드 그래프에서 다른 서열에 의존성이 없다.) 실시태양에서, 이것은 지향 비순환 그래프(DAG)이다: 여기서 각 노드는 전구 서열 부분, 중간 서열 부분 또는 최종 서열 부분 또는 최종 균주와 같은 뉴클레오타이드 서열 부분을 나타내고; 에지(edges)는 어떤 생물학적 성분이 특정한 추가 중간 또는 출력 부분을 생산하는 공정에 대한 입력인지를 전달하는데 사용된다. 후계자(들)을 생산하는데 각 전구 또는 중간 부분의 특정한 "역할"은 또한 오더 배치 엔진(208)에 의해 제작 그래프의 각 에지(즉, 에지를 나타내는 데이터 구조의 일부)에 기록된다. 제작 그래프의 특정 모양은 일련의 변경을 통해 최종 원하는 디자인을 생성하는 특정 실험실 프로토콜에서 수행된 실제 물리적 단계를 나타내는 사용자 제공 워크플로우에 의해 정의된다. 오더 배치 엔진(208)은 워크플로우에 의해 필요로 되는 역할의 선험적 지식으로부터 각 역할을 결정할 수 있다.
생성된 팩토리 오더는 미리 정해진 일련의 단계뿐만 아니라 구축될 각 DNA 서열에 대한 각 단계에 대한 매개 변수, 입력 및 출력의 조합을 포함할 수 있다. 팩토리 오더는 시작 미생물 기준 균주, 프라이머 목록, 가이드 RNA 서열, 또는 아래에 추가로 논의한 바와 같이, DNA 명세서 내에서 다른 연산을 위한 하나 이상의 제조 워크플로우 명세서와 함께 워크플로우를 수행하는 데 필요한 다른 주형 구성요소 또는 시약 명세서를 포함하는 DNA 부분 목록을 포함할 수 있다. 이러한 주요, 중간 및 최종 부분 또는 균주는 팩토리 빌드 그래프를 통해 구체화될 수 있다; 워크플로우 단계는 다양한 역할을 가진 제작 그래프의 요소를 참조한다. 오더 배치 엔진(208)은 위에서 논의한 정보에 대한 라이브러리(206)를 참조할 수 있다. 이 정보는 사용자 또는 다른 사람에 의해 개발된 맞춤 기술뿐만 아니라 뉴클레오타이드 서열 합성에 대한 통상적인 기술에 기초한 팩토리(210)의 물리적(인 실리코와 반대) 형태로 디자인 캠페인 연산을 구체화하는데 사용된다.
예를 들어, 재귀적 DNA 명세서가 원형화의 최상위 레벨 기능을 갖고 그것의 입력이 연결 명세서의 사슬인 것으로 가정한다. 팩토리 오더 플레이서(208)는 실험실의 사람 또는 로봇이 종래 기술 또는 관례/사용자에 의해 개발된 개선된 기술에 따라 각각의 입력을 증폭하고 이들을 원형 플라스미드 속에 조립하기 위해 PCR 반응을 수행할 수 있도록 일련의 입력을 해석할 수 있다. 팩토리 오더는 조립을 하기 위해 생성되어야 할 PCR 생성물을 지정할 수 있다. 팩토리 오더는 또한 PCR을 수행하기 위해 구입해야 하는 프라이머를 제공할 수 있다.
다른 예에서, DNA 명세서가 최상위 대체 기능을 지정한다고 가정하자. 팩토리 오더 플레이서(208)는 이것을 세포 변형(살아있는 세포에서 게놈의 한 부분을 다른 부분으로 대체하는 과정)으로 해석할 수 있다. 또한, 대체 기능에 대한 입력은 DNA의 출처를 나타내는 매개 변수를 포함할 수 있다(예를 들어, 다른 플라스미드로부터 절단, 일부 다른 균주로부터 증폭).
오더 배치 엔진(208)은 국소 또는 원격 접속을 통해 팩토리 오더를 팩토리(210)에 전달할 수 있다. 팩토리 오더에 기초하여, 팩토리(210)는 외부 공급업자 및 내부 저장 장치로부터 짧은 DNA 부분을 획득하고, 깁슨 조립 프로토콜 또는 골든 게이트 조립 프로토콜과 같은 당업계에 공지된 기술을 사용하여 입력 디자인에 상응하는 DNA 서열을 조립할 수 있다(310). 팩토리 빌드 그래프와 관련하여 아래에서 보다 상세히 논의되는 바와 같이, 그래프의 에지에 할당된 역할은 어떻게 빌드 그래프의 노드에 상응하는 성분이 다양한 기술(예를 들어, 깁슨 어셈블리)에서 사용되는지와 이들이 다중화된 작업(예를 들어, 96-웰 플레이트에서 발생)에서 결합되는 방법을 지정한다. 팩토리 오더 자체는 제조의 시작, 중간 및 최종 단계에서 채택할 기술을 지정할 수 있다. 예를 들어, 많은 실험실 프로토콜은 주형 서열 및 2개의 프라이머 서열을 필요로 하는 PCR 증폭 단계를 포함한다. 팩토리(210)는 로봇 자동화를 사용하여 부분적으로 또는 전체적으로 구현될 수 있다.
본 발명의 실시태양에 따르면, 팩토리 오더는 각각은 상이한 유전체 구성을 갖는 수십 또는 수천 개의 DNA 구조체의 팩토리(210)에서의 생산을 지정할 수 있다. DNA 구조체는 통상적으로 기본 균주에 삽입하기 위한 플라스미드를 형성하도록 원형화된다. 팩토리(210)에서, 기본 균주는 조립되어 삽입되는 플라스미드를 수용하기 위해 준비된다.
팩토리(210)에서 조립되어 생성된 DNA 서열은 테스트 장비(212)를 사용하여 테스트된다(312). 테스트 동안, 미생물 균주는 크기 및 서열화 방법에 기초한 품질 관리(QC) 평가를 받는다. 이어서, QC를 통과한 생성된 변형 균주는 액체 또는 콜로니 배양액로부터 플레이트로 옮겨질 수 있다. 생산 조건을 모델링한 환경 조건하에서, 균주가 재배되고 분석되어 성능(예를 들어, 원하는 생산물 농도)을 테스트한다. 동일한 테스트 과정이 플라스크 또는 탱크에서 수행될 수 있다.
피드백-루프 방식에서, 결과는 어느 미생물이 표현형 성질을 나타내는지 결정하기 위해 분석 장비(214)에 의해 분석될 수 있다(314). 분석 단계에서, 변형 균주 배양액은 이들의 성능, 즉 산업적 규모로 생산되는 능력을 포함하여 원하는 표현형 특성의 발현을 결정하기 위해 평가된다. 분석 단계는, 다른 것 중에서, 미생물 콜로니 성장을 콜로니 건강의 지표로서 측정하기 위해 플레이트의 이미지 데이터를 사용한다. 분석 장비(214)는 유전적 변화를 표현형 성능과 상관시키고 결과로 얻은 유전자형-표현형 상관 데이터를 라이브러리에 저장하는데 사용되며, 이는 미래의 미생물 생산을 알려주도록 라이브러리(206)에 저장될 수 있다.
LIMS는 이전의 팩토리 가동으로부터 개발된 상관관계에 기초하여 디자인/제작/테스트/분석 사이클을 반복한다. 후속 사이클 동안, 분석 장비(214)는 단독으로 또는 인간 조작자와 함께, 더 정밀한 입자성(granularity)을 가진 더 나은 표현형 성능을 달성하도록 미세하게 조정된 유전적 변형에 대한 상관관계 데이터를 사용하여, 입력 인터페이스(202)로 다시 입력하기 위한 기본 균주로서 최상의 후보를 선택할 수 있다. 이러한 방식으로, 본 발명의 실시태양의 실험실 정보 관리 시스템은 품질 개선 피드백 루프를 구현한다.
데이터 구조
뉴클레오타이드 서열 조립에 대한 일부 통상적인 기술과 달리, 본 발명의 실시태양은 원하는 서열을 직접 나타내는 기초열의 입력을 필요로 하지 않는다. 편집자 또는 다른 입력 인터페이스는 대신에 또는 부가적으로, 본 발명의 실시태양의 고차원 게놈 기술 언어로 표현된 진술을 수신할 수 있다. 전술한 바와 같이, 각각의 고차원 진술은, 본 발명의 실시태양에서 데이터 유형 DnaSpecification을 갖는 "DNA 명세서"로 평가된다. DNA 명세서는 적어도 하나의 (데이터 유형 DnaInput의) DNA 피연산자로 표현되는 적어도 하나의 DNA 부분에 대한 적어도 하나의 연산을 나타내는 데이터 구조이다. (여기서 DNA "부분"은 DNA 서열, 예를 들어, 프로모터, 유전자, 터미네이터 또는 이들의 임의의 조합을 의미한다. 보다 일반적으로, 본 발명의 실시태양은 임의의 뉴클레오타이드 서열 부분에 적용된다.) DnaInput은 DnaComponent(단일 DNA 서열의 모호하지 않은 표시) 또는 다른 DnaSpecification일 수 있다. 입력 자체는 스크립트 내의 이전 코돈 진술 출력 또는 스크립트의 이전 실행/평가로부터의 코돈 스트립트 출력일 수 있어서, 그 DnaSpecification에 대한 독립 변수로서 지정된 다른 DnaInputs에 대해 수행하는 정렬된 연산 집합을 설명하는 재귀적 데이터 구조를 제공한다.
일부 실시태양에서, DNA 명세서는 DNA 부분에서 수행될 1진 연산(예를 들어, 원형화한다(circularize)) 또는 2개 이상의 DNA 부분에서 수행될 2진 연산을 수행할 수 있다(예를 들어, 연결한다(concatenate), 대체한다(replace)). 일부 실시태양에서, DNA 명세서는 DNA 서열의 조합적 조립체를 기술한다.
요컨대, DNA 명세서는 다음을 제공할 수 있다:
● DNA 구성요소의 구조화된 콜렉션
● DNA 서열 관계의 간략한 표현
● 조합적 디자인에 대한 간결한 설명
● 다양한 세부 사항 및 추상화 층을 위한 중첩된 조직
● DNA 조립체의 디자인자와 제조업체 사이의 교환 포맷
DNA 명세서는 일부 실시태양에서 3개의 부분을 갖는다:
● 하나 이상의 세트의 주문된 입력
● 하나 이상의 변형 작업
● 한 세트의 주문된 출력
원형화(circularize) 함수와 같은 "1진" 입력을 취하는 함수의 경우에도, "1진" 입력 그 자체가 입력 목록일 수 있음에 주목한다. 이 경우, 함수의 실행은 목록으로부터 단일 선형 입력 서열로부터 각각 생성된 원형화된 DNA 서열의 목록을 방출할 수 있다. 2진 함수(예를 들어, 연결한다)는 두 목록의 요소가 "지퍼(zipper)"(내적) 연산(입력 목록 L 및 R에 대해, 모든 'i'에 대해, L[i] OP R[i], 여기서 "OP"는 내적 연산을 나타낸다) 또는 "외적" 연산(입력 목록 L 및 R에 대해, 모든 'i'에 대해, 모든 'j'에 대해, L[i] OP R[j] 여기서 "OP"는 외적 연산을 나타낸다)을 통해 결합되었는지 여부를 나타내는 함수 변형자(DOT(내적) 또는 CROSS(외적))에 의해 지정된 대로 각 목록의 요소를 결합하는 이런 두 목록에 대해 연산될 수 있다. 각 목록에 대한 결과는 각각 벡터 또는 행렬로 볼 수 있다.
일부 실시태양에서, DNA 명세서 내의 DNA 피연산자는 DNA 명세서 그 자체 또는 DNA 구성요소로 나타내어질 수 있고, DNA 구성요소는 뉴클레오타이드의 서열을 직접 나타내는 문자 숫자식 기초열을 갖는 DNA 부분을 나타낼 수 있다. 일부 실시태양에서, 상기 언급한 바와 같이, DNA 구성요소는 또한 식별 번호, 공급원, 분자 형태 (예를 들어, 선형, 원형)와 같은 DNA 부분의 특성을 기술하는 메타데이터 주석을 포함할 수 있다.
특히, 상기한 바와 같이, 일부 실시태양에서, DNA 명세서의 DNA 피연산자는 DNA 부분의 목록을 나타낼 수 있다. 이런 부분의 목록은 DNA 구성요소의 목록, DNA 명세서 또는 DNA 명세서의 목록일 수 있다.
DNA 구성요소
DNA 명세서의 논의에 대한 서문으로서, dna() 함수를 사용하는 DNA 구성요소의 예는 다음과 같다:
Figure pct00001
이 예에서, 인터프리터는 다음을 반환할 것이다:
Figure pct00002
DNA 구성요소를 사용하여, 인터프리터(204)는 스크립트에서 직접 DNA 서열을 지정하거나 또는 라이브러리로부터 DNA 서열을 로딩함으로써 지정하는 것을 가능하게 한다. 예를 들어 사용자는 dna() 함수, 예를 들어,
Figure pct00003
내에서 짧은 DNA 서열을 직접 지정할 수 있다.
선택적으로, 사용자는 dnaComponent() 함수를 사용하여 ID 또는 이름으로 라이브러리에서 DNA 구성요소를 로드할 수 있다:
Figure pct00004
다른 대안으로서, 사용자는 dnaForStrain() 함수를 사용하여, 미생물 균주에 대한 서열을 나타내는 DNA 구성요소를 라이브러리로부터 로딩할 수 있다:
Figure pct00005
보다 일반적으로, DNA 서열은 로컬 소스(파일, 데이터베이스)로부터 또는 공개 소스(예를 들어, NCBI)로부터 명시적으로(즉, 기호열로부터) 식별될 수 있다.
DNA 명세서
DNA 명세서를 참조하면, 인터프리터(204)는 또한 예를 들어, dnaSpecification() 함수를 사용하여 라이브러리로부터 전체 DNA 명세서를 로딩하는 것을 포함하여, 사용자가 DNA 명세서를 식별할 수 있게 한다:
Figure pct00006
이 마지막 예는 DNA 명세서를 반환하지만 이전 예는 DNA 구성요소를 반환하였다. 이 두 가지 유형 모두는 DnaInput 유형(이 두 유형의 "상위 유형")의 데이터를 나타내므로, 이들은 DNA 수정 기능에서 자주 상호 교환할 수 있다. 즉, 프로그램은 DNA 구성요소 또는 DNA 명세서를 독립 변수로 참조하여 캠페인에 대한 더 복잡한 DNA 명세서를 생성할 수 있다. 본 발명에서 논의되는 바와 같이, 더 복잡한 명세서에 대해서조차도, DNA 명세서는 다수의 서열의 취급 및 생성을 가능하게하는 컴팩트하고, 인간이 판독가능한 데이터 구조를 제공한다.
DnaInput 값은 DnaComp(DNA 구성요소; "DnaComp" 및 "DnaComponent"는 "DnaComponent" 유형의 변수 또는 값을 나타내기 위해 본 발명에서 상호 교환적으로 사용된다), DnaSpec(DNA 명세서; "DnaSpec" 및 "DnaSpecification"은 "DnaSpecification" 유형의 변수 또는 값을 나타내기 위해 본 발명에서 상호 교환적으로 사용된다), LocatedDnaSpec, List[DnaComp](DNA 구성요소의 목록)일 수 있다.
연결 함수
본 발명의 실시태양의 게놈 디자인 프로그래밍 언어 및 연산은 상이한 함수를 지원한다. 예를 들어, 코돈은 DNA 부분을 연결하여 더 큰 조립체를 만들 수 있다. 코돈은 dna(), dnaForStrain() 및 dnaComponent()와 같은 DNA 구성요소 함수를 사용하여 개별 서열의 명세서를 가능하게 한다. 개별(스칼라) 값으로 작업할 때, 코돈은("+" 연결 함수를 사용하여) 다음과 같이 두 개의 스칼라 기호열을 연결할 수 있다.
Figure pct00007
그러나, LIMS는 한 번에 여러 DNA 서열을 디자인, 제작, 테스트 및 분석하도록 특별히 디자인된다. 따라서, 코돈은 사용자가 dnaSpecification() 함수를 사용하여 여러 DNA 서열을 나타내는 DNA 명세서(DnaSpec)를 로딩함으로써 DNA 서열 목록을 사용하여 작업할 수 있게 한다. 프로그램은, 예를 들어, 알려진 Genbank 또는 CSV 형식의 파일을 라이브러리에 업로드하여 서열 목록을 나타내는 DNA 명세서(DnaSpec)를 생성할 수 있다.
서열 목록의 연결은 적어도 두 가지 방식으로 수행될 수 있다. 목록이 같은 길이인 경우, DNA 명세서는 항목별로 연결을 지정할 수 있다. 인터프리터(204)(또는 다른 실시태양에서, 실행 엔진(207))에 의한 DNA 명세서의 실행은 [a, b, c] 및 [d, e, f]를 ad, be, cf로 연결할 수 있다. 이 함수는 "내적(dot product)"이라고 표시된다. 선택적으로, DNA 명세서는 모든 가능한 쌍을 연결하기 위해 카테시안 외적 산물을 통해 임의 길이의 목록의 연결을 지정할 수 있다. 동일한 예시 목록을 사용하여, 인터프리터(204)(또는 다른 실시태양에서, 실행 엔진(207))는 외적 출력을 ad, ae, af, bd, be, bf, cd, ce 및 cf로 연결할 수 있다. 이러한 출력은 DNA 구성요소로서 표현될 수 있다. 본 발명에 설명된 바와 같이, 외적이 메모리 용량에 비해 매우 많은 수의 출력을 발생시키는 경우, 시스템(200)은 생산된 출력의 수를 감소시키기 위해 샘플링을 이용할 수 있다. 후술하는 바와 같이, 사전 제작 및 테스트 사이클 동안 생산되거나 영향을 받은 유익한 표현형 특성을 갖는 것으로 측정된 유전자 부분을 포함하도록 샘플 세트를 가중하는 것을 포함하는 상이한 샘플링 기술이 사용될 수 있다. 그런 후에, 오더 배치 엔진(208)은 그 출력에 기초하여 팩토리 오더를 생성한다.
코돈은 상이한 방식으로 연결 함수를 나타낸다. concat() 함수는 두 개의 DnaInput 독립 변수를 취하여 요소를 연결한다. 이 함수는, 아래 예에서와 같이 내적 또는 외적인지를 나타내기 위해 함수 이름과 독립 변수 사이의 함수 변형자[*] 또는 [x]를 포함한다:
Figure pct00008
DNA 연결은 현대 프로그래밍 언어에서 수학과 같은 이항 연산자를 사용하여 일반적으로 수행되는 것인 기호열 연결과 매우 유사하기 때문에, 코돈은 다음 예에 도시된 바와 같이, 연결을 나타내는 * 또는 x를 직접 사용하여 연결에 대한 속기법을 제공한다.
Figure pct00009
재귀
도 3을 참조하면, 다음은 본 발명의 실시태양에 의해 가능해진 재귀적 연결 함수의 실행의 한 예이다. 여기에, 재귀는 객체가 다른 유사한 객체를 포함하는 레벨 또는 층에서의 정보 또는 기능의 구성을 참조하거나 함수의 평가는 다른 유사한 하위 함수의 평가에 따라 결정된다. 이 예에서, 연결 함수뿐만 아니라 DNA 명세서는 재귀적이다.
플라스미드 형태로 아래의 출력 "토탈(total)"의 순환 전에, 선형 형태의 예시적인 함수는 다음과 같이 표현될 수 있다:
토탈 = (p1 x p2) x (p3 x p4)
토탈 = 알파 x 베타,
여기서 알파 = p1 x p2 및 베타 = p3 x p4, 및 p1, p2, p3 및 p4는 프로모터를 나타낸다.
여기서, 알파와 베타의 외적 연결은 외부 함수이며, 여기서 알파와 베타는 두 개의 프로모터의 내부 외적을 나타낸다. 외적 함수에 대한 입력의 임의의 것은 단일 입력이 아닌 입력들의 목록일 수 있다는 것에 주목한다.
본 발명의 실시태양의 프로그래밍 언어로 이 기능을 구현하기 위해, 입력 인터페이스(202)는 사용자 또는 다른 컴퓨팅 장치로부터 다음 스크립트를 수신할 수 있다. (아래 코드에서, 순환화(circulanzation) 후에 토탈은 "마이플라스미드"(myplasmid)로 이름이 변경되고 알파와 베타는 각각 "왼쪽"과 "오른쪽"으로 이름이 변경된다. 따라서 마이 플라즈미드 = 순환된다(왼쪽 x 오른쪽). 프로그램 코드의 주석은 본 발명에서 "//"또는 "#"로 나타낼 수 있다.
Figure pct00010
Figure pct00011
이 예에서, 인터프리터(204)는 함수/연산자, 입력 및 매개 변수로 DNA 명세서를 채우지만, 출력을 분해하기 위한 함수를 실행하지는 않는다. 얻은 DNA 명세서 "마이 플라스미드"가 아래에 나와 있으며, 도 3의 나무 데이터 구조(350)로 예시된다. 자식 DNA 명세서("Child DnaSpec")를 포함하는 마이플라스미드 DNA 명세서 데이터 구조는 재귀적이며, 이 예에서, DNA 명세서는 입력 서열 피연산자를 나타내는 DNA 구성요소를 포함한다는 것에 주목한다.
Figure pct00012
Figure pct00013
Figure pct00014
Figure pct00015
샘플링이 없다고 가정하면, 실행 엔진(207)은 다음 16개의 서열(DNA 구성요소로 나타낼 수 있음)을 생산하기 위해 피연산자에 대한 DNA 명세서 외적 연산자를 실행할 것이다. 서열 목록은 본 발명의 다른 곳에 제공된다.
AAATTCCAGG SEQ ID NO: 1
AAATTCCCGG SEQ ID NO: 2
AAATTCCGGG SEQ ID NO: 3
AAATTCCTGG SEQ ID NO: 4
AAGTTCCAGG SEQ ID NO: 5
AAGTTCCCGG SEQ ID NO: 6
AAGTTCCGGG SEQ ID NO: 7
AAGTTCCTGG SEQ ID NO: 8
AATTTCCAGG SEQ ID NO: 9
AATTTCCCGG SEQ ID NO: 10
AATTTCCGGG SEQ ID NO: 11
AATTTCCTGG SEQ ID NO: 12
AACTTCCAGG SEQ ID NO: 13
AACTTCCCGG SEQ ID NO: 14
AACTTCCGGG SEQ ID NO: 15
AACTTCCTGG SEQ ID NO: 16
본 발명의 실시태양의 유리한 특징은 오더 배치 엔진(208)이 상기와 같은 DNA 명세서 데이터 구조를 이용하여 팩토리(210)가 생산하기 위한 출력 뉴클레오타이드 서열을 단순히 제공하는 것 이상의 팩토리 오더의 생성을 알릴 수 있다는 것이다. 상기한 바와 같이, 데이터 구조는 도 3에 예시된 바와 같이 나무 형태이다. 오더 배치 엔진(208)은 나무 구조를 잎(예를 들어, 356, 358에 해당하는 잎 노드) 내지 가지로부터 뿌리 노드(예를 들어, 352에 해당)까지 횡단하여 실행의 각 단계에서 수행되는 연산뿐만 아니라 각 단계에서 사용된 입력, 팩토리 워크플로우 및 다른 매개 변수를 결정할 수 있다. 오더 배치 엔진(208)은 이 정보를 팩토리 오더에 통합할 수 있다. (본 발명의 연산의 "성능"은 대안적으로 (실시태양에 따라) 실행 엔진(207) 또는 인터프리터(204)에 의한 연산의 인 실리코 실행 또는 당업자가 인식하는 것과 같이, 본 발명에서의 논의 내용에 따라, 유전자 제조 시스템에서 연산의 물리적 생체 내 또는 생체 외 물리적 구체화를 의미할 수 있다. 예를 들어, 두 개의 뉴클레오타이드 서열에 대한 연결 조작은 컴퓨터 장치에 의해 논리적으로 수행되는 반면, 팩토리에서 두 개의 물리적 서열을 함께 결합함으로써 물리적으로 구체화될 수 있다.)
따라서, 종래의 서열 디자인 구현과 달리, 본 발명의 실시태양은 최종 서열 출력뿐만 아니라 디자인 개발의 시작, 중간 및 종료 단계에서 연산 및 문맥 정보의 팩토리 오더 플레이서(본 발명에서 오더 배치 엔진(208))를 알려주는 서열 디자인을 위한 데이터 구조를 제공한다. 이 정보의 전달은 모든 시작 및 중간 부품, 워크플로우 및 다른 매개 변수를 결정하는 팩토리(210)에 대한 부담을 덜어서, 원하는 서열의 생산 효율을 향상시킨다. 예를 들어, DNA 명세서에서 이 정보에 기초하여, 오더 배치 엔진(208)은 변형될 초기 기본 균주뿐만 아니라 최종의 원하는 뉴클레오타이드 서열을 조립하는 과정의 중간 단계에서 팩토리(210)에서 사용될 잠재적으로 상이한 프로모터, 워크플로우, 온도 설정 및 프라이머를 결정할 수 있다. 예를 들어, 어닐링 온도의 허용 범위는 플라스미드 DNA로부터의 증폭보다 게놈 DNA로부터의 증폭에 대해 다를 수 있다.
DNA 명세서에서 세트파람(setparam) 키워드는 임의의 생성된 DNA 명세서의 명칭 및 설명뿐만 아니라 어떻게 팩토리 작업이 수행되는지를 지배하는 다른 속성을 설정하는데 사용될 수 있다. 세트파람 진술은 두 개의 독립 변수, 매개 변수 이름 및 이에 할당된 값을 지정한다. 일부 매개 변수는 단일 기호열 값을 사용하며; 다른 것은 단일 기호열 또는 기호열의 목록을 사용할 수 있다. "명칭(name)" 및 "설명(description)" 매개 변수는 DnaSpec의 가장 명백한 사용자 가시 특성을 설정할 것이다. 다음은 세트파람을 사용하여 지정할 수있는 매개 변수의 비 제한적인 목록이다:
amplifyPart - 부분을 증폭할지 여부를 지정하는 "참(true)" 또는 "거짓(false)"의 불리언 값.
assemblyMethod - 구조체를 조립하기 위해서 팩토리에서 사용하는 구축 방법. 예를 들어, "효모 상동성 재조합", "깁슨" 또는 "LCR"의 하나
description - DnaSpec/캠페인에 할당할 설명
groupName - 특정 DnaSpecification에 의해 생성된 조립 부분 모음에 할당 할 이름. amplifyPart와 함께 사용할 수 있다.
leftTailLen 및 rightTailLen - 증폭을 위해 생성할 최대 꼬리 길이를 지정하는 정수 값
name - DnaSpec/캠페인에 할당할 이름.
note - 인간 참조를 위한 캠페인에 대한 더 긴 자유형 메모 세트다. 이것은 기초열의 목록일 수 있다.
outputName - 이 매개 변수 이름으로 생성된 DnaSpec에 의해 생성된 DnaComponents를 할당할 이름을 지정하는 기호열 또는 기호열 목록(예를 들어, 입력 세트를 원형화하는 경우, setparam "outputName", [ "myCircularl" , "myCircular2", ...]를 사용하여 다른 원형 구조체의 이름을 지정할 수 있다.
primerSource - 예를 들어, 캠페인에 대한 프라이머 소스를 지정하는 "IDT"(Integrated DNA Technologies, Inc.) 또는 "library"의 하나
plasmidSource - 예를 들어, 캠페인의 플라즈미드 소스를 지정하는 "build" 또는 "library"의 하나
targetAnnealingTemperature - 구성요소를 증폭하기 위해 팩토리에서 사용되는 원하는 온도
대체 함수
특히 적절한 다른 함수는 대체 함수이다. 미생물 균주의 DNA 서열에서 유전자 앞에 위치한 프로모터를 대체하는 프로그램의 예로서, 도 4의 DNA 구성요소를 먼저 참조한다. 도 4는 두 세트의 프로모터(402A, 402B), 유전자(404A, 404B) 및 터미네이터(406A, 406B)(일반적으로 "p-g-t" 서열), 각각 p1(SEQ ID NO: 17)-YFG1(SEQ ID NO: 18)-t1 및 p2-YFG2-t2를 포함하는 주석된 DNA 서열(400)의 한 예를 예시한다. (주석은 프로모터 p1(SEQ ID NO: 17) 및 유전자 YFG1(SEQ ID NO: 18)에 대해 도시된다).
도 5는 도 4의 p-g-t 서열에 적용된 프로모터 스왑 연산(500)을 도시한다. 조합 외적("x") 연산을 사용하여, 프로그램은 p1', p2' 및 p3'에 의해 1 대 1로 대체된 원래 p-g-t 서열에서 프로모터를 갖는 모든 p-g-t 서열의 모든 조합을 생성하여, 디자인 캠페인으로 전환될 6개 출력 서열을 생성할 것이다. (첫 번째 4개 출력 서열(502)은 도면에 예시된다.)
이 연산을 수행하기 위한 프로그램 코드는 다음과 같다. 함수에 대한 설명은 주석에 제공된다.
Figure pct00016
Figure pct00017
replacePromoter() 함수는 주석 처리된 프로모터를 주어진 유전자를 조절하는 것으로 대체한다. 외적 함수 호출 변형자 "x"가 나타내는 것처럼, replacePromoter()는 "프로모터"에 의해 식별된 프로모터 서열의 표현으로 대체된 유전자의 주석이 달린 프로모터의 표현으로 "유전자"로 식별되는 모든 주석(게놈의 위치)의 표현을 생성한다. 이런 생성 함수는 "replace" 함수를 갖는 DnaSpecification 및 "replace-promoter"모드에서 수행되어야한다, 하나의 독립 변수 목록이 프로모터이고 다른 독립 변수가 Located DnaSpecification(여기서는 "genes"), 즉 함수가 "locate"이고 프로모터가 교체되어야 하는 이름에 의해 유전자의 모음을 나타내는 매개 변수를 생성한다. "생성" 함수는 DNA 서열 생성을 위해 팩토리에 입력하기 위한 디자인 캠페인을 생성한다.
본 발명의 실시태양의 하나의 특징은 게놈 디자인 언어가 게놈 인식 편집 연산을 포함한다는 것이다. 예를 들어, 인터프리터(204)(또는 몇몇 실시태양에서 실행 엔진(207))는 p-g-t 서열에서 유전자를 조절하는 것으로 주석된 프로모터의 위치에 대한 지식을 얻기 위해 replacePromoter()를 실행한다. 라이브러리에서 p-g-t 서열을 판독함으로써, 인터프리터(204)(또는 일부 실시태양에서는 실행 엔진(207))는 그의 DNA 성분 주석으로부터 각 유전자에 대한 적절한 프로모터를 확인한 다음, 프로모터의 대체를 가능하게 한다. BBF RFC 108: Synthetic Biology Open Language (SBOL) Version 2.0.0, editors Bartley, et al., July 31, 2015(annotations) 참조.
replacePromoter()는 유전자를 조절하는 프로모터를 위치시키기 위해 프로모터 주석을 사용하는 것 이상을 수행함을 주목한다. 이것은 주석된 프로모터의 상류 끝에서 유전자의 시작 코돈까지 전체 서열을 대체한다. 관심 유전자에 대한 프로모터 주석이 없으면, 새로운 프로모터가 유전자 앞에 삽입될 것이다. 프로모터의 영역과 겹치는 주석이 있는 경우, 이 방법은 사용자에게 경고하거나 때로는 충돌을 수정하려고 시도할 것이다.
도 6은 삽입 영역이 지정된 유전자(602A, 602B, 602C)로 대체된 플라스미드의 모든 3개의 조합(606)을 나타냄으로써 플라스미드(604)로 유전자(새로운 유전자)(602A, 602B, 602C)를 삽입하기 위한 외적 함수
Figure pct00018
의 DNA 명세서의 그래프 표현을 제공한다. 이 함수는 변형된 플라스미드를 나타내는 DNA 명세서를 출력하기 위해 플라스미드 삽입 영역(스칼라 DNA 구성요소로 나타낼 수 있음)이 있는 유전자 목록의 외적을 취한다. 대안적으로, 플라스미드는 DNA 구성요소로서 나타낼 수 있다. 이 함수는 먼저 locateTerm[x](plasmid, "insertion-site")를 호출하여 대체할 서열의 플라스미드 내 위치를 지정한다.
대안적으로, 삽입 장소는 장소 위치의 이름, 예를 들어, locateName [x] (plasmid, "MseI cut site")를 식별함으로써 파악될 수 있다. 이 함수는 LocatedDnaSpecifications를 반환한다. 그런 후에 replace 함수는 LocatedDnaSpecifications로 지정된 위치로 newGenes 목록의 외적 대체를 수행한다.
상기 예들은 본 발명의 실시태양의 프로그래밍 언어 및 데이터 구조의 재귀 능력의 또 다른 이점을 나타낸다. 이 언어는 각 제조 단계에서 사용될 연산, 입력 및 조건을 지정하여 사용자가 서열 제조 공정의 모든 단계(시작, 중간 및 종료)를 독립적으로 제어할 수 있게 한다. 위의 예에서, 명세서는 DNA 명세서 나무 구조의 상이한 레벨(노드)에서 외적 연산을 지정한다: 즉 위치 결정 내부 함수에서뿐만 아니라 나무 구조에서 더 멀리 있는 대체 함수 외부 함수에서의 외적 연산. 유사하게, 사용자는 상이한 단계/레벨에서 내적 및 외적 연산자의 상이한 조합, 상이한 매개 변수(예를 들어, 온도 및 다른 환경 조건) 및 상이한 입력(예를 들어, 프로모터)을 지정할 수 있다.
비 결정적 함수
본 발명의 실시태양은 확률론적, 비 결정적 함수를 제공하며, 그 중 일부는 확률론적 결과를 생성하는 실험실 방법의 실제 결과를 반영한다. 일반적으로, 확률 론적 함수는 비 결정적 방식으로 뉴클레오타이드 서열에 변화를 초래한다. 예를 들어, 예는 서열의 임의의 위치에 전이 가능한 요소, 서열 중 어느 곳에서나 하나 이상의 단일 뉴클레오타이드 변화(예를 들어, 화학적 또는 UV 돌연변이 반영), 암호화 서열에서 임의의 한 코돈의 세 번째 위치에서 하나의 단일 뉴클레오타이드 변화(예를 들어, NNK 라이브러리의 생성을 통해), 알려진 위치에서 1 또는 2개의 뉴클레오타이드 변화(예를 들어, 퇴행성 프라이머가 있는 PCR에서) 또는 지시된 진화를 통한 알려지지 않은 변화의 집합의 삽입이다. 생물학적 성분에 대한 비 결정적 연산은 다수의 돌연변이 서열로 이어질 수 있다.
이하의 두 가지 예는 뉴클레오타이드 서열의 생성에서 제한된 무작위화를 가능하게 하는 확률적 함수를 구현한다.
Figure pct00019
플라스미드 만들기
다른 예로서, 하기 프로그램은 일부 프로모터, 일부 유전자, 터미네이터 및 플라스미드 백본을 로드한다. 외적 연결 함수를 사용하여, 프로그램은 모든 가능한 조합의 프로모터와 유전자(및 터미네이터)를 만들고, 각각을 백본에 연결하고, 플라스미드로 순환시키고, 모든 이런 디자인을 나타내는 캠페인을 만든다.
Figure pct00020
샘플링
상기 논의된 바와 같이, 본 발명의 실시태양과 같은 합성 생물학 시스템은 다중 DNA 피연산자로 표현되는 다수의 DNA 부분에 대해 다수의 연산이 수행될 수 있게 한다. 따라서, 생성된 디자인 캠페인은 수천 개의 DNA 서열의 표현을 포함할 수 있다. 예를 들어, 프로그램은 50-100GB의 저장 공간을 차지할 수 있는 10,000개의 변형된 게놈을 생성할 수 있다. 이 정보는 현재의 일반적인 메모리에서 효율적인 관리를 가능하게 하지 않으며, 대신 느린 디스크 기반 액세스를 필요로 한다. 현재 상용 컴퓨터 시스템은 게놈을 나타내는 50-100GB SBOL 파일에서 효율적으로 로드 및 연산할 수 없다. 이런 연산은 실패하거나 프로세싱에 예상치 못한 지연을 유발할 수 있다.
본 발명의 실시태양은 샘플링에 의해 이러한 잠재적인 저장 및 프로세싱 문제를 피한다. 일부 실시태양에서, 오더 배치 엔진(208)은 팩토리 오더에 통합하기 위해 출력의 하부 세트만을 선택할 수 있다. 이 연산은, 예를 들어, N 구조체를 생산하는 무작위 샘플링 또는 최초 또는 최종 K DNA 구조체 샘플링과 같은 여러 상이한 기술을 사용할 수 있다. 저장 요구 사항을 줄이기 위해, 이 방법은 팩토리 오더에 통합하기 위해 샘플링된 출력만 저장할 수 있다.
대안으로, 실행 엔진(207)이 DNA 명세서를 실행하여 DNA 명세서를 파풀레이트(populate)하는 출력을 생성하는 실시태양에서, 실행 엔진(207) 자체는 선택적으로 실행을 위한 DNA 명세서의 하부 세트를 선택하기 위해 인터프리터(204)로부터 DNA 명세서를 샘플링할 수 있다. 이 접근법은 인터프리터(204)의 보다 큰 재귀적인 DNA 명세서 출력 데이터 구조 내의 중간 연산을 나타내는 DNA 명세서(예를 들어, 자식 DNA 명세서)에 특히 적용 가능하다. 결과적으로, 실행 엔진(207)은 선택되고, 실행된 DNA 명세서만에 대한 출력을 생산한다. 실행 엔진(207)에 의한 실행으로부터 인터프리터(204)에 의한 해석의 분리는 실행을 위한 샘플링이 출력의 크기를 크게 감소시키는 것을 가능하게 하여, 매우 큰 저장 용량 및 과도한 프로세싱에 대한 필요성을 감소시킨다.
바로 위의 실시태양의 샘플링 연산은, 예를 들어 무작위 샘플링 또는 실행을위한 최초 또는 최종 K DNA 명세서의 샘플링과 같은 많은 상이한 기술을 이용할 수 있다. 또한, 실행 엔진(207)은 실행 전에 DNA 명세서를 더 지능적으로 샘플링할 수 있다. 하나의 접근법은 실행을 위한 DNA 명세서를 가중시키는 것이다. 예를 들어, DNA 명세서 데이터 구조 내에서, 프로모터 및 다른 매개 변수화된 인자는, 예를 들어, 이의 비용, 가용성 또는 공지된 유효성에 따라 상이한 가중치가 할당될 수 있다. 예를 들어, DNA 명세서 데이터 구조가 연결 외적 함수를 두 개의 입력 피연산자-유전자 목록과 프로모터 목록에 적용한다고 가정한다. 이 예에서, 각 프로모터는 실행 엔진(207)가 DNA 명세서의 선택을 실행할 것을 알리는 0과 1 사이의 가중 매개 변수(params)를 할당받을 수 있다. 목록 내의 프로모터의 가중치가 높을수록, 실행 엔진(207)은 이러한 프로모터를 위한 DNA 명세서를 실행할 가능성이 높다(연결 외적 연산자를 적용).
가중치는 그 자체가 다른 매개 변수를 가중시키기 위한 DNA 명세서의 매개 변수로서 첨가될 수 있다. 예를 들어, 자식 DNA 명세서(즉, 최상위 DNA 명세서 아래)는 자식 DNA 명세서 내의 단일 프로모터에 대해 weightPromoter = pi 또는 동일한 자식 DNA 명세서 내의 프로모터의 목록에 대해 weightPromoter = [p1, p2, ... pN]로서 표현된 확률적 가중치를 할당받은 가중치 매개 변수를 포함할 수 있다. 매개 변수(예를 들어, 프로모터)에 대한 가중치의 합은 재귀적 DNA 명세서의 계층적 나무 구조 내의 동일한 연산 레벨에 있는 매개 변수에 대해, 특히 1의 값을 더할 수 있다.
다른 전략은 각각의 효능을 알기 위해 특정 수의 가능한 프로모터-유전자 조합을 지능적으로 선택하기 위해 실험 디자인 방법론을 채택하는 것이다. 이 구현의 일부로서, 한 실시태양에서, 실행 엔진(207)은 조합의 총 수를 제한하면서 각각의 프로모터가 적어도 한 번 적절한 조합으로 사용되는 것을 보장하도록 적절한 명세서를 실행할 수 있다.
심지어 DNA 구성요소는 실행 엔진(207)이 DNA 구성요소에 대한 연산자의 실행을 안내하도록 가중될 수 있다. 예를 들어, 입력으로서 DNA 구성요소의 목록을 갖는 DNA 명세서는 DNA 구성요소의 목록에 대한 가중 벡터 weightVector = [p1, p2, ... pN]를 포함할 수 있다.
캐싱
본 발명의 실시태양에서, 실행 엔진(207)(또는 해석이 DNA 명세서를 실행하는 실시태양에서 인터프리터(204))은 캐싱을 이용하여 DNA 명세서의 실행 중에 재사용될 수 있는 결과의 재계산을 피할 수 있다. 예를 들어, 명세서는 A, B, C가 뉴클레오타이드 서열의 긴 목록인 외적 연결 A x (B x C)를 지정할 수 있다. 실행 엔진(207)은 A의 각 요소를 외적 BxC로부터 생성된 모든 요소와 연결시킬 수 있다. A의 각 항목으로 각 연결에 대한 BxC 출력을 다시 계산하려면 과잉이고 시간이 많이 걸리므로, 실행 엔진(207)은 BxC의 최초 계산 후에 이러한 BxC 결과를 대신 캐시하고 A의 요소와 외적 계산의 그 결과를 사용할 수 있다. 따라서 캐싱의 요소는 프로세싱 시간을 절약하고 프로세싱 속도를 향상시킨다.
캐싱은 동일한 실행(예를 들어, 오더의 생성) 내에서뿐만 아니라 상이한 실행들 사이에서 사용을 찾는다. 예를 들어, 사용자는 이전 주문으로부터 생성된 서열과 비교하여 보다 양호하거나 상이한 결과가 요구되는 것을 결정할 수 있다. 따라서, 사용자는 또 다른 팩토리 오더를 하기 위해 프로그램을 재실행할 수 있으며, 이번에는 샘플링을 지시하여 실행될 DNA 명세서의 상이한 하부 세트를 선택할 수 있다. 그러나, 이렇게 하면서, 스크립트는 실행하면 이전 주문 생성 실행과 동일한 중간 연산의 일부의 실행을 여전히 필요로 할 수 있다. 우측 및 좌측 프로모터의 네스트 연결의 본 발명의 예를 참조하면, 사용자는 상이한 우측 서열 출력을 얻기 위해 상위 레벨(전체) 연결 함수를 재실행하지만 좌측 연산을 변경하지 않을 수 있다. 따라서, 시스템은 더 높은 레벨 함수의 재실행 동안 나중 사용을 위한 하위 레벨, 중간 왼쪽 결과를 캐시할 수 있다. 일반적으로, 하위 레벨 연산의 출력(예를 들어, 계층적 나무 구조의 잎(즉, 잎 노드)에서)은 상위 레벨 연산보다 반복적으로 필요할 것이므로, 실행 엔진(207)은 저장이 제한되는 경우 상위 레벨로부터의 출력보다 하위 레벨 출력을 캐싱하는 것을 선호할 수 있다. 상술한 바에 기초하여, 본 발명의 실시태양에서 실행 엔진(207)은 후속 실행 동안의 재실행을 피하기 위해 나무 구조 내의 상이한 레벨의 연산으로부터의 DNA 명세서 결과를 캐시하여 프로세싱 시간을 절약하고 프로세싱 속도를 증가시킨다.
팩토리 빌드 그래프
빌드 그래프의 오더 플레이서 생성
본 발명의 실시태양에 따라, 미리 정의된 팩토리 제조 워크플로우를 나타내는 팩토리 빌드 그래프는 팩토리 오더의 한 실시태양이다. 본 발명의 실시태양에 따라, 팩토리 오더 플레이서(208)는 통상적으로 미생물 또는 다른 숙주 세포 내에서 구현되는 하나 이상의 원하는 DNA 디자인을 생성하기 위해 추상적인 형태의 논리 명령의 모음을 기술하는 DnaSpecifiion을 수용할 수 있다. 팩토리에서 워크플로우를 실시하기 위한 특정 물리적 필요요건에 따라, 오더 플레이서(208)는 특정 물리적 반응과 조건을 나타내는 정보를 얻고 팩터리 오더에 나타낼 수 있다. 오더 플레이서(208)는 라이브러리(206)로부터 이것을 얻을 수 있으며, DNA 명세서 내의 사용자에 의해 제공될 수 있다(예를 들어, 반응 온도와 같은 매개변수).
DNA 명세서에 아직 명시되지 않은 제조 매개변수(예를 들어, 프라이머, 반응 온도)뿐만 아니라 워크플로우의 물리적 구현에 관한 정보는 소정의 입력 서열을 기초로 중간 또는 최종 뉴클레오타이드 서열을 합성하는 것에 대한 실험을 통해 개발되어, 업계에서 알려진 또는 개발자가 소유한 물리적 워크플로우를 기초로 결정될 수 있다. 이 워크플로우는 각각의 특정 출력 디자인을 제조하기 위해 각 단계에서 수행해야 할 작업을 기술하는 입력 세트와 쌍을 이룬다.
팩토리 빌드 그래프는 지향 비순환 그래프(DAG)를 유지하는 데이터 구조의 형태를 취할 수 있다(부록 2 참조). 그래프는 0개 이상의 특성과 함께 노드와 에지의 두 가지 유형의 기록의 모음이다. 각 노드는 노드 ID를 가지며 이로부터 나온 에지를 추적한다. 각각의 노드는 본 발명의 실시태양에 따라 뉴클레오타이드 서열(예를 들어, DNA) 부분 또는 세포주를 나타낸다. 이 부분은 전구체(예를 들어, 제 3 자 공급 업체에서 주문한 프라이머), 중간 부분(예를 들어, 연결의 결과인 더 긴 DNA 단편 또는 최종 균주 DNA 서열의 변화를 통합하는데 사용되는 플라스미드) 또는 최종 DNA 서열, 균주 또는 유기체 그 자체일 수 있다.
본 발명의 실시태양에서, 오더 배치 엔진(208)은 잎 노드로부터 최종 뿌리 노드까지 DnaSpecification을 횡단하고(전술한 바와 같이), 각각의 접합을 나무의 그 레벨에서 중간 또는 최종 결과가 이전의 의존성 부분으로부터 어떻게 생성되는지를 계산하는 기회로서 사용한다. 오더 플레이서(208)는 이 정보를 DAG의 데이터 구조에 기입한다. 이 정보는 물리적으로 연산을 수행하는데 사용되는 특정 워크플로우 단계의 컨텍스트에 기록된다; 따라서, 빌드 그래프의 노드에 단계의 입력과 출력을 기록하는 것 외에도, 각 에지는 소스 노드가 특정 표적을 구축하는데 사용하는 "역할"이 주석으로 표시된다. 그래프의 데이터 구조 내의 노드 및 에지는 워크플로우를 매개 변수화하는 데 필요한 다른 매개 변수(예를 들어, PCR 반응에서 사용되는 온도 순환기 상의 온도 설정)를 또한 보유한다.
팩토리 빌드 그래프의 요소는 DnaSpecification에서 문자적으로 기술된 서열 또는 하부 서열뿐만 아니라 팩토리 오더 배치 엔진(208) 자체에 의해 계산되는 다른 서열 - 예를 들어, 도 8에 예시된 바와 같이, PCR 공정에서 더 긴 주형 서열의 특정 하부 서열을 증폭하는데 사용되는 프라이머의 조합이다. 이 경우에, 오더 플레이서(208)는 그래프의 노드에 의해 더 긴 주형 서열을 나타낼 수 있다. 오더 플레이서(208)는 이 주형 서열 노드로부터 "주형 서열"과 같은 역할을 갖는 PCR 생산물을 나타내는 노드에 에지를 주석으로 표시할 수 있다. 오더 플레이서(208)는 계산된 프라이머를 다른 노드에 저장할 수 있고, "증폭 프라이머"와 같은 역할을 갖는 PCR 생산물에 이들의 에지를 주석으로 표시할 수 있다. 이들 노드 모두는 PCR 증폭 하부 서열을 나타내는 네 번째 노드에 아웃바운드 에지를 가질 것이다.
특히, 도 8은 예시적인 팩토리 빌드 그래프의 다이어그램이다. 간략하게, 이 예는 부분 빌드 그래프이다; 완전한 그래프는 모든 루트 전구체로부터 모든 최종 디자인까지의 모든 정보를 포함할 것이다. 도 8에서, 노드(902)는 DNA 서열을 나타낸다. 에지(904)는 노드(902)의 입력 DNA 서열을 팩토리 워크플로우 공정을 통해 노드(906)의 출력 DNA 서열에 연결하여 특정 출력(906)을 생산할 때 특정 입력(902)의 역할(904, "프라이머")을 지정한다. 노드(906)의 출력 서열은 PCR 공정의 증폭된 서열을 포함한다. (오더 배치 엔진(208)에 의해 계산되거나 사용자에 의해 제공되는) 노드(908)와 같은 다른 노드는 노드(908)의 서열의 물리적 또는 메타데이터 프로세싱에 필요한 추가 매개 변수 및 정보를 포함할 수 있다. 부록 2는 도 8(JSON 직렬화 형식의 노드 1(902), 노드 2(914), 노드 3(916), 노드 4(906), 노드 5(912))에 표시된 상위 5개 노드의 데이터 구조 표현의 한 예를 제공한다.
도 8에서, 그래프는 노드(906)로부터 나오는 에지 상에 표시된 바와 같이 페이로드 영역의 역할을 하는 노드(906)의 서열이 플라스미드 백본의 역할을 하는 것으로 도시되는 노드(910)의 서열과 연결되는 것을 나타낸다. 오더 플레이서(208)는 노드(912)에 표시된 바와 같이 이들 2개의 입력을 "페이로드 영역을 플라스미드 백본과 연결하고 그 결과를 원형화"하는 물리적 제조 워크플로우와 연관시킨다. 오더 배치 엔진(208)에 의해 지원되는 연산은 특정 전구체 또는 중간 서열이 동일한 오더의 일부로서 생산되는 다수의 원하는 출력 서열의 제조에 사용될 수 있을 때를 인식하는 능력이다. 오더 배치 엔진(208)은 그래프의 단일 노드에 의해 그러한 서열(예를 들어, 공통적인 플라스미드 백본(910))을 나타낼 수 있고, 다수의 출력 에지는 이에 직접적으로 의존하는 모든 중간 또는 최종 서열을 유도한다. 오더 배치 엔진(208)은 이 정보를 사용하여 완전한 오더에 대응하는 제조 하부-워크플로우를 수행하는 데 필요한 부피, 농도 또는 다른 양을 계산할 수 있다. 노드의 아웃바운드 에지의 수는 상이한 하부-워크플로우에서 대응하는 서열의 프로세싱을 지정하기 위해 오더 배치 엔진(208)에 의해 사용될 수 있다. 예를 들어, 사용량이 많은 앰플리콘은 한 번만 나타나는 앰플리콘과 다른 수단을 통해 처리될 수 있다. 또한 빌드 그래프의 각 경로는 고유하게 인덱싱되며 상이한 팩토리 오더 빌드 그래프의 다른 경로와 독립적으로 결합될 수 있다. 이러한 구조는 유전자 제조 시스템이 단일 팩토리 오더에 명시된 특정 뉴클레오타이드 서열 세트로부터 분리되는 방식으로 다중 뉴클레오타이드 서열의 서열 부분을 조립할 수 있게 한다.
빌드 그래프의 워크플로우 엔진 생성
전술한 바와 같이, 오더 플레이서(208)는 빌드 그래프를 생성할 수 있다. 그렇게 하기 위해, 오더 플레이서(208)는 팩토리에서 워크플로우의 물리적 구현에 관한 정보에 접근할 수 있다. 이러한 물리적 구현 정보는 PCR 반응에 사용되는 서모 사이클러에 대한 온도 설정을 포함할 수 있으며, 이는 DNA 명세서에 구체화된 매개변수로부터 오더 플레이서(208)에 의해 획득될 수 있다.
그러나, 다른 실시태양에서, 오더 플레이서(208)는 팩토리에서 워크플로우의 물리적 구현에 관한 정보에 접근하지 못할 수 있다. 이 경우에, 오더 플레이서(208)는 워크플로우에 기초하여 팩토리에서 관심 생성물을 제조하기에 가장 적합할 수 있는 특정 작업 및 작업 매개변수에 관한 상세 정보 없이, 더 높은 레벨에서 워크플로우를 특정하는 팩토리 오더를 생성할 수 있다. 팩토리 오더는 빌드 그래프에서 에지에 표현될 수 있는 성분 사이의 관계와 함께, 다른 생물학적 성분을 형성하도록 조합될 빌드 그래프에서 노드에 의해 표현될 수 있는 생물학적 성분을 특정할 수 있다. 그러나, 이들 실시태양에서 빌드 그래프는 물리적 팩토리 조건 및 작업에 대한 지식을 필요로 하는 정보(예를 들어, 매개변수)를 특정하지 않는다.
특히, 이 섹션 및 이후에 기술된 실시태양에 있어서, 오더 플레이서(208) 대신에 워크플로우 엔진은 팩토리에서의 워크플로우의 물리적 구현에 관한 정보에 접근할 수 있고, 따라서 워크플로우 엔진은 빌드 그래프를 생성하는 데 사용된다. 편의를 위해, 빌드 그래프의 워크플로우 엔진 생성에 관한 실시태양에 특히 적용 가능한 일부 용어가 아래에 설명된다. 일부 용어는 유전자 변형된 균주의 생산에 사용되는 반면, 다른 용어는 오더에 따라 팩토리에서 균주의 물리적 구축에 관한 것이다.
본 발명의 이러한 실시태양에 따르면, "팩토리 오더"는 유전자 변형이 하나 이상의 디자인 기술(예를 들어, 프로모터 스왑)의 적용을 나타내는 하나 이상의 유전자 변형된 미생물을 구축하라는 요청을 의미한다. 일반적으로, 팩토리 오더는 변형된 미생물을 생산하기 위해 하나의 디자인 기술을 적용하는 요청을 의미하며, 이는 이후에 성능에 대해 분석된다. 분석 결과는, 예를 들어, 본 발명의 실시태양의 LIMS 시스템을 통해 반복적인 피드백 방식으로 사용되어 서열 디자인을 개선하고 후속 팩토리 주문을 생성하여 미생물 성능을 최적화한다.
본 발명의 이러한 실시태양에 따라, 팩토리 오더는 미생물에 포함될 유전자 서열의 명세서를 포함한다. 팩토리 오더는 또한 변형 균주를 생성하기 위한 하나 이상의 디자인 기술을 구체화할 수 있다. 오더 플레이서(208)는 (예를 들어, 라이브러리(206)에 저장될 수 있는 구현에 대한 종래의 지식에 기초하여) 특정 디자인 기술을 구현하기 위한 반응을 결정하여 빌드 그래프를 만드는 데 사용될 수 있는 에지를 생성할 수 있다. 따라서 팩토리 오더는 에지를 기술하는 정보를 포함할 수 있으며, 이 경우 팩토리 오더는 또한 중간 DNA 부분의 식별을 제공할 수 있다.
본 발명의 이러한 실시태양에 따라, 팩토리 오더는 새로운 부분을 만들기 위해 함께 혼합될 서열 부분(예를 들어, 프라이머 및 주형)을 나타내지만, 팩토리에서 변형 미생물을 물리적으로 생산하는 방법에 대한 추가 정보는 명시하지 않는다(예를 들어, 팩토리 오더는 액체 전달 계획, 조립 기술 또는 접합과 같은 반응 단계를 나타내지 않는다).
"디자인 기술"은 미생물의 유전자 서열을 변형시키기 위한 방법(예를 들어, 프로모터 스왑)의 논리적 설명을 의미한다. 이와 관련하여, "논리적 설명"은 그 자체가 유전자 부분을 나타내는 데이터(예를 들어, 텍스트 문자열)의 조작을 나타내는 프로그램 코드를 의미한다. 변형되는 다지인 기술과 유기체는 변형 미생물의 물리적 구축에 영향을 줄 수 있다.
"워크플로우"는 팩토리 오더에서 명시된 변형 뉴클레오타이드 서열을 물리적으로 구축하고 그 서열을 변형되는 유기체에 포함시키기 위한 일련의 워크플로우 단계를 의미한다. 이들 실시태양에 따라, 워크플로우는 팩토리 빌드 그래프로 표현된다.
"워크플로우 단계"는 워크플로우의 하위-부분(예를 들어, 부분 생성, 플라스미드 조립, 변형)을 의미한다. 실험 및 산업 경험에 기초하여, 전체 워크플로우가 실질적으로 상이하더라도 상이한 워크플로우가 워크플로우 단계의 공통 구현을 공유하는 빈도에 기초하여 워크플로우 단계가 정의될 수 있다. 워크플로우 단계는 중간 또는 최종 생물학적 성분을 생성한다.
"반응 단계"는 워크플로우 단계를 구현하기 위한 개별 물리적 반응(예를 들어, PCR, 전기 천공)을 의미한다. 워크플로우 반응 단계는 본 발명의 다른 곳에 기술된 분석 반응 단계와 구별되어야 한다.
"프로토콜"은 반응 단계를 수행하기 위해 하나의 자동화 장비에 의해 수행되는 기계 작업의 집합을 의미한다. 예를 들어, 액체 처리 로봇은 플레이트에 프라이머와 주형을 혼합하여 PCR 반응 설정 단계를 수행하기 위해 액체 전달을 구현하기 위한 프로토콜을 실행할 수 있으며, 열 순환기는 온도를 순환시키는 프로토콜을 실행하여 다른 PCR 반응 단계를 수행할 수 있다.
명확히 하기 위해, 본 발명에서 달리 지시되지 않는 한, 용어 "미생물 균주", "미생물", "세포", "생물학적 성분" 등은 "미생물 균주", "미생물", "세포", "생물학적 성분" 등의 유형을 의미하나, 이의 각각의 개별적인 분리된 버전을 의미하지 않는다.
도 10을 참조하면, 워크플로우 엔진(1002)을 포함하는 팩토리 장비 서비스 인터페이스(FESI)(1000)는 팩토리(210)에 상주하거나 이와 밀접하게 연결될 수 있다. 본 발명의 실시태양에 따르면, 워크플로우 엔진(1002)은 팩토리에서 워크플로우의 물리적 구현에 관한 정보에 대한 접근(실시간 접근 포함)을 갖는다. 예를 들어, 워크플로우 엔진은 팩토리 장비의 특정 부분의 제조 용량 및 이용 가능한 반응물의 양에 관한 정보에 실시간으로 접근할 수 있다. 이러한 접근은 팩토리(예를 들어, 팩토리 플랫폼(1016))과의 통신 또는 팩토리 운영자에 의한 입력을 통해 얻을 수 있다. 이들 실시태양에서, 워크플로우 엔진(1002)은 여전히 오더 플레이서(208)로부터 더 높은 레벨의 팩토리 오더를 수신하지만, 워크플로우 엔진(102)는 오더 플레이서(208)가 팩토리 장비의 특정 부분의 제조 용량과 같은 팩토리에서 워크플로우의 물리적 구현에 관한 정보에 대해 접근할 때 오더 플레이서(208)에 의해 수행되는 것과 같이 본 발명의 다른 곳에서 기술된 기능을 수행할 수 있다.
FESI(1000)는 본 발명의 실시태양에 따라 팩토리(210) 내에 있거나 오더 플레이서(208)와 팩토리(210) 사이에 개재될 수 있다. FESI(1000)는 소프트웨어와 하드웨어 요소 간의 통신을 가능하게 하는 네트워크를 포함한다. 워크플로우 엔진(1002)은 메시지 버스(1010)에서 실행 큐(1006) 및 실행 응답 토픽 교환(1008)을 통해 프로토콜 브로커(1004), 스케줄러(1012), 장비 관리자(1014) 및 팩토리 플랫폼(1016)과 메시지를 통신한다. 팩토리 플랫폼(1016)은, 본 발명의 실시태양에 따라, 메세지 버스(1010)에서 상응하는 작업자 큐(1020)를 통해 프로토콜 브로커(1004)와 통신하고 상태 토픽 교환(1022)을 통해 워크플로우 엔진(1002)과 통신하는 팩토리 작업자를 포함한다.
팩토리 오더가 워크플로우 엔진(1002)에 의해 수신될 때, 각각의 워크플로우 단계에서 실행될 반응 및 이런 반응을 얻는 데 필요한 조건을 결정하기 위해 팩토리에서 워크플로우의 물리적 구현에 관한 지식을 사용할 수 있다. 이것은 각 반응(반응물)에 대한 입력과 각 반응(반응 생성물)에 의해 생산되는 것에 대한 세부사항을 포함한다. 반응은 시퀀스에 있기 때문에, 한 반응의 생성물은 종종 시퀀스에서 미래 반응의 반응물이 될 것이다. 본 발명의 실시태양에서, 워크플로우 엔진(1002)은 빌드 그래프 관계에서 이 지식을 유지한다.
당업자는, 다른 실시태양에서, 오더 플레이서(208) 및 워크플로우 엔진(1002)은 상이한 정도로 팩토리 물리적 구현 정보에 접근할 수 있고, 따라서 각각은 그 정보를 사용하여 오더 플레이서(208) 및 워크플로우 엔진(1002)이 물리적 구현 정보를 빌드 그래프에 제공하게 할 수 있다.
서브 워크플로우를 결합하여 운영 효율을 증가시킨다
전술한 바와 같이, 균주 편집을 디자인하는 데 관여하는 생물학자 및 다른 사람들("개발 과학자")은 본 발명의 실시태양을 사용하여 투입물 및 최종 생성물을 포함하는 높은 수준의 생물학적 워크플로우를 명시할 수 있다. 완전히 명시된 각 워크플로우는 편집(변경 사항)과 단계(생물학적으로 편집이 발생하는 방법)를 모두 기술한다. 예를 들어, 워크플로우는 균주에 특정 편집을 도입하는 데 사용될 플라스미드 및 앰플리콘의 집합을 명시할 수 있다. 실시태양에서, 워크플로우는 DNA 명세서를 사용하여 명시될 수 있다(본 발명의 다른 곳에서 자세한 설명 참조). 편집이 균주에 성공적으로 적용되기 위해서, 생물학적 워크플로우의 여러 단계가 필요할 수 있다. 본 발명의 실시태양에서, 워크플로우 엔진(1002)은 (예를 들어, DNA 명세서 데이터 구조를 횡단함으로써) 필요한 중간 출력 및 이들 출력 사이의 관계를 결정한다. 실시태양에서, 특정 워크플로우의 결과는 개발 과학자가 정의한 대로 일부 편집 내용을 포함하는 기존 균주의 변형이다.
워크플로우는 모듈식이고 구성 가능하다. 작업 효율을 이용하기 위해, (예를 들어, 워크플로우 엔진(1002)을 사용하는) 본 발명의 실시태양의 시스템은 구성 요소의 물리적 생산과 관련된 생물학자("팩토리 운영자")가 여러 워크플로우의 부분 (하위 워크플로우)을 결합하게 한다. 이 조합은 "코호트"로 표시되고 작업의 각 특정 부분은 "라인 항목"으로 표시된다. 팩토리 운영자가 구축할 코호트를 생성하고 선택한 후, 워크플로우 엔진(1002)은 그 부분에 대한 상응하는 빌드 그래프를 생성할 수 있다. 이와 관련하여, 빌드 그래프는 하나 이상의 라인 항목을 병렬로 구축하기 위한 명령어를 나타내는 데이터 모델이다.
각각의 생물학적 성분(예를 들어, 플라스미드, 앰플리콘)은 구축 그래프에서 노드로 표시된다. 이미 기술한 것처럼, 빌드 그래프 자체는 표지화된 에지를 갖는 다중 에지 유향 그래프이다. 우선 순위에 관한 질문에 대답할 수 있도록 지시된다. 표지화된 에지는 성분(예를 들어, "프라이머") 사이의 빌드 관계를 정의하며; 각 노드는 지향 에지에 의해 그래프에서 다른 노드에 연결된다.
그래프의 각각의 "레벨"은 궁극적으로 변형된 균주를 생성하는 데 필요한 반응의 집합을 정의한다. 일반적인 빌드 그래프 패턴은 그래프에서 잎 노드가 앰플리콘, 플라스미드 및 변형된 균주를 생산하는 프라이머 및 주형을 나타낸다. 시스템은 이러한 반응을 빌드 그래프에서 일련의 노드(성분) 및 에지(반응의 역할)로 나타낸다. 빌드 그래프는 요청된 각 라인 항목마다 하나의 "루트"를 가진다.
이 구성은 빌드 그래프를 뿌리에서 독립적으로 분리하고 재조합할 수 있음을 의미한다. 운영 편의성으로 인해 팩토리 운영자가 선택한 빌드 그래프의 집합, 즉 개별 항목 집합이 공통 구조를 공유하는 경우, 그 구조는 워크플로우 엔진(1002)이 단일 통합 빌드 그래프를 생성함에 따라 중복 제거될 수 있다. 특히, 라인 항목 집합에 대한 이 단일 빌드 그래프는 중간 노드가 동일할 때 중간 노드를 결합한다. 결과적으로, 동일한 중간 부분은 한 번 제작될 필요가 있으며, 시스템은 팩토리 운영이 규모의 경제를 활용하게 한다.
본 발명의 실시태양에 따르면, 전형적인 작업 패턴은 워크플로우 엔진(1002)이 코호트에 대한 빌드 그래프를 생성 및 검색하는 것이다. 빌드 그래프 데이터 구조는 노드와 서로의 관계에 의해 정의되지만, 물리적 성분에 대한 특정 운영 질문에 대답하는 능력을 제공한다. 예를 들어, 빌드 그래프를 사용하면 앰플리콘 X가 여러 상이한 균주 편집을 정의하는 워크플로우의 여러 상이한 단계에서 사용되는 경우에도 "앰플리콘 X와 관련된 프라이머는 무엇입니까?"와 같은 질문을 하고 대답할 수 있다.
도 9는 하나의 균주 "C"(902)를 구축하기 위한 빌드 그래프(900)를 도시한다. 특정 성분(예를 들어, 노드(21))은 다음 자식 레벨의 그래프에서 상이한 성분을 갖는 상이한 종류(포워드 프라이머, 리버스 프라이머)의 다수의 빌드 관계를 갖는다.
빌드 그래프로부터 제조 작업 계획
팩토리 운영자가 수행할 작업을 선택하고 워크플로우 엔진(1002)이 빌드 그래프를 생성한 후, 워크플로우 엔진(1002)은 물리적 실험 장비 및 워크플로우의 각 단계에 대한 생물학적 프로토콜의 기술에 모두에 대한 입력과 출력의 각 세트의 빌드 그래프와 맵을 횡단한다.
이 계획 단계에서, 워크플로우 엔진(1002)은 물리적 작업을 매핑한다. 워크플로우 엔진(1002)은 각 레벨의 빌드 그래프를 플레이트 역할 및 플레이트 마스크와 연관시킨다. 이 연관은 팩토리 운영자의 입력을 기반으로 할 수 있다. 플레이트 역할은 플레이트의 기능을 설명하는 데이터 모델이며 일반적으로 이 레벨의 빌드 그래프(예를 들어, "프라이머")로 들어오는 지향 에지를 기초로 한다. 플레이트 마스크는 일반적인 실험실 플레이트의 물리적 레이아웃이 특정 디자인(아직 구축되지 않은) 균주의 식별자와 같은 예상 값과 어떻게 관련되는지를 설명하는 데이터 모델이다.
최종 단계용 플레이트 마스크("생성물" 플레이트 마스크, 즉 최종 편집된 균주를 함유할 플레이트용)는, 예를 들어, 팩토리 운영자에 의해 제공된 입력에 기초하여 워크플로우 엔진(1002)에 의해 배치된다.
중간 단계에 대한 플레이트 마스크(예를 들어, "프라이머" 플레이트 마스크)는 워크플로우 엔진(1002)에 의해 결정될 수 있다. 이를 달성하기 위해, 워크플로우 엔진(1002)은 빌드 그래프를 의미한다. 워크플로우 엔진(1002)은 또한 각각의 반응 단계에 대한 매개 변수와 같은 관련 정보 및 빌드 그래프에 의해 표현된 다른 물리적 구현 정보에 대한 라이브러리(206)를 의미하거나, 그렇지 않으면 팩토리(210)로부터 이런 정보를 얻을 수 있다.
프라이머 플레이트 마스크의 예에서, 워크플로우 엔진(1002)은 빌드 그래프로부터 특정 프라이머가 몇 번 사용되는지를 결정할 수 있고; 이는 필요한 프라이머의 웰(복제)의 수를 결정한다.
부가적으로, 워크플로우 엔진(1002)은 물리적 작업의 효율을 최적화하는 방식으로 중간 플레이트 마스크를 결정할 수 있다. 예를 들어, "스탬프" 작업(소스 플레이트의 위치로부터의 액체를 목적 플레이트의 동일한 상응하는 위치로 동일한 형상으로 전달)은 소스 플레이트의 웰에서 목적 플레이트에서 임의의 웰 위치로의 액체 전달 작업보다 훨씬 빠르며, 이는 또한 상이한 위치일 수 있다. 따라서, 워크플로우 엔진(1002)은 일반적인 액체 전달 대신 스탬프를 허용하기 위해 중간 플레이트 마스크의 레이아웃을 결정하고 최적화할 수 있다.
워크플로우 엔진(1002)은 공정 변형과 같은 알려진 물리적 구현 정보를 고려하도록 플레이트 마스크의 레이아웃을 디자인할 수 있다. 예를 들어, 플레이트의 가장 자리에 있는 웰이 일부 장비에서 소정의 생물학적 공정에 대해 덜 빠르게 반응한다면, 워크플로우 엔진(1002)은 계획된 반응을 적절히 배치할 수 있다. 플레이트 역할과 시스템 결정 플레이트 마스크의 조합은 자동화된 워크플로우 실행 중에 제공되는 임의의 특정 물리적 플레이트 상부에 놓일 수 있다.
생성된 플레이트 마스크에 기초하여, 워크플로우 엔진(1002)은 필요한 정확한 액체 전달을 결정하고 계획할 수 있다; 이를 액체 운송 계획이라고 한다. 빌드 그래프의 각 레벨에 대해, 목적 플레이트에 대한 플레이트 마스크는 각 개별 웰에 대한 원하는 함량(생성물)을 기술한다. 그 생성물을 사용하여, 워크플로우 엔진(1002)은 빌드 그래프를 사용하여 생성물의 이전 것을 찾는다(즉, 이전 레벨의 빌드 그래프에서 이 생성물에 연결되는 것은 무엇입니까? 이 생성물의 반응물은 무엇입니까?). 그런 후에, 워크플로우 엔진(1002)은 반응물을 함유하는 웰을 소스 플레이트에서 검색하고, 전달을 위해 이들 소스 웰을 목적 웰과 일치시킬 수 있다.
또한, 소스 플레이트를 검색할 때, 워크플로우 엔진(1002)은 제조 작업을 실행하는 자동화 시스템에 의해 알려진 기존의 물리적 제약을 고려할 수 있다. 예를 들어, 워크플로우 엔진(1002)은 그러한 웰에서 이용 가능한 알려진 양의 반응물에 기초하여 소스 웰을 선택할 수 있다. 그런 다음 소스 플레이트와 대상 플레이트 간의 이러한 웰 레벨 일치가 액체 전달을 명시하는 데 사용되며, 이는 시스템의 FESI 부분에 사용되는 지침의 기초를 형성한다.
빌드 그래프로부터 제조 작업 실행
제조 작업을 계획하기 위해 빌드 그래프를 사용한 후, 시스템은 생물학적 프로토콜의 상위 레벨 설명(즉, 빌드 그래프 및 계획된 작업)과 프로토콜의 개별 단계를 수행하는 특정 자동화 플랫폼 사이에서 통신할 수 있다.
도 10을 참조하면, FESI(1000)은 장치 애그노스틱(여러 유형의 플랫폼과 통신할 수 있음)이고 언어 애그노스틱(여러 소프트웨어 언어를 사용하여 통신할 수 있음)이어서, 모듈식이며 새로운 플랫폼 및 프로토콜로 쉽게 확장 가능하다. 소정의 프로토콜의 다른 단계를 수행하는 여러 자동화된 플랫폼이 있을 수 있다. 시스템은 모든 상호 연결된 플랫폼의 일정을 조정한다. 플랫폼은 자동화 장비의 하나 이상의 부분을 포함할 수 있으며 네트워크에 자체 연결되어 있다. 단일 플랫폼 유형은 여러 경우를 가질 수 있어서, 소정의 프로토콜이 실행될 수 있는 위치에 대한 여러 옵션을 가질 수 있다. 단일 플랫폼은 여러 프로토콜 유형을 실행할 수도 있다. 명령을 해석하고 나머지 시스템과 통신하는 데 사용되는 소프트웨어를 팩토리 워커로 알려져 있다.
다수의 큐 및 주제 교환을 포함하는 메시지 버스는 워크플로우 엔진과 팩토리 워커 사이에서 통신한다. 이 메시지는 대부분의 주요 프로그래밍 언어의 객체로 컴파일 및 디컴파일할 수 있는 프로토콜 버퍼 객체를 포함하여, 시스템 프로그래밍을 언어 애그노스틱으로 유지한다. 프로토콜 브로커는 실행 명령을 워크플로우 엔진에서 명령을 실행할 수 있는 사용 가능한 팩토리 워커에게 전달하는 중간 역할을 하는 소프트웨어 서비스이다. 프로토콜 브로커는 소프트웨어 스케줄링 서비스 및 장비 관리자와 상의하여 어느 플랫폼이 소정의 시간에 프로토콜을 실행할 수 있는지를 결정한다. 장비 관리자는 이용 가능한 모든 플랫폼, 프로토콜 및 장비 상태 및 프로토콜 검증 상태와 같은 관련 메타 데이터 세트를 유지한다. 프로토콜 실행의 작동 논리에서 이 데이터를 분리하면 시스템이 장치 및 플랫폼에 애그노스틱으로 유지된다.
통신하기 위해 메시지 버스를 사용하기 때문에, 시스템은 워크플로우 엔진 및 팩토리 워커의 언어 및 운영 체제에 애그노스틱이다. 또한 네트워크에 연결되어 있고 큐 및 주제 교환을 구독하고 게시할 수 있는 한, 모든 팩토리 워커가 동일한 작업 시스템에서 작동되거나 동일한 언어를 사용할 필요조차 없다.
도 10은 본 발명의 실시태양에 따른, FESI(1000) 내의 통신 흐름을 도시한다. 먼저, 워크플로우 엔진(1002)이 (액체 전달 계획과 같은) 특정 프로토콜을 실행할 시간이라고 결정할 때, 실행 요청을 프로토콜 브로커에 의해 선택되는 실행 큐에 공개한다. 실행 요청은 실행될 프로토콜, 요청 ID로 알려진 고유 식별자 및 영향을 받을 실험실 장비의 양과 같이 사용자가 요청할 수 있는 추가 변수를 포함한다. 실행 요청을 받으면, 프로토콜 브로커는 스케줄러 및 장비 관리자와 통신하여 어느 플랫폼 및 팩토리 워커가 요청한 프로토콜을 실행할 수 있는지를 결정한다 (도 10의 2, 3 및 4 단계). 이러한 팩토리 워커가 없으면, 프로토콜 브로커는 이 영향에 대한 메세지를 실행 응답 주제 교환에 게시함으로써 워크플로우 엔진과 사용자에게 다시 통신한다(5 단계).
일단 팩토리 워커가 프로토콜 브로커에 의해 지정되면, 스케줄러는 사용 중임을 알리고 프로토콜 브로커는 두 메세지를 게시한다: 공정이 시작되었다는 것을 나타내는 워크플로우 엔진에 의해 읽혀질 실행 반응 주제에 대한 메세지(5 단계) 및 프로토콜이 최초 실행 요청으로부터 요청 id를 포함하는 것을 요청하는 할당된 워커의 워커 큐에 대한 메세지(6 단계). 각 팩토리 워커는 요청을 읽는 자체 워커 큐를 가진다(7 단계).
소정의 팩토리 워커가 큐에서 요청을 수신하면, 워커는 요청을 기계 특정 명령으로 변환한다. 이들은 실행 요청의 모든 입력 값을 통합하여 프로토콜을 실행하는 데 사용된다. 팩토리 워커는 측정 및 상태 업데이트를 포함하여 프로토콜과 관련된 모든 중간 상태 메시지를 최초 요청 id와 함께 상태 주제 교환에 게시한다(8 단계). 팩토리 작업자는 프로토콜 실행을 완료하면, 포함된 요청 id에 연결된 프로토콜의 완료를 나타내는 최종 상태 메시지를 상태 토픽 교환에 게시한다. 요청 id를 사용하여, 워크플로 엔진은 이러한 상태 메시지를 요청한 특정 워크플로우와 연결하고 응답으로 전체 워크플로우를 앞으로 이동할 수 있다. 그런 다음 워크플로우 엔진은 다음 실행 명령 세트를 요청할 수 있으며, 결국 빌드 그래프에 지정된 상위 레벨 워크플로우의 각 단계에 대한 명령을 수신한다.
팩토리 오더 및 빌드 그래프 생성
이 섹션은 빌드 그래프의 생성, 특히 제조 효율을 개선하기 위해 코호트에 대한 빌드 그래프의 생성에 대한 추가 세부 사항을 제공한다. 팩토리 오더는 각각이 유전자 편집을 포함하는 구축할 균주 모음을 정의한다. 팩토리 오더는 디자인을 제어하는 특정 디자인 기술을 지정하여 이루어진다. 특정 균주는, 상이한 디자인 기술을 사용하여, 하나 이상의 팩토리 오더로 주문될 수 있기 때문에, 워크플로우 엔진(1002)은 주문된 각각의 균주에 대한 라인 항목을 생성할 수 있다. 라인 항목은 특정 균주, 특히 단일 팩토리 오더(따라서 팩토리 오더에 사용된 디자인 기술)를 주문하는 예이다. 라인 항목은 균주, 오더 및 오더에 사용된 디자인 기술 간의 연관성을 기록하기 때문에 유용하다.
예를 들어, 팩토리 오더는 프로모터 스왑 디자인 기술을 사용하여 균주 집합을 구축하기 위해 배치될 수 있으며, 여기서 (하나 이상의 관심 유전자의 발현에 영향을 미치는) 게놈의 프로모터 영역은 다른 프로모터가 상응하는 표적 유전자의 발현을 증가 또는 감소시키도록 스왑된다. 이러한 팩토리 오더를 배치하기 위해, 과학자는 변경될 부모 균주, 부모 균주에서 대체될 게놈 영역(네이티브 프로모터) 및 대체품으로 사용될 게놈 서열(새로운 프로모터)을 (예를 들어, DNA 명세서를 통해) 입력으로서 명시할 수 있다.
팩토리 오더로 명시된 유전자 변화를 보유하는 균주의 구축은 일련의 생물학적 반응이 필요하다. 팩토리 오더를 내릴 때 사용된 유기체의 디자인 기술 및 유형은 일련의 반응뿐만 아니라 각 반응에 사용되는 생물학적 기술을 결정한다. 예를 들어, 워크플로우 엔진(1002)은 단일 균주에서 수행되는 단일 프로모터 스왑 디자인 기술이 다음의 일련의 상응하는 생물학적 반응에 의해 다음의 워크플로우 단계가 구현될 것을 요구할 수 있다고 결정할 수 있다:
디자인 기술: 프로모터 스왑
(a) 워크플로우 단계: 부분 생성. 반응: 새로운 프로모터를 포함하는 유전자 서열을 함께 암호화하는 DNA 부분을 생성하는 PCR 반응.
(b) 워크플로우 단계: 플라스미드 조립. 반응: 효모 상동성, 재조합, 이전 단계의 DNA 부분을 플라스미드로 스티칭하는 반응으로, 균주에 쉽게 도입될 수 있다.
(c) 워크플로우 단계: 형질전환. 반응: 전기 천공, 전기를 사용하여 플라스미드를 부모 균주에 도입하여 부모 균주를 유능하게 만들며 (세포벽에 새로운 DNA를 넣을 수 있음), 세포 자체의 유전자 기계를 사용하여 플라스미드 DNA를 부모 균주의 게놈에 포함시켜, 새로운 변형된 균주를 생성하는 반응.
프로모터 스왑 디자인 기술 및 일부 유기체에 대해, 상기 설명은 각각의 워크플로우 단계에 사용되는 특정 종류의 반응의 예를 제공한다. 상이한 디자인 기술, 상이한 유기체 또는 상이한 성능 요구 사항(효율, 성공률)은 각 워크플로우 단계에서 상이한 종류의 반응이 필요할 수 있다. 예를 들어, 상기 워크플로우 엔진(1002)은 유기체가 전기 천공에 취약한 것으로 결정하였다. 경우에 따라 그렇지 않을 수도 있으며, 워크플로우 엔진이 상이한 생물학적 기술로 구동되는 대체 반응 유형을 사용하도록 지시할 수도 있다. 예를 들어, 형질전환은 별도의 박테리아의 기구를 사용하여 플라스미드를 모 균주의 게놈에 포함시키는 반응인 컨쥬게이션(conjugation)을 통해 달성될 수 있다.
위에서 논의된 바와 같이, 팩토리 오더가 워크플로우 엔진(1002)에 의해 수신될 때, 각 워크플로우 단계에서 수행될 반응 및 이런 반응을 달성하기 위해 요구되는 조건을 결정하기 위해 공장에서의 워크플로우의 물리적 구현에 관한 지식을 이용할 수 있다. 이것은 각 반응에 대한 입력(반응물) 및 각 반응에 의해 생성되는 것(반응 생성물)에 대한 세부내용을 포함한다. 이 지식을 이용하여, 워크플로우 엔진(1002)은 주문된 임의의 라인 항목에 대해 라인 항목에 의해 주문된 균주를 생성하기 위해 실행될 일련의 특정 반응을 결정할 수 있다. 이것은 각 반응에 대한 입력(반응물) 및 각 반응에 의해 생성되는 것(반응 생성물)에 대한 세부내용을 포함한다.
본 발명의 실시태양에서, 워크플로우 엔진(1002)은 이 지식을 빌드 그래프 관계로서 유지한다. 단일 빌드 그래프 관계는 빌드 그래프에 추가할 수 있는 단일 에지를 나타낸다. 네 부분의 데이터가 빌드 그래프 관계를 정의할 수 있다:
(a) 반응을 위한 반응물의 ID(에지의 소스).
(b) 반응을 위한 생성물의 ID(에지의 목적).
(c) 생성물을 생성하는 반응에서 반응물의 목적의 스트링 식별자.
(d) 이 관계가 구축과 관련되는 라인 항목.
단독으로 단일 관계는 매우 유용하지 않다(단일 에지는 단일 반응을 완전히 특정하지 않는다). 그러나, 각각의 관계는 구축과 관련된 라인 항목에 의해 색인화되기 때문에, 워크플로우 엔진(1002)은 특정 라인 항목을 구축하는 것과 관련된 모든 관계에 대한 팩토리 오더를 분석할 수 있고, 이런 에지는 라인 항목을 구축하는 데 필요한 모든 반응을 완전히 명시하는 빌드 그래프에 동적으로 결합될 수 있다. 빌드 그래프는 실제로 물리적 반응을 실행하기 위해 쿼리할 수 있는 형식으로 라인 항목을 구축하는 데 필요한 일련의 물리적 반응을 완전히 지정하기 때문에 유용하다.
개별 관계가 이러한 방식으로 저장된다는 사실은 또한 빌드 그래프가 라인 항목의 임의의 집합에 대해 구축될 수 있음을 의미한다. 이 지식은 코호트를 사용하여 활용할 수 있으며, 각 코호트는 팩토리의 제조 능력을 보다 잘 활용할 수 있는 제조 작업 단위이다.
상이한 팩토리 오더는 특정 워크플로우 단계에 대해 상이한 반응 유형의 사용을 야기할 수 있지만, 다른 워크플로우 단계에서 동일한 반응 유형을 공유할 수도 있다. 상기 예로 돌아가서, 프로모터 스왑 디자인 기술을 사용하지만 전기 천공-감수성 유기체를 사용하고 형질전환 단계에 대해 접합-감수성 유기체를 사용하는 두 가지 팩토리 오더를 고려한다. 워크플로우 단계 부분 생성에서, 두 오더로부터의 라인 항목은 PCR 반응을 사용하였다. 따라서, 구축 공정의 해당 단계에서 두 오더의 라인 항목이 함께 처리될 수 있다. 이후의 워크플로우 단계 형질전환에서, 오더는 상이한 반응(전기천공 및 컨쥬게이션)을 사용하며 두 팩토리 오더의 라인 항목은 함께 처리될 수 없고 별도로 작업해야 한다.
(PCR을 사용한) 부분 생성의 제조 능력이 단일 팩토리 오더에 속하는 라인 항목의 수보다 많은 경우, 여러 팩토리 오더의 라인 항목에 함께 작업하여 제조 능력이 완전히 활용될 수 있다는 것이 유리하다. 이러한 이유로, 코호트의 개념이 유용하다. 코호트는 특정 워크플로우 단계에서 함께 작업할 수 있는 라인 항목 그룹화로 정의된다. 라인 항목은 임의의 팩토리 오더(상이한 디자인 기술과 유기체를 사용하는 팩토리 오더)에서 나올 수 있다. 코호트는 공장의 제조 단위이다. 특정 워크플로우 단계와 관련된 제조 용량이 실현될 때까지 코호트에 라인 항목으로 채워질 수 있다. 코호트는 서로 다른 팩토리 오더 사이의 공정 공통성을 이용하여 제조 능력을 최대한 활용하는 방식으로 제조 공정의 특정 단계에서 작업의 임의의 그룹화를 허용하기 때문에 유용하다.
코호트는 부분적으로 코호트의 라인 항목에 의해 정의되므로, 워크플로우 엔진은 코호트의 모든 라인 항목과 관련된 빌드 관계를 쿼리함으로써 코호트에 대한 빌드 그래프를 동적으로 구축할 수 있다. 그런 다음 이 그래프의 지식을 사용하여 코호트와 관련된 워크플로우 단계에서 필요한 물리적 반응을 수행하는 데 필요한 액체 전달을 계획하고 실행할 수 있다(위에서 자세히 설명). 빌드 그래프의 또 다른 장점은 라인 항목의 임의의 그룹화(예를 들어, 코호트)에 대해 빌드 그래프를 구축하고 사용하는 이런 능력이다. 이는 제조 시스템이 적용될 수 있는 작업 바디에 큰 유연성을 부여한다.
고 처리량 균주 디자인 시스템에서의 품질 관리
QC 테스트 디자인
본 발명의 실시태양은 팩토리(210)에서 관심 생성물의 생성에서 반응 단계에 상응하는 중간 및 최종 생물학적 성분에 대해 수행될 하나 이상의 분석을 나타내는 품질 관리 테스트를 디자인하기 위해 도 1의 LIMS 시스템의 요소 또는 LIMS 시스템과 별개인 유사한 요소를 사용할 수 있다. 이러한 분석은 제한 효소 분해, PCR, 성장 분석, 광학 밀도 판독 및 DNA 정량화를 포함하나 이에 제한되지 않는다.
본 발명의 실시태양에 따르면, 인터페이스(202)의 것과 같은 입력 인터페이스는 자체적으로 하나 이상의 분석을 포함하는 품질 관리 테스트를 명시하는 프로그램/스크립트의 구문을 수신한다. 본 발명의 다른 곳에 언급된 바와 같이, 입력 인터페이스는 API를 통해 다른 컴퓨팅 장치로부터의 직접 사용자 입력 또는 입력을 허용할 수 있다.
본 발명의 실시태양에 따르면, 유닛(204) 또는 유닛(207)의 것과 같은 인터프리터 또는 컴파일러/실행 유닛은 각각 품질 제어 테스트를 위해 프로그램 구문을 데이터 구조로 평가한다. 본 발명의 실시태양에 따르면, 명시된 품질 관리 테스트에 기초하여, 실행 엔진(207)은 QC 테스트를 수행하기 위해 분석을 선택한다. 실행 엔진(207)은 명시된 QC 테스트에 기초하여 적절한 분석을 검색하기 위해 라이브러리(206)에 접근할 수 있다. 본 발명의 실시태양에 따르면, 오더 플레이서(208)는, 예를 들어, 라이브러리(206)에 저장된 예상 분석 반응 생성물 및 참조 정보에 기초하여 표적 생물학적 성분에 대한 분석의 예상 결과를 결정한다.
본 발명의 실시태양에 따르면, 실행 엔진(207) 및 오더 플레이서(208)에 의해 수행되는 QC 테스트 기능은 워크플로우 엔진(1002)에 의해 수행될 수 있다. 편의를 위해, 품질 제어 테스트를 디자인하는데 관여하는 하나 이상의 모듈의 소프트웨어 부분(예를 들어, 실행 엔진(207), 오더 플레이서(208))은 본 발명에서 "QC 테스트 디자인 엔진"으로 지칭될 것이다.
본 발명의 실시태양에 따르면, 예를 들어, 라이브러리(206)에 저장된 예상 분석 반응 생성물 및 참조 정보에 기초하여 표적 생물학적 성분에 대한 예상 분석 결과를 찾는 것 대신에, QC 테스트 디자인 엔진은 실시간으로 그 정보의 일부 또는 전부를 계산할 수 있다. 예를 들어, 표적 생물학적 성분으로서 플라스미드 및 반응물로서 효소가 주어지면, QC 테스트 디자인 엔진은, 예를 들어, 인 실리코에서 효소의 인식 부위(예를 들어, AGGA)의 플라스미드를 검색할 수 있다. 해당 위치 정보로부터, QC 테스트 디자인 엔진은 QC 테스트를 위한 참조 정보로 사용되는 인식 부위 사이의 부분(뉴클레오타이드)의 수와 순서를 도출할 수 있다.
데이터 구조는 본 발명의 다른 곳에 기술된 바와 같이 지향 그래프의 형태일 수 있다. 테스트 장비(212)는 본 발명의 실시태양에 따라 QC 데이터 구조를 논리 명세서에서 물리적 QC 공정으로 변환한다.
본 발명의 실시태양에 따르면, QC 테스트 디자인 엔진은 복수의 생물학적 성분에 대한 품질 관리 테스트를 디자인하는 데 사용된다. 본 발명의 실시태양에 따르면, QC 테스트 디자인 엔진(1)은 하나 이상의 생물학적 성분에 대해 하나 이상의 분석을 인 실리코로 수행하며, 여기서 하나 이상의 생물학적 성분 중 하나에 대한 각각의 분석의 인 실리코 성능이 하나 이상의 표적 생물학적 성분(예를 들어, 플라스미드) 중 하나를 포함하는 분석 반응(예를 들어, 소화)으로부터 생성된 하나 이상의 분석 반응 생성물(예를 들어, 다중 플라스미드 단편)을 생성한다; (2) 각 분석의 둘 이상의 예상 결과를 분석에 관한 실험적 정보에 적어도 부분적으로 기초하여, 적어도 하나의 성공 모드 또는 적어도 하나의 실패 모드의 그룹으로 분류하며; 및 (3) 하나 이상의 분석 반응 생성물에 대한 분석 데이터 구조로, (a) 하나 이상의 분석 반응 생성물의 속성, 및 (b) 둘 이상의 예상 결과의 분류를 포함하는 참조 정보를 저장한다.
본 발명의 실시태양에 따르면, 테스트 장비(212)는 (a) 실험실 장비가 하나 이상의 생물학적 성분에 물리적 실험실 장비를 사용하여 하나 이상의 인 실리코 분석에 상응하는 하나 이상의 물리적 분석을 수행하도록 지시하여 각 물리적 분석에 대한 하나 이상의 물리적 분석 반응 생성물을 생성하고; (b) 각 물리적 분석에 대해, 하나 이상의 물리적 분석 반응 생성물을 상응하는 참조 정보와 비교하여 적어도 하나의 성공 모드 또는 적어도 하나의 실패 모드에 상응하는 것으로서 표적 생물학적 성분을 분류함으로써 분석 데이터 구조를 처리한다.
표적 생물학적 성분은 플라스미드를 포함할 수 있고, 하나 이상의 반응 생성물은 플라스미드 단편을 포함할 수 있다. 각각의 표적 생물학적 성분은 뉴클레오타이 서열 또는 미생물 균주를 포함할 수 있다.
분석에 관한 실험 정보는 하나 이상의 분석 반응 생성물에 관한 실험 정보를 포함할 수 있다. 분류는 검정 반응, 검정 반응에 관여하는 검정 반응물 및 하나 이상의 표적 생물학적 성분 중 하나에 적어도 부분적으로 기초할 수 있다. 하나 이상의 표적 생물학적 성분에 대한 하나 이상의 분석을 인 실리코에서 수행하는 단계는 하나 이상의 표적 생물학적 성분의 제 1 표적 생물학적 성분에 대해 하나 이상의 분석의 적어도 2개의 분석을 인 실리코에서 수행하는 단계를 포함할 수 있다.
분석 데이터 구조는 하나 이상의 표적 생물학적 성분에 대한 하나 이상의 분석에 대해, 복수의 분석 노드를 포함하는 복수의 수준을 포함하는 지향 그래프일 수 있다. 본 발명의 실시태양에 따르면, 지향 그래프에서, 복수의 레벨의 한 레벨에 상주하는 각각의 분석 노드는 하나 이상의 표적 생물학적 성분, 하나 이상의 분석 반응물, 또는 하나 이상의 분석 반응 생성물 중 하나를 나타내며; 복수의 분석 노드의 표적 분석 노드는 소정의 레벨에서 하나 이상의 표적 생물학적 성분의 표적 생물학적 성분을 나타내고; 및 표적 분석 노드와 관련된 복수의 분석 노드의 분석 반응 생성물 노드는 소정의 레벨의 자식 레벨에서 하나 이상의 분석 반응 생성물 및 참조 정보를 나타낸다.
본 발명의 실시태양에 따르면, 소정의 레벨은 소정의 레벨에서 표적 생물학적 성분과 인 실리코에서 반응하는 적어도 하나의 분석 반응물을 나타내는 적어도 하나의 분석 반응물 노드를 포함한다. 본 발명의 실시태양에 따르면, 소정의 레벨의 표적 분석 노드 및 분석 반응물 노드 및 자식 레벨의 분석 반응 생성물 노드는 자식 레벨에 상응하는 하나 이상의 분석 반응 그룹의 분석 반응 그룹을 구성한다.
한 예로서, 도 12는 반응 그룹의 생성물에 대한 QC 테스트를 디자인하기 위한 QC 그래프 데이터 구조(1200)를 도시한다. 반응 그룹은 빌드 그래프 데이터 구조(1202)로서 예시된다. 반응 그룹은 부분 1(노드 1204) 및 부분 2(노드 1206)의 반응을 모델링한다. 이들 부분의 역할은 역할 페이로드(1210) 및 플라스미드 골격(1212)으로 각각 라벨링된 에지로서 저장된다. 반응 그룹의 결과는 플라스미드(1208)를 나타내는 노드이다.
QC 그래프(1200)는 표적 생물학적 성분인 플라스미드(노드 1208) 상에서 수행된 인 실리코 분석을 나타낸다. 이 예를 위해, 노드(1208)는 하나의 표적 생물학적 성분만을 나타낸다. 그래프는 분석 반응물, 효소(노드 1214)와 플라스미드(노드 1208)의 반응으로서 분석 반응 생성물(들)(노드 1216))을 생성하는 분석을 나타낸다. 노드(1216)는 하나 이상의 분석 반응 생성물을 나타낼 수 있다. 플라스미드(노드 1208), 효소(노드 1214) 및 분석 반응 생성물(노드 1216)은 함께 분석 반응 그룹을 구성한다.
본 발명의 실시태양에 따르면, QC 테스트 디자인 동안, QC 테스트 디자인 엔진은 분석 반응 생성물의 속성을 참조 정보(예를 들어, 예상 반응 생성물의 수, 예상 길이, 예상 순서)와 비교하기 위해 검정 반응 생성물의 속성을 비교하여 표적 생물학적 성분을 하나 이상의 성공 또는 실패 모드에 속하는 것으로 분류한다. QC 테스트 디자인 엔진은 성공 및 실패 모드와 표적 생물학적 성분에 대한 반응 생성물의 상응하는 서브 세트의 결합을 노드(1218 및 1220)로서 저장할 수 있다.
본 발명의 실시태양에 따르면, QC 테스트 디자인 엔진 또는 다른 컴퓨팅 장치는 성공적인 결과 및 실패한 결과를 초래하는 분석으로부터의 참조 정보를 저장할 수 있다. 예를 들어, 표적 생물학적 성분과 유사하지만 동일하지 않은 생물학적 성분에 대한 분석으로부터의 참조 정보는 실패 모드에 해당할 것이다. 다른 예로서, 공지된 결함을 갖는 효소 반응물을 사용하여 표적 생물학적 성분에 대한 분석으로부터의 참조 정보는 다른 실패 모드에 해당할 것이다.
본 발명의 실시태양은 특정 내용으로부터 유사한 QC 테스트의 공통적인 양상을 취하고 함께 수행함으로써 고 처리량 균주 디자인 시스템에 대한 QC 테스트를 디자인하는 어려움을 완화시킨다. 본 발명의 실시태양은 본 발명의 다른 실시태양이 상이한 생물학적 공정의 공통 부분을 분별하여 팩토리 오더 스케일로 함께 그룹화하는 방식과 유사하게, 동일한 분석 반응 단계를 공유하는 많은 상이한 QC 분석에 대한 단계의 공통 처리를 허용한다. 본 발명의 실시태양에 따르면, 각각의 분석은 하나 이상의 분석 단계를 포함하고, 각각의 분석 단계는 복수의 분석 반응 단계의 분석 반응 단계를 포함한다.
본 발명의 실시태양은 상이한 분석의 하나 이상의 분석 단계가 공통 분석 단계의 하나 이상의 분석 반응 단계의 공통성에 적어도 부분적으로 기초하여 함께 처리될 수 있는 공통 분석 단계인 것을 결정하고, 공통 분석 단계에 적어도 부분적으로 기초한 분석 데이터 구조를 생성한다. 공통 분석 단계는 동일한 분석 반응물과 연관될 수 있다.
본 발명의 실시태양에 따르면, QC 테스트 디자인 엔진은 일반적인 분석 단계에 필요한 분석 반응물의 양을 결정한다. 예를 들어, 2개의 공통 분석 단계가 2개의 상이한 생물학적 성분에 대해 동일한 분석 반응 단계를 수행하는 경우, 본 발명의 실시태양은 공통 분석 단계에 필요한 총 분석 반응물의 양을 계산하고, 공통 분석 단계의 성능을 효율적인 방식으로 적절한 실험실 장비로 할당할 수 있다. 본 발명의 실시태양에 따라, 물리적 세계에서의 품질 관리 테스트의 수행 동안, 테스트 장비(212)는 QC 테스트 데이터 구조(예를 들어, 데이터 구조의 지향 그래프)를 가로 질러 QC 분석에 대한 물리적 실험실 장비의 각 부분에 사용되는 반응물의 양을 결정한다.
본 발명의 실시태양에 따르면, 테스트 장비(212)는 QC 테스트 데이터 구조를 가로 질러 공유된 반응물(예를 들어, 효소)을 갖는 모든 표적 생물학적 성분을 식별하고 실험실 장비(예를 들어, 로봇)에게 이들 표적 생물학적 성분의 각각을 동일한 플레이트에 배치하도록 지시하여, 이들 샘플에 효소를 분배하는 복잡성을 최소화한다. 예를 들어, 400개 플라스미드의 QC 테스트를 가정한다. 분석이 400개 플라스미드 중 80개가 효소 1에 의해 분해될 것을 필요로 하고 80개의 상이한 플라스미드가 5개의 상이한 플레이트 상의 다른 320개 플라스미드와 혼합되는 경우, 효소 1을 분배하도록 선택된 로봇은 5개의 플레이트를 모두 보내야 한다. 따라서, 효소를 옮기는 데 오랜 시간이 걸리고 조직하기가 복잡할 것이다. 그러나, 본 발명의 실시태양에 따르면, 테스트 장비는 효소로 분해될 80개 플라스미드의 동일한 플레이트 상의 배치를 지시한다. 따라서, 하나의 플레이트만 로봇으로 보내져야 하며, 모든 전달은 한 번에 수행될 수 있으며 훨씬 빠르고 덜 복잡하다.
도 13은 본 발명의 실시태양은 상이한 분석 반응에서 동일한 분석 반응물을 효율적으로 사용하는 QC 테스트의 디자인을 가능하게 하는 방법을 도시한 예시적인 QC 그래프이다. 노드(1302, 1304)는 각각 표적 생물학적 성분 플라스미드 1 및 플라스미드 2를 나타낸다. 각 플라스미드 상의 각 분석 반응은 효소, 효소 1과의 반응을 필요로 한다. 플라스미드 1 및 플라스미드 2와의 반응은 분석 반응 생성물 1(노드 1308)과 분석 반응 생성물 2(노드 1310)을 초래한다. 본 발명의 실시태양에 따르면, QC 테스트 디자인 엔진은 두 검정 반응 모두에서 효소 1의 공통 사용을 인식하고, 도면에 도시된 바와 같이, 단일 분석 노드가 2개의 상이한 분석 반응 그룹에 의해 공유되는 효소 1을 나타냄으로써 공통 사용을 반영하는 데이터 구조를 구축한다. 도 8과 관련하여 기술된 실시태양과 유사하게, 데이터 구조(예를 들어, 노드)는 표현된 생물학적 성분 및 반응의 특성(예를 들어, 주석)을 저장한다. QC 테스트 디자인 엔진은 이 정보를 사용하여 분석을 수행하는 데 필요한, 예를 들어 효소 1의 부피, 농도 또는 다른 양을 계산할 수 있다.
본 발명의 실시태양에 따르면, 분류하는 것은 분석에 관한 실험적 정보에 적어도 부분적으로 기초하여 각각의 분석의 예상 결과를 적어도 2개의 실패 모드로서 분류하는 것을 포함한다. 본 발명의 실시태양에 따르면, 실패 모드는 표적 생물학적 성분의 결함을 나타낸다. 본 발명의 실시태양에 따르면, 실패 모드는 분석의 실패를 나타낸다. 본 발명의 실시태양에 따르면, 제 1 실패 모드는 제 1 구축 오류에 따라 잘못 구축된 표적 생물학적 성분을 나타내고 (예를 들어, 예상되는 수와 비교하여 너무 많거나 2개 적은 부분), 제 2 실패 모드는 제 2 구축 오류에 따라 잘못 구축된 표적 생물학적 성분을 나타낸다(예를 들어, 역순으로 삽입된 부분). 본 발명의 실시태양에 따르면, 실패 모드는 결함 분석 반응물을 나타낸다. 본 발명의 실시태양은 상기 성공 및 실패 모드의 임의의 조합에 따라 예상 분석 결과를 분류할 수 있다.
본 발명의 실시태양에 따르면, 분석 반응의 하나 이상의 분석 반응 생성물에 대해, 참조 정보는 분석 반응, 하나 이상의 분석 반응 생성물 또는 분석 반응물의 확인을 추가로 포함한다. 참조 정보 속성은 하나 이상의 분석 반응 생성물의 예상 길이, 서열 또는 성장 능력을 포함할 수 있다.
본 발명의 실시태양에 따르면, 하나 이상의 표적 생물학적 성분의 각각은 빌드 그래프 데이터 구조의 적어도 일부에 따라 생성되며, 빌드 그래프 데이터 구조의 복수의 레벨의 한 레벨에 상주하는 각 노드는 하나 이상의 생물학적 성분 중 적어도 하나를 나타낸다. 본 발명의 실시태양에 따르면, 빌드 그래프 데이터 구조는 관심 생성물의 유전자 제조 시스템에서의 생산을 제어하고, 여기서 관심 생성물은 빌드 그래프에 의해 표현되는 유전자 변형을 포함한다.
본 발명의 실시태양에 따르면, 빌드 그래프 데이터 구조의 복수 레벨의 소정의 레벨에서 하나 이상의 소스 노드, 및 빌드 그래프 데이터 구조의 소정의 레벨의 자식 레벨에서 하나 이상의 소스 노드와 관련된 목적지 노드는 빌드 그래프 데이터 구조의 자식 레벨에 상응하는 하나 이상의 반응 그룹의 한 반응 그룹을 구성한다. 본 발명의 실시태양에 따르면, 각각의 반응 그룹은 소정의 레벨에서 하나 이상의 소스 노드에 의해 그들 자신이 표현되는 하나 이상의 생물학적 성분 사이의 반응을 나타내어, 빌드 그래프 데이터 구조의 자식 레벨에서 반응 그룹의 목적 노드에 의해 표현되는 하나 이상의 표적 생물학적 성분을 생성한다
QC 테스트 구현
본 발명의 실시태양에 따르면, 팩토리(210)에서 조립된 생물학적 성분은 테스트 장비(212)를 사용하여 테스트된다. 테스트 동안, 생물학적 성분은 다른 방법 중에서도 크기 및 서열 분석에 기초한 품질 관리 평가를 받는다. 본 발명의 실시태양에 따르면, QC는 팩토리(210)에 의해 생성된 최종 관심 생성물만이 아니라 중간 생물학적 성분에 대해 수행된다. 그런 후에, QC를 통과하는 생성된 변형 생물학적 성분은 액체 또는 콜로니 배양물로부터 플레이트로 옮겨질 수 있고, 또는 그렇지 않으면 최종 관심 생성물의 제조를 촉진하기 위해 추가로 처리될 수 있다. 본 발명의 실시태양에 따르면, 테스트 장비(212)는 표적 생물학적 성분의 물리적 분석으로부터 생성된 하나 이상의 물리적 분석 반응 생성물에 관한 정보를 획득하고; 하나 이상의 물리적 분석 반응 생성물을 상응하는 참조 정보와 비교하여, 표적 생물학적 성분을 적어도 하나의 성공 모드, 적어도 하나의 실패 모드 또는 불확정 모드에 상응하는 것으로 분류함으로써 표적 생물학적 성분(예를 들어, 중간 또는 최종 생성물)에 대한 품질 관리 테스트를 수행하며, 여기서 참조 정보는 성공 및 실패 모드에 상응하는 하나 이상의 물리적 분석 반응 생성물의 예상 속성을 포함한다. 라이브러리(206) 또는 다른 데이터베이스는 참조 정보를 저장할 수 있다.
표적 생물학적 성분이 불확정 모드에 상응하는 것으로 분류되는 경우, 본 발명의 실시태양의 테스트 장비(212)는 물리적 분석이 다시 수행되어야 함을 나타낸다. 표적 생물학적 성분이 적어도 하나의 성공 모드에 상응하는 것으로 분류되는 경우, 본 발명의 실시태양의 테스트 장비(212)는 관심 생성물 생성의 촉진을 위해 표적 생물학적 성분의 추가 처리를 위한 명령을 제공한다. 실패 모드는 표적 생물학적 성분의 결함을 나타낼 수 있다. 실패 모드는 물리적 분석의 실패를 나타낼 수 있다. 본 발명의 실시태양에 따르면, 제 1 실패 모드는 제 1 구축 오류에 따라 부적절하게 구성된 표적 생물학적 성분을 나타내고, 제 2 실패 모드는 제 2 구축 오류에 따라 부적절하게 구성된 표적 생물학적 성분을 나타낸다. 본 발명의 실시태양에 따르면, 실패 모드는 물리적 분석의 물리적 분석 반응에 사용되는 결함 분석 반응물을 나타낸다. 본 발명의 실시태양의 테스트 장비(212)는 상기 성공, 실패 및 불확정 모드의 임의의 조합에 따라 표적 생물학적 성분을 분류할 수 있다.
도 12를 참조하면, 본 발명의 실시태양에 따르면, 테스트 장비(212)는 물리적 실험실 장비가 팩토리(210)에 의해 생성된 물리적 플라스미드(노드 1208에 상응)의 인 비트로 분석을 수행하도록 지시한다. 테스트 장비(212)는 물리적 반응 생성물(노드 1216에 상응)을 형성하기 위해 효소(노드 1214)가 플라스미드와 반응하도록 한다. 테스트 장비(1212)는 물리적 반응 생성물을 참조 정보와 비교하여 플라스미드를 하나 이상의 성공 또는 실패 모드에 상응하는 것으로 분류하거나 또는 둘 다 아닌 것으로 분류한다(예를 들어, 미결정).
컴퓨터 시스템
도 7은 본 발명의 실시태양에 따라 일시적이지 않은 컴퓨터 판독가능한 매체(예를 들어, 메모리)에 저장된 프로그램 코드를 실행하는데 사용될 수 있는 컴퓨터 시스템(800)의 한 예를 도시한다. 컴퓨터 시스템은 응용분야에 따라 인간 사용자 및/또는 다른 컴퓨터 시스템과 인터페이스하는 입력 인터페이스(202)를 구현하는데 사용될 수 있는 입력/출력 하부 시스템(802)을 포함한다. 예를 들어, 본 발명의 실시태양의 에디터는 인간 사용자로부터(예를 들어, GUI 또는 키보드를 통해) 입력 프로그램 진술을 수신하고 이를 다시 사용자에게 표시하기 위해 사용되는 I/O 하부 시스템(802)을 갖는 시스템(800) 상의 프로그램 코드로 구현될 수 있다 I/O 하부 시스템(802)은, 예를 들어, 키보드, 마우스, 그래픽 사용자 인터페이스, 터치 스크린, 또는 입력을 위한 다른 인터페이스, 및 예를 들어 LED 또는 다른 평면 스크린 디스플레이, 또는 출력을 위한 다른 인터페이스를 포함할 수 있다. 워크플로우 엔진(1002) 또는 오더 배치 엔진(208)과 같은 본 발명의 실시태양의 다른 요소는 아마도 I/O가 있거나 없는 컴퓨터 시스템(800)과 같은 컴퓨터 시스템으로 구현될 수 있다.
프로그램 코드는 영구 저장 장치(810) 또는 메모리(808) 또는 둘 다와 같은 비 일시적인 매체에 저장될 수 있다. 프로세서(804)는 하나 이상의 비 일시적인 매체로부터 프로그램 코드를 판독하고 이 코드를 실행하여 컴퓨터 시스템이 도 2의 흐름도에 의해 표현된 것과 같이, 본 실시태양에 의해 수행된 방법을 완성하게 한다. 당업자는 프로세서가 본 발명의 실시태양의 고-레벨 게놈 디자인 언어로 표현된 진술과 같은 소스 코드를 섭취하고 소스 코드를 프로세서의 하드웨어 게이트 레벨에서 이해할 수 있는 기계 코드로 해석 또는 컴파일할 수 있다는 것을 이해할 것이다. 버스는 I/O 하부 시스템(802), 프로세서(804), 주변 장치(806), 메모리(808) 및 영구 저장 장치(810)를 연결한다.
당업자는 도 1에 도시된 것과 같이, 본 발명의 실시태양의 요소들 중 일부 또는 전부(예를 들어, 인터프리터, 실행 엔진, 오더 배치 엔진, 팩토리, 테스트 장비, 분석 장비), (및 도 2에 도시된 바와 같은 이들의 동반 연산) 또는 도 10에 도시된 것과 같이, 본 발명의 실시태양의 요소들 중 일부 또는 전부(예를 들어, 워크플로우 엔진)는 하나 이상의 프로세서 및 컴퓨터 시스템(800)의 메모리 시스템과 같은 하나 이상의 메모리 시스템을 포함하는 하나 이상의 컴퓨터 시스템 상에서 전체적으로 또는 부분적으로 구현될 수 있다는 것을 이해할 것이다. 일부 요소 및 기능은 국소적으로 구현될 수 있고 다른 것은, 예를 들어, 클라이언트-서버 방식으로, 다른 서버를 통해 네트워크 상에 분산된 방식으로 구현될 수 있다.
도 11은 본 발명의 실시태양에 따른 클라우드 컴퓨팅 환경을 예시한다. 본 발명의 실시태양에서, LIMS 또는 FESI 애플리케이션 소프트웨어(1110)는 클라우드 컴퓨팅 시스템(1102)에서 구현되어, 다수의 사용자가 본 발명의 실시태양에 따라 이러한 시스템에 접근할 수 있게 한다. 도 7에 도시된 것과 같은 클라이언트 컴퓨터(1106)는 인터넷과 같은 네트워크(1108)를 통해 시스템에 접근한다. 시스템은 도 7에 도시된 유형의 하나 이상의 프로세서를 사용하는 하나 이상의 컴퓨팅 시스템을 사용할 수 있다. 클라우드 컴퓨팅 시스템 자체는 네트워크(1108)를 통해 소프트웨어(1110)를 클라이언트 컴퓨터(1106)에 인터페이스하기 위한 네트워크 인터페이스(1112)를 포함한다. 네트워크 인터페이스(1112)는 클라이언트 컴퓨터(1106)에서의 클라이언트 애플리케이션이 시스템 소프트웨어(1110)에 접근할 수 있도록 하는 애플리케이션 프로그래밍 인터페이스(API)를 포함할 수 있다.
서비스로서의 소프트웨어(SaaS) 소프트웨어 모듈(1114)은 클라이언트 컴퓨터(1106)에 대한 서비스로서 시스템 소프트웨어(1110)를 제공한다. 클라우드 관리 모듈(1116)은 클라이언트 컴퓨터(1106)에 의해 소프트웨어(1110)에 대한 접근을 관리한다. 클라우드 관리 모듈(1116)은 멀티테넌트 애플리케이션, 가상화 또는 당업계에 알려진 다른 아키텍처를 사용할 수 있는 클라우드 아키텍처가 여러 사용자에게 서비스를 제공하게 할 수 있다.
본 발명의 실시태양은 예시된 실시태양과 관련하여 구체적으로 기술되었지만, 본 발명에 기초하여 다양한 변경, 수정 및 개조가 이루어질 수 있고 본 발명의 범위 내에 있는 것으로 이해될 것이다. 본 발명의 실시태양은 개시된 실시태양과 관련하여 설명되었지만, 본 발명은 개시된 실시태양에 한정되지 않으며, 반대로, 청구항의 범위 내에 포함되는 다양한 변형 및 균등한 구성을 포함하는 것으로 이해되어야 한다.
부록 1: 함수 참조
이런 부록은 LIMS에서 코돈 언어에 대한 빌트-인 라이브러리에서 이용가능한 함수의 일부를 기술한다.
Figure pct00021
Figure pct00022
Figure pct00023
Figure pct00024
Figure pct00025
부록 2: 데이터 구조
이 부록은 본 발명의 실시태양에 의해 사용될 수 있는 데이터 구조의 예를 제공한다. 이것은 DnaSpecifications와 DnaComponents를 의미하며, Avro 사양 형식으로 다음을 통해 지정 및 직렬화될 수 있다. (http://avro.apache.org/docs/current/spec.html 참조)
Figure pct00026
Figure pct00027
Figure pct00028
Figure pct00029
Figure pct00030
Figure pct00031
Figure pct00032
Figure pct00033
Figure pct00034
Figure pct00035
다음은 JSON 직렬화 형식으로 도 8(노드 1(902), 노드 2(914), 노드 3(916), 노드 4(906), 노드 5(912))에 표시된 상위 5개 노드의 데이터 구조 표현의 한 예이다.
Figure pct00036
Figure pct00037
Figure pct00038

Claims (191)

  1. 빌드 그래프 데이터 구조를 생성하여 유전자 변형을 포함하는 적어도 하나의 관심 생성물의 유전자 제조 시스템에서 생산을 제어하는 시스템으로서, 이 시스템은:
    하나 이상의 프로세서; 및
    하나 이상의 프로세서 중 적어도 하나에 의해 실행될 때, 시스템이
    생물학적 워크플로우의 설명에 접근하고, 여기서 설명은 생물학적 성분의 표현을 포함한다; 및
    워크플로우 설명에 적어도 부분적으로 기초하여 빌드 그래프 데이터 구조를 조립하게 하는 명령을 저장하는 하나 이상의 메모리를 포함하며,
    여기서 빌드 그래프 데이터 구조에서, 각각의 생물학적 성분은 복수의 레벨의 한 레벨에 상주하는 노드로 표현되고,
    여기서 복수의 레벨의 소정의 레벨에서 하나 이상의 소스 노드, 및 소정의 레벨의 자식 레벨에서 목적 노드는 자식 레벨에 상응하는 하나 이상의 반응 그룹의 한 반응 그룹을 구성하고,
    여기서 각각의 반응 그룹은 소정의 레벨에서 하나 이상의 소스 노드에 의해 그들 자신이 표현되는 하나 이상의 생물학적 성분 사이의 반응을 나타내어 자식 레벨에서 반응 그룹의 단일 목적 노드에 의해 표현되는 생물학적 성분을 생성하며,
    여기서 자식 레벨에서 하나 이상의 목적 노드는 소정의 레벨의 손자 레벨에서 하나 이상의 반응 그룹의 반응 그룹에서 하나 이상의 소스 노드로서 작용하며, 및
    여기서 복수의 레벨의 최종 레벨에서 적어도 하나의 목적 노드는 적어도 하나의 관심 생성물을 나타내며, 이는 상이한 레벨에서 생물학적 성분 사이의 반응에 의해 야기된 유전자 변형을 포함하며, 및
    여기서 빌드 그래프 데이터 구조를 처리하는 것은 적어도 하나의 관심 생성물의 생산을 초래하는 것인 시스템.
  2. 제 1 항에 있어서,
    적어도 하나의 관심 생성물은 뉴클레오타이드 서열 또는 미생물 균주를 포함하는 것인 시스템.
  3. 제 1 항 또는 제 2 항에 있어서,
    소정의 레벨에서 하나 이상의 소스 노드 중 적어도 하나가 2개의 상이한 반응 그룹에 속하는 것인 시스템.
  4. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
    하나 이상의 메모리는 상이한 팩토리 오더에 대한 2개 이상의 워크플로우 단계가 공통 워크플로우 단계의 반응 단계의 공통성에 적어도 부분적으로 기초하여 함께 처리될 수 있는 공통 워크플로우 단계임을 결정하기 위한 추가 명령을 저장하며,
    여기서 빌드 그래프 데이터 구조를 조립하는 것은 공통 워크플로우 단계에 적어도 부분적으로 기초하는 것인 시스템.
  5. 제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
    하나 이상의 반응 그룹 중 제 1 반응 그룹의 제 1 목적 노드는 제 1 반응 그룹에서 하나 이상의 소스 노드로 표시되는 하나 이상의 생물학적 성분에 적용된 하나 이상의 반응으로부터 생성되도록 계산된 비 결정적 생물학적 성분 세트를 나타내는 것인 시스템.
  6. 제 1 항 내지 제 5 항 중 어느 한 항에 있어서,
    제 1 목적 노드는 제 2 생물학적 성분의 하나 이상의 비 결정적 위치에서의 하나 이상의 제 1 생물학적 성분 중 하나의 삽입으로부터 생성되도록 계산된 비 결정적 생물학적 성분 세트를 나타내며, 여기서 제 2 생물학적 성분은 생물학적 서열인 시스템.
  7. 제 1 항 내지 제 6 항 중 어느 한 항에 있어서,
    제 1 목적 노드는 제 2 생물학적 성분 내의 하나 이상의 상응하는 특정 위치에서 하나 이상의 생물학적 성분에 대한 비 결정적 변화로부터 생성되도록 계산된 비 결정적 생물학적 성분 세트를 나타내며, 여기서 제 2 생물학적 성분은 생물학적 서열인 시스템.
  8. 제 1 항 내지 제 7 항 중 어느 한 항에 있어서,
    비 결정적 변화는 제 2 생물학적 성분 내의 하나 이상의 특정 위치의 각각에서 제 1 생물학적 성분에 의한 대체를 포함하는 것인 시스템.
  9. 제 1 항 내지 제 8 항 중 어느 한 항에 있어서,
    각각의 제 1 생물학적 성분이 뉴클레오타이드이고 제 2 생물학적 성분이 뉴클레오타이드 서열인 시스템.
  10. 제 1 항 내지 제 9 항 중 어느 한 항에 있어서,
    반응 그룹 내의 소정의 레벨의 제 1 소스 노드는 복수의 제 1 생물학적 성분을 나타내거나, 자식 레벨의 목적 노드는 복수의 제 2 생물학적 성분을 나타내는 것인 시스템.
  11. 제 1 항 내지 제 10 항 중 어느 한 항에 있어서,
    소정의 레벨에서 하나 이상의 소스 노드로 표시되는 하나 이상의 생물학적 성분은 미생물 균주이고, 균주 사이의 반응은 균주 사이의 수평 유전자 전달을 포함하는 것인 시스템.
  12. 제 1 항 내지 제 11 항 중 어느 한 항에 있어서,
    각각의 생물학적 성분이 뉴클레오타이드 서열 또는 미생물 균주 중 적어도 하나인 시스템.
  13. 유전자 변형을 포함하는 적어도 하나의 관심 생성물의 유전자 제조 시스템에서의 생산을 제어하기 위한 빌드 그래프 데이터 구조를 생성하기 위한 컴퓨터 구현 방법으로서, 방법은
    생물학적 워크플로우의 설명에 접근하는 단계, 여기서 설명은 생물학적 성분의 표현을 포함하며; 및
    워크플로우 설명에 적어도 부분적으로 기초하여 빌드 그래프 데이터 구조를 조립하는 단계를 포함하며,
    여기서 빌드 그래프 데이터 구조에서, 각각의 생물학적 성분은 복수의 레벨의 한 레벨에 상주하는 노드로 표현되며,
    여기서 복수의 레벨의 소정의 레벨에서 하나 이상의 소스 노드, 및 소정의 레벨의 자식 레벨에서 목적 노드는 자식 레벨에 상응하는 하나 이상의 반응 그룹의 한 반응 그룹을 구성하고,
    여기서 각각의 반응 그룹은 소정의 레벨에서 하나 이상의 소스 노드에 의해 그들 자신이 표현되는 하나 이상의 생물학적 성분 사이의 반응을 나타내어 자식 레벨에서 반응 그룹의 단일 목적 노드에 의해 표현되는 생물학적 성분을 생성하며,
    여기서 자식 레벨에서 하나 이상의 목적 노드는 소정의 레벨의 손자 레벨에서 하나 이상의 반응 그룹의 반응 그룹에서 하나 이상의 소스 노드로서 작용하며, 및
    여기서 복수의 레벨의 최종 레벨에서 적어도 하나의 목적 노드는 적어도 하나의 관심 생성물을 나타내며, 이는 상이한 레벨에서 생물학적 성분 사이의 반응에 의해 야기된 유전자 변형을 포함하며, 및
    여기서 빌드 그래프 데이터 구조를 처리하는 것은 적어도 하나의 관심 생성물의 생산을 초래하는 것인 컴퓨터 구현 방법.
  14. 제 13 항에 있어서,
    적어도 하나의 관심 생성물이 뉴클레오타이드 서열 또는 미생물 균주를 포함하는 것인 방법.
  15. 제 13 항 또는 제 14 항에 있어서,
    소정의 레벨에서 하나 이상의 소스 노드 중 적어도 하나가 2개의 상이한 반응 그룹에 속하는 것인 방법.
  16. 제 13 항 내지 제 15 항 중 어느 한 항에 있어서,
    상이한 팩토리 오더에 대한 2개 이상의 워크플로우 단계는 공통 워크플로우 단계의 반응 단계의 공통성에 적어도 부분적으로 기초하여 함께 처리될 수 있는 공통 워크플로우 단계인 것을 결정하는 단계를 더 포함하며,
    여기서 빌드 그래프 데이터 구조를 조립하는 단계는 적어도 부분적으로 공통 워크플로우 단계에 기초하는 것인 방법.
  17. 제 13 항 내지 제 16 항 중 어느 한 항에 있어서,
    하나 이상의 반응 그룹 중 제 1 반응 그룹의 제 1 목적 노드는 제 1 반응 그룹에서 하나 이상의 소스 노드로 표시되는 하나 이상의 생물학적 성분에 적용된 하나 이상의 반응으로부터 생성되도록 계산된 비 결정적 생물학적 성분 세트를 나타내는 것인 방법.
  18. 제 13 항 내지 제 17 항 중 어느 한 항에 있어서,
    제 1 목적 노드는 제 2 생물학적 성분의 하나 이상의 비 결정적 위치에서의 하나 이상의 제 1 생물학적 성분 중 하나의 삽입으로부터 생성되도록 계산된 비 결정적 생물학적 성분 세트를 나타내며, 여기서 제 2 생물학적 성분은 생물학적 서열인 방법.
  19. 제 13 항 내지 제 18 항 중 어느 한 항에 있어서,
    제 1 목적 노드는 제 2 생물학적 성분 내의 하나 이상의 상응하는 특정 위치에서 하나 이상의 생물학적 성분에 대한 비 결정적 변화로부터 생성되도록 계산된 비 결정적 생물학적 성분 세트를 나타내며, 여기서 제 2 생물학적 성분은 생물학적 서열인 방법.
  20. 제 13 항 내지 제 19 항 중 어느 한 항에 있어서,
    비 결정적 변화는 제 2 생물학적 성분 내의 하나 이상의 특정 위치의 각각에서 제 1 생물학적 성분에 의한 대체를 포함하는 것인 방법.
  21. 제 13 항 내지 제 20 항 중 어느 한 항에 있어서,
    각각의 제 1 생물학적 성분이 뉴클레오타이드이고 제 2 생물학적 성분이 뉴클레오타이드 서열인 방법.
  22. 제 13 항 내지 제 21 항 중 어느 한 항에 있어서,
    반응 그룹 내의 소정의 레벨의 제 1 소스 노드는 복수의 제 1 생물학적 성분을 나타내거나, 자식 레벨의 목적 노드는 복수의 제 2 생물학적 성분을 나타내는 것인 방법.
  23. 제 13 항 내지 제 22 항 중 어느 한 항에 있어서,
    소정의 레벨에서 하나 이상의 소스 노드로 표시되는 하나 이상의 생물학적 성분은 미생물 균주이고, 균주 사이의 반응은 균주 사이의 수평 유전자 전달을 포함하는 것인 방법.
  24. 제 13 항 내지 제 23 항 중 어느 한 항에 있어서,
    각각의 생물학적 성분이 뉴클레오타이드 서열 또는 미생물 균주 중 적어도 하나인 시스템.
  25. 제 13 항 내지 제 24 항 중 어느 한 항의 방법을 사용하여 생산된 미생물 균주.
  26. 유전자 변형을 포함하는 적어도 하나의 관심 생성물의 유전자 제조 시스템에서 생산을 제어하기 위한 빌드 그래프 데이터 구조를 생성하기 위한 명령을 저장하는 하나 이상의 비 일시적 컴퓨터 판독 가능 매체로서, 여기서 명령은, 하나 이상의 컴퓨팅 장치에 의해 실행될 때, 하나 이상의 컴퓨팅 장치 중 적어도 하나가
    생물학적 워크플로우의 설명에 접근하고, 상기 설명은 생물학적 성분의 표현을 포함한다; 및
    워크플로우 설명에 적어도 부분적으로 기초하여 빌드 그래프 데이터 구조를 조립하게 하며,
    여기서 빌드 그래프 데이터 구조에서, 각각의 생물학적 성분은 복수의 레벨의 레벨의 한 레벨에 상주하는 노드로 표현되고,
    여기서 복수의 레벨의 소정의 레벨에서 하나 이상의 소스 노드, 및 소정의 레벨의 자식 레벨에서 목적 노드는 자식 레벨에 상응하는 하나 이상의 반응 그룹의 한 반응 그룹을 구성하고,
    여기서 각각의 반응 그룹은 소정의 레벨에서 하나 이상의 소스 노드에 의해 그들 자신이 표현되는 하나 이상의 생물학적 성분 사이의 반응을 나타내어 자식 레벨에서 반응 그룹의 단일 목적 노드에 의해 표현되는 생물학적 성분을 생성하며,
    여기서 자식 레벨에서 하나 이상의 목적 노드는 소정의 레벨의 손자 레벨에서 하나 이상의 반응 그룹의 반응 그룹에서 하나 이상의 소스 노드로서 작용하며, 및
    여기서 복수의 레벨의 최종 레벨에서 적어도 하나의 목적 노드는 적어도 하나의 관심 생성물을 나타내며, 이는 상이한 레벨에서 생물학적 성분 사이의 반응에 의해 야기된 유전자 변형을 포함하며, 및
    여기서 빌드 그래프 데이터 구조를 처리하는 것은 적어도 하나의 관심 생성물의 생산을 초래하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  27. 제 26 항에 있어서,
    적어도 하나의 관심 생성물은 뉴클레오타이드 서열 또는 미생물 균주를 포함하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  28. 제 26 항 또는 제 27 항에 있어서,
    소정의 레벨에서 하나 이상의 소스 노드 중 적어도 하나가 2개의 상이한 반응 그룹에 속하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  29. 제 26 항 내지 제 28 항 중 어느 한 항에 있어서,
    하나 이상의 메모리는 상이한 팩토리 오더에 대한 2개 이상의 워크플로우 단계가 공통 워크플로우 단계의 반응 단계의 공통성에 적어도 부분적으로 기초하여 함께 처리될 수 있는 공통 워크플로우 단계임을 결정하기 위한 추가 명령을 저장하며,
    여기서 빌드 그래프 데이터 구조를 조립하는 것은 공통 워크플로우 단계에 적어도 부분적으로 기초하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  30. 제 26 항 내지 제 29 항 중 어느 한 항에 있어서,
    하나 이상의 반응 그룹 중 제 1 반응 그룹의 제 1 목적 노드는 제 1 반응 그룹에서 하나 이상의 소스 노드로 표시되는 하나 이상의 생물학적 성분에 적용된 하나 이상의 반응으로부터 생성되도록 계산된 비 결정적 생물학적 성분 세트를 나타내는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  31. 제 26 항 내지 제 30 항 중 어느 한 항에 있어서,
    제 1 목적 노드는 제 2 생물학적 성분의 하나 이상의 비 결정적 위치에서의 하나 이상의 제 1 생물학적 성분 중 하나의 삽입으로부터 생성되도록 계산된 비 결정적 생물학적 성분 세트를 나타내며, 여기서 제 2 생물학적 성분은 생물학적 서열인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  32. 제 26 항 내지 제 31 항 중 어느 한 항에 있어서,
    제 1 목적 노드는 제 2 생물학적 성분 내의 하나 이상의 상응하는 특정 위치에서 하나 이상의 생물학적 성분에 대한 비 결정적 변화로부터 생성되도록 계산된 비 결정적 생물학적 성분 세트를 나타내며, 여기서 제 2 생물학적 성분은 생물학적 서열인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  33. 제 26 항 내지 제 32 항 중 어느 한 항에 있어서,
    비 결정적 변화는 제 2 생물학적 성분 내의 하나 이상의 특정 위치의 각각에서 제 1 생물학적 성분에 의한 대체를 포함하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  34. 제 26 항 내지 제 33 항 중 어느 한 항에 있어서,
    각각의 제 1 생물학적 성분이 뉴클레오타이드이고 제 2 생물학적 성분이 뉴클레오타이드 서열인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  35. 제 26 항 내지 제 34 항 중 어느 한 항에 있어서,
    반응 그룹 내의 소정의 레벨의 제 1 소스 노드는 복수의 제 1 생물학적 성분을 나타내거나, 자식 레벨의 목적 노드는 복수의 제 2 생물학적 성분을 나타내는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  36. 제 26 항 내지 제 35 항 중 어느 한 항에 있어서,
    소정의 레벨에서 하나 이상의 소스 노드로 표시되는 하나 이상의 생물학적 성분은 미생물 균주이고, 균주 사이의 반응은 균주 사이의 수평 유전자 전달을 포함하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  37. 제 26 항 내지 제 36 항 중 어느 한 항에 있어서,
    각각의 생물학적 성분이 뉴클레오타이드 서열 또는 미생물 균주 중 적어도 하나인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  38. 유전자 변형을 포함하는 하나 이상의 관심 생성물의 유전자 제조 시스템에서 생산을 제어하기 위해 팩토리 오더를 처리하기 위한 시스템으로서, 시스템은
    하나 이상의 프로세서; 및
    하나 이상의 프로세서 중 적어도 하나에 의해 실행될 때, 시스템이
    복수의 팩토리 오더에 접근하고, 여기서 각각의 팩토리 오더는 하나 이상의 관심 생성물을 구축하기 위한 하나 이상의 유전자 디자인 기술을 나타낸다;
    복수의 팩토리 오더의 상이한 팩토리 오더를 구축하기 위한 워크플로우에 대한 2개 이상의 워크플로우 단계는 공통 워크플로우 단계의 공통 반응 단계의 공통성에 적어도 부분적으로 기초하여 함께 처리될 수 있는 공통 워크플로우 단계인 것을 측정하게 하고, 여기서 각각의 워크플로우는 일련의 워크플로우 단계를 포함하며 각각의 워크플로우 단계는 하나 이상의 반응 단계를 포함한다; 및
    공통 워크플로우 단계에 적어도 부분적으로 기초하여 빌드 그래프 데이터 구조를 생성하게 하는 명령을 저장하는 하나 이상의 메모리를 포함하는 것인 시스템.
  39. 제 38 항에 있어서,
    빌드 그래프 데이터 구조의 소정의 레벨에서 공통 워크플로우 단계들의 처리를 나타내는 목적 노드는, 소정의 레벨의 자식 레벨에서 2개 이상의 목적 노드에 연결되는 소스 노드로서 작용하는 것인 시스템.
  40. 제 38 항 또는 제 39 항에 있어서,
    하나 이상의 메모리는 상이한 팩토리 오더에 적어도 부분적으로 기초하여 2개 이상의 공통 워크플로우 단계를 결정하기 위한 추가 명령을 저장하는 것인 시스템.
  41. 유전자 변형을 포함하는 하나 이상의 관심 생성물의 유전자 제조 시스템에서의 생산을 제어하기 위해 팩토리 오더를 처리하기 위한 컴퓨터 구현 방법으로서, 방법은
    복수의 팩토리 오더에 접근하는 단계, 여기서 각각의 팩토리 오더는 하나 이상의 관심 생성물을 구축하기 위한 하나 이상의 유전자 디자인 기술을 나타낸다;
    복수의 팩토리 오더의 상이한 팩토리 오더를 구축하기 위한 워크플로우에 대한 2개 이상의 워크플로우 단계는 공통 워크플로우 단계의 공통 반응 단계의 공통성에 적어도 부분적으로 기초하여 함께 처리될 수 있는 공통 워크플로우 단계인 것을 측정하게 하는 단계, 여기서 각각의 워크플로우는 일련의 워크플로우 단계를 포함하며 각각의 워크플로우 단계는 하나 이상의 반응 단계를 포함한다; 및
    공통 워크플로우 단계에 적어도 부분적으로 기초하여 빌드 그래프 데이터 구조를 생성하게 하는 단계를 포함하는 것인 컴퓨터 구현 방법.
  42. 제 41 항에 있어서,
    빌드 그래프 데이터 구조의 소정의 레벨에서 공통 워크플로우 단계들의 처리를 나타내는 목적 노드는, 소정의 레벨의 자식 레벨에서 2개 이상의 목적 노드에 연결되는 소스 노드로서 작용하는 것인 컴퓨터 구현 방법.
  43. 제 41 항 또는 제 42 항에 있어서,
    상이한 팩토리 오더에 적어도 부분적으로 기초하여 2개 이상의 공통 워크플로우 단계를 결정하는 단계를 추가로 포함하는 것인 컴퓨터 구현 방법.
  44. 제 41 항 내지 제 43 항 중 어느 한 항의 방법을 사용하여 생산된 미생물 균주.
  45. 유전자 변형을 포함하는 적어도 하나의 관심 생성물의 유전자 제조 시스템에서 생산을 제어하기 위한 빌드 그래프 데이터 구조를 생성하기 위한 명령을 저장하는 하나 이상의 비 일시적 컴퓨터 판독 가능 매체로서, 여기서 명령은, 하나 이상의 컴퓨팅 장치에 의해 실행될 때, 하나 이상의 컴퓨팅 장치 중 적어도 하나가
    복수의 팩토리 오더에 접근하고, 여기서 각각의 팩토리 오더는 하나 이상의 관심 생성물을 구축하기 위한 하나 이상의 유전자 디자인 기술을 나타낸다;
    복수의 팩토리 오더의 상이한 팩토리 오더를 구축하기 위한 워크플로우에 대한 2개 이상의 워크플로우 단계는 공통 워크플로우 단계의 공통 반응 단계의 공통성에 적어도 부분적으로 기초하여 함께 처리될 수 있는 공통 워크플로우 단계인 것을 측정하게 하고, 여기서 각각의 워크플로우는 일련의 워크플로우 단계를 포함하며 각각의 워크플로우 단계는 하나 이상의 반응 단계를 포함한다; 및
    공통 워크플로우 단계에 적어도 부분적으로 기초하여 빌드 그래프 데이터 구조를 생성하게 하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  46. 제 45 항에 있어서,
    빌드 그래프 데이터 구조의 소정의 레벨에서 공통 워크플로우 단계들의 처리를 나타내는 목적 노드는, 소정의 레벨의 자식 레벨에서 2개 이상의 목적 노드에 연결되는 소스 노드로서 작용하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  47. 제 45 항 또는 제 46 항에 있어서,
    상이한 팩토리 오더에 적어도 부분적으로 기초하여 2개 이상의 공통 워크플로우 단계를 결정하기 위한 추가 명령을 저장하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  48. 유전자 변형을 포함하는 관심 생성물의 유전자 제조 시스템에서의 생산을 제어하기 위한 빌드 그래프 데이터 구조를 처리하기 위한 시스템으로서, 시스템은
    하나 이상의 프로세서; 및
    하나 이상의 프로세서 중 적어도 하나에 의해 실행될 때, 시스템이
    복수의 노드를 포함하는 빌드 그래프 데이터 구조에 접근하고,
    여기서 각각의 노드는 생물학적 성분을 나타내고 복수의 레벨의 한 레벨에 상주하고,
    복수의 레벨의 소정의 레벨에서 하나 이상의 소스 노드 및 소정의 레벨의 자식 레벨에서 목적 노드는 자식 레벨에 상응하는 하나 이상의 반응 그룹의 반응 그룹을 구성하고, 및
    각각의 반응 그룹은 소정의 레벨에서 하나 이상의 소스 노드에 의해 그들 자신이 표현되는 하나 이상의 생물학적 성분 사이의 반응을 나타내어 자식 레벨에서 반응 그룹의 단일 목적 노드에 의해 표현되는 생물학적 성분을 생성한다; 및
    복수의 레벨에서 빌드 그래프 데이터 구조를 가로질러 복수의 레벨의 노드에 상응하는 생물학적 성분을 관심 생성물을 생성하기 위한 물리적 실험실 장비에 맵핑하게 하는 명령을 저장하는 하나 이상의 메모리를 포함하는 것인 시스템.
  49. 제 48 항에 있어서,
    하나 이상의 메모리는 상응하는 생물학적 성분의 전달을 소싱하기 위한 소스 물리적 매체의 수를 결정하여 소스 물리적 매체 내의 생물학적 성분의 양에 적어도 부분적으로 기초하여 자식 레벨에서 각 반응 그룹 내의 목적 노드에 의해 표현되는 생물학적 성분을 생성하는 추가 명령을 저장하는 것인 시스템.
  50. 제 48 항 또는 제 49 항에 있어서,
    빌드 그래프 데이터 구조를 가로지르는 것은 하나 이상의 각각의 물리적 캐리어의 물리적 매체상의 생물학적 성분의 하나 이상의 레이아웃을 결정하는 단계를 포함하는 것인 시스템.
  51. 제 48 항 내지 제 50 항 중 어느 한 항에 있어서,
    물리적 매체상의 생물학적 성분의 하나 이상의 레이아웃을 결정하는 단계는 하나 이상의 공정 변형에 적어도 부분적으로 기초하는 것인 시스템.
  52. 제 48 항 내지 제 51 항 중 어느 한 항에 있어서,
    하나 이상의 공정 변형은 물리적 캐리어 상의 물리적 매체의 위치와 관련되는 것인 시스템.
  53. 제 48 항 내지 제 52 항 중 어느 한 항에 있어서,
    물리적 매체상의 생물학적 성분의 하나 이상의 레이아웃을 결정하는 단계는 소스 물리적 매체로부터 목적 물리적 매체로 생물학적 성분의 효율적인 전달을 위한 하나 이상의 레이아웃을 최적화하는 것에 적어도 부분적으로 기초하는 것인 시스템.
  54. 제 48 항 내지 제 53 항 중 어느 한 항에 있어서,
    하나 이상의 메모리는 최종 물리적 캐리어의 물리적 매체상에 생물학적 성분의 최종 레이아웃을 수신하기 위한 추가 명령을 저장하며,
    최종 레이아웃의 각각의 생물학적 성분은 빌드 그래프 데이터 구조의 최종 레벨에서 목적지 노드에 의해 표현되며,
    가로지르는 것은 복수의 레벨의 상응하는 하나 이상의 비 최종 레벨에서 하나 이상의 각각의 물리적 캐리어의 물리적 매체상의 생물학적 성분의 하나 이상의 레이아웃을 결정하는 단계를 더 포함하는 것인 시스템.
  55. 제 48 항 내지 제 54 항 중 어느 한 항에 있어서,
    하나 이상의 메모리는 소정의 레벨의 빌드 그래프 데이터 구조에서 하나 이상의 반응 그룹의 각 반응 그룹 내의 하나 이상의 소스 노드로부터, 소정의 레벨에서 하나 이상의 반응 그룹 내의 하나 이상의 목적 노드에 상응하는 하나 이상의 목적 성분을 생산하는 데 사용되는 소정의 레벨에서 모든 반응 그룹의 하나 이상의 소스 노드에 상응하는 각각의 생물학적 성분의 예의 수를 측정하고; 및
    상응하는 생물학적 성분의 예의 수에 적어도 부분적으로 기초하여 소정의 레벨에서 각각의 반응 그룹 내에서 목적 성분을 생산하기 위해 상응하는 생물학적 성분의 전달을 소싱하기 위한 소스 물리적 매체의 수를 결정하기 위한 추가 명령을 저장하는 것인 시스템.
  56. 제 48 항 내지 제 55 항 중 어느 한 항에 있어서,
    상응하는 생물학적 성분의 전달을 소싱하기 위해 결정된 소스 물리적 매체의 수는 소스 물리적 매체의 적어도 하나의 물리적 제약에 적어도 부분적으로 기초하는 것인 시스템.
  57. 제 48 항 내지 제 56 항 중 어느 한 항에 있어서,
    적어도 하나의 물리적 제약은 소스 물리적 매체 내의 생물학적 성분의 양을 포함하는 것인 시스템.
  58. 제 48 항 내지 제 57 항 중 어느 한 항에 있어서,
    물리적 캐리어는 플레이트이고, 물리적 캐리어의 물리적 매체는 플레이트 상에 다수의 웰을 포함하는 것인 시스템.
  59. 제 48 항 내지 제 58 항 중 어느 한 항에 있어서,
    복수의 레벨의 최종 레벨에서 물리 캐리어의 물리 매체는 관심 생성물을 지원하는 것인 시스템.
  60. 제 48 항 내지 제 59 항 중 어느 한 항에 있어서,
    관심 생성물은 뉴클레오타이드 서열 또는 미생물 균주를 포함하는 것인 시스템.
  61. 유전자 변형을 포함하는 관심 생성물의 유전자 제조 시스템에서의 생산을 제어하기 위한 빌드 그래프 데이터 구조를 처리하기 위한 컴퓨터 구현 방법으로서, 방법은
    복수의 노드를 포함하는 빌드 그래프 데이터 구조에 접근하는 단계,
    여기서 각각의 노드는 생물학적 성분을 나타내고 복수의 레벨의 한 레벨에 상주하고,
    복수의 레벨의 소정의 레벨에서 하나 이상의 소스 노드 및 소정의 레벨의 자식 레벨에서 목적 노드는 자식 레벨에 상응하는 하나 이상의 반응 그룹의 반응 그룹을 구성하고, 및
    각각의 반응 그룹은 소정의 레벨에서 하나 이상의 소스 노드에 의해 그들 자신이 표현되는 하나 이상의 생물학적 성분 사이의 반응을 나타내어 자식 레벨에서 반응 그룹의 단일 목적 노드에 의해 표현되는 생물학적 성분을 생성한다; 및
    복수의 레벨에서 빌드 그래프 데이터 구조를 가로질러 복수의 레벨의 노드에 상응하는 생물학적 성분을 관심 생성물을 생성하기 위한 물리적 실험실 장비에 맵핑하게 하는 단계를 포함하는 것인 방법.
  62. 제 61 항에 있어서,
    상응하는 생물학적 성분의 전달을 소싱하기 위한 소스 물리적 매체의 수를 결정하여 소스 물리적 매체 내의 생물학적 성분의 양에 적어도 부분적으로 기초하여 자식 레벨에서 각 반응 그룹 내의 목적 노드에 의해 표현되는 생물학적 성분을 생성하는 단계를 추가로 포함하는 것인 방법
  63. 제 61 항 또는 제 62 항에 있어서,
    빌드 그래프 데이터 구조를 가로지르는 것은 하나 이상의 각각의 물리적 캐리어의 물리적 매체상의 생물학적 성분의 하나 이상의 레이아웃을 결정하는 단계를 포함하는 것인 방법.
  64. 제 61 항 내지 제 63 항 중 어느 한 항에 있어서,
    물리적 매체상의 생물학적 성분의 하나 이상의 레이아웃을 결정하는 단계는 하나 이상의 공정 변형에 적어도 부분적으로 기초하는 것인 방법.
  65. 제 61 항 내지 제 64 항 중 어느 한 항에 있어서,
    하나 이상의 공정 변형은 물리적 캐리어 상의 물리적 매체의 위치와 관련되는 것인 방법.
  66. 제 61 항 내지 제 65 항 중 어느 한 항에 있어서,
    물리적 매체상의 생물학적 성분의 하나 이상의 레이아웃을 결정하는 단계는 소스 물리적 매체로부터 목적 물리적 매체로 생물학적 성분의 효율적인 전달을 위한 하나 이상의 레이아웃을 최적화하는 것에 적어도 부분적으로 기초하는 것인 방법.
  67. 제 61 항 내지 제 66 항 중 어느 한 항에 있어서,
    최종 물리적 캐리어의 물리적 매체상에 생물학적 성분의 최종 레이아웃을 수신하기 위한 추가 명령을 저장하며, 여기서 최종 레이아웃의 각각의 생물학적 성분은 빌드 그래프 데이터 구조의 최종 레벨에서 목적지 노드에 의해 표현되며,
    가로지르는 것은 복수의 레벨의 상응하는 하나 이상의 비 최종 레벨에서 하나 이상의 각각의 물리적 캐리어의 물리적 매체상의 생물학적 성분의 하나 이상의 레이아웃을 결정하는 단계를 더 포함하는 것인 방법.
  68. 제 61 항 내지 제 67 항 중 어느 한 항에 있어서,
    소정의 레벨의 빌드 그래프 데이터 구조에서 하나 이상의 반응 그룹의 각 반응 그룹 내의 하나 이상의 소스 노드로부터, 소정의 레벨에서 하나 이상의 반응 그룹 내의 하나 이상의 목적 노드에 상응하는 하나 이상의 목적 성분을 생산하는 데 사용되는 소정의 레벨에서 모든 반응 그룹의 하나 이상의 소스 노드에 상응하는 각각의 생물학적 성분의 예의 수를 측정하는 단계; 및
    상응하는 생물학적 성분의 예의 수에 적어도 부분적으로 기초하여 소정의 레벨에서 각각의 반응 그룹 내에서 목적 성분을 생산하기 위해 상응하는 생물학적 성분의 전달을 소싱하기 위한 소스 물리적 매체의 수를 결정하는 단계를 포함하는 것인 방법.
  69. 제 61 항 내지 제 68 항 중 어느 한 항에 있어서,
    상응하는 생물학적 성분의 전달을 소싱하기 위해 결정된 소스 물리적 매체의 수는 소스 물리적 매체의 적어도 하나의 물리적 제약에 적어도 부분적으로 기초하는 것인 방법.
  70. 제 61 항 내지 제 69 항 중 어느 한 항에 있어서,
    적어도 하나의 물리적 제약은 소스 물리적 매체 내의 생물학적 성분의 양을 포함하는 것인 방법.
  71. 제 61 항 내지 제 70 항 중 어느 한 항에 있어서,
    물리적 캐리어는 플레이트이고, 물리적 캐리어의 물리적 매체는 플레이트 상에 다수의 웰을 포함하는 것인 방법.
  72. 제 61 항 내지 제 71 항 중 어느 한 항에 있어서,
    복수의 레벨의 최종 레벨에서 물리 캐리어의 물리 매체는 관심 생성물을 지원하는 것인 방법.
  73. 제 61 항 내지 제 72 항 중 어느 한 항에 있어서,
    관심 생성물은 뉴클레오타이드 서열 또는 미생물 균주를 포함하는 것인 방법.
  74. 제 61 항 내지 제 73 항 중 어느 한 항의 방법을 사용하여 생산된 미생물 균주.
  75. 유전자 변형을 포함하는 관심 생성물의 유전자 제조 시스템에서의 생산을 제어하기 위한 빌드 그래프 데이터 구조를 처리하기 위한 명령을 저장하는 하나 이상의 비 일시적 컴퓨터 판독 가능 매체로서, 여기서 명령은, 하나 이상의 컴퓨팅 장치에 의해 실행될 때, 하나 이상의 컴퓨팅 장치 중 적어도 하나가
    복수의 노드를 포함하는 빌드 그래프 데이터 구조에 접근하고, 여기서 각각의 노드는 생물학적 성분을 나타내고 복수의 레벨의 한 레벨에 상주하고,
    복수의 레벨의 소정의 레벨에서 하나 이상의 소스 노드 및 소정의 레벨의 자식 레벨에서 목적 노드는 자식 레벨에 상응하는 하나 이상의 반응 그룹의 반응 그룹을 구성하고,
    각각의 반응 그룹은 소정의 레벨에서 하나 이상의 소스 노드에 의해 그들 자신이 표현되는 하나 이상의 생물학적 성분 사이의 반응을 나타내어 자식 레벨에서 반응 그룹의 단일 목적 노드에 의해 표현되는 생물학적 성분을 생성한다; 및
    복수의 레벨에서 빌드 그래프 데이터 구조를 가로질러 복수의 레벨의 노드에 상응하는 생물학적 성분을 관심 생성물을 생성하기 위한 물리적 실험실 장비에 맵핑하게 하는 명령을 저장하는 하나 이상의 메모리를 포함하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  76. 제 75 항에 있어서,
    상응하는 생물학적 성분의 전달을 소싱하기 위한 소스 물리적 매체의 수를 결정하여 소스 물리적 매체 내의 생물학적 성분의 양에 적어도 부분적으로 기초하여 자식 레벨에서 각 반응 그룹 내의 목적 노드에 의해 표현되는 생물학적 성분을 생성하는 추가 명령을 저장하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  77. 제 75 항 또는 제 76 항에 있어서,
    빌드 그래프 데이터 구조를 가로지르는 것은 하나 이상의 각각의 물리적 캐리어의 물리적 매체상의 생물학적 성분의 하나 이상의 레이아웃을 결정하는 단계를 포함하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  78. 제 75 항 내지 제 77 항 중 어느 한 항에 있어서,
    물리적 매체상의 생물학적 성분의 하나 이상의 레이아웃을 결정하는 단계는 하나 이상의 공정 변형에 적어도 부분적으로 기초하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  79. 제 75 항 내지 제 78 항 중 어느 한 항에 있어서,
    하나 이상의 공정 변형은 물리적 캐리어 상의 물리적 매체의 위치와 관련되는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  80. 제 75 항 내지 제 79 항 중 어느 한 항에 있어서,
    물리적 매체상의 생물학적 성분의 하나 이상의 레이아웃을 결정하는 단계는 소스 물리적 매체로부터 목적 물리적 매체로 생물학적 성분의 효율적인 전달을 위한 하나 이상의 레이아웃을 최적화하는 것에 적어도 부분적으로 기초하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  81. 제 75 항 내지 제 80 항 중 어느 한 항에 있어서,
    최종 물리적 캐리어의 물리적 매체상에 생물학적 성분의 최종 레이아웃을 수신하기 위한 추가 명령을 저장하며,
    최종 레이아웃의 각각의 생물학적 성분은 빌드 그래프 데이터 구조의 최종 레벨에서 목적지 노드에 의해 표현되며,
    가로지르는 것은 복수의 레벨의 상응하는 하나 이상의 비 최종 레벨에서 하나 이상의 각각의 물리적 캐리어의 물리적 매체상의 생물학적 성분의 하나 이상의 레이아웃을 결정하는 단계를 더 포함하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  82. 제 75 항 내지 제 81 항 중 어느 한 항에 있어서,
    소정의 레벨의 빌드 그래프 데이터 구조에서 하나 이상의 반응 그룹의 각 반응 그룹 내의 하나 이상의 소스 노드로부터, 소정의 레벨에서 하나 이상의 반응 그룹 내의 하나 이상의 목적 노드에 상응하는 하나 이상의 목적 성분을 생산하는 데 사용되는 소정의 레벨에서 모든 반응 그룹의 하나 이상의 소스 노드에 상응하는 각각의 생물학적 성분의 예의 수를 측정하고; 및
    상응하는 생물학적 성분의 예의 수에 적어도 부분적으로 기초하여 소정의 레벨에서 각각의 반응 그룹 내에서 목적 성분을 생산하기 위해 상응하는 생물학적 성분의 전달을 소싱하기 위한 소스 물리적 매체의 수를 결정하기 위한 추가 명령을 저장하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  83. 제 75 항 내지 제 82 항 중 어느 한 항에 있어서,
    상응하는 생물학적 성분의 전달을 소싱하기 위해 결정된 소스 물리적 매체의 수는 소스 물리적 매체의 적어도 하나의 물리적 제약에 적어도 부분적으로 기초하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  84. 제 75 항 내지 제 83 항 중 어느 한 항에 있어서,
    적어도 하나의 물리적 제약은 소스 물리적 매체 내의 생물학적 성분의 양을 포함하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  85. 제 74 항 내지 제 84 항 중 어느 한 항에 있어서,
    물리적 캐리어는 플레이트이고, 물리적 캐리어의 물리적 매체는 플레이트 상에 다수의 웰을 포함하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  86. 제 75 항 내지 제 85 항 중 어느 한 항에 있어서,
    복수의 레벨의 최종 레벨에서 물리 캐리어의 물리 매체는 관심 생성물을 지원하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  87. 제 75 항 내지 제 86 항 중 어느 한 항에 있어서,
    관심 생성물은 뉴클레오타이드 서열 또는 미생물 균주를 포함하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  88. 유전자 변형을 포함하는 관심 생성물을 생성하기 위해 복수의 자동화 장비 상에 생물학적 프로토콜을 구현하기 위한 시스템으로서, 여기서 자동화 장비의 상이한 장비는 각각 상이한 기계-특정 언어로 기계-특정 명령에 따라 생물학적 프로토콜을 구현하며,
    하나 이상의 프로세서; 및
    하나 이상의 프로세서 중 적어도 하나에 의해 실행될 때, 시스템이
    하나 이상의 팩토리 오더에 적어도 부분적으로 기초하여 객체 명령을 발행하며, 객체 명령은 복수의 자동화 장비가 생물학적 프로토콜을 실행하도록 명령한다; 및
    복수의 기계-특정 언어의 한 기계-특정 언어로 객체 명령을 기계-특정 명령으로 번역하게 하는 명령을 저장하는 하나 이상의 메모리를 포함하며,
    각각의 자동화 장비는 관심 생성물을 생성하기 위한 경로를 따라 생물학적 성분을 생성하기 위한 생물학적 프로토콜을 구현하기 위해 각각의 기계-특정 언어로 기계-특정 명령을 실행하도록 동작 가능하고, 적어도 2개의 자동화 장비는 상이한 기계-특정 언어에 따라 동작하는 것인 시스템.
  89. 제 88 항에 있어서,
    하나 이상의 메모리는 상이한 팩토리 오더에 대한 공통 워크플로우 단계를 나타내는 빌드 그래프 데이터 구조를 생성하기 위한 추가 명령을 저장하는 것인 시스템.
  90. 제 88 항 또는 제 89 항에 있어서,
    하나 이상의 메모리는 하나 이상의 자동화 장비와 관련된 메세지에 적어도 부분적으로 기초하여 생물학적 프로토콜을 실행할 수 있는 하나 이상의 자동화 장비를 결정하고,
    객체 명령을 이용 가능한 자동화 장비에 지시하기 명령을 추가로 저장하는 것인 시스템.
  91. 제 88 항 내지 제 90 항 중 어느 한 항에 있어서,
    프로토콜은 생물학적 성분을 소스 물리적 캐리어로부터 목적 물리적 캐리어로 전달하는 단계를 포함하는 것인 시스템.
  92. 유전자 변형을 포함하는 관심 생성물을 생성하기 위해 복수의 자동화 장비 상에 생물학적 프로토콜을 구현하기 위한 컴퓨터 구현 방법으로서, 자동화 장비의 상이한 장비는 각각 상이한 기계-특정 언어로 기계-특정 명령에 따라 생물학적 프로토콜을 구현하며, 방법은
    하나 이상의 팩토리 오더에 적어도 부분적으로 기초하여 객체 명령을 발행하는 단계, 객체 명령은 복수의 자동화 장비가 생물학적 프로토콜을 실행하도록 명령한다; 및
    복수의 기계-특정 언어의 한 기계-특정 언어로 객체 명령을 기계-특정 명령으로 번역하는 단계를 포함하며,
    각각의 자동화 장비는 관심 생성물을 생성하기 위한 경로를 따라 생물학적 성분을 생성하기 위한 생물학적 프로토콜을 구현하기 위해 각각의 기계-특정 언어로 기계-특정 명령을 실행하도록 동작 가능하고, 적어도 2개의 자동화 장비는 상이한 기계-특정 언어에 따라 동작하는 것인 방법.
  93. 제 92 항에 있어서,
    상이한 팩토리 오더에 대한 공통 워크플로우 단계를 표현하는 빌드 그래프 데이터 구조를 생성하는 단계를 추가로 포함하는 것인 방법.
  94. 제 92 항 또는 제 93 항에 있어서,
    하나 이상의 자동화 장비와 관련된 메세지에 적어도 부분적으로 기초하여 생물학적 프로토콜을 실행할 수 있는 하나 이상의 자동화 장비를 결정하는 단계,
    객체 명령을 이용 가능한 자동화 장비에 지시하는 단계를 추가로 포함하는 것인 방법.
  95. 제 92 항 내지 제 94 항 중 어느 한 항에 있어서,
    프로토콜은 생물학적 성분을 소스 물리적 캐리어로부터 목적 물리적 캐리어로 전달하는 단계를 포함하는 것인 방법.
  96. 제 92 항 내지 제 95 항 중 어느 한 항의 방법을 사용하여 생산된 미생물 균주.
  97. 유전자 변형을 포함하는 관심 생성물을 생성하기 위해 복수의 자동화 장비 상에 생물학적 프로토콜을 구현하기 위한 명령을 저장하는 하나 이상의 비 일시적 컴퓨터 판독 가능 매체로서, 자동화 장비의 상이한 장비는 각각 상이한 기계-특정 언어로 기계-특정 명령에 따라 생물학적 프로토콜을 구현하며, 여기서 명령은, 하나 이상의 컴퓨팅 장치에 의해 실행될 때, 하나 이상의 컴퓨팅 장치 중 적어도 하나가
    하나 이상의 팩토리 오더에 적어도 부분적으로 기초하여 객체 명령을 발행하고, 객체 명령은 복수의 자동화 장비가 생물학적 프로토콜을 실행하도록 명령한다; 및
    복수의 기계-특정 언어의 한 기계-특정 언어로 객체 명령을 기계-특정 명령으로 번역하게 하며,
    각각의 자동화 장비는 관심 생성물을 생성하기 위한 경로를 따라 생물학적 성분을 생성하기 위한 생물학적 프로토콜을 구현하기 위해 각각의 기계-특정 언어로 기계-특정 명령을 실행하도록 동작 가능하고, 적어도 2개의 자동화 장비는 상이한 기계-특정 언어에 따라 동작하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  98. 제 97 항에 있어서,
    상이한 팩토리 오더에 대한 공통 워크플로우 단계를 표현하는 빌드 그래프 데이터 구조를 생성하는 추가 명령을 저장하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  99. 제 97 항 또는 제 98 항에 있어서,
    하나 이상의 자동화 장비와 관련된 메세지에 적어도 부분적으로 기초하여 생물학적 프로토콜을 실행할 수 있는 하나 이상의 자동화 장비를 결정하고,
    객체 명령을 이용 가능한 자동화 장비에 지시하는 추가 명령을 저장하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  100. 제 97 항 내지 제 99 항 중 어느 한 항에 있어서,
    프로토콜은 생물학적 성분을 소스 물리적 캐리어로부터 목적 물리적 캐리어로 전달하는 단계를 포함하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  101. 복수의 생물학적 성분의 품질 테스트를 디자인하기 위한 컴퓨터 구현 방법으로서, 방법은
    하나 이상의 표적 생물학적 성분에 대한 하나 이상의 분석을 인 실리코에서 수행하는 단계, 하나 이상의 생물학적 성분에 대한 각각의 분석의 인 실리코 실행은 하나 이상의 표적 생물학적 성분의 하나를 필요로 하는 분석 반응으로부터 얻은 하나 이상의 분석 반응 생성물을 생산한다;
    각각의 분석의 2개 이상의 예상 결과를 분석에 관한 실험적 정보에 적어도 부분적으로 기초하여 적어도 하나의 성공 모드 또는 적어도 하나의 실패 모드의 그룹으로 분류하는 단계; 및
    (a) 하나 이상의 분석 반응 생성물의 속성, 및 (b) 2개 이상의 예상 결과의 분류를 포함하는 참조 정보를 하나 이상의 분석 반응 생성물에 대해 분석 데이터 구조로 저장하는 단계를 포함하며,
    상기 분석 데이터 구조의 처리는 (a) 각각의 물리적 분석을 위해 하나 이상의 물리적 분석 반응을 생성하기 위해 물리적 실험실 장비를 사용하여 하나 이상의 표적 생물학적 성분에 대해 하나 이상의 인 실리코 분석에 상응하는 하나 이상의 물리적 분석을 수행하고 및 (b) 각각의 물리적 분석을 위해, 하나 이상의 물리적 분석 반응 생성물을 상응하는 참조 정보와 비교하여 적어도 하나의 성공 모드 또는 적어도 하나의 실패 모드에 상응하는 것으로서 표적 생물학적 성분을 분류하는 것을 초래하는 것인 컴퓨터 구현 방법.
  102. 제 101 항에 있어서,
    분석 데이터 구조는 하나 이상의 표적 생물학적 성분에 대한 하나 이상의 분석을 위해, 복수의 분석 노드를 포함하는 복수의 레벨을 포함하는 지향 그래프이며, 지향 그래프에서,
    복수의 레벨의 한 레벨에 상주하는 각각의 분석 노드는 하나 이상의 표적 생물학적 성분, 하나 이상의 분석 반응물 또는 하나 이상의 분석 반응 생성물 중 하나를 나타내고,
    복수의 분석 노드의 표적 분석 노드는 소정의 레벨에서 하나 이상의 표적 생물학적 성분의 표적 생물학적 성분을 나타내고,
    표적 분석 노드와 관련된 복수의 분석 노드의 분석 반응 생성물 노드는, 소정의 레벨의 자식 레벨에서, 하나 이상의 분석 반응 생성물 및 참조 정보를 나타내는 것인 방법.
  103. 제 101 항 또는 제 102항에 있어서,
    소정의 레벨은 소정의 레벨에서 표적 생물학적 성분과 인 실리코에서 반응하는 적어도 하나의 분석 반응물을 나타내는 적어도 하나의 분석 반응물 노드를 포함하는 것인 방법.
  104. 제 101 항 내지 제 103 항 중 어느 한 항에 있어서,
    소정의 레벨의 표적 분석 노드 및 분석 반응물 노드 및 자식 레벨의 분석 반응 생성물 노드는 자식 레벨에 상응하는 하나 이상의 분석 반응 그룹의 한 분석 반응 그룹을 구성하는 것인 방법.
  105. 제 101 항 내지 제 104 항 중 어느 한 항에 있어서,
    각각의 분석은 하나 이상의 분석 단계를 포함하고, 각각의 분석 단계는 복수의 분석 반응 단계의 한 분석 반응 단계를 포함하며, 방법은
    상이한 분석의 하나 이상의 분석 단계가 공통 분석 단계의 하나 이상의 분석 반응 단계의 공통성에 적어도 부분적으로 기초하여 함께 처리될 수 있는 공통 분석 단계인 것을 결정하는 단계; 및
    공통 분석 단계에 적어도 부분적으로 기초하여 분석 데이터 구조를 생성하는 단계를 추가로 포함하는 것인 방법.
  106. 제 101 항 내지 제 105 항 중 어느 한 항에 있어서,
    공통 분석 단계가 동일한 분석 반응물과 관련되는 것인 방법.
  107. 제 101 항 내지 제 106 항 중 어느 한 항에 있어서,
    공통 분석 단계에 필요한 분석 반응물의 양을 결정하는 단계를 추가로 포함하는 것인 방법.
  108. 제 101 항 내지 제 107 항 중 어느 한 항에 있어서,
    분석에 관한 실험적 정보는 하나 이상의 분석 반응 생성물에 관한 실험적 정보를 포함하는 것인 방법.
  109. 제 101 항 내지 제 108 항 중 어느 한 항에 있어서,
    분류하는 단계는 분석 반응, 분석 반응에 관여하는 분석 반응물 및 하나 이상의 표적 생물학적 성분 중 하나에 적어도 부분적으로 기초하는 것인 방법.
  110. 제 101 항 내지 제 109 항 중 어느 한 항에 있어서,
    하나 이상의 표적 생물학적 성분에 대해 하나 이상의 분석을 인 실리코에서 수행하는 단계는, 하나 이상의 표적 생물학적 성분의 제 1 표적 생물학적 성분에 대한 하나 이상의 분석의 적어도 2개 분석을 수행하는 것을 포함하는 것인 방법.
  111. 제 101 항 내지 제 110 항 중 어느 한 항에 있어서,
    분류하는 단계는 분석에 관한 실험적 정보에 적어도 부분적으로 기초하여 각각의 분석의 예상 결과를 적어도 2개의 실패 모드로서 분류하는 것을 포함하는 것인 방법.
  112. 제 101 항 내지 제 111 항 중 어느 한 항에 있어서,
    적어도 하나의 실패 모드의 한 실패 모드는 표적 생물학적 성분의 결함을 나타내는 것인 방법.
  113. 제 101 항 내지 제 112 항 중 어느 한 항에 있어서,
    적어도 하나의 실패 모드의 한 실패 모드는 분석의 실패를 나타내는 것인 방법.
  114. 제 101 항 내지 제 113 항 중 어느 한 항에 있어서,
    적어도 하나의 실패 모드의 제 1 실패 모드가 제 1 구축 오류에 따라 부적절하게 구축된 표적 생물학적 성분을 나타내고 적어도 하나의 실패의 제 2 실패 모드가 제 2 구축 오류에 따라 부적절하게 구축된 표적 생물학적 성분을 나타내는 것인 방법.
  115. 제 101 항 내지 제 114 항 중 어느 한 항에 있어서,
    적어도 하나의 실패 모드의 한 실패 모드는 결함 분석 반응물을 나타내는 것인 방법.
  116. 제 101 항 내지 제 115 항 중 어느 한 항에 있어서,
    분석 반응의 하나 이상의 분석 반응 생성물에 대해, 참조 정보는 분석 반응, 하나 이상의 분석 반응 생성물 또는 분석 반응물을 추가로 포함하는 것인 방법.
  117. 제 101 항 내지 제 116 항 중 어느 한 항에 있어서,
    참조 정보 속성은 하나 이상의 분석 반응 생성물의 예상 길이, 서열 또는 성장 용량을 포함하는 것인 방법.
  118. 제 101 항 내지 제 117 항 중 어느 한 항에 있어서,
    하나 이상의 표적 생물학적 성분이 플라스미드를 포함하고, 하나 이상의 반응 생성물이 플라스미드 단편을 포함하는 것인 방법.
  119. 제 101 항 내지 제 118 항 중 어느 한 항에 있어서,
    하나 이상의 표적 생물학적 성분의 각각은 뉴클레오타이드 서열 또는 미생물 균주를 포함하는 것인 방법.
  120. 제 101 항 내지 제 119 항 중 어느 한 항에 있어서,
    하나 이상의 표적 생물학적 성분의 각각은 빌드 그래프 데이터 구조의 적어도 일부에 따라 생성되고,
    복수의 레벨의 빌드 그래프 데이터 구조의 한 레벨에 상주하는 각각의 노드는 하나 이상의 생물학적 성분의 적어도 하나를 나타내며, 빌드 그래프 데이터 구조는 관심 생성물의 유전자 제조 시스템에서의 생산을 제어하기 위한 것이며, 여기서 관심 생성물은 빌드 그래프로 표시되는 유전자 변형을 포함하며,
    여기서 복수의 레벨의 빌드 그래프 데이터 구조의 소정의 레벨에서 하나 이상의 소스 노드, 및 하나 이상의 소스 노드와 관련되는 빌드 그래프 데이터 구조의 소정의 레벨의 자식 레벨에서 하나 이상의 소스 노드는 빌드 그래프 데이터 구조의 자식 레벨에 상응하는 하나 이상의 반응 그룹의 한 반응 그룹을 구성하며,
    여기서 각각의 반응 그룹은 소정의 레벨에서 하나 이상의 소스 노드에 의해 그들 자신이 표현되는 하나 이상의 생물학적 성분 사이의 반응을 나타내어, 빌드 그래프 데이터 구조의 자식 레벨에서 반응 그룹의 목적 노드에 의해 표현되는 하나 이상의 표적 생물학적 성분을 생산하는 것인 방법.
  121. 복수의 생물학적 성분의 품질 테스트를 디자인하기 위한 시스템으로서, 시스템은
    하나 이상의 프로세서; 및
    하나 이상의 프로세서의 적어도 하나에 의해 실행될 때 시스템이
    하나 이상의 표적 생물학적 성분에 대한 하나 이상의 분석을 인 실리코에서 수행하고, 하나 이상의 생물학적 성분에 대한 각각의 분석의 인 실리코 실행은 하나 이상의 표적 생물학적 성분의 하나를 필요로 하는 분석 반응으로부터 얻은 하나 이상의 분석 반응 생성물을 생산한다;
    각각의 분석의 2개 이상의 예상 결과를 분석에 관한 실험적 정보에 적어도 부분적으로 기초하여 적어도 하나의 성공 모드 또는 적어도 하나의 실패 모드의 그룹으로 분류하고; 및
    (a) 하나 이상의 분석 반응 생성물의 속성, 및 (b) 2개 이상의 예상 결과의 분류를 포함하는 참조 정보를 하나 이상의 분석 반응 생성물에 대해 분석 데이터 구조로 저장하게 하는 명령을 저장하는 하나 이상의 메모리를 포함하며,
    상기 분석 데이터 구조의 처리는 (a) 각각의 물리적 분석을 위해 하나 이상의 물리적 분석 반응을 생성하기 위해 물리적 실험실 장비를 사용하여 하나 이상의 표적 생물학적 성분에 대해 하나 이상의 인 실리코 분석에 상응하는 하나 이상의 물리적 분석을 수행하고 및 (b) 각각의 물리적 분석을 위해, 하나 이상의 물리적 분석 반응 생성물을 상응하는 참조 정보와 비교하여 적어도 하나의 성공 모드 또는 적어도 하나의 실패 모드에 상응하는 것으로서 표적 생물학적 성분을 분류하는 것을 초래하는 것인 시스템.
  122. 제 121 항에 있어서,
    분석 데이터 구조는 하나 이상의 표적 생물학적 성분에 대한 하나 이상의 분석을 위해, 복수의 분석 노드를 포함하는 복수의 레벨을 포함하는 지향 그래프이며, 지향 그래프에서,
    복수의 레벨의 한 레벨에 상주하는 각각의 분석 노드는 하나 이상의 표적 생물학적 성분, 하나 이상의 분석 반응물 또는 하나 이상의 분석 반응 생성물 중 하나를 나타내고,
    복수의 분석 노드의 표적 분석 노드는 소정의 레벨에서 하나 이상의 표적 생물학적 성분의 표적 생물학적 성분을 나타내고,
    표적 분석 노드와 관련된 복수의 분석 노드의 분석 반응 생성물 노드는, 소정의 레벨의 자식 레벨에서, 하나 이상의 분석 반응 생성물 및 참조 정보를 나타내는 것인 시스템.
  123. 제 121 항 또는 제 122항에 있어서,
    소정의 레벨은 소정의 레벨에서 표적 생물학적 성분과 인 실리코에서 반응하는 적어도 하나의 분석 반응물을 나타내는 적어도 하나의 분석 반응물 노드를 포함하는 것인 시스템.
  124. 제 121 항 내지 제 123 항 중 어느 한 항에 있어서,
    소정의 레벨의 표적 분석 노드 및 분석 반응물 노드 및 자식 레벨의 분석 반응 생성물 노드는 자식 레벨에 상응하는 하나 이상의 분석 반응 그룹의 한 분석 반응 그룹을 구성하는 것인 시스템.
  125. 제 121 항 내지 제 124 항 중 어느 한 항에 있어서,
    각각의 분석은 하나 이상의 분석 단계를 포함하고, 각각의 분석 단계는 복수의 분석 반응 단계의 한 분석 반응 단계를 포함하며, 하나 이상의 메모리는 실행될 때 시스템이
    상이한 분석의 하나 이상의 분석 단계가 공통 분석 단계의 하나 이상의 분석 반응 단계의 공통성에 적어도 부분적으로 기초하여 함께 처리될 수 있는 공통 분석 단계인 것을 결정하고; 및
    공통 분석 단계에 적어도 부분적으로 기초하여 분석 데이터 구조를 생성하게 하는 명령을 저장하는 것인 시스템.
  126. 제 121 항 내지 제 125 항 중 어느 한 항에 있어서,
    공통 분석 단계가 동일한 분석 반응물과 관련되는 것인 시스템.
  127. 제 121 항 내지 제 126 항 중 어느 한 항에 있어서,
    하나 이상의 메모리는 실행될 때 시스템이 공통 분석 단계에 필요한 분석 반응물의 양을 결정하게 하는 명령을 저장하는 것인 시스템.
  128. 제 121 항 내지 제 127 항 중 어느 한 항에 있어서,
    분석에 관한 실험적 정보는 하나 이상의 분석 반응 생성물에 관한 실험적 정보를 포함하는 것인 시스템.
  129. 제 121 항 내지 제 128 항 중 어느 한 항에 있어서,
    분류하는 단계는 분석 반응, 분석 반응에 관여하는 분석 반응물 및 하나 이상의 표적 생물학적 성분 중 하나에 적어도 부분적으로 기초하는 것인 시스템.
  130. 제 121 항 내지 제 129 항 중 어느 한 항에 있어서,
    하나 이상의 표적 생물학적 성분에 대해 하나 이상의 분석을 인 실리코에서 수행하는 단계는, 하나 이상의 표적 생물학적 성분의 제 1 표적 생물학적 성분에 대한 하나 이상의 분석의 적어도 2개 분석을 수행하는 것을 포함하는 것인 시스템.
  131. 제 121 항 내지 제 130 항 중 어느 한 항에 있어서,
    분류하는 단계는 분석에 관한 실험적 정보에 적어도 부분적으로 기초하여 각각의 분석의 예상 결과를 적어도 2개의 실패 모드로서 분류하는 것을 포함하는 것인 시스템.
  132. 제 121 항 내지 제 131 항 중 어느 한 항에 있어서,
    적어도 하나의 실패 모드의 한 실패 모드는 표적 생물학적 성분의 결함을 나타내는 것인 시스템.
  133. 제 121 항 내지 제 132 항 중 어느 한 항에 있어서,
    적어도 하나의 실패 모드의 한 실패 모드는 분석의 실패를 나타내는 것인 시스템.
  134. 제 121 항 내지 제 133 항 중 어느 한 항에 있어서,
    적어도 하나의 실패 모드의 제 1 실패 모드가 제 1 구축 오류에 따라 부적절하게 구축된 표적 생물학적 성분을 나타내고 적어도 하나의 실패의 제 2 실패 모드가 제 2 구축 오류에 따라 부적절하게 구축된 표적 생물학적 성분을 나타내는 것인 시스템.
  135. 제 121 항 내지 제 134 항 중 어느 한 항에 있어서,
    적어도 하나의 실패 모드의 한 실패 모드는 결함 분석 반응물을 나타내는 것인 시스템.
  136. 제 121 항 내지 제 135 항 중 어느 한 항에 있어서,
    분석 반응의 하나 이상의 분석 반응 생성물에 대해, 참조 정보는 분석 반응, 하나 이상의 분석 반응 생성물 또는 분석 반응물을 추가로 포함하는 것인 시스템.
  137. 제 121 항 내지 제 136 항 중 어느 한 항에 있어서,
    참조 정보 속성은 하나 이상의 분석 반응 생성물의 예상 길이, 서열 또는 성장 용량을 포함하는 것인 시스템.
  138. 제 121 항 내지 제 137 항 중 어느 한 항에 있어서,
    하나 이상의 표적 생물학적 성분이 플라스미드를 포함하고, 하나 이상의 반응 생성물이 플라스미드 단편을 포함하는 것인 시스템.
  139. 제 121 항 내지 제 138 항 중 어느 한 항에 있어서,
    하나 이상의 표적 생물학적 성분의 각각은 뉴클레오타이드 서열 또는 미생물 균주를 포함하는 것인 시스템.
  140. 제 121 항 내지 제 139 항 중 어느 한 항에 있어서,
    하나 이상의 표적 생물학적 성분의 각각은 빌드 그래프 데이터 구조의 적어도 일부에 따라 생성되고,
    복수의 레벨의 빌드 그래프 데이터 구조의 한 레벨에 상주하는 각각의 노드는 하나 이상의 생물학적 성분의 적어도 하나를 나타내며, 빌드 그래프 데이터 구조는 관심 생성물의 유전자 제조 시스템에서의 생산을 제어하기 위한 것이며, 여기서 관심 생성물은 빌드 그래프로 표시되는 유전자 변형을 포함하며,
    여기서 복수의 레벨의 빌드 그래프 데이터 구조의 소정의 레벨에서 하나 이상의 소스 노드, 및 하나 이상의 소스 노드와 관련되는 빌드 그래프 데이터 구조의 소정의 레벨의 자식 레벨에서 하나 이상의 소스 노드는 빌드 그래프 데이터 구조의 자식 레벨에 상응하는 하나 이상의 반응 그룹의 한 반응 그룹을 구성하며,
    여기서 각각의 반응 그룹은 소정의 레벨에서 하나 이상의 소스 노드에 의해 그들 자신이 표현되는 하나 이상의 생물학적 성분 사이의 반응을 나타내어, 빌드 그래프 데이터 구조의 자식 레벨에서 반응 그룹의 목적 노드에 의해 표현되는 하나 이상의 표적 생물학적 성분을 생산하는 것인 시스템.
  141. 복수의 생물학적 성분의 품질 테스트를 디자인하기 위한 명령을 저장하는 하나 이상의 비 일시적 컴퓨터 판독 가능 매체로서, 여기서 명령은 하나 이상의 컴퓨팅 장치에 의해 실행될 때, 하나 이상의 컴퓨팅 장치의 적어도 하나가
    하나 이상의 표적 생물학적 성분에 대한 하나 이상의 분석을 인 실리코에서 수행하고, 하나 이상의 생물학적 성분에 대한 각각의 분석의 인 실리코 실행은 하나 이상의 표적 생물학적 성분의 하나를 필요로 하는 분석 반응으로부터 얻은 하나 이상의 분석 반응 생성물을 생산한다;
    각각의 분석의 2개 이상의 예상 결과를 분석에 관한 실험적 정보에 적어도 부분적으로 기초하여 적어도 하나의 성공 모드 또는 적어도 하나의 실패 모드의 그룹으로 분류하고; 및
    (a) 하나 이상의 분석 반응 생성물의 속성, 및 (b) 2개 이상의 예상 결과의 분류를 포함하는 참조 정보를 하나 이상의 분석 반응 생성물에 대해 분석 데이터 구조로 저장하게 하며,
    상기 분석 데이터 구조의 처리는 (a) 각각의 물리적 분석을 위해 하나 이상의 물리적 분석 반응을 생성하기 위해 물리적 실험실 장비를 사용하여 하나 이상의 표적 생물학적 성분에 대해 하나 이상의 인 실리코 분석에 상응하는 하나 이상의 물리적 분석을 수행하고 및 (b) 각각의 물리적 분석을 위해, 하나 이상의 물리적 분석 반응 생성물을 상응하는 참조 정보와 비교하여 적어도 하나의 성공 모드 또는 적어도 하나의 실패 모드에 상응하는 것으로서 표적 생물학적 성분을 분류하는 것을 초래하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  142. 제 141 항에 있어서,
    분석 데이터 구조는 하나 이상의 표적 생물학적 성분에 대한 하나 이상의 분석을 위해, 복수의 분석 노드를 포함하는 복수의 레벨을 포함하는 지향 그래프이며, 지향 그래프에서,
    복수의 레벨의 한 레벨에 상주하는 각각의 분석 노드는 하나 이상의 표적 생물학적 성분, 하나 이상의 분석 반응물 또는 하나 이상의 분석 반응 생성물 중 하나를 나타내고,
    복수의 분석 노드의 표적 분석 노드는 소정의 레벨에서 하나 이상의 표적 생물학적 성분의 표적 생물학적 성분을 나타내고,
    표적 분석 노드와 관련된 복수의 분석 노드의 분석 반응 생성물 노드는, 소정의 레벨의 자식 레벨에서, 하나 이상의 분석 반응 생성물 및 참조 정보를 나타내는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  143. 제 141 항 또는 제 142 항에 있어서,
    소정의 레벨은 소정의 레벨에서 표적 생물학적 성분과 인 실리코에서 반응하는 적어도 하나의 분석 반응물을 나타내는 적어도 하나의 분석 반응물 노드를 포함하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  144. 제 141 항 내지 제 143 항 중 어느 한 항에 있어서,
    소정의 레벨의 표적 분석 노드 및 분석 반응물 노드 및 자식 레벨의 분석 반응 생성물 노드는 자식 레벨에 상응하는 하나 이상의 분석 반응 그룹의 한 분석 반응 그룹을 구성하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  145. 제 141 항 내지 제 144 항 중 어느 한 항에 있어서,
    각각의 분석은 하나 이상의 분석 단계를 포함하고, 각각의 분석 단계는 복수의 분석 반응 단계의 한 분석 반응 단계를 포함하며, 하나 이상의 비 일시적 컴퓨터 판독 가능 매체는 실행될 때 하나 이상의 컴퓨팅 장치의 적어도 하나가
    상이한 분석의 하나 이상의 분석 단계가 공통 분석 단계의 하나 이상의 분석 반응 단계의 공통성에 적어도 부분적으로 기초하여 함께 처리될 수 있는 공통 분석 단계인 것을 결정하고; 및
    공통 분석 단계에 적어도 부분적으로 기초하여 분석 데이터 구조를 생성하게 하는 명령을 저장하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  146. 제 141 항 내지 제 145 항 중 어느 한 항에 있어서,
    공통 분석 단계가 동일한 분석 반응물과 관련되는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  147. 제 141 항 내지 제 146 항 중 어느 한 항에 있어서,
    실행될 때 하나 이상의 컴퓨팅 장치의 적어도 하나가 공통 분석 단계에 필요한 분석 반응물의 양을 결정하게 하는 명령을 저장하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  148. 제 141 항 내지 제 147 항 중 어느 한 항에 있어서,
    분석에 관한 실험적 정보는 하나 이상의 분석 반응 생성물에 관한 실험적 정보를 포함하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  149. 제 141 항 내지 제 148 항 중 어느 한 항에 있어서,
    분류하는 단계는 분석 반응, 분석 반응에 관여하는 분석 반응물 및 하나 이상의 표적 생물학적 성분 중 하나에 적어도 부분적으로 기초하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  150. 제 141 항 내지 제 149 항 중 어느 한 항에 있어서,
    하나 이상의 표적 생물학적 성분에 대해 하나 이상의 분석을 인 실리코에서 수행하는 단계는, 하나 이상의 표적 생물학적 성분의 제 1 표적 생물학적 성분에 대한 하나 이상의 분석의 적어도 2개 분석을 수행하는 것을 포함하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  151. 제 141 항 내지 제 150 항 중 어느 한 항에 있어서,
    분류하는 단계는 분석에 관한 실험적 정보에 적어도 부분적으로 기초하여 각각의 분석의 예상 결과를 적어도 2개의 실패 모드로서 분류하는 것을 포함하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  152. 제 141 항 내지 제 151 항 중 어느 한 항에 있어서,
    적어도 하나의 실패 모드의 한 실패 모드는 표적 생물학적 성분의 결함을 나타내는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  153. 제 141 항 내지 제 152 항 중 어느 한 항에 있어서,
    적어도 하나의 실패 모드의 한 실패 모드는 분석의 실패를 나타내는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  154. 제 141 항 내지 제 153 항 중 어느 한 항에 있어서,
    적어도 하나의 실패 모드의 제 1 실패 모드가 제 1 구축 오류에 따라 부적절하게 구축된 표적 생물학적 성분을 나타내고 적어도 하나의 실패의 제 2 실패 모드가 제 2 구축 오류에 따라 부적절하게 구축된 표적 생물학적 성분을 나타내는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  155. 제 141 항 내지 제 154 항 중 어느 한 항에 있어서,
    적어도 하나의 실패 모드의 한 실패 모드는 결함 분석 반응물을 나타내는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  156. 제 141 항 내지 제 155 항 중 어느 한 항에 있어서,
    분석 반응의 하나 이상의 분석 반응 생성물에 대해, 참조 정보는 분석 반응, 하나 이상의 분석 반응 생성물 또는 분석 반응물을 추가로 포함하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  157. 제 141 항 내지 제 156 항 중 어느 한 항에 있어서,
    참조 정보 속성은 하나 이상의 분석 반응 생성물의 예상 길이, 서열 또는 성장 용량을 포함하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  158. 제 141 항 내지 제 157 항 중 어느 한 항에 있어서,
    하나 이상의 표적 생물학적 성분이 플라스미드를 포함하고, 하나 이상의 반응 생성물이 플라스미드 단편을 포함하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  159. 제 141 항 내지 제 158 항 중 어느 한 항에 있어서,
    하나 이상의 표적 생물학적 성분의 각각은 뉴클레오타이드 서열 또는 미생물 균주를 포함하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  160. 제 141 항 내지 제 159 항 중 어느 한 항에 있어서,
    하나 이상의 표적 생물학적 성분의 각각은 빌드 그래프 데이터 구조의 적어도 일부에 따라 생성되고,
    복수의 레벨의 빌드 그래프 데이터 구조의 한 레벨에 상주하는 각각의 노드는 하나 이상의 생물학적 성분의 적어도 하나를 나타내며, 빌드 그래프 데이터 구조는 관심 생성물의 유전자 제조 시스템에서의 생산을 제어하기 위한 것이며, 여기서 관심 생성물은 빌드 그래프로 표시되는 유전자 변형을 포함하며,
    여기서 복수의 레벨의 빌드 그래프 데이터 구조의 소정의 레벨에서 하나 이상의 소스 노드, 및 하나 이상의 소스 노드와 관련되는 빌드 그래프 데이터 구조의 소정의 레벨의 자식 레벨에서 하나 이상의 소스 노드는 빌드 그래프 데이터 구조의 자식 레벨에 상응하는 하나 이상의 반응 그룹의 한 반응 그룹을 구성하며,
    여기서 각각의 반응 그룹은 소정의 레벨에서 하나 이상의 소스 노드에 의해 그들 자신이 표현되는 하나 이상의 생물학적 성분 사이의 반응을 나타내어, 빌드 그래프 데이터 구조의 자식 레벨에서 반응 그룹의 목적 노드에 의해 표현되는 하나 이상의 표적 생물학적 성분을 생산하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  161. 표적 생물학적 성분의 품질 테스트를 수행하기 위한 컴퓨터 구현 방법으로서, 방법은
    표적 생물학적 성분의 물리적 분석으로부터 생성된 하나 이상의 물리적 분석 반응 생성물에 관한 정보를 얻는 단계; 및
    하나 이상의 물리적 분석 반응 생성물을 상응하는 참조 정보와 비교하여, 목표 생물학적 성분을 적어도 하나의 성공 모드, 적어도 하나의 실패 모드 또는 불확정 모드에 상응하는 것으로 분류하는 단계를 포함하며,
    여기서 참조 정보는 성공 및 실패 모드에 상응하는 하나 이상의 물리적 분석 반응 생성물의 예상되는 속성을 포함하는 것인 컴퓨터 구현 방법.
  162. 제 161 항에 있어서,
    표적 생물학적 성분이 불확정 모드에 상응하는 것으로 분류되는 경우, 물리적 분석을 다시 수행해야 함을 나타내는 것을 추가로 포함하는 것인 방법.
  163. 제 161 항 또는 제 162 항에 있어서,
    표적 생물학적 성분이 적어도 하나의 성공 모드에 상응하는 것으로 분류되는 경우, 관심 생성물을 생성하는 것을 촉진하도록 표적 생물학적 성분의 추가 처리를 위한 명령을 제공하는 것을 추가로 포함하는 것인 방법.
  164. 제 161 항 내지 제 163 항 중 어느 한 항에 있어서,
    적어도 하나의 실패 모드의 한 실패 모드는 표적 생물학적 성분의 결함을 나타내는 것인 방법.
  165. 제 161 항 내지 제 164 항 중 어느 한 항에 있어서,
    적어도 하나의 실패 모드의 한 실패 모드는 물리적 분석의 실패를 나타내는 것인 방법.
  166. 제 161 항 내지 제 165 항 중 어느 한 항에 있어서,
    적어도 하나의 실패 모드의 제 1 실패 모드가 제 1 구축 오류에 따라 부적절하게 구축된 표적 생물학적 성분을 나타내고 적어도 하나의 실패의 제 2 실패 모드가 제 2 구축 오류에 따라 부적절하게 구축된 표적 생물학적 성분을 나타내는 것인 방법.
  167. 제 161 항 내지 제 166 항 중 어느 한 항에 있어서,
    적어도 하나의 실패 모드의 한 실패 모드는 물리적 분석의 물리적 분석 반응에 사용된 결함 분석 반응물을 나타내는 것인 방법.
  168. 제 161 항 내지 제 167 항 중 어느 한 항의 방법을 사용하여 생산된 미생물 균주.
  169. 표적 생물학적 성분의 품질 테스트를 수행하기 위한 시스템으로서, 시스템은
    하나 이상의 프로세서; 및
    하나 이상의 프로세서의 적어도 하나에 의해 실행될 때 시스템이
    표적 생물학적 성분의 물리적 분석으로부터 생성된 하나 이상의 물리적 분석 반응 생성물에 관한 정보를 얻고; 및
    하나 이상의 물리적 분석 반응 생성물을 상응하는 참조 정보와 비교하여, 목표 생물학적 성분을 적어도 하나의 성공 모드, 적어도 하나의 실패 모드 또는 불확정 모드에 상응하는 것으로 분류하게 하는 명령을 저장하는 하나 이상의 메모리를 포함하며,
    여기서 참조 정보는 성공 및 실패 모드에 상응하는 하나 이상의 물리적 분석 반응 생성물의 예상되는 속성을 포함하는 것인 시스템.
  170. 제 169 항에 있어서,
    하나 이상의 메모리는 하나 이상의 프로세서의 적어도 하나에 의해 실행될 때 시스템이 표적 생물학적 성분이 불확정 모드에 상응하는 것으로 분류되는 경우, 물리적 분석을 다시 수행해야 함을 나타내는 명령을 저장하는 것인 시스템.
  171. 제 169 항 또는 제 170 항에 있어서,
    하나 이상의 메모리는 하나 이상의 프로세서의 적어도 하나에 의해 실행될 때 시스템이 표적 생물학적 성분이 적어도 하나의 성공 모드에 상응하는 것으로 분류되는 경우, 관심 생성물을 생성하는 것을 촉진하도록 표적 생물학적 성분의 추가 처리를 위한 명령을 제공하게 하는 명령을 저장하는 것인 시스템.
  172. 제 169 항 내지 제 171 항 중 어느 한 항에 있어서,
    적어도 하나의 실패 모드의 한 실패 모드는 표적 생물학적 성분의 결함을 나타내는 것인 시스템.
  173. 제 169 항 내지 제 172 항 중 어느 한 항에 있어서,
    적어도 하나의 실패 모드의 한 실패 모드는 물리적 분석의 실패를 나타내는 것인 시스템.
  174. 제 169 항 내지 제 173 항 중 어느 한 항에 있어서,
    적어도 하나의 실패 모드의 제 1 실패 모드가 제 1 구축 오류에 따라 부적절하게 구축된 표적 생물학적 성분을 나타내고 적어도 하나의 실패의 제 2 실패 모드가 제 2 구축 오류에 따라 부적절하게 구축된 표적 생물학적 성분을 나타내는 것인 시스템.
  175. 제 169 항 내지 제 174 항 중 어느 한 항에 있어서,
    적어도 하나의 실패 모드의 한 실패 모드는 물리적 분석의 물리적 분석 반응에 사용된 결함 분석 반응물을 나타내는 것인 시스템.
  176. 표적 생물학적 성분의 품질 테스트를 수행하기 위한 명령을 저장하는 하나 이상의 비 일시적 컴퓨터 판독 가능 매체로서, 여기서 명령은 하나 이상의 컴퓨팅 장치에 의해 실행될 때, 하나 이상의 컴퓨팅 장치의 적어도 하나가
    표적 생물학적 성분의 물리적 분석으로부터 생성된 하나 이상의 물리적 분석 반응 생성물에 관한 정보를 얻고; 및
    하나 이상의 물리적 분석 반응 생성물을 상응하는 참조 정보와 비교하여, 목표 생물학적 성분을 적어도 하나의 성공 모드, 적어도 하나의 실패 모드 또는 불확정 모드에 상응하는 것으로 분류하게 하며,
    여기서 참조 정보는 성공 및 실패 모드에 상응하는 하나 이상의 물리적 분석 반응 생성물의 예상되는 속성을 포함하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  177. 제 176 항에 있어서,
    실행될 때 하나 이상의 컴퓨팅 장치의 적어도 하나가 표적 생물학적 성분이 불확정 모드에 상응하는 것으로 분류되는 경우, 물리적 분석을 다시 수행해야 함을 나타내는 명령을 저장하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  178. 제 176 항 또는 제 177 항에 있어서,
    실행될 때 하나 이상의 컴퓨팅 장치의 적어도 하나가 표적 생물학적 성분이 적어도 하나의 성공 모드에 상응하는 것으로 분류되는 경우, 관심 생성물을 생성하는 것을 촉진하도록 표적 생물학적 성분의 추가 처리를 위한 명령을 제공하게 하는 명령을 저장하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  179. 제 176 항 내지 제 178 항 중 어느 한 항에 있어서,
    적어도 하나의 실패 모드의 한 실패 모드는 표적 생물학적 성분의 결함을 나타내는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  180. 제 176 항 내지 제 179 항 중 어느 한 항에 있어서,
    적어도 하나의 실패 모드의 한 실패 모드는 물리적 분석의 실패를 나타내는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  181. 제 176 항 내지 제 180 항 중 어느 한 항에 있어서,
    적어도 하나의 실패 모드의 제 1 실패 모드가 제 1 구축 오류에 따라 부적절하게 구축된 표적 생물학적 성분을 나타내고 적어도 하나의 실패의 제 2 실패 모드가 제 2 구축 오류에 따라 부적절하게 구축된 표적 생물학적 성분을 나타내는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  182. 제 176 항 내지 제 181 항 중 어느 한 항에 있어서,
    적어도 하나의 실패 모드의 한 실패 모드는 물리적 분석의 물리적 분석 반응에 사용된 결함 분석 반응물을 나타내는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  183. 유전자 제조 시스템에 의해 생물학적 서열의 생산을 제어하기 위한 팩토리 오더를 생성하기 위한 컴퓨터 구현 방법으로서,
    컴퓨팅 장치에서, 제 1 시퀀스 피연산자에 대한 비 결정적 연산을 나타내는 표현을 수신하는 단계, 여기서 시퀀스 피연산자는 생물학적 시퀀스 부분을 나타내고, 상기 제 1 시퀀스 피연산자는 하나 이상의 생물학적 시퀀스 부분을 나타낸다;
    컴퓨팅 장치에 의해, 표현을 시퀀스 명세서로 평가하기 위한 명령을 실행하는 단계, 여기서, 시퀀스 명세서는 (a) 제 1 시퀀스 피연산자를 포함하는 하나 이상의 제 1 레벨 시퀀스 피연산자에 대해 실행될 제 1 비 결정적 연산을 포함하는 하나 이상의 제 1 레벨 비 결정적 연산, 및 (b) 이의 실행이 하나 이상의 제 1 레벨 시퀀스 피연산자의 하나 이상의 값을 해결하는 하나 이상의 제 2 레벨 연산을 포함한다; 및
    컴퓨팅 장치에 의해, 하나 이상의 제 1 레벨 연산 및 하나 이상의 제 2 레벨 연산의 실행에 기초하여 팩토리 오더를 생성하는 단계, 팩토리 오더는 생물학적 시퀀스 부분을 생성하기 위해 유전자 제조 시스템에 의해 사용되며, 여기서 하나 이상의 제 1 레벨 비 결정적 연산은 생물학적 시퀀스 부분을 생성하기 위한 프로토콜에 상응하는 것인 방법.
  184. 제 183 항에 있어서,
    하나 이상의 제 1 레벨 비 결정적 연산은 또한 생물학적 시퀀스 부분을 생성하기 위한 물리적 실험실 장비에 상응하는 것인 방법.
  185. 제 183 항 또는 제 184 항에 있어서,
    지향 빌드 그래프 데이터 구조가 팩토리 오더를 생성하는데 사용되며,
    상이한 팩토리 오더에 대한 2개 이상의 워크플로우 단계가 공통 워크플로우 단계의 반응 단계의 공통성에 적어도 부분적으로 기초하여 함께 처리될 수 있는 공통 워크플로우 단계인 것을 결정하는 단계; 및
    공통 워크플로우 단계에 적어도 부분적으로 기초하여 빌드 그래프 데이터 구조를 조립하는 단계를 포함하는 것인 방법.
  186. 유전자 제조 시스템에 의해 생물학적 서열의 생산을 제어하기 위한 팩토리 오더를 생성하기 위한 시스템으로서, 시스템은
    하나 이상의 프로세서; 및
    하나 이상의 프로세서의 적어도 하나에 의해 실행될 때 시스템이
    제 1 시퀀스 피연산자에 대한 비 결정적 연산을 나타내는 표현을 수신하고, 여기서 시퀀스 피연산자는 생물학적 시퀀스 부분을 나타내고, 상기 제 1 시퀀스 피연산자는 하나 이상의 생물학적 시퀀스 부분을 나타낸다;
    표현을 시퀀스 명세서로 평가하기 위한 명령을 실행하고, 여기서, 시퀀스 명세서는 (a) 제 1 시퀀스 피연산자를 포함하는 하나 이상의 제 1 레벨 시퀀스 피연산자에 대해 실행될 제 1 비 결정적 연산을 포함하는 하나 이상의 제 1 레벨 비 결정적 연산, 및 (b) 이의 실행이 하나 이상의 제 1 레벨 시퀀스 피연산자의 하나 이상의 값을 해결하는 하나 이상의 제 2 레벨 연산을 포함한다; 및
    컴퓨팅 장치에 의해, 하나 이상의 제 1 레벨 연산 및 하나 이상의 제 2 레벨 연산의 실행에 기초하여 팩토리 오더를 생성하게 하는 명령을 저장하는 하나 이상의 메모리를 포함하며, 팩토리 오더는 생물학적 시퀀스 부분을 생성하기 위해 유전자 제조 시스템에 의해 사용되며, 여기서 하나 이상의 제 1 레벨 비 결정적 연산은 생물학적 시퀀스 부분을 생성하기 위한 프로토콜에 상응하는 것인 시스템.
  187. 제 186 항에 있어서,
    하나 이상의 제 1 레벨 비 결정적 연산은 또한 생물학적 시퀀스 부분을 생성하기 위한 물리적 실험실 장비에 상응하는 것인 시스템.
  188. 제 186 항 또는 제 187 항에 있어서,
    지향 빌드 그래프 데이터 구조가 팩토리 오더를 생성하는데 사용되며, 하나 이상의 메모리는 실행될 때 시스템이
    상이한 팩토리 오더에 대한 2개 이상의 워크플로우 단계가 공통 워크플로우 단계의 반응 단계의 공통성에 적어도 부분적으로 기초하여 함께 처리될 수 있는 공통 워크플로우 단계인 것을 결정하고; 및
    공통 워크플로우 단계에 적어도 부분적으로 기초하여 빌드 그래프 데이터 구조를 조립하게 하는 명령을 저장하는 것인 시스템.
  189. 유전자 제조 시스템에 의해 생물학적 서열의 생산을 제어하기 위한 팩토리 오더를 생성하기 위한 하나 이상의 비 일시적 컴퓨터 판독 가능 매체로서, 여기서 명령은 하나 이상의 컴퓨팅 장치에 의해 실행될 때, 하나 이상의 컴퓨팅 장치의 적어도 하나가
    제 1 시퀀스 피연산자에 대한 비 결정적 연산을 나타내는 표현을 수신하고, 여기서 시퀀스 피연산자는 생물학적 시퀀스 부분을 나타내고, 상기 제 1 시퀀스 피연산자는 하나 이상의 생물학적 시퀀스 부분을 나타낸다;
    표현을 시퀀스 명세서로 평가하기 위한 명령을 실행하고, 여기서, 시퀀스 명세서는 (a) 제 1 시퀀스 피연산자를 포함하는 하나 이상의 제 1 레벨 시퀀스 피연산자에 대해 실행될 제 1 비 결정적 연산을 포함하는 하나 이상의 제 1 레벨 비 결정적 연산, 및 (b) 이의 실행이 하나 이상의 제 1 레벨 시퀀스 피연산자의 하나 이상의 값을 해결하는 하나 이상의 제 2 레벨 연산을 포함한다; 및
    컴퓨팅 장치에 의해, 하나 이상의 제 1 레벨 연산 및 하나 이상의 제 2 레벨 연산의 실행에 기초하여 팩토리 오더를 생성하게 하며, 팩토리 오더는 생물학적 시퀀스 부분을 생성하기 위해 유전자 제조 시스템에 의해 사용되며, 여기서 하나 이상의 제 1 레벨 비 결정적 연산은 생물학적 시퀀스 부분을 생성하기 위한 프로토콜에 상응하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  190. 제 189 항에 있어서,
    하나 이상의 제 1 레벨 비 결정적 연산은 또한 생물학적 시퀀스 부분을 생성하기 위한 물리적 실험실 장비에 상응하는 것인 하나 이상의 비 일시적 컴퓨터 판독 가능 매체.
  191. 제 189 항 또는 제 190 항에 있어서,
    지향 빌드 그래프 데이터 구조가 팩토리 오더를 생성하는데 사용되며, 하나 이상의 비 일시적 컴퓨터 판독 가능 매체는 실행될 때, 하나 이상의 컴퓨팅 장치의 적어도 하나가
    상이한 팩토리 오더에 대한 2개 이상의 워크플로우 단계가 공통 워크플로우 단계의 반응 단계의 공통성에 적어도 부분적으로 기초하여 함께 처리될 수 있는 공통 워크플로우 단계인 것을 결정하고; 및
    공통 워크플로우 단계에 적어도 부분적으로 기초하여 빌드 그래프 데이터 구조를 조립하게 하는 명령을 저장하는 것인 시스템.
KR1020207014493A 2017-10-26 2018-10-25 고 처리량 게놈 제조 작업을 계획하고 수행하기 위한 장치-애그노스틱 시스템 Withdrawn KR20200078558A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762577615P 2017-10-26 2017-10-26
US62/577,615 2017-10-26
PCT/US2018/057583 WO2019084315A1 (en) 2017-10-26 2018-10-25 INDEPENDENT SYSTEM FOR PLANNING AND EXECUTING HIGH-PERFORMANCE GENOMIC MANUFACTURING OPERATIONS

Publications (1)

Publication Number Publication Date
KR20200078558A true KR20200078558A (ko) 2020-07-01

Family

ID=64267972

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207014493A Withdrawn KR20200078558A (ko) 2017-10-26 2018-10-25 고 처리량 게놈 제조 작업을 계획하고 수행하기 위한 장치-애그노스틱 시스템

Country Status (7)

Country Link
US (1) US11581064B2 (ko)
EP (1) EP3701535A1 (ko)
JP (1) JP2021501410A (ko)
KR (1) KR20200078558A (ko)
CN (1) CN111937075A (ko)
CA (1) CA3079098A1 (ko)
WO (1) WO2019084315A1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201405246D0 (en) * 2014-03-24 2014-05-07 Synthace Ltd System and apparatus
US11070488B2 (en) * 2018-07-03 2021-07-20 Electronics And Telecommunications Research Institute System and method to control a cross domain workflow based on a hierarchical engine framework
WO2021168368A1 (en) * 2020-02-19 2021-08-26 Multiply Labs, Inc. Systems and methods for facilitating modular and parallelized manufacturing at a biological foundry
CN111863120B (zh) * 2020-06-28 2022-05-13 深圳晶泰科技有限公司 晶体复合物的药物虚拟筛选系统及方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7826975B2 (en) 2002-07-10 2010-11-02 The Penn State Research Foundation Method for redesign of microbial production systems
US10541046B2 (en) * 2009-09-02 2020-01-21 Microsoft Technology Licensing, Llc Creating genetic devices
US8332160B1 (en) * 2011-11-17 2012-12-11 Amyris Biotechnologies, Inc. Systems and methods for engineering nucleic acid constructs using scoring techniques
US10192024B2 (en) * 2012-05-18 2019-01-29 454 Life Sciences Corporation System and method for generation and use of optimal nucleotide flow orders
KR20180016391A (ko) * 2015-05-08 2018-02-14 플로우조, 엘엘시 데이터 발견 노드
US9988624B2 (en) * 2015-12-07 2018-06-05 Zymergen Inc. Microbial strain improvement by a HTP genomic engineering platform

Also Published As

Publication number Publication date
US20200350036A1 (en) 2020-11-05
US11581064B2 (en) 2023-02-14
EP3701535A1 (en) 2020-09-02
CA3079098A1 (en) 2019-05-02
WO2019084315A1 (en) 2019-05-02
CN111937075A (zh) 2020-11-13
JP2021501410A (ja) 2021-01-14

Similar Documents

Publication Publication Date Title
US11151497B2 (en) Microbial strain design system and methods for improved large-scale production of engineered nucleotide sequences
Guarracino et al. ODGI: understanding pangenome graphs
Appleton et al. Design automation in synthetic biology
Wattam et al. Assembly, annotation, and comparative genomics in PATRIC, the all bacterial bioinformatics resource center
US9977862B2 (en) Bioprocess method and system
Hérisson et al. The automated Galaxy-SynBioCAD pipeline for synthetic biology design and engineering
KR20200078558A (ko) 고 처리량 게놈 제조 작업을 계획하고 수행하기 위한 장치-애그노스틱 시스템
US10590494B2 (en) Multifactorial process optimisation method and system
Yeoh et al. SynBiopython: an open-source software library for Synthetic Biology
Houimli et al. On formal modeling, analysis and optimization of reconfigurable manufacturing systems
Hérisson et al. Galaxy-SynBioCAD: automated pipeline for synthetic biology design and engineering
Sparkes et al. AutoLabDB: a substantial open source database schema to support a high-throughput automated laboratory
Ko et al. Closha 2.0: a bio-workflow design system for massive genome data analysis on high performance cluster infrastructure
du Lac et al. Galaxy-SynBioCAD: Synthetic biology design automation tools in galaxy workflows
HK40033048A (en) Device-agnostic system for planning and executing high-throughput genomic manufacturing operations
Oberortner et al. An integrated computer-aided design and manufacturing workflow for synthetic biology
KR101962960B1 (ko) 유전체 염기서열 분석 파이프라인 처리시스템 및 방법
Chowdhury et al. Robin: an advanced tool for comparative loop caller result analysis leveraging large language models
Cruz et al. Detecting distant homologies on protozoans metabolic pathways using scientific workflows
Ravel et al. GraTools, an user-friendly tool for exploring and manipulating pangenome variation graphs
Quargnali et al. BioPipelines: Accessible Computational Protein and Ligand Design for Chemical Biologists
HK40001065A (en) Methods and systems for generating factory order forms to control production of nucleotide sequences
McClymont et al. Software system design to support scale in mammalian cell line engineering
JP2007207113A (ja) 系統樹表示システム
Naidoo et al. Scheduling of an On-Demand Fixture Manufacturing Cell for Mass Customization: Optimal Method Vs. Heuristic

Legal Events

Date Code Title Description
PA0105 International application

St.27 status event code: A-0-1-A10-A15-nap-PA0105

PG1501 Laying open of application

St.27 status event code: A-1-1-Q10-Q12-nap-PG1501

A201 Request for examination
E13-X000 Pre-grant limitation requested

St.27 status event code: A-2-3-E10-E13-lim-X000

P11-X000 Amendment of application requested

St.27 status event code: A-2-2-P10-P11-nap-X000

P13-X000 Application amended

St.27 status event code: A-2-2-P10-P13-nap-X000

PA0201 Request for examination

St.27 status event code: A-1-2-D10-D11-exm-PA0201

R18-X000 Changes to party contact information recorded

St.27 status event code: A-3-3-R10-R18-oth-X000

R18-X000 Changes to party contact information recorded

St.27 status event code: A-3-3-R10-R18-oth-X000

PC1202 Submission of document of withdrawal before decision of registration

St.27 status event code: N-1-6-B10-B11-nap-PC1202