JPH0944564A - Dnaの塩基配列決定時におけるフラグメント波形表示方法および装置 - Google Patents

Dnaの塩基配列決定時におけるフラグメント波形表示方法および装置

Info

Publication number
JPH0944564A
JPH0944564A JP19200695A JP19200695A JPH0944564A JP H0944564 A JPH0944564 A JP H0944564A JP 19200695 A JP19200695 A JP 19200695A JP 19200695 A JP19200695 A JP 19200695A JP H0944564 A JPH0944564 A JP H0944564A
Authority
JP
Japan
Prior art keywords
base
fragment
sequence
waveform
base sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP19200695A
Other languages
English (en)
Other versions
JP3675521B2 (ja
Inventor
Kensaku Imai
建策 今井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP19200695A priority Critical patent/JP3675521B2/ja
Priority to US08/685,959 priority patent/US5891632A/en
Priority to GBGB9615563.5A priority patent/GB9615563D0/en
Priority to GB9615699A priority patent/GB2303702B/en
Publication of JPH0944564A publication Critical patent/JPH0944564A/ja
Application granted granted Critical
Publication of JP3675521B2 publication Critical patent/JP3675521B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

(57)【要約】 【目的】 DNA塩基配列の決定方法に係り、各フラグ
メント波形上で比較すべき位置を明快にし、より正確な
塩基配列を決定可能にすることを目的とする。 【構成】 まず各フラグメントに対するフラグメント塩
基配列を決定し、次に各フラグメント塩基配列を結合し
た結果としてのDNA全体の塩基配列を曖昧さを許容し
たコンセンサス配列として求め、さらにコンセンサス配
列に対応させてフラグメント内の塩基位置を示す波形を
表示し、該表示波形との比較により正確なコンセンサス
配列を求めるように構成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、核酸の1つとしてのD
NAにおける塩基配列の決定方法に係り、更に詳しくは
DNAシーケンサを用いたDNA塩基配列決定時におけ
るDNAの断片としてのフラグメントにおける塩基の配
列に対応する波形の表示方法に関する。
【0002】
【従来の技術】核酸の構成単位はヌクレオチドであり、
このヌクレオチドは塩基、糖、リン酸の3成分が結合し
たものである。ヌクレオチドはヌクレオシドにリン酸が
結合したものでもあり、リン酸はヌクレオシドをはしか
けして、ポリマーが作られ、DNA(レオキシリボ核
酸)とRNA(リボ核酸)のいずれかが形成される。
【0003】核酸を構成する塩基にはプリン塩基とピリ
ミジン塩基の2種類があり、プリン塩基にはアデニンA
とグアニンGがあり、またピリミジン塩基にはシトシン
CとチミンTがある。
【0004】ポリヌクレオチド鎖構造と呼ばれる構造を
持つDNAは、前述の4つの塩基アデニンA、グアニン
G、シトシンC、およびチミンTが一列に並んだ細長い
糸のような構造を持っており、例えば1個のヒトの細胞
の染色体からDNAを引き出し、それらを繋ぎ合わせる
と1mにもおよび、この上に30億個の塩基が並んでい
ると言われる。
【0005】従って、このA,G,TおよびCの配列順
序を知ることが、すなわち遺伝情報を解明することにつ
ながり、この塩基配列を決めるシーケンス技術は他の分
野の技術と互いに関連しながら進歩しており、その発展
は制限酵素や核酸関連酵素の発見、DNAのクローニン
グ、核酸化学などの技術分野の発展と大いに関連してい
る。
【0006】最近ではコンピュータ技術がシーケンス法
の1つとして活用され、人間の能力を越えた膨大なデー
タの入力や蓄積が可能となり、塩基配列の決定にとって
コンピュータは必須の道具として用いられるようになっ
ている。
【0007】DNAは、前述のように塩基が一列、すな
わち鎖状に結合した塩基一次配列の構造を持っている。
このDNA鎖には向きがあり、ATGCACGA→とA
TGCACGA←(すなわち、AGCACGTA→)と
は別のものである。
【0008】このDNA鎖の両側、すなわち末端には名
称がついており、糖の3′の位置に水酸基がついた末端
は3′末端と呼ばれ、また他方の末端、すなわち糖の
5′の位置にリン酸基がついた末端は5′末端と呼ばれ
る。そしてDNA鎖を記述する際には、一般に5′末端
が左、3′末端が右となるように記述する。
【0009】DNAは通常、向きが異なって相補的な2
本の塩基配列がくっついた二重鎖の状態で存在する。こ
の時2本の塩基配列において、お互いに向かい合う塩基
の間には一定の関係があり、アデニンAはチミンTと、
またグアニンGはシトシンCと向き合うようになってい
る。この例を次に示す(上下の塩基がペアとなってい
る)。
【0010】
【数1】
【0011】DNAは相補鎖となる2本の塩基配列が組
となって、1つの遺伝的意味を持ち、2つの配列のうち
どちらか1つの配列を確定することができれば、そのD
NAの塩基配列を決定できたことになる。
【0012】DNAの塩基配列を自動的に読み取る装置
であるDNAシーケンサにおいては、ジデオキシ法、ま
たはサンガ法と呼ばれる方法が塩基配列決定のために用
いられる。一般にDNAの二重鎖の一方の相補鎖の一部
分を、DNA合成のきっかけとなるプライマーとしてD
NA合成を行う際に、ジデオキシヌクレオチドと言うヌ
クレオチドが取り込まれると、そこでDNA合成がスト
ップし、様々な長さのDNAの断片(フラグメント)が
得られるが、プライマーを用いたDNA合成反応の際
に、G,A,T、及びCの各塩基に対応するジデオキシ
ヌクレオチドを加えることにより、それぞれの塩基の位
置で鎖の伸びがストップした様々な長さのDNA断片が
得られる。
【0013】図11は特定のヌクレオチド、この場合ア
デニンAの所で切断されてできるDNA断片の作り方の
説明図である。この場合にはDNA鎖から1個のヌクレ
オチド、すなわちアデニンAを取り除く程度の穏やかな
化学処理が行われ、5′末端にリン酸基を持つ左側の断
片のみが放射性の断片となり、これらの断片をゲル電気
泳動させることにより、放射性の断片のみはその断片の
長さ、例えば分子量に対応する位置で検出される。
【0014】DNAシーケンサでは、ジデオキシ法の反
応生成物としてのDNA断片が蛍光標識され、その結果
としての蛍光標識されたいろいろの長さの鎖を持つDN
A断片が、ゲル電気泳動によって分離される。ゲル内を
泳動されてくるDNA断片に対してゲル上のある位置に
おいて、レーザ照射により蛍光色素を励起発光させ、こ
の蛍光を光検出器で検出する。電気泳動と同時に経時的
に蛍光を検出していくことにより、G,A,T、及びC
の各塩基に対応するDNA断片の泳動パターンのデータ
を得ることができる。このようにして得られたデータが
コンピュータによって解析され、塩基配列データに変換
される。
【0015】DNAシーケンサの出力データとしては、
DNA塩基配列そのものと、配列の決定に使われた波形
データがある。この波形データはゲル電気泳動パターン
のデータに対応し、G,A,T、およびCの各波形にお
いて波形のピークの位置がその塩基の存在する位置に対
応する。
【0016】しかしながら、前述のように一般にDNA
の塩基配列における塩基の個数は非常に多いので、DN
Aシーケンサによって一度に塩基配列の全てを決定する
ことはできず、一般に配列を決定したいDNAを複数の
断片にフラグメント化して、各フラグメントの塩基配列
を決定し、それらの塩基配列を結合することによって全
体の塩基配列を決定する方法がとられている。このフラ
グメント化においては、各フラグメントを結合するため
にフラグメントの両端はオーバーラップする形でフラグ
メント化され、各フラグメントに対する塩基配列が求め
られる。
【0017】
【発明が解決しようとする課題】DNAシーケンサを用
いた塩基配列決定処理においては、以上に述べたように
一度に読み取られる塩基の数に制限があり、また読み取
られた配列データの内容にもゲル電気泳動による実験の
精度によってはかなりの曖昧性が含まれる。
【0018】図12はシーケンサによって得られた波形
のデータを示し、縦軸は蛍光強度、また横軸の数値はD
NAの配列における塩基の番号、すなわち、末端からの
塩基の位置を表す。同図において、上から下に向かって
示すように、必要に応じて波形を拡大し、波形に対応す
る位置の塩基の配列が読み取られる。
【0019】このように塩基配列を決定したい目的のD
NAに対しては、フラグメントの配列を必要に応じて拡
大し、フラグメント配列同士を結合したり、曖昧な塩基
を削除したり、必要に応じて塩基を挿入したりする編集
の処理をして塩基配列を組み立てることになるが、その
処理ではより正確に、かつ迅速に目的の塩基配列を得る
ことが望ましい。
【0020】塩基配列を組み立てるためには、DNAシ
ーケンサによって読み取られたフラグメントデータを結
合、または編集する際に、通常は文字の配列だけをシー
ケンサデータから抽出して結合編集操作を行うが、必要
に応じて波形データを参照することも行われている。
【0021】このように波形を参照する場合でも、従来
はフラグメントに対応する波形データが表示されるに過
ぎず、波形同士を比較して検討できるような表示がなさ
れていないという問題点があった。前述のように電気泳
動用ゲルの質のバラつきや、実験条件の微妙な違いなど
によって、波形データのピーク間隔も実験データによっ
て一般的に異なってくる。そのため単純に波形を表示し
ても、波形の間での比較すべき部分の対応が視覚的にわ
かりにくく、塩基配列の正確な組立にあまり役に立たな
いと言う問題点があった。
【0022】また従来においては、ゲル電気泳動におい
て単位塩基数あたりの泳動距離が塩基数が大きくなると
共に短くなり、その結果波形に対応する塩基の間隔が均
一にならないと言う問題点があった。
【0023】図13はこの問題点、すなわち塩基間隔の
不均一性の説明図である。同図において、例えば塩基番
号で100と200の間隔、600と700の間隔が異
なっており、塩基間隔が均一でないことを示している。
また実験条件の微妙な違いによって、同じ塩基番号に対
応する波形の位置も異なっており、波形の間の単純比較
が難しいという問題点がある。
【0024】本発明はDNAの各フラグメントの波形デ
ータを比較する際に、波形上で比較すべき位置の対応が
すぐにわかり、その結果フラグメントデータの結合、お
よび結合後の編集操作において、より正確に塩基配列を
決定できるようにすることを目的とする。
【0025】
【課題を解決するための手段】図1は本発明の機能ブロ
ック図である。同図はDNAの塩基配列を複数の部分的
配列としてのフラグメントに分割して、各フラグメント
毎に該フラグメント内の塩基の位置を示す波形を表示
し、該複数の波形に対応する塩基配列を結合、および編
集してDNA全体の塩基の配列を決定する、塩基配列決
定時におけるフラグメント波形表示方法の機能ブロック
図である。
【0026】このフラグメント波形表示方法において
は、まず図1の1で各フラグメントに対する塩基の配列
がフラグメント塩基配列として決定される。このフラグ
メント塩基配列は、例えばDNAの塩基配列決定用に用
いられるDNAシーケンサの出力によって得られる。
【0027】続いて2で決定された各フラグメント配列
が結合され、その結果としてDNA全体の塩基の配列を
示す1本のコンセンサス配列が、曖昧さ、例えばある位
置の塩基が2つの塩基のうちのいずれか1つであること
などを示す曖昧さが許容された状態で求められる。
【0028】更に3で、このコンセンサス配列に対応さ
せてフラグメント内の塩基の位置を示す波形が表示さ
れ、表示された波形との比較によってコンセンサス配列
の編集、例えば不適当な塩基の削除、必要に応じた塩基
の挿入などの操作が行われ、曖昧さが解消されたDNA
全体の塩基配列が決定される。
【0029】本発明においては、コンセンサス配列に対
応させて表示波形との比較によるコンセンサス配列の編
集を容易にするような波形表示が行われる。その方法
は、例えば次のような方法である。
【0030】例えばDNAシーケンサの出力としてのフ
ラグメント塩基配列上の塩基に対して波形上の位置を示
す位置情報が与えられ、編集操作によってフラグメント
塩基配列に挿入された塩基にはその位置情報を与えず
に、編集後のフラグメント塩基配列中で位置情報を持つ
両端の塩基が前記コンセンサス配列に対応させられ、例
えばスケール変換が行われて、両端の塩基間の波形の表
示が行われる。
【0031】本発明によれば、このような波形表示を行
うことにより、コンセンサス配列に対応する位置に波形
が正しく表示されることになる。
【0032】
【実施例】図2は本発明の波形表示方法を用いる塩基配
列の結合、および編集処理の全体フローチャートであ
る。同図の処理は、フラグメントの結合や編集操作など
のイベントが実行されるたびに行われる、波形表示の更
新までのフローチャートである。
【0033】図2において、まずステップS11でフラ
グメントの結合、または編集などのイベントが入力さ
れ、ステップS12で必要に応じてそのフラグメントの
塩基配列の書き直しなどのプレ処理が行われる。
【0034】ステップS13〜S15の処理が本発明に
特有のものである。まずステップS13で、配列データ
リンク領域の更新処理が行われる。ここで配列データリ
ンク領域とは、現在編集対象となっているフラグメント
配列の塩基の中で、対応する波形データの位置情報を持
っている最も先頭に近い塩基と、最も末尾に近い塩基と
に挟まれた塩基配列の部分領域である。
【0035】後述のように、シーケンサの出力として得
られた配列の中の塩基は、波形データ上でその位置、す
なわち対応する位置情報がわかるので、そのような塩基
に対しては、位置情報と対応した形で例えばメモリにそ
のデータが格納される。これに対して、例えば編集中に
挿入された塩基の場合には、波形データ上で対応する位
置は不明であるので、そのような塩基に対しては対応す
る位置情報は格納されない。従って、配列データリンク
領域とはフラグメント配列の中で対応する位置情報を持
つ最も左側の塩基と右側の塩基とに挟まれた部分領域で
ある。
【0036】図2において、ステップS13で配列デー
タリンク領域の更新、すなわちそのフラグメント配列に
対する配列データリンク領域が求められると、続いてス
テップS14で波形データリンク領域の更新が行われ
る。ここで波形データリンク領域とは、前述の配列デー
タリンク領域の両端の塩基が持つ波形データ位置情報、
すなわち最も左側の塩基の位置と、最も右側の塩基の位
置とに挟まれた波形データの部分領域であり、このステ
ップでは編集対象となっているフラグメント配列の中で
の配列データリンク領域に対応する波形データリンク領
域が求められる。
【0037】ステップS15で波形表示の更新が行わ
れ、編集対象となっているフラグメント配列に対する波
形データリンク領域が求められると、ステップS15で
波形表示の更新(後述)が行われる。その後ステップS
16で必要なポスト処理やその他のイベント処理が行わ
れ、ステップS17で、例えば実際の波形表示を行うた
めのメインループの処理が行われる。
【0038】続いて本発明の波形表示方法において用い
られるデータの構成について説明するが、その前に本発
明で用いるコンセンサス配列の概念について説明する。
前述のように非常に長いDNA鎖の塩基配列を決定する
ためにそのDNAを複数のフラグメントに分割し、各フ
ラグメントについての塩基配列をDNAシーケンサを用
いて決定した後に、それらの配列を結合および編集して
全体のDNAの塩基配列を決定することになるが、その
全体の塩基配列を決定するために各フラグメントの塩基
配列を結合していく過程の1つの塩基配列をコンセンサ
ス配列と呼ぶことにする。そのコンセンサス配列の例を
下に示す。なお、この例は二重鎖の一方のみを示す。 塩基番号 1 5 10 15 20 25 コンセンサス配列 ATGCTTAGSWGTACCARGGTAAAAA ──────────────────────────────────── フラグメントA ATGCTTAGCTGTACCAG フラグメントB TTAGGT−TACCAAGGTA フラグメントC AGCAGTACCAAGGTAAAAA この例では、3つのフラグメントA,B、およびCを結
合させた場合のコンセンサス配列が示されており、フラ
グメントがオーバーラップしている部分では、オーバー
ラップしている塩基が一致している場合にはその塩基が
コンセンサス配列の塩基として用いられ、CかGのいず
れかと考えられる場合にはS、TかAのいずれかと考え
られる場合にはW、GかAのいずれかと考えられる場合
にはRとするIUPACコードが用いられている。
【0039】本発明の波形表示方法において用いられる
データとしては、まずコンセンサス配列毎のデータがあ
る。このコンセンサス配列毎のデータの第1はそのコン
センサス配列に属するフラグメントの本数Fragment Cnt
であり、第2はそのコンセンサス配列に属するフラグメ
ント配列毎のメイン構造体を指すポインタの配列 pFrag
ment〔Fragment Cnt〕である。このフラグメント毎のメ
イン構造体については後述する。第3のデータはコンセ
ンサス配列 Consensus〔Consensus Cnt 〕としての塩基
配列データそのものである。
【0040】次に各フラグメントに対して持つデータに
ついて説明する。そのデータの第1は波形データであ
る。波形データとしては、図3に示すように4種類の塩
基、すなわちアデニンA、チミンT、グアニンG、およ
びシトシンCのそれぞれの塩基について、波形のデータ
が存在する。それぞれの塩基に対する波形データとし
て、一定時間間隔でおよそ10,000回のサンプリングを行
った結果としてのデータが格納され、波形データは二次
元の配列を持つことになる。すなわちデータポイント位
置xの10,000個に対して、各波形の高さを示す、例えば
16ビットのデータがそれぞれの塩基に対して格納され
る。ここでは各波形のデータを次のように表現する。
【0041】 WaveData
〔0〕〔x〕:A(アデニン)の波形データ WaveData〔1〕〔x〕:T(チミン)の波形データ WaveData〔2〕〔x〕:G(グアニン)の波形データ WaveData〔3〕〔x〕:C(シトシン)の波形データ x:データポイント位置 各フラグメントに対する第2のデータは、オリジナルの
塩基配列データである。このオリジナル配列データは、
シーケンサから得られた結果としての結合、および編集
操作の前の各フラグメントの塩基配列である。この塩基
配列データの格納法を図4に示す。同図に示すように、
オリジナル塩基配列データは、塩基番号nに対応する構
造体の配列であり、構造体のメンバはベースコード(B
C)としての塩基の種類を表す文字、すなわちIUPA
Cコードと、ウェーブデータポイント、すなわち図3の
データポイント位置x(各塩基に対応する波形のピーク
におけるデータポイント位置)であり、この配列は次の
記号で表される。
【0042】Originalbase〔n−1〕 (n:塩基番号、1≦n≦〔オリジナル塩基配列の総塩
基数〕) 各フラグメントの第3のデータは、編集用塩基配列デー
タである。これは編集対象となっている塩基配列のデー
タであり、塩基毎の構造体、すなわち第4のデータとし
ての編集用塩基データを指すポインタの配列であり、こ
の配列は次の記号で表される。
【0043】pEditBase 〔m−1〕→m番目の塩基の構
造体を指すポインタ (m:塩基番号) (1≦m≦〔編集中塩基配列の総塩基数〕) 第4のデータは第3のデータ、すなわち編集用塩基配列
データのポインタによって指される塩基毎の構造体であ
り、その構造体のメンバの第1はベースコード、すなわ
ち塩基の種類を表す文字であり、第2のメンバはオリジ
ナルベースナンバ、すなわちベースコードの塩基に対応
するオリジナル塩基配列中の塩基の塩基番号nである。
オリジナル塩基配列中に対応する塩基が存在しない場
合、例えば編集時に挿入された塩基のような場合には、
オリジナルベースナンバは“−1”とされる。
【0044】図5は編集用塩基配列データと編集用塩基
データとを示す。編集用塩基配列データは、前述のよう
に塩基番号に対応して編集用塩基データを指すポインタ
Pの配列であり、このポインタによって編集用塩基デー
タがポイントされる。例えばポインタP3によって指さ
れる構造体の塩基としてのTは、第2のデータとしての
オリジナル塩基配列データ中には存在しない塩基であ
り、従ってこの塩基に対応するオリジナルベースナンバ
は“−1”となっている。
【0045】第5のデータは波形データ、および配列デ
ータに対応して各フラグメントに対して持たれる固有情
報(メイン構造体)であり、この固有情報としては以下
のものがある。
【0046】 ・pWave → WaveDataを指すポインタ ・pOriginalData → OriginalBaseを指すポインタ ・pEditData → pEditBase を指すポインタ ・OffsetBase → フラグメントのコンセンサス
配列上での先頭位置 ・LeftBaseNumber → 編集用塩基配列中における、
配列データリンク領域の左端の塩基番号 ・RightBaseNumber → 編集用塩基配列中における、
配列データリンク領域の右端の塩基番号 ・LeftWaveDataPoint → 波形データ中における波形デ
ータリンク領域の左端のデータポイント位置 ・RightWaveDataPoint→ 波形データ中における波形デ
ータリンク領域の右端のデータポイント位置 このうちオフセットベースは、それぞれのフラグメント
の塩基配列のコンセンサス配列上での位置を示すもので
あり、例えば前述のコンセンサス配列の例では、フラグ
メントBのオフセットは5である。
【0047】次に図2における本発明の特有の処理とし
てのステップS13〜S15の処理について、図6〜図
8によって詳細に説明する。まず図6は波形データリン
ク領域の更新処理の説明図である。同図において、エデ
ィットベース、すなわち編集用塩基配列データ上の全て
の塩基について、編集用塩基データのメンバとしてのオ
リジナルベースナンバが調べられ、オリジナルベースナ
ンバが“−1”でない左と右の端の塩基番号がレフトベ
ースナンバ、およびライトベースナンバに格納される。
【0048】図7は図2のステップS14、すなわち波
形データリンク領域の更新処理の説明図である。同図に
おいては、図6で求められたレフトベースナンバおよび
ライトベースナンバを用いて、例えばレフトベースナン
バに対応してオリジナルベース、すなわちオリジナルの
塩基配列データにおける同一の塩基番号nからそれに対
応するウェーブデータポイントxが求められ、それがレ
フトウェーブデータポイントに格納される。同様にし
て、ライトベースナンバに対応するオリジナル塩基配列
データ上でのウェーブデータポイントがライトウェーブ
データポイントに格納される。
【0049】図8は図2のステップS15、すなわち波
形表示の更新処理の説明図である。同図においては、各
塩基に対応する4本の波形データについて、それぞれレ
フトウェーブデータポイントとライトウェーブデータポ
イントとの間の波形が、コンセンサス配列表示上の塩基
番号でレフトベースナンバとライトベースナンバとの間
に一致するようにスケール変換がなされて、波形の表示
が行われる。
【0050】すなわち本発明においては、各フラグメン
トに対応する波形が、コンセンサスを表すコンセンサス
配列に対応した位置にスケール変換されて表示される。
編集などの処理によってフラグメント配列上の塩基の位
置や内容に変更があった場合には、それに応じてその都
度波形データの表示位置、およびスケールの変換が行わ
れる。
【0051】例えば 345個の塩基から成るフラグメント
配列に対する編集処理等によって塩基数が 350塩基にな
り、またこのフラグメント配列がコンセンサス配列上で
101番目から 450番目に対応することがわかっている場
合には、フラグメント配列の一番目の塩基をコンセンサ
ス配列上の 101番目の位置に、また例えば元々 345番目
にあった 350番目の塩基をコンセンサス配列上の 450番
目の位置に対応するように、スケール変更や表示位置の
シフトなどが行われて、波形表示が行われる。すなわち
シーケンサによって塩基数がnと判断されたフラグメン
トに対して、結合や編集などの操作によって塩基数がn
+5になった場合には、n+5塩基分の範囲に、シーケ
ンサによって決定されたn個の塩基の配列に対応した波
形が表示されることになる。
【0052】次に本発明においては、波形に対応する塩
基間隔を均一にするために、ゲル電気泳動時の移動距離
のひずみを自動的に近似するひずみ補正が行われる。こ
れによって波形同士の単純比較を容易にすることができ
る。その方法を以下に説明する。
【0053】分子量300000以下の分子をゲル電気泳動に
かけたとき、分子の移動速度と分子量の間には近似的に
以下の式が成り立つことが、実験により分かっている。 v=C1log m+C2 ・・・・・・(1) (m:分子量>0,v:移動速度>0,C1 :定数>
0,C2 :定数>0) 蛍光強度の測定は実験毎に設定される一定時間間隔(T
1 >0)毎に行われている。泳動開始位置と蛍光強度検
出位置の距離をC2 >0とすると C3 =v(T1 x+T2 ) ・・・・・・(2) (x=1つ目の塩基が見つかってからのデータポイント
数) (T2 :泳動開始から一番目(x=0)の塩基検出まで
にかかった時間>0) ここで、本実施例では、波形表示用のデータには泳動開
始直後のデータが含まれていないものとする。すなわち
泳動が開始されてから一定時間たった後に、蛍光強度の
データがとられ始める。(1) 式を利用するためには泳動
開始位置、すなわちサンプルが注入された位置から蛍光
強度検出位置までの距離が必要であり、その式が(2) 式
である。なお泳動開始とは電気泳動装置に電圧がかけら
れた時点を意味し、この泳動開始の瞬間から蛍光強度が
測定されてはいるが、データとしては一定時間たってか
らのものが保持されているものとする。
【0054】(2) 式においてはT2 は泳動開始、すなわ
ち電圧が印加されてから蛍光強度がデータとして取られ
始めるまでの時間を意味し、蛍光強度のデータは一定時
間(T1 )間隔、通常1秒位の間隔で測定され、xはデ
ータポイントの数であり、(2) 式はx番目のデータとし
て観測されたDNA塩基が泳動している泳動速度を表
す。
【0055】(1) ,(2) 式を用いて、塩基間隔が均等に
補正された結果としてのデータポイント数xと塩基番号
nとを対応づける式を、以下のようにして誘導する。ま
ず(1) ,(2) の両式から C3 /(T1 x+T2 )=−C1log m+C2 log m=−C3 /C1 (T1 x+T2 )+C2 /C1 ・・・・・・(3) ここでC4 =C3 /C1 >0,C5 =C2 /C1 >0と
すると(3) 式は log m=−C4 /(T1 x+T2 )+C5 ・・・・・・(4) となる。
【0056】プライマーの分子量をMP 、塩基番号を
n、塩基の平均分子量をMB とすると、 m=MP +(n−1)MB ・・・・・・(5) と表せる。(5) 式を(4) 式に代入して log {MP +(n−1)MB }=−C4 /(T1 x+T2 )+C5 P +(n−1)MB =10^{−C4 /(T1 x+T2 )+C5 } ∴ n=f(x) =〔10^{−C4 /(T1 x+T2 )+C5 }−MP 〕/MB +1 ・・・・・・(6) となる。
【0057】ここで、MP はシークエンシング毎のプラ
イマーの分子量として特定される。MB には塩基の平均
分子量として316 を用いる。T1 にはシークエンス時に
設定した測定間隔を用いる。
【0058】T2 には泳動開始から、1番目(n=0)
の塩基検出までにかかった時間を用いる。最後に(6) 式
における定数C4 、およびC5 を実際の泳動データから
決定する。すなわち例えばn=1と、n=101 に対応す
るデータポイント数x1 ,x101のような2つのデータ
を使って、C4 ,C5 を求めることによって、塩基間隔
が近似的に均等に補正されたデータ配列を求めるための
データポイント数xと塩基番号nとを求める式(6) が完
成する。完成された関数としての(6) 式を用いて、塩基
間隔が均等に補正されたデータ配列を求めるための手順
を次の〜で説明する。
【0059】 まず始めに、元の波形データの最後の
データポイントが塩基番号にして何番目(nLast)にな
るかを(6) 式を用いて求める。元の波形データの最後の
データポイントをxLastとする。
【0060】(6) 式より nLast=f(xLast) 次に(6) 式を使って元の波形データの塩基番号n=
−4のときのデータポイントを求める。
【0061】(6) 式より
【0062】
【数2】
【0063】これにn=−4を代入しx−4を求める。 次に(6) 式を使って新たな波形データを作成する。
(nLast+5)×50のデータポイントを持つ配列を作成
し、(6) 式を使って元の波形データのデータポイントか
ら新たな波形データ配列を作成する。
【0064】元の波形データのデータポイントのx−4
からxLastを(6) 式に代入し、nを求め、新たな波形デ
ータの(n+5)×50のデータポイントに格納する。
【0065】 最後に、新たな波形データのデータポ
イントを指す塩基配列を作成する。塩基配列データのn
塩基目の指す新たな波形データ上のデータポイントは
(n+5)×50となる。この値の代入を全ての塩基につ
いて行う。
【0066】なお、ここで塩基番号の50倍のデータポイ
ントを持たせる理由は、塩基間のデータ数を均一にし、
またある程度多いデータ数を持たせるためである。この
新たな波形データの作成にあたってデータが埋まらない
データポイントがある場合には、その直前のデータポイ
ントにおける値が用いられる。すなわち新たな波形デー
タ作成時に、あたらな波形データ上で直前に埋められた
データポイントの値を記憶しておき、データポイントが
とんでいる場合にはその直前に埋められたデータポイン
トの値をとんでいるデータポイントに対して使用する。
【0067】以上に説明したように、(6) 式を基にして
塩基間隔が近似的に均等に補正された波形データの配列
が求められ、その結果は例えばメモリに格納されて、波
形表示に用いられる。具体的には、前述の図3、および
図4のデータはこの計算結果に対応して更新されるが、
図5のデータは更新されない。
【0068】図9および図10は本発明を使用した場合
のフラグメント波形表示の変化の説明図である。図9は
DNAシーケンサの出力をそのまま表示したもの(スケ
ール変換前)である。これに対して図10は本発明の波
形表示方法を用いた結果である。例えば一番下の波形に
おいて、塩基間の間隔が上の波形と比較して均一になっ
ていることがわかる。
【0069】
【発明の効果】以上詳細に説明したように、本発明によ
ればフラグメントの結合状態、および編集状態に対応し
て、例えば編集操作と同時に波形をリアルタイムで表示
し、比較検討できるために、結合や編集の結果の正確さ
を視覚的に確認しながら、塩基配列の決定を行うことが
可能になる。また塩基の記号の配列としての文字配列上
の整合性だけでなく、波形データ上においての整合性も
確認しながら結合や編集を行うことができるため、塩基
配列の組み立てをより正確に、また迅速に行うことがで
きる。更に波形に対応する塩基間隔を均一化することが
でき、波形の比較が容易となり、シーケンシングミスな
どを防止することが可能になる。
【図面の簡単な説明】
【図1】本発明の機能ブロック図である。
【図2】本発明の波形表示方法を用いる塩基配列の結合
および編集処理の全体フローチャートである。
【図3】波形データの格納法を説明する図である。
【図4】オリジナル塩基配列データの格納法を説明する
図である。
【図5】編集用塩基配列データと編集用塩基データとの
格納法の説明図である。
【図6】配列データリンク領域の更新処理の説明図であ
る。
【図7】波形データリンク領域の更新処理の説明図であ
る。
【図8】波形表示の更新処理の説明図である。
【図9】DNAシーケンサの出力波形(スケール変換
前)を示す図である。
【図10】図9の波形に対する本発明の波形表示方法の
適用結果(スケール変換後)を示す図である。
【図11】DNA断片の作り方の説明図である。
【図12】シーケンサによって得られる波形の例を示す
図である。
【図13】塩基間隔の不均一性の説明図である。

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 DNAの塩基配列を複数の部分的塩基配
    列としてのフラグメントに分割して、各フラグメント毎
    に該フラグメント内の各塩基の位置を示す複数の波形を
    表示し、該複数の波形に対応する塩基配列を結合、およ
    び編集してDNA全体の塩基の配列を決定する塩基配列
    決定時において、 該各フラグメントに対する塩基の配列をフラグメント塩
    基配列として決定し(1)、 該決定された各フラグメント塩基配列を結合した結果と
    しての、DNA全体の塩基の配列を示す1本のコンセン
    サス配列を、曖昧さを許容して求め(2)、 該コンセンサス配列に対応させて前記波形を表示し、該
    表示波形との比較により該コンセンサス配列の編集を行
    って、曖昧さを解消したDNA全体の塩基配列を決定す
    る(3)ことを特徴とするDNAの塩基配列決定時にお
    けるフラグメント波形表示方法。
  2. 【請求項2】 前記コンセンサス配列に対応する波形の
    表示において、 DNAの塩基配列を決定するDNAシーケンサの出力と
    しての塩基配列に基づいて波形表示を行うことを特徴と
    する請求項1記載のDNAの塩基配列決定時におけるフ
    ラグメント波形表示方法。
  3. 【請求項3】 前記DNAシーケンサの出力としてのフ
    ラグメント塩基配列上の塩基に対して前記波形上の位置
    を示す位置情報を与え、編集操作によって該フラグメン
    ト塩基配列に挿入された塩基には該位置情報を与えず
    に、編集後のフラグメント塩基配列の中で該位置情報を
    持つ両端の塩基を前記コンセンサス配列に対応させて、
    該両端の塩基間の波形の表示を行うことを特徴とする請
    求項2記載のDNAの塩基配列決定時におけるフラグメ
    ント波形表示方法。
  4. 【請求項4】 前記フラグメントの1つの塩基配列、ま
    たは複数の塩基配列を結合した結果の塩基配列に対応し
    て、前記塩基の位置を示す波形を表示するにあたり、 表示領域内で隣接する塩基間の間隔が均一となるように
    塩基の表示位置を調整して波形表示を行うことを特徴と
    する請求項1記載のDNAの塩基配列決定時におけるフ
    ラグメント波形表示方法。
  5. 【請求項5】 前記フラグメントの1つの塩基配列、ま
    たは複数の塩基配列を結合した結果の塩基配列が、DN
    A塩基配列決定用のDNAシーケンサの出力としての塩
    基配列であり、 前記塩基の表示位置の調整結果を、ゲル電気泳動におけ
    る泳動開始から各塩基の位置に対応する蛍光強度検出位
    置までの泳動距離がプライマーの分子量と泳動開始位置
    から数えた該塩基の番号との関数として求められた結果
    に基づいて求めることを特徴とする請求項4記載のDN
    Aの塩基配列決定時におけるフラグメント波形表示方
    法。
  6. 【請求項6】 DNAの塩基配列を複数の部分的塩基配
    列としてのフラグメントに分割して、各フラグメント毎
    に該フラグメント内の各塩基の位置を示す複数の波形を
    表示し、該複数の波形に対応する塩基配列を結合、およ
    び編集してDNA全体の塩基の配列を決定する塩基配列
    決定用フラグメント波形表示装置において、 該各フラグメントに対する塩基の配列をフラグメント塩
    基配列として決定する手段と、 該決定された各フラグメント塩基配列を結合した結果と
    しての、DNA全体の塩基の配列を示す1本のコンセン
    サス配列を、曖昧さを許容して求める手段と、 該コンセンサス配列に対応させて前記波形を表示し、該
    表示波形との比較により該コンセンサス配列の編集を行
    って、曖昧さを解消したDNA全体の塩基配列を決定す
    る手段とを備えることを特徴とするDNAの塩基配列決
    定用フラグメント波形表示装置。
JP19200695A 1995-07-27 1995-07-27 Dnaの塩基配列決定時におけるフラグメント波形表示方法および装置 Expired - Fee Related JP3675521B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP19200695A JP3675521B2 (ja) 1995-07-27 1995-07-27 Dnaの塩基配列決定時におけるフラグメント波形表示方法および装置
US08/685,959 US5891632A (en) 1995-07-27 1996-07-22 Method and device for fragment trace data display in DNA base sequencing
GBGB9615563.5A GB9615563D0 (en) 1995-07-27 1996-07-24 Method and device for fragment trace data display in DNA base sequencing
GB9615699A GB2303702B (en) 1995-07-27 1996-07-26 Method and device for fragment trace data display in dna base sequencing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP19200695A JP3675521B2 (ja) 1995-07-27 1995-07-27 Dnaの塩基配列決定時におけるフラグメント波形表示方法および装置

Publications (2)

Publication Number Publication Date
JPH0944564A true JPH0944564A (ja) 1997-02-14
JP3675521B2 JP3675521B2 (ja) 2005-07-27

Family

ID=16284043

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19200695A Expired - Fee Related JP3675521B2 (ja) 1995-07-27 1995-07-27 Dnaの塩基配列決定時におけるフラグメント波形表示方法および装置

Country Status (3)

Country Link
US (1) US5891632A (ja)
JP (1) JP3675521B2 (ja)
GB (2) GB9615563D0 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6941317B1 (en) 1999-09-14 2005-09-06 Eragen Biosciences, Inc. Graphical user interface for display and analysis of biological sequence data
US6760668B1 (en) * 2000-03-24 2004-07-06 Bayer Healthcare Llc Method for alignment of DNA sequences with enhanced accuracy and read length
US7222059B2 (en) * 2001-11-15 2007-05-22 Siemens Medical Solutions Diagnostics Electrophoretic trace simulator
US7177452B2 (en) * 2002-04-10 2007-02-13 Battelle Memorial Institute Visualization of information with an established order
US20050165566A1 (en) * 2002-06-03 2005-07-28 Omnigon Technologies Ltd. Method for solving waveform sequence-matching problems using multidimensional attractor tokens
US7630736B2 (en) * 2005-10-11 2009-12-08 Mobitrum Corporation Method and system for spatial data input, manipulation and distribution via an adaptive wireless transceiver
US7801058B2 (en) * 2006-07-27 2010-09-21 Mobitrum Corporation Method and system for dynamic information exchange on mesh network devices
US8165821B2 (en) * 2007-02-05 2012-04-24 Applied Biosystems, Llc System and methods for indel identification using short read sequencing
WO2011137368A2 (en) 2010-04-30 2011-11-03 Life Technologies Corporation Systems and methods for analyzing nucleic acid sequences
US9268903B2 (en) 2010-07-06 2016-02-23 Life Technologies Corporation Systems and methods for sequence data alignment quality assessment

Also Published As

Publication number Publication date
JP3675521B2 (ja) 2005-07-27
GB9615699D0 (en) 1996-09-04
GB9615563D0 (en) 1996-09-04
US5891632A (en) 1999-04-06
GB2303702B (en) 1999-12-01
GB2303702A (en) 1997-02-26

Similar Documents

Publication Publication Date Title
US10984887B2 (en) Systems and methods for detecting structural variants
US6681186B1 (en) System and method for improving the accuracy of DNA sequencing and error probability estimation through application of a mathematical model to the analysis of electropherograms
JP3675521B2 (ja) Dnaの塩基配列決定時におけるフラグメント波形表示方法および装置
US20260057967A1 (en) Method for predicting the melting temperature of oligonucleotide
US12482535B2 (en) Systems and methods for detecting recombination
US7660676B2 (en) Nucleic acid base sequence determining method and inspecting system
JP3261426B2 (ja) Dnaフラグメントのヌクレオチドのサイズの測定方法
JP2022548504A5 (ja)
US6444422B2 (en) Computer method and system for correlating data
WO2017009718A1 (en) Automatic processing selection based on tagged genomic sequences
JP3878503B2 (ja) 核酸塩基配列決定方法
JP4317398B2 (ja) 核酸塩基配列情報の記録方法及び核酸塩基配列決定方法
JPH11118760A (ja) 核酸断片の電気泳動パターンの解析法
JP4286332B2 (ja) Dna塩基配列に含まれるベクター部の自動除去方法および装置
JP2508404B2 (ja) 塩基配列決定装置
JP2000285120A (ja) 遺伝子発現探索方法及びその装置
EP1202211A2 (en) Genomic DNA analysis computer program
Bhat et al. DNA Sequencing
Kumar et al. Recent techniques and strategies for sequencing
US20030013863A1 (en) High resolution DNA size standards
Tara et al. ADVANCED ANALYTICAL TECHNIQUES FOR NEXT GENERATION SEQUENCING: A NARRATIVE REVIEW
Messing In vitro DNA synthesis as a tool to analyze and alter genes
JP2536105B2 (ja) 標識された核酸フラグメント
Thakur et al. REMAP a web server for regulatory elements mapping and prediction
BE183 DNA Sequencing

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050114

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050426

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050426

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080513

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090513

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees