JPH0944564A - Dnaの塩基配列決定時におけるフラグメント波形表示方法および装置 - Google Patents
Dnaの塩基配列決定時におけるフラグメント波形表示方法および装置Info
- Publication number
- JPH0944564A JPH0944564A JP19200695A JP19200695A JPH0944564A JP H0944564 A JPH0944564 A JP H0944564A JP 19200695 A JP19200695 A JP 19200695A JP 19200695 A JP19200695 A JP 19200695A JP H0944564 A JPH0944564 A JP H0944564A
- Authority
- JP
- Japan
- Prior art keywords
- base
- fragment
- sequence
- waveform
- base sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Immunology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
メント波形上で比較すべき位置を明快にし、より正確な
塩基配列を決定可能にすることを目的とする。 【構成】 まず各フラグメントに対するフラグメント塩
基配列を決定し、次に各フラグメント塩基配列を結合し
た結果としてのDNA全体の塩基配列を曖昧さを許容し
たコンセンサス配列として求め、さらにコンセンサス配
列に対応させてフラグメント内の塩基位置を示す波形を
表示し、該表示波形との比較により正確なコンセンサス
配列を求めるように構成する。
Description
NAにおける塩基配列の決定方法に係り、更に詳しくは
DNAシーケンサを用いたDNA塩基配列決定時におけ
るDNAの断片としてのフラグメントにおける塩基の配
列に対応する波形の表示方法に関する。
このヌクレオチドは塩基、糖、リン酸の3成分が結合し
たものである。ヌクレオチドはヌクレオシドにリン酸が
結合したものでもあり、リン酸はヌクレオシドをはしか
けして、ポリマーが作られ、DNA(レオキシリボ核
酸)とRNA(リボ核酸)のいずれかが形成される。
ミジン塩基の2種類があり、プリン塩基にはアデニンA
とグアニンGがあり、またピリミジン塩基にはシトシン
CとチミンTがある。
持つDNAは、前述の4つの塩基アデニンA、グアニン
G、シトシンC、およびチミンTが一列に並んだ細長い
糸のような構造を持っており、例えば1個のヒトの細胞
の染色体からDNAを引き出し、それらを繋ぎ合わせる
と1mにもおよび、この上に30億個の塩基が並んでい
ると言われる。
序を知ることが、すなわち遺伝情報を解明することにつ
ながり、この塩基配列を決めるシーケンス技術は他の分
野の技術と互いに関連しながら進歩しており、その発展
は制限酵素や核酸関連酵素の発見、DNAのクローニン
グ、核酸化学などの技術分野の発展と大いに関連してい
る。
の1つとして活用され、人間の能力を越えた膨大なデー
タの入力や蓄積が可能となり、塩基配列の決定にとって
コンピュータは必須の道具として用いられるようになっ
ている。
わち鎖状に結合した塩基一次配列の構造を持っている。
このDNA鎖には向きがあり、ATGCACGA→とA
TGCACGA←(すなわち、AGCACGTA→)と
は別のものである。
称がついており、糖の3′の位置に水酸基がついた末端
は3′末端と呼ばれ、また他方の末端、すなわち糖の
5′の位置にリン酸基がついた末端は5′末端と呼ばれ
る。そしてDNA鎖を記述する際には、一般に5′末端
が左、3′末端が右となるように記述する。
本の塩基配列がくっついた二重鎖の状態で存在する。こ
の時2本の塩基配列において、お互いに向かい合う塩基
の間には一定の関係があり、アデニンAはチミンTと、
またグアニンGはシトシンCと向き合うようになってい
る。この例を次に示す(上下の塩基がペアとなってい
る)。
となって、1つの遺伝的意味を持ち、2つの配列のうち
どちらか1つの配列を確定することができれば、そのD
NAの塩基配列を決定できたことになる。
であるDNAシーケンサにおいては、ジデオキシ法、ま
たはサンガ法と呼ばれる方法が塩基配列決定のために用
いられる。一般にDNAの二重鎖の一方の相補鎖の一部
分を、DNA合成のきっかけとなるプライマーとしてD
NA合成を行う際に、ジデオキシヌクレオチドと言うヌ
クレオチドが取り込まれると、そこでDNA合成がスト
ップし、様々な長さのDNAの断片(フラグメント)が
得られるが、プライマーを用いたDNA合成反応の際
に、G,A,T、及びCの各塩基に対応するジデオキシ
ヌクレオチドを加えることにより、それぞれの塩基の位
置で鎖の伸びがストップした様々な長さのDNA断片が
得られる。
デニンAの所で切断されてできるDNA断片の作り方の
説明図である。この場合にはDNA鎖から1個のヌクレ
オチド、すなわちアデニンAを取り除く程度の穏やかな
化学処理が行われ、5′末端にリン酸基を持つ左側の断
片のみが放射性の断片となり、これらの断片をゲル電気
泳動させることにより、放射性の断片のみはその断片の
長さ、例えば分子量に対応する位置で検出される。
応生成物としてのDNA断片が蛍光標識され、その結果
としての蛍光標識されたいろいろの長さの鎖を持つDN
A断片が、ゲル電気泳動によって分離される。ゲル内を
泳動されてくるDNA断片に対してゲル上のある位置に
おいて、レーザ照射により蛍光色素を励起発光させ、こ
の蛍光を光検出器で検出する。電気泳動と同時に経時的
に蛍光を検出していくことにより、G,A,T、及びC
の各塩基に対応するDNA断片の泳動パターンのデータ
を得ることができる。このようにして得られたデータが
コンピュータによって解析され、塩基配列データに変換
される。
DNA塩基配列そのものと、配列の決定に使われた波形
データがある。この波形データはゲル電気泳動パターン
のデータに対応し、G,A,T、およびCの各波形にお
いて波形のピークの位置がその塩基の存在する位置に対
応する。
の塩基配列における塩基の個数は非常に多いので、DN
Aシーケンサによって一度に塩基配列の全てを決定する
ことはできず、一般に配列を決定したいDNAを複数の
断片にフラグメント化して、各フラグメントの塩基配列
を決定し、それらの塩基配列を結合することによって全
体の塩基配列を決定する方法がとられている。このフラ
グメント化においては、各フラグメントを結合するため
にフラグメントの両端はオーバーラップする形でフラグ
メント化され、各フラグメントに対する塩基配列が求め
られる。
いた塩基配列決定処理においては、以上に述べたように
一度に読み取られる塩基の数に制限があり、また読み取
られた配列データの内容にもゲル電気泳動による実験の
精度によってはかなりの曖昧性が含まれる。
のデータを示し、縦軸は蛍光強度、また横軸の数値はD
NAの配列における塩基の番号、すなわち、末端からの
塩基の位置を表す。同図において、上から下に向かって
示すように、必要に応じて波形を拡大し、波形に対応す
る位置の塩基の配列が読み取られる。
NAに対しては、フラグメントの配列を必要に応じて拡
大し、フラグメント配列同士を結合したり、曖昧な塩基
を削除したり、必要に応じて塩基を挿入したりする編集
の処理をして塩基配列を組み立てることになるが、その
処理ではより正確に、かつ迅速に目的の塩基配列を得る
ことが望ましい。
ーケンサによって読み取られたフラグメントデータを結
合、または編集する際に、通常は文字の配列だけをシー
ケンサデータから抽出して結合編集操作を行うが、必要
に応じて波形データを参照することも行われている。
はフラグメントに対応する波形データが表示されるに過
ぎず、波形同士を比較して検討できるような表示がなさ
れていないという問題点があった。前述のように電気泳
動用ゲルの質のバラつきや、実験条件の微妙な違いなど
によって、波形データのピーク間隔も実験データによっ
て一般的に異なってくる。そのため単純に波形を表示し
ても、波形の間での比較すべき部分の対応が視覚的にわ
かりにくく、塩基配列の正確な組立にあまり役に立たな
いと言う問題点があった。
て単位塩基数あたりの泳動距離が塩基数が大きくなると
共に短くなり、その結果波形に対応する塩基の間隔が均
一にならないと言う問題点があった。
不均一性の説明図である。同図において、例えば塩基番
号で100と200の間隔、600と700の間隔が異
なっており、塩基間隔が均一でないことを示している。
また実験条件の微妙な違いによって、同じ塩基番号に対
応する波形の位置も異なっており、波形の間の単純比較
が難しいという問題点がある。
ータを比較する際に、波形上で比較すべき位置の対応が
すぐにわかり、その結果フラグメントデータの結合、お
よび結合後の編集操作において、より正確に塩基配列を
決定できるようにすることを目的とする。
ック図である。同図はDNAの塩基配列を複数の部分的
配列としてのフラグメントに分割して、各フラグメント
毎に該フラグメント内の塩基の位置を示す波形を表示
し、該複数の波形に対応する塩基配列を結合、および編
集してDNA全体の塩基の配列を決定する、塩基配列決
定時におけるフラグメント波形表示方法の機能ブロック
図である。
は、まず図1の1で各フラグメントに対する塩基の配列
がフラグメント塩基配列として決定される。このフラグ
メント塩基配列は、例えばDNAの塩基配列決定用に用
いられるDNAシーケンサの出力によって得られる。
が結合され、その結果としてDNA全体の塩基の配列を
示す1本のコンセンサス配列が、曖昧さ、例えばある位
置の塩基が2つの塩基のうちのいずれか1つであること
などを示す曖昧さが許容された状態で求められる。
せてフラグメント内の塩基の位置を示す波形が表示さ
れ、表示された波形との比較によってコンセンサス配列
の編集、例えば不適当な塩基の削除、必要に応じた塩基
の挿入などの操作が行われ、曖昧さが解消されたDNA
全体の塩基配列が決定される。
応させて表示波形との比較によるコンセンサス配列の編
集を容易にするような波形表示が行われる。その方法
は、例えば次のような方法である。
ラグメント塩基配列上の塩基に対して波形上の位置を示
す位置情報が与えられ、編集操作によってフラグメント
塩基配列に挿入された塩基にはその位置情報を与えず
に、編集後のフラグメント塩基配列中で位置情報を持つ
両端の塩基が前記コンセンサス配列に対応させられ、例
えばスケール変換が行われて、両端の塩基間の波形の表
示が行われる。
うことにより、コンセンサス配列に対応する位置に波形
が正しく表示されることになる。
列の結合、および編集処理の全体フローチャートであ
る。同図の処理は、フラグメントの結合や編集操作など
のイベントが実行されるたびに行われる、波形表示の更
新までのフローチャートである。
グメントの結合、または編集などのイベントが入力さ
れ、ステップS12で必要に応じてそのフラグメントの
塩基配列の書き直しなどのプレ処理が行われる。
特有のものである。まずステップS13で、配列データ
リンク領域の更新処理が行われる。ここで配列データリ
ンク領域とは、現在編集対象となっているフラグメント
配列の塩基の中で、対応する波形データの位置情報を持
っている最も先頭に近い塩基と、最も末尾に近い塩基と
に挟まれた塩基配列の部分領域である。
られた配列の中の塩基は、波形データ上でその位置、す
なわち対応する位置情報がわかるので、そのような塩基
に対しては、位置情報と対応した形で例えばメモリにそ
のデータが格納される。これに対して、例えば編集中に
挿入された塩基の場合には、波形データ上で対応する位
置は不明であるので、そのような塩基に対しては対応す
る位置情報は格納されない。従って、配列データリンク
領域とはフラグメント配列の中で対応する位置情報を持
つ最も左側の塩基と右側の塩基とに挟まれた部分領域で
ある。
タリンク領域の更新、すなわちそのフラグメント配列に
対する配列データリンク領域が求められると、続いてス
テップS14で波形データリンク領域の更新が行われ
る。ここで波形データリンク領域とは、前述の配列デー
タリンク領域の両端の塩基が持つ波形データ位置情報、
すなわち最も左側の塩基の位置と、最も右側の塩基の位
置とに挟まれた波形データの部分領域であり、このステ
ップでは編集対象となっているフラグメント配列の中で
の配列データリンク領域に対応する波形データリンク領
域が求められる。
れ、編集対象となっているフラグメント配列に対する波
形データリンク領域が求められると、ステップS15で
波形表示の更新(後述)が行われる。その後ステップS
16で必要なポスト処理やその他のイベント処理が行わ
れ、ステップS17で、例えば実際の波形表示を行うた
めのメインループの処理が行われる。
られるデータの構成について説明するが、その前に本発
明で用いるコンセンサス配列の概念について説明する。
前述のように非常に長いDNA鎖の塩基配列を決定する
ためにそのDNAを複数のフラグメントに分割し、各フ
ラグメントについての塩基配列をDNAシーケンサを用
いて決定した後に、それらの配列を結合および編集して
全体のDNAの塩基配列を決定することになるが、その
全体の塩基配列を決定するために各フラグメントの塩基
配列を結合していく過程の1つの塩基配列をコンセンサ
ス配列と呼ぶことにする。そのコンセンサス配列の例を
下に示す。なお、この例は二重鎖の一方のみを示す。 塩基番号 1 5 10 15 20 25 コンセンサス配列 ATGCTTAGSWGTACCARGGTAAAAA ──────────────────────────────────── フラグメントA ATGCTTAGCTGTACCAG フラグメントB TTAGGT−TACCAAGGTA フラグメントC AGCAGTACCAAGGTAAAAA この例では、3つのフラグメントA,B、およびCを結
合させた場合のコンセンサス配列が示されており、フラ
グメントがオーバーラップしている部分では、オーバー
ラップしている塩基が一致している場合にはその塩基が
コンセンサス配列の塩基として用いられ、CかGのいず
れかと考えられる場合にはS、TかAのいずれかと考え
られる場合にはW、GかAのいずれかと考えられる場合
にはRとするIUPACコードが用いられている。
データとしては、まずコンセンサス配列毎のデータがあ
る。このコンセンサス配列毎のデータの第1はそのコン
センサス配列に属するフラグメントの本数Fragment Cnt
であり、第2はそのコンセンサス配列に属するフラグメ
ント配列毎のメイン構造体を指すポインタの配列 pFrag
ment〔Fragment Cnt〕である。このフラグメント毎のメ
イン構造体については後述する。第3のデータはコンセ
ンサス配列 Consensus〔Consensus Cnt 〕としての塩基
配列データそのものである。
ついて説明する。そのデータの第1は波形データであ
る。波形データとしては、図3に示すように4種類の塩
基、すなわちアデニンA、チミンT、グアニンG、およ
びシトシンCのそれぞれの塩基について、波形のデータ
が存在する。それぞれの塩基に対する波形データとし
て、一定時間間隔でおよそ10,000回のサンプリングを行
った結果としてのデータが格納され、波形データは二次
元の配列を持つことになる。すなわちデータポイント位
置xの10,000個に対して、各波形の高さを示す、例えば
16ビットのデータがそれぞれの塩基に対して格納され
る。ここでは各波形のデータを次のように表現する。
塩基配列データである。このオリジナル配列データは、
シーケンサから得られた結果としての結合、および編集
操作の前の各フラグメントの塩基配列である。この塩基
配列データの格納法を図4に示す。同図に示すように、
オリジナル塩基配列データは、塩基番号nに対応する構
造体の配列であり、構造体のメンバはベースコード(B
C)としての塩基の種類を表す文字、すなわちIUPA
Cコードと、ウェーブデータポイント、すなわち図3の
データポイント位置x(各塩基に対応する波形のピーク
におけるデータポイント位置)であり、この配列は次の
記号で表される。
基数〕) 各フラグメントの第3のデータは、編集用塩基配列デー
タである。これは編集対象となっている塩基配列のデー
タであり、塩基毎の構造体、すなわち第4のデータとし
ての編集用塩基データを指すポインタの配列であり、こ
の配列は次の記号で表される。
造体を指すポインタ (m:塩基番号) (1≦m≦〔編集中塩基配列の総塩基数〕) 第4のデータは第3のデータ、すなわち編集用塩基配列
データのポインタによって指される塩基毎の構造体であ
り、その構造体のメンバの第1はベースコード、すなわ
ち塩基の種類を表す文字であり、第2のメンバはオリジ
ナルベースナンバ、すなわちベースコードの塩基に対応
するオリジナル塩基配列中の塩基の塩基番号nである。
オリジナル塩基配列中に対応する塩基が存在しない場
合、例えば編集時に挿入された塩基のような場合には、
オリジナルベースナンバは“−1”とされる。
データとを示す。編集用塩基配列データは、前述のよう
に塩基番号に対応して編集用塩基データを指すポインタ
Pの配列であり、このポインタによって編集用塩基デー
タがポイントされる。例えばポインタP3によって指さ
れる構造体の塩基としてのTは、第2のデータとしての
オリジナル塩基配列データ中には存在しない塩基であ
り、従ってこの塩基に対応するオリジナルベースナンバ
は“−1”となっている。
ータに対応して各フラグメントに対して持たれる固有情
報(メイン構造体)であり、この固有情報としては以下
のものがある。
配列上での先頭位置 ・LeftBaseNumber → 編集用塩基配列中における、
配列データリンク領域の左端の塩基番号 ・RightBaseNumber → 編集用塩基配列中における、
配列データリンク領域の右端の塩基番号 ・LeftWaveDataPoint → 波形データ中における波形デ
ータリンク領域の左端のデータポイント位置 ・RightWaveDataPoint→ 波形データ中における波形デ
ータリンク領域の右端のデータポイント位置 このうちオフセットベースは、それぞれのフラグメント
の塩基配列のコンセンサス配列上での位置を示すもので
あり、例えば前述のコンセンサス配列の例では、フラグ
メントBのオフセットは5である。
てのステップS13〜S15の処理について、図6〜図
8によって詳細に説明する。まず図6は波形データリン
ク領域の更新処理の説明図である。同図において、エデ
ィットベース、すなわち編集用塩基配列データ上の全て
の塩基について、編集用塩基データのメンバとしてのオ
リジナルベースナンバが調べられ、オリジナルベースナ
ンバが“−1”でない左と右の端の塩基番号がレフトベ
ースナンバ、およびライトベースナンバに格納される。
形データリンク領域の更新処理の説明図である。同図に
おいては、図6で求められたレフトベースナンバおよび
ライトベースナンバを用いて、例えばレフトベースナン
バに対応してオリジナルベース、すなわちオリジナルの
塩基配列データにおける同一の塩基番号nからそれに対
応するウェーブデータポイントxが求められ、それがレ
フトウェーブデータポイントに格納される。同様にし
て、ライトベースナンバに対応するオリジナル塩基配列
データ上でのウェーブデータポイントがライトウェーブ
データポイントに格納される。
形表示の更新処理の説明図である。同図においては、各
塩基に対応する4本の波形データについて、それぞれレ
フトウェーブデータポイントとライトウェーブデータポ
イントとの間の波形が、コンセンサス配列表示上の塩基
番号でレフトベースナンバとライトベースナンバとの間
に一致するようにスケール変換がなされて、波形の表示
が行われる。
トに対応する波形が、コンセンサスを表すコンセンサス
配列に対応した位置にスケール変換されて表示される。
編集などの処理によってフラグメント配列上の塩基の位
置や内容に変更があった場合には、それに応じてその都
度波形データの表示位置、およびスケールの変換が行わ
れる。
配列に対する編集処理等によって塩基数が 350塩基にな
り、またこのフラグメント配列がコンセンサス配列上で
101番目から 450番目に対応することがわかっている場
合には、フラグメント配列の一番目の塩基をコンセンサ
ス配列上の 101番目の位置に、また例えば元々 345番目
にあった 350番目の塩基をコンセンサス配列上の 450番
目の位置に対応するように、スケール変更や表示位置の
シフトなどが行われて、波形表示が行われる。すなわち
シーケンサによって塩基数がnと判断されたフラグメン
トに対して、結合や編集などの操作によって塩基数がn
+5になった場合には、n+5塩基分の範囲に、シーケ
ンサによって決定されたn個の塩基の配列に対応した波
形が表示されることになる。
基間隔を均一にするために、ゲル電気泳動時の移動距離
のひずみを自動的に近似するひずみ補正が行われる。こ
れによって波形同士の単純比較を容易にすることができ
る。その方法を以下に説明する。
かけたとき、分子の移動速度と分子量の間には近似的に
以下の式が成り立つことが、実験により分かっている。 v=C1log m+C2 ・・・・・・(1) (m:分子量>0,v:移動速度>0,C1 :定数>
0,C2 :定数>0) 蛍光強度の測定は実験毎に設定される一定時間間隔(T
1 >0)毎に行われている。泳動開始位置と蛍光強度検
出位置の距離をC2 >0とすると C3 =v(T1 x+T2 ) ・・・・・・(2) (x=1つ目の塩基が見つかってからのデータポイント
数) (T2 :泳動開始から一番目(x=0)の塩基検出まで
にかかった時間>0) ここで、本実施例では、波形表示用のデータには泳動開
始直後のデータが含まれていないものとする。すなわち
泳動が開始されてから一定時間たった後に、蛍光強度の
データがとられ始める。(1) 式を利用するためには泳動
開始位置、すなわちサンプルが注入された位置から蛍光
強度検出位置までの距離が必要であり、その式が(2) 式
である。なお泳動開始とは電気泳動装置に電圧がかけら
れた時点を意味し、この泳動開始の瞬間から蛍光強度が
測定されてはいるが、データとしては一定時間たってか
らのものが保持されているものとする。
ち電圧が印加されてから蛍光強度がデータとして取られ
始めるまでの時間を意味し、蛍光強度のデータは一定時
間(T1 )間隔、通常1秒位の間隔で測定され、xはデ
ータポイントの数であり、(2) 式はx番目のデータとし
て観測されたDNA塩基が泳動している泳動速度を表
す。
補正された結果としてのデータポイント数xと塩基番号
nとを対応づける式を、以下のようにして誘導する。ま
ず(1) ,(2) の両式から C3 /(T1 x+T2 )=−C1log m+C2 log m=−C3 /C1 (T1 x+T2 )+C2 /C1 ・・・・・・(3) ここでC4 =C3 /C1 >0,C5 =C2 /C1 >0と
すると(3) 式は log m=−C4 /(T1 x+T2 )+C5 ・・・・・・(4) となる。
n、塩基の平均分子量をMB とすると、 m=MP +(n−1)MB ・・・・・・(5) と表せる。(5) 式を(4) 式に代入して log {MP +(n−1)MB }=−C4 /(T1 x+T2 )+C5 MP +(n−1)MB =10^{−C4 /(T1 x+T2 )+C5 } ∴ n=f(x) =〔10^{−C4 /(T1 x+T2 )+C5 }−MP 〕/MB +1 ・・・・・・(6) となる。
イマーの分子量として特定される。MB には塩基の平均
分子量として316 を用いる。T1 にはシークエンス時に
設定した測定間隔を用いる。
の塩基検出までにかかった時間を用いる。最後に(6) 式
における定数C4 、およびC5 を実際の泳動データから
決定する。すなわち例えばn=1と、n=101 に対応す
るデータポイント数x1 ,x101のような2つのデータ
を使って、C4 ,C5 を求めることによって、塩基間隔
が近似的に均等に補正されたデータ配列を求めるための
データポイント数xと塩基番号nとを求める式(6) が完
成する。完成された関数としての(6) 式を用いて、塩基
間隔が均等に補正されたデータ配列を求めるための手順
を次の〜で説明する。
データポイントが塩基番号にして何番目(nLast)にな
るかを(6) 式を用いて求める。元の波形データの最後の
データポイントをxLastとする。
−4のときのデータポイントを求める。
(nLast+5)×50のデータポイントを持つ配列を作成
し、(6) 式を使って元の波形データのデータポイントか
ら新たな波形データ配列を作成する。
からxLastを(6) 式に代入し、nを求め、新たな波形デ
ータの(n+5)×50のデータポイントに格納する。
イントを指す塩基配列を作成する。塩基配列データのn
塩基目の指す新たな波形データ上のデータポイントは
(n+5)×50となる。この値の代入を全ての塩基につ
いて行う。
ントを持たせる理由は、塩基間のデータ数を均一にし、
またある程度多いデータ数を持たせるためである。この
新たな波形データの作成にあたってデータが埋まらない
データポイントがある場合には、その直前のデータポイ
ントにおける値が用いられる。すなわち新たな波形デー
タ作成時に、あたらな波形データ上で直前に埋められた
データポイントの値を記憶しておき、データポイントが
とんでいる場合にはその直前に埋められたデータポイン
トの値をとんでいるデータポイントに対して使用する。
塩基間隔が近似的に均等に補正された波形データの配列
が求められ、その結果は例えばメモリに格納されて、波
形表示に用いられる。具体的には、前述の図3、および
図4のデータはこの計算結果に対応して更新されるが、
図5のデータは更新されない。
のフラグメント波形表示の変化の説明図である。図9は
DNAシーケンサの出力をそのまま表示したもの(スケ
ール変換前)である。これに対して図10は本発明の波
形表示方法を用いた結果である。例えば一番下の波形に
おいて、塩基間の間隔が上の波形と比較して均一になっ
ていることがわかる。
ればフラグメントの結合状態、および編集状態に対応し
て、例えば編集操作と同時に波形をリアルタイムで表示
し、比較検討できるために、結合や編集の結果の正確さ
を視覚的に確認しながら、塩基配列の決定を行うことが
可能になる。また塩基の記号の配列としての文字配列上
の整合性だけでなく、波形データ上においての整合性も
確認しながら結合や編集を行うことができるため、塩基
配列の組み立てをより正確に、また迅速に行うことがで
きる。更に波形に対応する塩基間隔を均一化することが
でき、波形の比較が容易となり、シーケンシングミスな
どを防止することが可能になる。
および編集処理の全体フローチャートである。
図である。
格納法の説明図である。
る。
る。
前)を示す図である。
適用結果(スケール変換後)を示す図である。
図である。
Claims (6)
- 【請求項1】 DNAの塩基配列を複数の部分的塩基配
列としてのフラグメントに分割して、各フラグメント毎
に該フラグメント内の各塩基の位置を示す複数の波形を
表示し、該複数の波形に対応する塩基配列を結合、およ
び編集してDNA全体の塩基の配列を決定する塩基配列
決定時において、 該各フラグメントに対する塩基の配列をフラグメント塩
基配列として決定し(1)、 該決定された各フラグメント塩基配列を結合した結果と
しての、DNA全体の塩基の配列を示す1本のコンセン
サス配列を、曖昧さを許容して求め(2)、 該コンセンサス配列に対応させて前記波形を表示し、該
表示波形との比較により該コンセンサス配列の編集を行
って、曖昧さを解消したDNA全体の塩基配列を決定す
る(3)ことを特徴とするDNAの塩基配列決定時にお
けるフラグメント波形表示方法。 - 【請求項2】 前記コンセンサス配列に対応する波形の
表示において、 DNAの塩基配列を決定するDNAシーケンサの出力と
しての塩基配列に基づいて波形表示を行うことを特徴と
する請求項1記載のDNAの塩基配列決定時におけるフ
ラグメント波形表示方法。 - 【請求項3】 前記DNAシーケンサの出力としてのフ
ラグメント塩基配列上の塩基に対して前記波形上の位置
を示す位置情報を与え、編集操作によって該フラグメン
ト塩基配列に挿入された塩基には該位置情報を与えず
に、編集後のフラグメント塩基配列の中で該位置情報を
持つ両端の塩基を前記コンセンサス配列に対応させて、
該両端の塩基間の波形の表示を行うことを特徴とする請
求項2記載のDNAの塩基配列決定時におけるフラグメ
ント波形表示方法。 - 【請求項4】 前記フラグメントの1つの塩基配列、ま
たは複数の塩基配列を結合した結果の塩基配列に対応し
て、前記塩基の位置を示す波形を表示するにあたり、 表示領域内で隣接する塩基間の間隔が均一となるように
塩基の表示位置を調整して波形表示を行うことを特徴と
する請求項1記載のDNAの塩基配列決定時におけるフ
ラグメント波形表示方法。 - 【請求項5】 前記フラグメントの1つの塩基配列、ま
たは複数の塩基配列を結合した結果の塩基配列が、DN
A塩基配列決定用のDNAシーケンサの出力としての塩
基配列であり、 前記塩基の表示位置の調整結果を、ゲル電気泳動におけ
る泳動開始から各塩基の位置に対応する蛍光強度検出位
置までの泳動距離がプライマーの分子量と泳動開始位置
から数えた該塩基の番号との関数として求められた結果
に基づいて求めることを特徴とする請求項4記載のDN
Aの塩基配列決定時におけるフラグメント波形表示方
法。 - 【請求項6】 DNAの塩基配列を複数の部分的塩基配
列としてのフラグメントに分割して、各フラグメント毎
に該フラグメント内の各塩基の位置を示す複数の波形を
表示し、該複数の波形に対応する塩基配列を結合、およ
び編集してDNA全体の塩基の配列を決定する塩基配列
決定用フラグメント波形表示装置において、 該各フラグメントに対する塩基の配列をフラグメント塩
基配列として決定する手段と、 該決定された各フラグメント塩基配列を結合した結果と
しての、DNA全体の塩基の配列を示す1本のコンセン
サス配列を、曖昧さを許容して求める手段と、 該コンセンサス配列に対応させて前記波形を表示し、該
表示波形との比較により該コンセンサス配列の編集を行
って、曖昧さを解消したDNA全体の塩基配列を決定す
る手段とを備えることを特徴とするDNAの塩基配列決
定用フラグメント波形表示装置。
Priority Applications (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP19200695A JP3675521B2 (ja) | 1995-07-27 | 1995-07-27 | Dnaの塩基配列決定時におけるフラグメント波形表示方法および装置 |
| US08/685,959 US5891632A (en) | 1995-07-27 | 1996-07-22 | Method and device for fragment trace data display in DNA base sequencing |
| GBGB9615563.5A GB9615563D0 (en) | 1995-07-27 | 1996-07-24 | Method and device for fragment trace data display in DNA base sequencing |
| GB9615699A GB2303702B (en) | 1995-07-27 | 1996-07-26 | Method and device for fragment trace data display in dna base sequencing |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP19200695A JP3675521B2 (ja) | 1995-07-27 | 1995-07-27 | Dnaの塩基配列決定時におけるフラグメント波形表示方法および装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH0944564A true JPH0944564A (ja) | 1997-02-14 |
| JP3675521B2 JP3675521B2 (ja) | 2005-07-27 |
Family
ID=16284043
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP19200695A Expired - Fee Related JP3675521B2 (ja) | 1995-07-27 | 1995-07-27 | Dnaの塩基配列決定時におけるフラグメント波形表示方法および装置 |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US5891632A (ja) |
| JP (1) | JP3675521B2 (ja) |
| GB (2) | GB9615563D0 (ja) |
Families Citing this family (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6941317B1 (en) | 1999-09-14 | 2005-09-06 | Eragen Biosciences, Inc. | Graphical user interface for display and analysis of biological sequence data |
| US6760668B1 (en) * | 2000-03-24 | 2004-07-06 | Bayer Healthcare Llc | Method for alignment of DNA sequences with enhanced accuracy and read length |
| US7222059B2 (en) * | 2001-11-15 | 2007-05-22 | Siemens Medical Solutions Diagnostics | Electrophoretic trace simulator |
| US7177452B2 (en) * | 2002-04-10 | 2007-02-13 | Battelle Memorial Institute | Visualization of information with an established order |
| US20050165566A1 (en) * | 2002-06-03 | 2005-07-28 | Omnigon Technologies Ltd. | Method for solving waveform sequence-matching problems using multidimensional attractor tokens |
| US7630736B2 (en) * | 2005-10-11 | 2009-12-08 | Mobitrum Corporation | Method and system for spatial data input, manipulation and distribution via an adaptive wireless transceiver |
| US7801058B2 (en) * | 2006-07-27 | 2010-09-21 | Mobitrum Corporation | Method and system for dynamic information exchange on mesh network devices |
| US8165821B2 (en) * | 2007-02-05 | 2012-04-24 | Applied Biosystems, Llc | System and methods for indel identification using short read sequencing |
| WO2011137368A2 (en) | 2010-04-30 | 2011-11-03 | Life Technologies Corporation | Systems and methods for analyzing nucleic acid sequences |
| US9268903B2 (en) | 2010-07-06 | 2016-02-23 | Life Technologies Corporation | Systems and methods for sequence data alignment quality assessment |
-
1995
- 1995-07-27 JP JP19200695A patent/JP3675521B2/ja not_active Expired - Fee Related
-
1996
- 1996-07-22 US US08/685,959 patent/US5891632A/en not_active Expired - Fee Related
- 1996-07-24 GB GBGB9615563.5A patent/GB9615563D0/en active Pending
- 1996-07-26 GB GB9615699A patent/GB2303702B/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP3675521B2 (ja) | 2005-07-27 |
| GB9615699D0 (en) | 1996-09-04 |
| GB9615563D0 (en) | 1996-09-04 |
| US5891632A (en) | 1999-04-06 |
| GB2303702B (en) | 1999-12-01 |
| GB2303702A (en) | 1997-02-26 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10984887B2 (en) | Systems and methods for detecting structural variants | |
| US6681186B1 (en) | System and method for improving the accuracy of DNA sequencing and error probability estimation through application of a mathematical model to the analysis of electropherograms | |
| JP3675521B2 (ja) | Dnaの塩基配列決定時におけるフラグメント波形表示方法および装置 | |
| US20260057967A1 (en) | Method for predicting the melting temperature of oligonucleotide | |
| US12482535B2 (en) | Systems and methods for detecting recombination | |
| US7660676B2 (en) | Nucleic acid base sequence determining method and inspecting system | |
| JP3261426B2 (ja) | Dnaフラグメントのヌクレオチドのサイズの測定方法 | |
| JP2022548504A5 (ja) | ||
| US6444422B2 (en) | Computer method and system for correlating data | |
| WO2017009718A1 (en) | Automatic processing selection based on tagged genomic sequences | |
| JP3878503B2 (ja) | 核酸塩基配列決定方法 | |
| JP4317398B2 (ja) | 核酸塩基配列情報の記録方法及び核酸塩基配列決定方法 | |
| JPH11118760A (ja) | 核酸断片の電気泳動パターンの解析法 | |
| JP4286332B2 (ja) | Dna塩基配列に含まれるベクター部の自動除去方法および装置 | |
| JP2508404B2 (ja) | 塩基配列決定装置 | |
| JP2000285120A (ja) | 遺伝子発現探索方法及びその装置 | |
| EP1202211A2 (en) | Genomic DNA analysis computer program | |
| Bhat et al. | DNA Sequencing | |
| Kumar et al. | Recent techniques and strategies for sequencing | |
| US20030013863A1 (en) | High resolution DNA size standards | |
| Tara et al. | ADVANCED ANALYTICAL TECHNIQUES FOR NEXT GENERATION SEQUENCING: A NARRATIVE REVIEW | |
| Messing | In vitro DNA synthesis as a tool to analyze and alter genes | |
| JP2536105B2 (ja) | 標識された核酸フラグメント | |
| Thakur et al. | REMAP a web server for regulatory elements mapping and prediction | |
| BE183 | DNA Sequencing |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041116 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050114 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050426 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050426 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080513 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090513 Year of fee payment: 4 |
|
| LAPS | Cancellation because of no payment of annual fees |