JP2023168024A - 情報処理装置及び情報処理方法 - Google Patents

情報処理装置及び情報処理方法 Download PDF

Info

Publication number
JP2023168024A
JP2023168024A JP2022079628A JP2022079628A JP2023168024A JP 2023168024 A JP2023168024 A JP 2023168024A JP 2022079628 A JP2022079628 A JP 2022079628A JP 2022079628 A JP2022079628 A JP 2022079628A JP 2023168024 A JP2023168024 A JP 2023168024A
Authority
JP
Japan
Prior art keywords
information processing
named entity
document
vectors
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022079628A
Other languages
English (en)
Inventor
康人 星
yasuto Hoshi
大輔 宮下
Daisuke Miyashita
淳 出口
Atsushi Deguchi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kioxia Corp
Original Assignee
Kioxia Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kioxia Corp filed Critical Kioxia Corp
Priority to JP2022079628A priority Critical patent/JP2023168024A/ja
Priority to TW112104558A priority patent/TWI852325B/zh
Priority to CN202310168895.9A priority patent/CN117056469A/zh
Priority to US18/181,642 priority patent/US12585878B2/en
Priority to DE102023106213.1A priority patent/DE102023106213A1/de
Priority to EP23161476.9A priority patent/EP4276654A1/en
Publication of JP2023168024A publication Critical patent/JP2023168024A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/383Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Library & Information Science (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】機械学習のタスクの精度を向上する情報処理装置及び情報処理方法を提供する。
【解決手段】情報処理装置において、検索システム200は、複数の文書に関する複数の第1のデータアイテムDc及び質問に関する第2のデータアイテムQsを受け、データアイテムDc、Qsを処理する抽出モジュールと、類似度計算部と、を含む。抽出モジュールは、第1のデータアイテムDcの夫々から複数の第1の固有表現dNEを抽出し、第2のデータアイテムQsから第2の固有表現qNEを抽出し、第1のデータアイテムの夫々と対応する複数の第1の固有表現の夫々とに関する複数の第1のベクトルKVを生成し、第2のデータアイテムと第2の固有表現とに関する第2のベクトルQVを生成する。類似度計算部は、ベクトルKV、QV間の類似度を計算し、類似度の計算結果に基づいて、複数の第1のデータアイテム中から回答に関する第3のデータアイテムRRを取得する。
【選択図】図2

Description

本発明の実施形態は、情報処理装置及び情報処理方法に関する。
機械学習に関する方法、デバイス、及びシステムが、研究及び提案されている。例えば、機械学習の各種のタスクの精度の向上のために、様々な計算手法、処理手法、システムの構成、及びデバイスの構成が、研究及び提案されている。機械学習を用いた情報の検索において、入力データである質問に関する情報をデータベースの中から検索するタスクがある。このタスクにおいて、未知の質問に対する回答に関する情報の検索の精度が低い場合がある。そのため、機械学習を用いた情報の検索の精度の向上が求められている。
特開2020-140435号 特開2021-99803号 特開2019-164409号
機械学習のタスクの精度を向上する情報処理装置及び情報処理方法を提供する。
本実施形態の情報処理装置は、複数の文書に関する複数の第1のデータアイテム及び質問に関する第2のデータアイテムを受けるインターフェース回路と、前記インターフェース回路が受けた前記複数の第1のデータアイテム及び前記第2のデータアイテムを処理するプロセッサと、を含み、前記プロセッサは、前記複数の第1のデータアイテムのそれぞれから複数の第1の固有表現を抽出し、前記第2のデータアイテムから第2の固有表現を抽出し、前記複数の第1のデータアイテムのそれぞれと対応する前記複数の第1の固有表現のそれぞれとに関する複数の第1のベクトルを、それぞれ生成し、前記第2のデータアイテムと前記第2の固有表現とに関する第2のベクトルを生成し、前記複数の第1のベクトルのそれぞれと前記第2のベクトルとの間の類似度を計算し、前記類似度の計算結果に基づいて、前記複数の第1のデータアイテムの中から検索された回答に関する第3のデータアイテムを取得する。
実施形態の情報処理装置の構成例を示すブロック図。 実施形態の情報処理装置の検索システムの構成例を示すブロック図。 実施形態の情報処理装置の検索システムの一部の構成例を示すブロック図。 実施形態の情報処理装置の検索システムの他の一部の構成例を示すブロック図。 実施形態の情報処理装置の検索システムを説明するための模式図。 実施形態の情報処理方法を示すフローチャート。 実施形態の情報処理方法の一部を説明するための模式図。 実施形態の情報処理方法の他の一部を説明するための模式図。 実施形態の情報処理方法を示すフローチャート。 実施形態の情報処理方法の一部を説明するための模式図。 実施形態の情報処理方法の他の一部を説明するための模式図。 実施形態の情報処理方法の更に他の一部を説明するための模式図。 実施形態の情報処理方法の更に他の一部を説明するための模式図。 実施形態の情報処理装置の特性を示すグラフ。 実施形態の情報処理装置の変形例を説明するための模式図。
以下、図1乃至図15を参照しながら、実施の形態について詳細に説明する。以下の説明において、同一の機能及び構成を有する要素については、同一符号を付す。
また、以下の各実施形態において、末尾に区別化のための数字/英字を伴った参照符号を付された構成要素(例えば、回路、配線、各種の電圧及び信号など)が、相互に区別されなくとも良い場合、末尾の数字/英字が省略された記載(参照符号)が用いられる。
(1)実施形態
図1乃至図14を参照して、実施形態の情報処理装置、及び、実施形態の情報処理方法について、説明する。尚、実施形態の情報処理方法は、実施形態の情報処理装置の制御方法を含み得る。
(a)構成
図1乃至図5を参照して、実施形態の情報処理装置の構成及び機能について、説明する。
図1は、本実施形態の情報処理装置1の構成例を説明するための模式図である。
実施形態の情報処理装置1は、各種の情報処理を実行できる。情報処理装置1は、例えば、自然言語処理を実行可能な人工知能(AI)の機能を有する。
情報処理装置1は、機械学習に基づいた各種の処理及びタスクを実行できる。例えば、情報処理装置1は、教師有り又は教師無しの学習データを用いた深層学習を実行可能に構成されている。
情報処理装置1は、プロセッサ11、メモリ12、ストレージ13、及びユーザーインターフェース14を含む。
プロセッサ11は、情報処理装置1の各種の処理及びタスクの実行のための制御処理及び計算処理を、行う。プロセッサ11は、メモリ12、ストレージ13、及びユーザーインターフェース14を、制御できる。例えば、プロセッサ11は、各種の制御処理、各種の計算処理及び各種のタスクなどを実行する処理部200を含む。
プロセッサ11は、レジスタ、キャッシュ及びROM(Read only memory)などを含む記憶領域111を含む。
また、プロセッサ11は、インターフェース部119を含む。インターフェース部119は、メモリ12、ストレージ13及びユーザーインターフェース14から各種のデータアイテムを受けることができる。インターフェース部119は、受け取ったデータアイテムを、記憶領域111及び(又は)処理部200に送ることができる。インターフェース部119は、例えば、処理部200によって実行された処理の結果のような、プロセッサ11の処理結果のデータアイテムを、メモリ12、ストレージ13及びユーザーインターフェース14に送ることができる。インターフェース部119は、これらの処理のための複数のデバイス及び回路などを含み得る。
メモリ12は、各種の情報及び各種のデータアイテムを一時的に記憶する。
メモリ12は、RAM(Random access memory)121及びROM122を含む。
RAM121は、SRAM(Static RAM)及びDRAM(Dynamic RAM)などを含む。RAM121は、情報処理装置1に用いられる各種のデータアイテム及びソフトウェアなどを、一時的に記憶する。RAM121は、情報処理装置1におけるワークメモリ及びバッファメモリとして機能する。RAM121は、データアイテムの取得のために、プロセッサ11にアクセスされ得る。
ROM122は、情報処理装置1に用いられるオペレーティングシステム(OS)、ファームウェア、各種のソフトウェア及び各種のデータアイテムを実質的に不揮発に記憶する。ROM122は、データアイテムの取得のために、プロセッサ11にアクセスされ得る。
例えば、データアイテムは、処理の対象であるユーザーデータ、各種のシステム及びデバイスに用いられる設定データ、各種の処理に用いられるパラメータ、及びソフトウェアの一部などを含む。例えば、ソフトウェアは、実行プログラム、ファームウェア、アプリケーション及びオペレーティングシステム(OS)を含み得る。データアイテム及び(又は)ソフトウェアは、各種のシステム及びデバイスに用いられる情報に相当し得る。
ストレージ13は、各種の情報及び各種のデータアイテムを実質的に不揮発に記憶できる。ストレージ13は、複数のデータベース131,132を含む。
ストレージ13は、例えば、SSD(Solid state drive)、UFS(Universal Flash Storage)デバイス又はHDD(Hard disc drive)である。ストレージ13がSSD又はUFSデバイスである場合、ストレージ13は、コントローラ及び不揮発性半導体メモリデバイスを含む。SSDに用いられる不揮発性半導体メモリデバイスは、NAND型フラッシュメモリである。不揮発性半導体メモリデバイスが、NAND型フラッシュメモリである場合、不揮発性半導体メモリデバイスは、Toggle DDRインターフェース規格又はONFi(Open NAND Flash interface)規格に基づいて、コントローラと通信する。コントローラは、読み出しシーケンス、書き込みシーケンス、消去シーケンス及びガベージコレクションのような各種の動作を、不揮発性半導体メモリデバイスに命令する。不揮発性半導体メモリデバイスは、コントローラからの命令に基づいて、各種の動作を実行する。
尚、本実施形態の情報処理装置1において、ストレージ13は、プロセッサ11と直接的又は間接的に通信が可能であれば、1つの筐体(図示せず)内に設けられていてもよいし、互いに異なる筐体内に設けられていてもよい。プロセッサ11及びストレージ13は、直接的又は間接的に互いに通信が可能であれば、同じ国又は地域に設置されていてもよいし、互いに異なる国又は地域に設置されていてもよい。
ユーザーインターフェース14は、情報処理装置1のユーザーとプロセッサ11との間の通信のための複数のデバイス及び回路などを含み得る。ユーザーインターフェース14は、入力デバイス及び出力デバイスを含む。入力デバイスは、例えば、タッチパネル、キーボード、操作ボタン及び(又は)マイクなどを含む。出力デバイスは、例えば、ディスプレイ、プリンタ及び(又は)スピーカーなどを含む。
ユーザーインターフェース14は、入力デバイスを介してユーザーからの各種の処理及び(又は)タスクの実行の要求をプロセッサ11に供給する。ユーザーインターフェース14は、出力デバイスを介して各種の処理及び(又は)タスクの実行の結果をユーザーに提供する。ユーザーインターフェース14は、各種の処理及び(又は)タスクの実行の途中経過をユーザーに提供することもできる。
ユーザーインターフェース14は、各種のデータアイテムを、プロセッサ11、メモリ12及びストレージ13を送ることができる。ユーザーインターフェース14は、各種のデータアイテムを、プロセッサ11、メモリ12及びストレージ13から受けることができる。
情報処理装置1は、無線又は有線のネットワークを介して、他のデバイス9と通信してもよい。例えば、処理及び(又は)タスクの実行の要求が、デバイス9から情報処理装置1に供給されてもよい。処理及び(又は)タスクの実行の結果が、情報処理装置1からデバイス9に供給されてもよい。デバイス9は、コンピュータデバイス又は携帯デバイスである。コンピュータデバイスの一例は、パーソナルコンピュータ又はサーバコンピュータである。携帯デバイスの一例は、スマートフォン、フィーチャーフォン、又はタブレットデバイスである。
本実施形態の情報処理装置1は、深層学習を用いた文書検索を実行するシステムである処理部200を含む。以下において、深層学習を用いた文書検索を実行するシステムである処理部200は、検索システム200とよばれる。
検索システム200は、プロセッサ11上において、ソフトウェア、ハードウェア、又は、ソフトウェアとハードウェアとの組み合わせによって実現され得る。
これによって、本実施形態の情報処理装置1において、プロセッサ11は、文書の検索のための検索タスクの各種の処理及び動作を実行する。以下において、検索タスクは、検索処理ともよばれる。
図2は、本実施形態の情報処理装置1における、検索システム200を説明するための模式的なブロック図である。
図2に示されるように、本実施形態の情報処理装置1において、検索システム200は、深層学習に基づく文書の検索タスクを実行する。検索システム200は、検索タスクによって、質問Qsに対して、知識源としてのデータベース131に格納された複数の文書Dcの中から回答となる1つ以上の文書Dcを、選択及び提示する。
質問Qsは、自然言語の1つ以上の文を含むデータアイテムである。質問Qsは、質問データアイテムともよばれる。例えば、質問Qsは、ユーザーインターフェース14を介して、情報処理装置1の外部(例えば、ユーザー)から検索システム200に供給される。
データベース131に格納された複数の文書Dcのそれぞれは、自然言語の1つ以上の文を含むデータアイテムである。文書Dcは、文書データアイテムともよばれる。例えば、複数の文書Dcは、ユーザーインターフェース14を介して、情報処理装置1の外部からストレージ13のデータベース131に供給される。
本実施形態において、情報処理装置1及び検索システム200に用いられる自然言語は、日本語、英語、中国語、ドイツ語、フランス語、ロシア語、スペイン語、及びイタリア語などの複数の自然言語の中から選択されるいずれかの自然言語である。質問Qsに用いられる自然言語は、文書Dcに用いられる自然言語と同じであることが、好ましい。但し、質問Qsに用いられる自然言語は、文書Dcに用いられる自然言語と異なってもよい。
図2の検索システム200は、抽出モジュール210、エンコーダ220,221(221-1~221-n)、類似度計算部230、判定部240、及び結果出力部250などを含む。例えば、検索システム200の各構成要素210,220,221,230,240,250は、プロセッサ11によって制御され得る。
検索システム200は、質問Qs及び複数の文書Dcを、受ける。
質問Qsは、ユーザーインターフェース14を介して、ユーザーから検索システム200に供給される。質問Qsは、プロセッサ11の記憶領域111又はメモリ12に記憶される。質問Qsは、他のデバイス9から、ネットワーク(図示せず)を介して、検索システム200に供給されてもよい。
質問Qsは、人物、組織、地域、事件、物品及び日時など或る事物に関して問う文を含む。質問Qsは、自然言語によって記述されている。
文書Dcは、ストレージ13のデータベース131から検索システム200に供給される。文書Dcは、人物、地域、事件及び物品などの或る事物に関する情報を示す文を含む。文書Dcは、自然言語によって記述されている。文書Dcは、1つ以上の文を含む。文書Dcは、複数の単語を含んで構成される。例えば、文書Dcは、十数から百数十の単語から構成される。文書Dcは、テキスト又はパッセージともよばれる。
データベース131は、文書集合である。データベース131は、検索システム200における検索タスクのための知識源及び情報源として機能する。
抽出モジュール210は、検索システム200に供給された質問Qs及び文書Dcを受ける。抽出モジュール210は、質問Qs及び文書Dcから各種の情報を抽出できる。
本実施形態において、抽出モジュール210は、或る質問Qsに含まれる1つ以上の固有表現qNEを抽出できる。本実施形態において、抽出モジュール210は、或る文書Dcに含まれる1つ以上の固有表現dNEを、抽出できる。
固有表現qNE,dNEは、人名、組織名、地名、事件名、物品名、及び(又は)日時などである。
抽出モジュール210は、抽出部又は固有表現抽出モジュールともよばれる。
例えば、抽出モジュール210は、自然言語に関するモデルに基づくニューラルネットワークから構成された機構を含む。
抽出モジュール210の構成及び機能の詳細は、後述される。
エンコーダ220,221は、供給された自然言語のデータアイテムQs,Dc及び固有表現qNE,dNEから、ベクトルQV,KVを生成する。
エンコーダ220は、或る質問Qsの文及び質問Qsから抽出された固有表現qNEに基づいて、質問Qsに関するベクトルQVを生成する。以下において、質問Qs及び固有表現qNEから得られたベクトルQVは、クエリベクトルQVとよばれる。尚、クエリベクトルQVは、クエリとよばれてもよい。
クエリベクトルQVは、自然言語の質問Qsとその質問Qsに含まれる固有表現qNEとに関する特徴量ベクトルのデータアイテムである。
エンコーダ221は、或る文書Dcの文及び文書Dcから抽出された固有表現dNEに基づいて、文書Dcに関するベクトルKVを生成する。以下において、文書Dc及び固有表現dNEから得られたベクトルKVは、キーベクトルKVとよばれる。尚、キーベクトルKVは、キーとよばれてもよい。
キーベクトルKVは、自然言語の文書Dcとその文書Dcに含まれる固有表現dNEとに関する特徴量ベクトルのデータアイテムである。
例えば、キーベクトルKVは、ストレージ13のデータベース132に記憶されている。
例えば、エンコーダ220,221のそれぞれは、自然言語に関するモデルに基づくニューラルネットワークから構成された機構を含む。
これによって、エンコーダ220は、自然言語の質問Qs及び固有表現qNEを、ベクトルQVに変換できる。エンコーダ221は、自然言語の文書Dc及び固有表現dNEを、ベクトルKVに変換できる。
エンコーダ220,221の構成及び機能の詳細は、後述される。
本実施形態において、例えば、キーベクトルKVは、文書Dcの特徴を示すデータアイテムとして用いられる。本実施形態において、例えば、クエリベクトルQVは、キーベクトルKV及び文書Dcの検索に用いられるデータアイテムとして用いられる。
類似度計算部230は、或るデータと別のデータとの間の類似度を計算する。本実施形態において、類似度計算部230は、クエリベクトルQVとキーベクトルKVとの間の類似度を計算する。
例えば、類似度は、2つのベクトルQV,KV間のコサイン類似度に基づいて、計算される。尚、類似度は、2つのベクトルQV,KV間の内積、又は、2つのベクトルQV,KV間の距離などに基づいて、計算されてもよい。類似度を計算するための距離は、例えば、ユークリッド距離、マンハッタン距離及びミンコフスキー距離などのうちいずれか1つを用いて、得られる。
判定部240は、プロセッサ11によって実行された各種の処理に対する判定を、実行できる。本実施形態において、判定部240は、類似度計算部230の計算結果に基づいて、クエリベクトルQVとキーベクトルKVとが類似しているか否かを判定する。
判定部240は、クエリベクトルQV及びキーベクトルKVに関して計算された類似度の計算結果の値が或る閾値以上である場合、クエリベクトルQVがキーベクトルKVに類似していると判定する。判定部240は、クエリベクトルQV及びキーベクトルKVに関して計算された類似度の計算結果の値が或る閾値未満である場合、クエリベクトルQVがキーベクトルKVに類似していないと判定する。以下において、類似度の計算結果の値は、スコアともよばれる。
尚、複数の閾値が、2つのベクトルQV,KV間の類似度を評価するために設定された場合、2つのベクトルQV,KV間の類似度は、段階的に評価され得る。この結果として、回答となり得る複数の文書Dcは、類似度のスコアに応じて、複数のレベルに分類され得る。
結果出力部250は、判定部240の処理の結果に基づいて、検索タスクにおける質問Qsに対する検索結果RRとして、或るスコア以上の類似度を有する1つ以上のキーベクトルKV<i>のそれぞれに対応する1つ以上の文書Dc<i>を、出力する。iは、1以上の整数である。
例えば、結果出力部250は、各キーベクトルKVに対応する文書Dcを、データベース131を含むストレージ13から読み出す。結果出力部250は、読み出した文書Dcを、ユーザーインターフェース14を介して、ユーザーに示す。
結果出力部250は、データベース131の文書Dcを読み出す時、テーブルTBLに基づいて、検索結果のキーベクトルKVに対応する文書Dcを検知する。
テーブルTBLは、キーベクトルKVと文書Dcとの対応関係に関する情報を含む。例えば、テーブルTBLは、テーブル管理部290によって、生成される。テーブルTBLは、テーブル管理部290に記憶される。
テーブル管理部290は、抽出モジュール210から提供された各文書Dcに関する情報及びエンコーダ221から提供されたキーベクトルKVに関する情報に基づいて、テーブルTBLを生成できる。
例えば、テーブルTBLは、管理テーブルTBLともよばれる。
例えば、テーブル管理部290は、プロセッサ11、メモリ12、及びストレージ13のうちいずれか1つに設けられ得る。
このように、検索システム200は、質問Qsに対して高い類似度を有する文書Dcを、データベース131の中から検索する。
検索システム200は、検索タスクの検索結果RRを、ユーザーに示す。この結果として、検索結果RRが、質問Qsに対する回答として、ユーザーに提供される。
尚、質問Qsは、ネットワークを介して他のデバイス9から情報処理装置1に供給されてもよい。質問Qsに対する検索結果RRは、ネットワークを介して情報処理装置1から他のデバイス9に供給されてもよい。
抽出モジュール210及びエンコーダ220,221は、ソフトウェア又はファームウェアとして、プロセッサ11に、提供される。抽出モジュール210及びエンコーダ220は、例えば、Pythonのような或るプログラム言語によって形成されたコンピュータプログラムとして、プロセッサ11の記憶領域111に記憶されている。
抽出モジュール210及びエンコーダ220,221のソフトウェアは、メモリ12に記憶されてもよいし、ストレージ13に記憶されてもよい。この場合、それらのソフトウェアが、後述される抽出モジュール210及びエンコーダ220,221を用いた処理の実行時に、メモリ12からプロセッサ11の記憶領域111に、又は、ストレージ13からプロセッサ11の記憶領域111に読み出される。
尚、抽出モジュール210及びエンコーダ220,221のソフトウェアは、抽出モジュール210及びエンコーダ220,221を用いた後述の処理の実行時に、RAM131に記憶され、それらのソフトウェアが、プロセッサ11によってRAM131上で実行されてもよい。
抽出モジュール210及びエンコーダ220,221は、ハードウェアとして、プロセッサ11の内部又はプロセッサ11の外部に設けられてもよい。
<抽出モジュール210>
図3は、本実施形態の情報処理装置1における、検索システム200の抽出モジュール210の構成及び機能を説明するためのブロック図である。
抽出モジュール210は、質問受信部211、複数の文書受信部212(212-1~212-n)、固有表現抽出部213,214(214-1~214-n)、及び、識別番号抽出部219(219-1~219-n)などを含む。nは、1以上の整数である。
質問受信部211は、検索システム200に供給された質問Qsを受ける。
複数の文書受信部212-1~212-nのそれぞれは、データベース131から供給された文書Dcを、受ける。
例えば、文書Dcは、識別番号Idを含む。識別番号Idは、文書Dcに付加された情報である。識別番号Idと文書Dcとを含むデータアイテムは、文書ファイルFL(FL<1>~FL<n>)ともよばれる。
識別番号Idは、データベース131において複数の文書Dcを管理及び識別するための番号を示すデータアイテムである。各識別番号Idは、複数の文書Dcのうち対応する1つの文書Dcに割り当てられている。識別番号Idは、文書Dcごとに固有の値を有する。識別番号Idは、文書ファイルFLのファイル名でもよいし、文書ファイルFLのメタデータに含まれる値でもよい。識別番号Idは、文書Dcに組み込まれた値でもよい。
固有表現抽出部213,214のそれぞれは、固有表現抽出モデルM1に基づくニューラルネットワークを含む。
固有表現抽出部213,214のそれぞれは、固有表現抽出モデルM1に基づいて、固有表現qNE,dNEを抽出する。固有表現抽出モデルM1は、自然言語で記述された文中の語句が固有表現であるか否かを判別することが可能なように構築された、自然言語に関するニューラルネットワークモデルである。
固有表現抽出部213は、固有表現抽出モデルM1に基づいて、質問受信部211から質問Qsを受ける。
固有表現抽出部213は、固有表現抽出モデルM1に基づいて、質問Qsを構成する文の中から、1つの固有表現qNEを抽出する。
例えば、固有表現抽出部213は、質問Qsを構成する文を、トークン化する。これによって、質問Qsは、複数のトークンに分割される。
固有表現抽出部213は、固有表現抽出モデルM1に基づいて、質問Qsにおけるトークンの位置、トークンの品詞、及び複数のトークン間の関係性などに基づいて、各トークンが固有表現であるか否か判別する。
この結果として、固有表現であると判別されたトークンが、質問Qsにおける固有表現qNEとして、質問Qsから抽出される。
固有表現抽出部213は、質問Qsから抽出された固有表現qNEを、エンコーダ220に送る。
複数の固有表現抽出部214-1~214-nのそれぞれは、複数の文書受信部212-1~212-nのうち対応する1つから、文書Dcを受ける。
各固有表現抽出部214は、文書Dcを構成する1つ以上の文の中から、1つ以上の固有表現dNE(dNE<1>-1,dNE<1>-j,・・・,dNE<n>-1,dNE<n>-k)を抽出する。j及びkは、1以上の整数である。
例えば、各固有表現抽出部214は、文書Dcに含まれる文を、トークン化する。これによって、文書Dcは、複数のトークンに分割される。
固有表現抽出部214は、固有表現抽出モデルM1に基づいて、文書Dcの文におけるトークンの位置、トークンの品詞、及び複数のトークン間の関係性などに基づいて、各トークンが固有表現であるか否か判別する。
この結果として、固有表現であると判別されたトークンが、文書Dcにおける固有表現dNEとして、文書Dcから抽出される。
各固有表現抽出部214は、文書Dcから抽出された1つ以上の固有表現dNEを、複数のエンコーダ221のうち対応する1つに送る。
複数の識別番号抽出部219-1~219-nのそれぞれは、複数の文書受信部212-1~212-nのうち対応する1つから、識別番号Idが付加された文書Dc(文書ファイルFL)を受ける。
各識別番号抽出部219-1,219-2,・・・,219-nのそれぞれは、識別番号Idを、抽出する。識別番号抽出部219は、抽出した識別番号Idを、テーブル管理部290に送る。抽出された識別番号Idは、対応する文書Dc及び対応する文書Dcから生成されるキーベクトルKVと紐づけされている。
例えば、文書受信部212が、文書Dcから識別番号Idを分離することによって、識別番号Idを抽出してもよい。
尚、文書Dcは、対応する識別番号Idを含まない場合もある。この場合において、識別番号抽出部219が、文書Dcに対応する識別番号Idを、生成してもよい。
質問受信部211は、質問Qsを、固有表現抽出部213だけでなくエンコーダ220に送る。エンコーダ220は、固有表現qNEとは別途に、質問Qsを受ける。
各文書受信部212は、文書Dcを、対応する固有表現抽出部214だけでなく複数のエンコーダ221のうち対応する1つに送る。エンコーダ221は、固有表現dNEとは別途に、文書Dcを受ける。
このように、抽出モジュール210は、質問Qs及び文書Dcの文中から固有表現qNE,dNEを抽出する。
抽出モジュール210は、質問Qsと共に、抽出された固有表現qNEを、後段のエンコーダ220に送る。
抽出モジュール210は、文書Dcと共に、抽出された固有表現dNEを、後段のエンコーダ221に送る。
<エンコーダ220,221>
図4は、本実施形態の情報処理装置1における、検索システム200のエンコーダ220,221の構成及び機能を説明するための図である。
エンコーダ220,221は、自然言語の深層学習に関する各種の計算処理を行うように構成されたニューラルネットワークを含む。
図4の(a)は、本実施形態における、質問Qsに対するエンコーダ220を説明するための図である。
エンコーダ220は、学習済み言語モデルM2のニューラルネットワークに基づいて、供給された自然言語のベクトル変換処理を行う。尚、学習済み言語モデルM2は、各種のデータセットを用いて自然言語処理に関する機械学習(深層学習)が既になされたニューラルネットワークモデルである。
エンコーダ220は、ニューラルネットワークの構成に応じて複数のレイヤLY1a,LY2aを含む。例えば、レイヤLY1aは、埋め込みレイヤである。レイヤLY2aは、隠れレイヤである。尚、レイヤLY1aは、アテンションレイヤでもよい。レイヤLY2aは、フィードフォーワードレイヤでもよい。
エンコーダ220は、質問Qs、及び、抽出モジュール210によって抽出された固有表現qNEを受ける。
エンコーダ220は、質問Qsの文を複数のトークンTkに分割する。
エンコーダ220は、固有表現qNE及びトークン化された質問Qsに対して、レイヤLY1a,LY2aの機能に応じた各種の処理を行う。
例えば、埋め込みレイヤを含むレイヤLY1aは、トークン化された質問Qs及び固有表現qNEに対して、各トークンの埋め込みのための各種の処理を行う。
例えば、隠れレイヤを含むレイヤLY2aは、レイヤLY1aからの出力に対して、積和演算のような各種の計算処理を行う。
エンコーダ220は、レイヤLY1a,LY2aによる各種の処理によって、質問Qs及び固有表現qNEに基づくクエリベクトルQVを、生成及び出力する。クエリベクトルQVは、複数の成分Cmを含む。各成分Cmは、p×qの行列式で示され得る。
p及びqは、1以上の整数である。尚、本実施形態において、各成分Cmは、簡略化のためにハッチングが付された矩形パターンで模式的に図示されているが、p×qで配列された複数の数値の配列である。
図4の(b)及び(c)は、本実施形態における、文書Dcに対するエンコーダ221を説明するための図である。
図4の(b)に示されるように、エンコーダ221は、エンコーダ220と実質的に同じ構成及び機能を有する。
エンコーダ221は、学習済み言語モデルM2のニューラルネットワークに基づいて、供給された自然言語のベクトル変換処理を行う。
エンコーダ221は、複数のレイヤLY1b,LY2bを含む。
エンコーダ221は、文書Dc、及び、抽出モジュール210によってその文書Dcから抽出された複数の固有表現dNEa,dNEbのうち固有表現dNEaを受ける。
エンコーダ221は、文書Dcの文を複数のトークンTkに分割する。
エンコーダ221は、固有表現dNEa及びトークン化された文書Dcに対して、各レイヤLY1b,LY2bの機能に応じた各種の処理を行う。
エンコーダ221は、レイヤLY1b,LY2bによる各種の処理によって、文書Dc及び固有表現dNEaに基づくキーベクトルKVaを、生成及び出力する。キーベクトルKVaは、p×qの成分Cmを含む。キーベクトルKVaの成分Cmの数は、クエリベクトルQVの成分Cmの数と同じである。
上述のように、1つの文書Dcから抽出された複数の固有表現dNE(dNEa,dNEb)のうちの1つが、1つのエンコーダ221に、供給される。
エンコーダ221は、固有表現dNE毎に、文書Dcと固有表現dNEとのキーベクトルKVを生成する。
図4の(c)に示されるように、文書Dcから抽出された固有表現dNEaとは別の固有表現dNEbが、文書Dcと共に、別のエンコーダ221に供給される。
このエンコーダ221は、文書Dc及び固有表現dNEbに基づくキーベクトルKVbを、生成及び出力する。
キーベクトルKVbの成分Cmの数は、キーベクトルKVaの成分Cmの数と同じである。キーベクトルKVbの複数の成分Cmは、キーベクトルKVaの複数の成分Cmと異なる。
図4の(b)及び(c)のように、1つの文書Dcが2つの固有表現dNEa,dNEbを含んでいる場合、固有表現dNEa,dNEb毎に、2つのキーベクトルKVa,KVbが、生成される。
複数のキーベクトルKVは、ストレージ13のデータベース132に記憶される。
生成された複数のキーベクトルKVは、潜在表現空間LSを形成する。潜在表現空間LSは、学習済み言語モデルM2のような、共通のモデルのニューラルネットワークに基づいて生成されたベクトルの集合である。尚、潜在表現空間LSは、潜在空間LSともよばれる。
本実施形態における質問Qsと固有表現qNEとから生成されるクエリベクトルQVは、或る固有表現qNEを含む質問Qsの文脈がその固有表現qNEに反映されることによって生成されるベクトルである、とも換言できる。
本実施形態における文書Dcと固有表現dNEとから生成されるキーベクトルKVは、或る固有表現dNEを含む文書Dcの文脈がその固有表現dNEに反映されることによって生成されるベクトルである、とも換言できる。
以上のように、本実施形態において、検索システム200に用いられる複数のベクトルQV,KVが、形成される。
尚、上述の例において、文書Dc毎に、対応する1つのエンコーダ221が設けられた構成が、示されている。
但し、複数の文書Dcが、1つのエンコーダ221に対応付けられてもよい。この場合において、1つのエンコーダ221が、順次供給される複数の文書Dcのそれぞれに対して、各文書Dcと固有表現dNEとを用いて、複数のキーベクトルKVを順次生成する。
<テーブルTBL>
図5は、本実施形態の情報処理装置1における、検索システム200が文書Dc及びキーベクトルKVを管理するためのテーブルTBLを説明するための図である。
例えば、テーブル管理部290は、抽出モジュール210からの複数の文書Dcの複数の識別番号Idに関する情報と、複数のエンコーダ221からの複数のキーベクトルKVに関する情報と、を受ける。
テーブル管理部290は、複数の識別番号Idに関する情報及び複数のキーベクトルKVに関する情報に基づいて、図5のようなテーブルTBLを生成及び格納する。
図5は、本実施形態の情報処理装置1における、テーブルTBLの一例を示している。
図5に示されるように、或る文書Dc(Dc<1>,Dc<2>、Dc<3>,・・・,Dc<n―1>,Dc<n>)及びその文書Dcの識別番号Id(Id<1>,Id<2>、Id<3>,・・・,Id<n―1>,Id<n>)に基づいて、その文書Dcから生成された1つ以上のキーベクトルKV(KV<1>,KV<2>,KV<3>,・・・,KV<n―1>,KV<n>)は、その文書Dcの1つの識別番号Idに関連付けられる。
上述のように、各識別番号Id<1>,Id<2>,Id<3>,・・・,Id<n-1>,Id<n>は、各文書Dc<1>,Dc<2>,Dc<3>,・・・,Dc<n-1>,Dc<n>に、1対1で関連付けられている。
図5のテーブルTBLにおいて、1つの識別番号Idに、1つの文書Dcから生成された1つ以上のキーベクトルKVが関連付けられる。
例えば、<1>の識別番号Idに、2つのキーベクトルKV<1>-1,KV<1>-2が関連付けられている。例えば、<2>の識別番号Idに、2つのキーベクトルKV<2>-1,KV<2>-2が関連付けられている。例えば、<3>の識別番号Idに、m個のキーベクトルKV<3>-1,KV<3>-2,・・・,KV<3>-mが関連付けられている。mは、1以上の整数である。
例えば、<n-1>の識別番号Idに、1つのキーベクトルKV<n-1>が関連付けられている。例えば、<n>の識別番号Idに、2つのキーベクトルKV<n>-1,KV<n>-2が関連付けられている。
それゆえ、テーブル管理部290に保存されたテーブルTBLに基づいて、対応する識別番号Idが、選択された1つのキーベクトルKVから検知できる。
したがって、1つの文書Dcから複数のキーベクトルKVが生成されたとしても、対応する文書Dcが、或るキーベクトルKVに関連付けられた識別番号Idに基づいて、データベース131の中から読み出され得る。
このように、本実施形態において、検索システム200は、テーブルTBLの参照によって、キーベクトルKVに対応する特定の文書Dcを、取得することができる。
本実施形態のように、キーベクトルKVに基づく文書Dcの検索及び取得が、識別番号Idを用いて実行された場合、検索システム200の構成を、簡素化できる。例えば、本実施形態において、検索システム200は、キーベクトルKVを文に変換するためのデコーダを、含まない。
以上のように、本実施形態の情報処理装置1における検索システム200は、上述の構成及び機能を含む。
本実施形態において、生成されたクエリベクトルQVは、質問Qsの文の文脈の特徴量ベクトルに、質問Qsに含まれる固有表現qNeの特徴量ベクトルが反映された値を有する。
これと同様に、生成されたキーベクトルKVa,KVbのそれぞれは、文書Dcの文の文脈の特徴量ベクトルに、文書Dcに含まれる各固有表現dNEa,dNEbの特徴量ベクトルが反映された値を有する。
互いに異なる固有表現dNEa,dNEbの特徴がそれぞれ反映された2つのキーベクトルKVa,KVbは、1つの文書Dcに基づく特徴量ベクトルであっても、固有表現dNEa,dNEb毎に異なる成分Cmを含み得る。
例えば、本実施形態において、文書Dcの文脈が質問Qsの文脈に関連していても、文書Dcに含まれる固有表現dNEが質問Qsに含まれる固有表現qNEと類似していなければ、固有表現dNEの特徴が反映されたキーベクトルKVは、クエリベクトルQVに対して低い類似度を、有する。この結果として、質問Qsの固有表現qNEに対して低い類似度の固有表現dNEを有する文書Dcは、質問Qsに対する回答から除外される。
これに対して、文書Dcの文脈が質問Qsの文脈に関連し、且つ、文書Dcに含まれる固有表現dNEが質問Qsに含まれる固有表現qNEと類似していれば、固有表現dNEの特徴が反映されたキーベクトルKVは、クエリベクトルQVに対して高い類似度を、有する。この結果として、質問Qsの固有表現qNEに対して高い類似度の固有表現dNEを有する文書Dcは、回答として選択される。
また、本実施形態の情報処理装置1によれば、1つの文書Dcに含まれる固有表現dNEの数に応じて、1つの文書Dcから複数のキーベクトルKVが、生成され得る。
これによって、1つの文書Dcから1つのキーベクトルKVが生成される場合に比較して、1つの文書に含まれる固有表現dNEの数に応じて、1つの潜在表現空間LSに存在するキーベクトルKVの数が、増加する。
これらの結果として、本実施形態の情報処理装置1は、検索システム200における検索クエリに対する検索の精度を向上できる。
それゆえ、本実施形態の情報処理装置1は、タスクの信頼性を向上できる。
(b)情報処理方法
図6乃至図14を参照して、本実施形態の情報処理装置1による情報処理方法について、説明する。
尚、実施形態の情報処理方法は、実施形態の情報処理装置の制御方法を含み得る。
<キーベクトルKVの生成>
図6乃至図8を参照して、本実施形態の情報処理装置1における、検索システム200によるキーベクトルKVの生成処理について、説明する。
図6は、本実施形態の情報処理装置1におけるキーベクトルKVの生成処理を示すフローチャートである。図7及び図8のそれぞれは、本実施形態における、キーベクトルKVの生成処理を説明するための模式図である。
<S1>
図6及び図7に示されるように、検索システム200において、抽出モジュール210は、プロセッサ11のインターフェース部119を介して、ストレージ13のデータベース131から複数の文書Dcを受ける。文書Dcは、1つ以上の文を含む。複数の文書Dcは、情報処理装置1の外部のデバイスから提供されてもよい。
例えば、抽出モジュール210は、文書Dc<1>として、“Biden was born in Scranton.”という文を、受ける。抽出モジュール210は、文書Dc<2>として、“Obama was born in Hawaii.”という文を、受ける。抽出モジュール210は、文書Dc<n>として、“Obama was awarded the Nobel peace prize.”という文を、受ける。
<S2>
抽出モジュール210は、文書Dcと共に、文書Dcに関連付けられた識別番号Idを受ける。抽出モジュール210は、識別番号Idを抽出する。例えば、抽出モジュール210は、文書Dcから識別番号Idを分離する。抽出された識別番号Idは、テーブル管理部290に送られる。
<S3>
抽出モジュール210は、固有表現抽出モデルM1に基づいて、各文書Dcに含まれる1つ以上の固有表現dNEを抽出する。
図7の例において、抽出モジュール210は、文書Dc<1>から、“Biden”という固有表現dNEaと、“Scranton”という固有表現dNEbと、を抽出する。抽出モジュール210は、文書Dc<2>から、“Obama”という固有表現dNEcと、“Hawaii”という固有表現dNEdと、を抽出する。抽出モジュール210は、文書Dc<n>から、“Obama”という固有表現dNEeと、“Nobel peace prize”という固有表現dNEfと、を抽出する。
抽出モジュール210は、抽出された固有表現dNEのそれぞれを、対応するエンコーダ221に送る。また、抽出モジュール210は、文書Dcから抽出された固有表現dNEと共に、文書Dc自体を、対応するエンコーダ221に送る。
<S4>
エンコーダ221は、学習済み言語モデルM2に基づいて、キーベクトルKVを生成する。
図8に示されるように、各エンコーダ221は、文書Dc及び抽出された1つ以上の固有表現dNEを受ける。
各エンコーダ221は、受け取った文書Dcをトークン化する。各エンコーダ221は、トークン及び固有表現dNEの埋め込み処理を行う。これによって、文書Dcを構成する語句及び固有表現dNEは、ベクトル化される。
エンコーダ221は、学習済み言語モデルM2に基づいて、或る文書Dcから抽出された固有表現dNE毎に、その文書Dcと固有表現dNEとに関するキーベクトルKVを計算する。
これによって、1つの文書Dcに対して、その文書Dcから抽出された固有表現dNEの数に応じて、1つ以上のキーベクトルKVが、生成される。
例えば、文書Dc<1>に関して、2つのキーベクトルKV<1>-a,KV<1>-bが、生成される。キーベクトルKV<1>-aが、“Biden”という固有表現dNEaと文書Dc<1>とによって、生成される。キーベクトルKV<1>-bが、“Scranton”という固有表現dNEbと文書Dc<1>とによって、生成される。
例えば、文書Dc<2>に関して、2つのキーベクトルKV<2>-c,KV<2>-dが、生成される。キーベクトルKV<2>-cが、“Obama”という固有表現dNEcと文書Dc<2>とによって、生成される。キーベクトルKV<2>-dが、“Hawaii”という固有表現dNEdと文書Dc<2>とによって、生成される。
例えば、文書Dc<n>に関して、2つのキーベクトルKV<n>-e,KV<n>-fが、生成される。キーベクトルKV<n>-eが、“Obama”という固有表現dNEeと文書Dc<n>とによって、生成される。キーベクトルKV<n>-fが、“Nobel peace prize”という固有表現dNEfと文書Dc<n>とによって、生成される。
この結果として、知識源としてデータベース131に格納されている複数の文書Dcに関する潜在表現空間LSが生成される。複数の文書Dcの複数のキーベクトルKVを含む潜在表現空間LSは、同一の自然言語モデルを用いたニューラルネットワークに基づいて生成される。
潜在表現空間LSのキーベクトルKVの数は、データベース131に格納されている文書Dcの数より多い。但し、各文書Dcに含まれる固有表現dNeの数に応じて、キーベクトルKVの数が、文書Dcの数より少なくなる場合もある。
<S5>
検索システム200は、プロセッサ11によって、生成されたキーベクトルKVとキーベクトルKVに対応する識別番号Idとを、ストレージ13に記憶する。これによって、潜在表現空間LSは、ストレージ13に格納される。例えば、キーベクトルKV及び識別番号Idは、テーブルTBLにおいて互いに関連付けられるように、保存される。
例えば、テーブル管理部290は、キーベクトルKV及び識別番号Idを受ける。テーブル管理部290は、キーベクトルKV及び識別番号Idの対応関係を示すテーブルTBLを生成する。テーブルTBLは、検索タスクの実行前に生成されていればよい。
例えば、検索タスクの実行時、生成された複数のキーベクトルKVは、メモリ12に読み出される。検索タスクの実行時、キーベクトルKV及び識別番号Idに関するテーブルTBLは、テーブル管理部290に読み出される。尚、キーベクトルKVは、テーブル管理部290に読み出されてもよい。
以上のように、複数の文書Dcから、キーベクトルKVが生成される。
これによって、複数のキーベクトルKVを含む潜在表現空間LSが、形成される。
<検索タスク>
図9乃至図13を参照して、本実施形態の情報処理装置1における、検索システム200による検索タスクについて、説明する。
図9は、本実施形態の情報処理装置1における検索タスクを示すフローチャートである。図10乃至図13のそれぞれは、本実施形態における、検索タスクを説明するための模式図である。
<S10>
図9に示されるように、検索システム200は、検索タスクの対象となる質問Qsを受ける。質問Qsは、情報処理装置1のユーザー又はデバイス9によって生成される。ユーザーは、質問Qsを、ユーザーインターフェース14を介して、情報処理装置1に供給する。質問Qsは、プロセッサ11のインターフェース部119を介して、検索システム200に入力される。質問Qsは、1つ以上の文を含む。
図10に示されるように、検索システム200において、抽出モジュール210は、質問Qsを受ける。
例えば、本実施形態において、抽出モジュール210は、“Where was Obama born?”という文を、質問Qsとして、受ける。
<S11>
抽出モジュール210は、固有表現抽出モデルM1に基づいて、質問Qsから固有表現qNEを抽出する。
図10の例において、抽出モジュール210は、質問Qsから“Obama”という固有表現qNEを抽出する。
抽出モジュール210は、抽出された固有表現qNEを、エンコーダ220に送る。抽出モジュール210は、質問Qsから抽出された固有表現qNEと共に、質問Qs自体を、エンコーダ220に送る。
<S12>
エンコーダ220は、質問Qs及び固有表現qNEを受ける。
エンコーダ220は、学習済み言語モデルM2に基づいて、質問Qs及び固有表現qNEを用いて、クエリベクトルQVを計算する。
これによって、質問Qsに対応するクエリベクトルQVが、生成される。生成されたクエリベクトルQVは、質問Qsの特徴量ベクトルに質問Qsから抽出された固有表現qNEの特徴量ベクトルが反映された値を有する。
<S13>
図11に示されるように、検索システム200は、質問Qsの受信及び質問Qsに対する各種の処理に並行して、プロセッサ11の制御によって、潜在表現空間LSに含まれる複数のキーベクトルKVを、ストレージ13のデータベース132から読み出す。読み出されたキーベクトルKVは、例えば、メモリ12に格納される。
検索システム200は、プロセッサ11によって、識別番号Id及びキーベクトルKVに関するテーブルTBLを、テーブル管理部290に読み出す。
尚、キーベクトルKV及びテーブルTBLは、質問Qsの受信の前に、ストレージ13から読み出されていてもよい。
<S14>
図12に示されるように、類似度計算部230は、クエリベクトルQVと各キーベクトルKVとの間の類似度を計算する。例えば、クエリベクトルQVとキーベクトルKVとの間の類似度は、コサイン類似度によって、計算される。
これによって、クエリベクトルQVと各キーベクトルKVとの間の類似度の計算結果を示すスコアSCRが、キーベクトルKVごとにそれぞれ得られる。
類似度計算部230は、スコアSCRを判定部240に送る。
<S15>
判定部240は、類似度の計算結果に基づいて、回答候補となり得るキーベクトルKVの判定処理を、実行する。
図13に示されるように、判定部240は、類似度のスコアSCRを、類似度計算部230から受ける。判定部240は、クエリベクトルQVに類似するキーベクトルKVを、潜在表現空間LSの複数のキーベクトルKVの中から検索する。
判定部240は、各キーベクトルKVに関するスコアSCRに基づいて、質問Qsに対する回答候補となり得るキーベクトルKVを、複数のキーベクトルKVの中から判定する。
例えば、判定部240は、類似度のスコアSCRが閾値を満たすか否かに応じて、クエリベクトルQVに対するキーベクトルKVのランク付けを行う。これによって、判定部240は、或る閾値以上の類似度を有するキーベクトルKVを、回答候補として取得する。
図13の例において、判定部240は、文書Dc自体の文脈の特徴と共に“Obama”という固有表現dNEの特徴が反映された複数のキーベクトルKV<2>-c,KV<n>-eを選択し、取得する。
<S16>
図13に示されるように、結果出力部250は、判定処理の結果に基づいて、1つ以上の文書Dcを、質問Qsに対する検索結果RRとして、取得及び出力する。
例えば、結果出力部250は、類似度に基づくキーベクトルKVの判定結果を判定部240から受ける。
結果出力部250は、受けたキーベクトルKVに基づいて、テーブル管理部290のテーブルTBLを参照する。結果出力部250は、テーブルTBLの参照結果に基づいて、回答候補のキーベクトルKVに対応する識別番号Idを検知する。
結果出力部250は、ストレージ13のデータベース131にアクセスする。結果出力部250は、検知された識別番号Idに対応する文書Dcを、データベース131から読み出す。
例えば、キーベクトルKV<2>-cが選択された場合、結果出力部250は、選択されたキーベクトルKV<2>-c及びテーブルTBLに基づいて、キーベクトルKV<2>-cに識別番号Id<2>が関連付けられていることを、検知する。
これによって、結果出力部250は、検知された識別番号Id<2>に対応する文書Dc<2>を、データベース131から読み出す。
キーベクトルKV<n>-eが選択された場合、結果出力部250は、選択されたキーベクトルKV<n>-e及びテーブルTBLに基づいて、キーベクトルKV<n>-eに識別番号Id<n>が関連付けられていることを、検知する。
これによって、結果出力部250は、検知された識別番号Id<n>に対応する文書Dc<n>を、データベース131から読み出す。
このように、結果出力部250は、回答候補として選択されたキーベクトルKVに対応する文書Dc(Dc<2>,Dc<n>)を、取得する。
結果出力部250は、取得された文書Dc<2>,Dc<n>を、回答に関するデータアイテムとして、ユーザーインターフェース14に出力する。
この結果として、質問Qsを提供したユーザーは、結果出力部250からの出力に基づいて、質問Qsに対する検索結果RRの文書Dcを、認識できる。
以上の処理によって、本実施形態の情報処理装置1における、検索タスクが、完了する。
(c)まとめ
DPR(Dense passage retrieval)のような深層学習を用いた文書検索方法は、文字列の一致による関連文書の検索方法のような古典的な検索方法に比較して、DPRとして機能するために必要な追加学習に用いたデータセットに対してより高精度の検索を実現できる場合がある。
但し、DPRによる文書検索方法は、初見の文書に対する検索精度が低い傾向がある。例えば、固有表現に関する質問に対する検索タスクにおいて、DPRによる文書検索方法の検索性能は、古典的な検索方法の検索性能より低いことがある。
上述のように、本実施形態の情報処理装置1において、検索システム200は、質問Qs及び検索対象の文書Dcのそれぞれから、固有表現qNE,dNEを抽出する。
検索システム200は、質問Qsと抽出された固有表現qNEとからクエリベクトルQVを生成する。検索システム200は、文書Dcから抽出された複数の固有表現dNEごとに、文書Dcと各固有表現dNEとから複数のキーベクトルKVを生成する。
これによって、本実施形態の情報処理装置1は、同一の潜在表現空間LS上に、文書Dcの数より多い数のキーベクトルKVを、存在させることができる。また、本実施形態において、1つの文書Dcに対するキーベクトルKVの冗長性が、高くなる。
本実施形態において、質問Qsに対応するクエリベクトルQVは、質問Qsの文脈の特徴に加えて、質問Qsから抽出された固有表現qNEの特徴がさらに反映される。これと同様に、文書Dcに対応するキーベクトルKVは、文書Dcの文脈の特徴に加えて、文書Dcから抽出された固有表現dNEの特徴がさらに反映される。
これによって、本実施形態の情報処理装置1は、質問Qsに含まれる固有表現qNEに類似する固有表現dNEの特徴が反映されたキーベクトルKVを、複数のキーベクトルKVの中から検索できる。
これらの結果として、本実施形態の情報処理装置1において、初見の文に対する検索性能が向上する。
図14は、本実施形態の情報処理装置1の検索タスクに関する特性を示すグラフである。
図14のグラフの横軸は、検索結果として取得され得るキーベクトルの個数に対応する。図14のグラフの縦軸は、検索精度(単位:%)に対応する。
丸のプロット及び実線で示される特性A1は、実施形態の情報処理装置1の検索システム200における検索精度の推移を示している。三角のプロット及び破線で示される特性A2は、比較例の検索システムにおける検索精度の推移を示している。比較例の検索システムは、一般的なDPRを用いた検索システムである。
本実施形態の検索システム200の特性及び比較例の検索システムの特性は、EntityQuestions データセットを用いて評価された。開発セットにおける質問の数は、10170問である。
図14に示されるように、本実施形態のように抽出された固有表現dNEと文書Dcとから生成されたキーベクトルKVが、検索システム200の検索タスクに用いられた場合、本実施形態の検索システム200の検索精度は、比較例の検索システムの検索精度に比較して、高くなる。
このように、本実施形態の情報処理装置1は、検索タスクの検索精度を向上できる。
以上のように、本実施形態の情報処理装置1及び情報処理方法は、タスクの精度を向上できる。
(2)変形例
図15を参照して、実施形態の情報処理装置1の変形例について、説明する。
図15は、実施形態の情報処理装置1の変形例を説明するための模式図である。
図15に示されるように、質問Qsxが、複数の固有表現qNEa,qNEbを含む場合がある。例えば、図15の例において、“Which Nobel prize was awarded to Obama?”という質問Qsxが、情報処理装置1の検索システム200に供給される。質問Qsは、“Obama”という固有表現qNEaと、“Nobel prize”という固有表現qNEbと、を含む。
この場合において、文書Dc及びキーベクトルKVと同様に、複数のクエリベクトルQVa,QVbが、1つの質問Qsxに含まれる複数の固有表現qNE毎に、計算及び生成される。
抽出モジュール210は、固有表現抽出モデルM1に基づいて、複数の固有表現qNEa,qNEbを、質問Qsxから抽出する。ここでは、“Obama”と“Novel prize”という2つの固有表現qNEa,qNEbが、それぞれ抽出される。
抽出モジュール210は、質問Qsx、及び、抽出された2つの固有表現qNEa,qNEbを、エンコーダ220へ送る。
エンコーダ220は、学習済み言語モデルM2に基づいて、固有表現qNEa,qNEb毎に、質問Qsxと各固有表現qNEa,qNEbとを用いたクエリベクトルQVa,QVbを計算する。これによって、2つのクエリベクトルQVa,QVbが、1つの質問Qsxから生成される。
一方のクエリベクトルQVaに、質問Qsxの文脈の特徴に対して固有表現qNEaの特徴が反映されている。他方のクエリベクトルQVbに、質問Qsxの文脈の特徴に対して固有表現qNEbの特徴が反映されている。
類似度計算部230は、複数のクエリベクトルQVa,QVbと複数のキーベクトルKVとの間の類似度を、それぞれ計算する。
類似度計算部230は、クエリベクトルQVaと各キーベクトルKVとの間の類似度を計算する。これによって、クエリベクトルQVa及び各キーベクトルKVに関する類似度の計算結果として、複数のスコアSCRaが、得られる。
類似度計算部230は、クエリベクトルQVbと各キーベクトルKVとの間の類似度を計算する。これによって、クエリベクトルQVb及び各キーベクトルKVに関する類似度の計算結果として、複数のスコアSCRbが、得られる。
判定部240は、各クエリベクトルQVa,QVbに関する類似度の計算結果に基づいて、潜在表現空間LSの複数のキーベクトルKVの中から質問Qsxに対する回答候補となり得るキーベクトルKVを、判定する。
結果出力部250は、判定結果及びテーブルTBLに基づいて、回答となる文書Dcを、データベース131から検索する。これによって、結果出力部250は、1以上の文書Dcをデータベース131から取得する。
結果出力部250は、検索結果RRの文書Dcを出力する。
本変形例のように、ユーザーからの質問Qsxが、複数の固有表現qNEa,qNEbを含む場合であっても、実施形態の検索システム200は、固有表現qNEa,qNEb毎に生成された複数のクエリベクトルQVa,QVbを用いて、質問Qsxに対する回答となる文書Dcを、取得できる。
したがって、本変形例の情報処理装置1は、上述の実施形態と実質的に同じ効果を得ることができる。
(3)その他
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
1:情報処理装置、11:プロセッサ、12:メモリ、13:ストレージ、14:ユーザーインターフェース、200:検索システム、210:抽出モジュール、220,221:エンコーダ、230:類似度計算部、240:判定部、250:結果出力部。

Claims (9)

  1. 複数の文書に関する複数の第1のデータアイテム及び質問に関する第2のデータアイテムを受けるインターフェース回路と、
    前記インターフェース回路が受けた前記複数の第1のデータアイテム及び前記第2のデータアイテムを処理するプロセッサと、
    を備え、
    前記プロセッサは、
    前記複数の第1のデータアイテムのそれぞれから複数の第1の固有表現を抽出し、前記第2のデータアイテムから第2の固有表現を抽出し、
    前記複数の第1のデータアイテムのそれぞれと対応する前記複数の第1の固有表現のそれぞれとに関する複数の第1のベクトルを、それぞれ生成し、
    前記第2のデータアイテムと前記第2の固有表現とに関する第2のベクトルを生成し、
    前記複数の第1のベクトルのそれぞれと前記第2のベクトルとの間の類似度を計算し、
    前記類似度の計算結果に基づいて、前記複数の第1のデータアイテムの中から検索された回答に関する第3のデータアイテムを取得する、
    情報処理装置。
  2. 前記プロセッサは、固有表現に関する第1の自然言語モデルの第1のニューラルネットワークに基づいて、前記複数の第1の固有表現及び前記第2の固有表現を抽出する、
    請求項1に記載の情報処理装置。
  3. 前記プロセッサは、第2の自然言語モデルの第2のニューラルネットワークに基づいて、前記複数の第1のベクトル及び前記第2のベクトルを生成する、
    請求項1に記載の情報処理装置。
  4. 前記プロセッサは、前記複数の第1のデータアイテムのうち1つの第1のデータアイテムからk個(kは、2以上の整数)の前記第1の固有表現を抽出し、前記1つの第1のデータアイテム及び前記k個の前記第1の固有表現に基づいてk個の前記第1のベクトルを生成する、
    請求項1に記載の情報処理装置。
  5. 前記プロセッサは、複数の識別番号と前記複数の第1のベクトルとの対応関係を記憶し、
    前記複数の識別番号のそれぞれは、前記複数の第1のデータアイテムのそれぞれに割り当てられている、
    請求項1に記載の情報処理装置。
  6. 前記複数の第1のデータアイテムのそれぞれに複数の識別番号のそれぞれが割り当てられ、
    前記複数の識別番号のそれぞれは、前記複数の第1のベクトルのうち対応する1つに関連付けられ、
    前記複数の第1のベクトルのうち選択された第1のベクトルに対応する前記識別番号に基づいて、前記複数の第1のデータアイテムの中から前記選択されたベクトルに対応する第1のデータアイテムが、取得される、
    請求項1に記載の情報処理装置。
  7. 前記複数の第1のデータアイテム及び前記複数の第1のベクトルを記憶するストレージを、
    さらに具備する請求項1に記載の情報処理装置。
  8. 生成された前記複数の第1のベクトルを記憶するストレージをさらに具備し、
    前記プロセッサは、前記類似度を計算する時、前記複数の第1のベクトルを前記ストレージから読み出す、
    請求項1に記載の情報処理装置。
  9. 複数の文書に関する複数の第1のデータアイテムを受けることと、
    前記複数の第1のデータアイテムのそれぞれから複数の第1の固有表現を抽出することと、
    前記複数の第1のデータアイテムのそれぞれと対応する前記複数の第1の固有表現のそれぞれとに基づいて、複数の第1のベクトルを生成することと、
    質問に関する第2のデータアイテムを受けることと、
    前記第2のデータアイテムから第2の固有表現を抽出することと、
    前記第2のデータアイテムと前記第2の固有表現とに基づいて、第2のベクトルを生成することと、
    前記複数の第1のベクトルのそれぞれと前記第2のベクトルとの間の類似度を計算することと、
    前記類似度の計算結果に基づいて、前記複数の第1のデータアイテムの中から検索された回答に関する第3のデータアイテムを取得することと、
    を具備する情報処理方法。
JP2022079628A 2022-05-13 2022-05-13 情報処理装置及び情報処理方法 Pending JP2023168024A (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2022079628A JP2023168024A (ja) 2022-05-13 2022-05-13 情報処理装置及び情報処理方法
TW112104558A TWI852325B (zh) 2022-05-13 2023-02-09 資訊處理裝置及資訊處理方法
CN202310168895.9A CN117056469A (zh) 2022-05-13 2023-02-27 信息处理装置以及信息处理方法
US18/181,642 US12585878B2 (en) 2022-05-13 2023-03-10 Information processing apparatus and information processing method
DE102023106213.1A DE102023106213A1 (de) 2022-05-13 2023-03-13 Informationsverarbeitungsvorrichtung und Informationsverarbeitungsverfahren
EP23161476.9A EP4276654A1 (en) 2022-05-13 2023-03-13 Information processing apparatus and information processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022079628A JP2023168024A (ja) 2022-05-13 2022-05-13 情報処理装置及び情報処理方法

Publications (1)

Publication Number Publication Date
JP2023168024A true JP2023168024A (ja) 2023-11-24

Family

ID=85601554

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022079628A Pending JP2023168024A (ja) 2022-05-13 2022-05-13 情報処理装置及び情報処理方法

Country Status (6)

Country Link
US (1) US12585878B2 (ja)
EP (1) EP4276654A1 (ja)
JP (1) JP2023168024A (ja)
CN (1) CN117056469A (ja)
DE (1) DE102023106213A1 (ja)
TW (1) TWI852325B (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12380285B2 (en) * 2022-08-31 2025-08-05 Centre for Perceptual and Interactive Intelligence (CPII) Limited Grounded dialogue generation with cross-encoding re-ranker, grounding span prediction, and passage dropout
CN119377133B (zh) * 2024-10-16 2025-07-08 北京帝派智能科技有限公司 一种可预设kv缓存容量的大模型构建方法及装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9135238B2 (en) * 2006-03-31 2015-09-15 Google Inc. Disambiguation of named entities
CN102436456B (zh) * 2010-09-29 2016-03-30 国际商业机器公司 用于对命名实体进行分类的方法和装置
US10354182B2 (en) * 2015-10-29 2019-07-16 Microsoft Technology Licensing, Llc Identifying relevant content items using a deep-structured neural network
US10402750B2 (en) * 2015-12-30 2019-09-03 Facebook, Inc. Identifying entities using a deep-learning model
CN106295796B (zh) * 2016-07-22 2018-12-25 浙江大学 基于深度学习的实体链接方法
JP2019164409A (ja) 2018-03-19 2019-09-26 株式会社日立ソリューションズ 文書検索装置、文書検索方法、及び文書検索プログラム
CN109086386B (zh) * 2018-07-26 2023-04-28 腾讯科技(深圳)有限公司 数据处理方法、装置、计算机设备和存储介质
CN109325108B (zh) * 2018-08-13 2022-05-27 北京百度网讯科技有限公司 查询处理方法、装置、服务器及存储介质
US11321529B2 (en) * 2018-12-25 2022-05-03 Microsoft Technology Licensing, Llc Date and date-range extractor
JP7338848B2 (ja) 2019-02-28 2023-09-05 学校法人 川崎学園 文章検索システム、文章検索方法及び文章検索プログラム
CN111767365A (zh) * 2019-03-12 2020-10-13 株式会社理光 文档检索设备及方法
GB201904167D0 (en) * 2019-03-26 2019-05-08 Benevolentai Tech Limited Name entity recognition with deep learning
US11651037B2 (en) 2019-12-20 2023-05-16 Rakuten Group, Inc. Efficient cross-modal retrieval via deep binary hashing and quantization
US11860684B2 (en) * 2020-06-01 2024-01-02 Asapp, Inc. Few-shot named-entity recognition
US11947571B2 (en) * 2021-04-20 2024-04-02 Microsoft Technology Licensing, Llc Efficient tagging of content items using multi-granular embeddings
CN113408273B (zh) * 2021-06-30 2022-08-23 北京百度网讯科技有限公司 文本实体识别模型的训练与文本实体识别方法、装置
US12190621B2 (en) * 2022-03-03 2025-01-07 Adobe Inc. Generating weighted contextual themes to guide unsupervised keyphrase relevance models

Also Published As

Publication number Publication date
TWI852325B (zh) 2024-08-11
TW202349258A (zh) 2023-12-16
EP4276654A1 (en) 2023-11-15
CN117056469A (zh) 2023-11-14
DE102023106213A1 (de) 2023-11-16
US12585878B2 (en) 2026-03-24
US20230367965A1 (en) 2023-11-16

Similar Documents

Publication Publication Date Title
Moon et al. Multimodal named entity disambiguation for noisy social media posts
Weston et al. Memory networks
Zhang et al. Entity linking with effective acronym expansion, instance selection, and topic modeling
US12541543B2 (en) Large language model-based information retrieval for large datasets
Azmi et al. Real-word errors in Arabic texts: A better algorithm for detection and correction
US20230119161A1 (en) Efficient Index Lookup Using Language-Agnostic Vectors and Context Vectors
WO2020114100A1 (zh) 一种信息处理方法、装置和计算机存储介质
KR20220039075A (ko) 전자 장치, 컨텐츠 검색 시스템 및 검색 방법
CN114330303B (zh) 文本纠错方法及相关设备
TWI852325B (zh) 資訊處理裝置及資訊處理方法
KR20230062430A (ko) 스토리 기반 이미지 시퀀스 결정 방법, 장치 및 시스템
Nguyen et al. OCR error correction using correction patterns and self-organizing migrating algorithm
CN116701605A (zh) 问答机器人的回复优化方法及装置、电子设备、存储介质
CN120470090A (zh) 一种文本块检索方法、计算机程序产品及设备
Köksal et al. Improving automated Turkish text classification with learning‐based algorithms
Zhang et al. Multi-document extractive summarization using window-based sentence representation
JP4640593B2 (ja) 多言語文書検索装置および多言語文書検索方法、並びに、多言語文書を検索するプログラム
Gupta et al. Fast and effective searches of personal names in an international environment
CN114372480B (zh) 机器翻译模型的训练方法和机器翻译方法
Lauriola et al. Learning representations for biomedical named entity recognition
CN107818076B (zh) 针对自然语言的语义处理
Lv et al. N-gram nearest neighbor machine translation
US12579369B2 (en) Data merging using machine learning
US20260087051A1 (en) Information retrieval system using a hierarchical corpus encoder
Bhuyan et al. Generation of Missing Words in Assamese text using N-gram based Model

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20230106