JP2014120053A - 質問応答装置、方法、及びプログラム - Google Patents
質問応答装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP2014120053A JP2014120053A JP2012275924A JP2012275924A JP2014120053A JP 2014120053 A JP2014120053 A JP 2014120053A JP 2012275924 A JP2012275924 A JP 2012275924A JP 2012275924 A JP2012275924 A JP 2012275924A JP 2014120053 A JP2014120053 A JP 2014120053A
- Authority
- JP
- Japan
- Prior art keywords
- answer
- learning
- question
- question sentence
- extracted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】質問解析部11が、自然言語による質問文を拡張固有表現の体系に従って分類することにより、質問文に対する回答の種類を示す回答タイプを解析し、文書検索部12が、質問文に含まれる単語を検索条件として文書DB31から検索された文書集合を取得し、回答候補抽出部13、検索された文書集合に含まれる拡張固有表現から、解析された回答タイプに対応した拡張固有表現を回答候補として抽出し、回答評価部14が、特徴量抽出部21を呼び出して、回答候補から特徴量を抽出し、回答候補の信頼度を算出するために予め回答タイプ毎に構築された信頼度算出式32に特徴量を入力して算出した、回答タイプに応じた信頼度の高い回答候補を、質問文に対する回答として出力する。
【選択図】図1
Description
第1の実施の形態に係る質問応答装置10は、CPUと、RAMと、後述する信頼度算出式構築処理ルーチン、及び質問応答処理ルーチンを実行するためのプログラム及び各種データを記憶したROMとを備えたコンピュータで構成されている。また、記憶手段としてHDDを設けてもよい。
・文書の検索順位(rank)・・・回答候補が出現する文書の検索時における順位を値として持つ特徴量である。
・検索結果における回答候補の頻度(cand_count)・・・文書の検索結果から抽出された全ての回答候補における対象の回答候補の出現回数を値として持つ特徴量である。文書の検索結果における出現頻度が高い場合に、対象の回答候補が回答らしい(信頼度が高い)としたい場合に有効な特徴量である。
・検索結果における回答候補の割合(cand_ratio)・・・文書の検索結果から抽出された全ての回答候補に対して、対象の回答候補が占める割合を値として持つ特徴量である。例えば、対象の回答候補が「A」であり、文書の検索結果中から10個の回答候補が抽出されており、そのうち5個が「A」という回答候補だったとすると、回答候補「A」についての本特徴量は0.5となる。
次に、第2の実施の形態について説明する。なお、第2の実施の形態に係る質問応答装置について、第1の実施の形態に係る質問応答装置10と同様の構成については、同一符号を付して詳細な説明を省略する。
1 エベレスト 0.969366(22)
2 富士山 0.246514(3)
3 チョモランマ 0.226562(1)
4 K2 0.151517(2)
5 ハワイ島 0.13605(1)
6 エベレスト/チョモランマ 0.0898824(1)
7 ダウラギリ 0.0621022(3)
8 カンチェンジュンガ 0.0353058(5)
9 カメルーン山 0.0261512(2)
10 マナスル 0.0173765(1)
11 ローツェ 0.0152677(1)
12 チョ・オユー 0.0152677(1)
13 マカルー 0.00845766(1)
14 アルプス 0.00446622(1)
enetype_Mountain-cand_ratio 3.812258026357529
enetype_Mountain-score_dist 0.02188293329420078
enetype_Mountain-cand_count 0.006644647005094824
enetype_Mountain-rank -0.02508300268047375
比較として、回答タイプ「Lake」に関する各特徴量の回帰係数を以下に示す。
enetype_Lake-cand_ratio 3.260375594203147
enetype_Lake-cand_count 0.01467459091733951
enetype_Lake-rank -0.03125393707655315
enetype_Lake-score_dist -0.09606970225518727
11 質問解析部
12 文書検索部
13 回答候補抽出部
14、214 回答評価部
21 特徴量抽出部
22、222 学習部
31 文書DB
32、232 信頼度算出式
Claims (7)
- 自然言語による質問文を拡張固有表現の体系に従って分類することにより、前記質問文に対する回答の種類を示す回答タイプを解析する解析手段と、
前記質問文に含まれる単語を検索条件として複数の文書から検索された文書に含まれる拡張固有表現から、前記解析手段により解析された回答タイプに対応した拡張固有表現を回答候補として抽出する抽出手段と、
前記回答候補の前記質問文に対する回答としての信頼度を算出する信頼度算出式に基づいて得られた、前記解析手段により解析された回答タイプに応じた信頼度の高い回答候補を、前記質問文に対する回答として出力する出力手段と、
を含む質問応答装置。 - 前記出力手段は、質問文に対する回答タイプ及び回答が既知の複数の学習用質問文について抽出された複数の学習用回答候補の各々について、該学習用回答候補の各々から抽出された学習用特徴量と、該学習用回答候補が正解の回答か否かを示すラベルとの組を学習データとして、前記回答タイプ毎に学習することにより得られた前記回答タイプ毎の信頼度算出式のうち、前記解析手段により解析された回答タイプの信頼度算出式に、前記質問文について抽出された回答候補から抽出された特徴量を入力して、前記回答候補の信頼度を算出する請求項1記載の質問応答装置。
- 前記出力手段は、質問文に対する回答タイプ及び回答が既知の複数の学習用質問文について抽出された複数の学習用回答候補の各々について、該学習用回答候補の各々から抽出された学習用特徴量に、前記学習用質問文の回答タイプを示す情報を含めた特徴量と、該学習用回答候補が正解の回答か否かを示すラベルとの組を学習データとして学習することにより得られた前記信頼度算出式に、前記質問文について抽出された回答候補から抽出された特徴量に、前記解析手段により解析された回答タイプを示す情報を含めた特徴量を入力して、前記回答候補の信頼度を算出する請求項1記載の質問応答装置。
- 解析手段と、抽出手段と、出力手段とを含む質問応答装置における質問応答方法であって、
前記解析手段が、自然言語による質問文を拡張固有表現の体系に従って分類することにより、前記質問文に対する回答の種類を示す回答タイプを解析し、
前記抽出手段が、前記質問文に含まれる単語を検索条件として複数の文書から検索された文書に含まれる拡張固有表現から、前記解析手段により解析された回答タイプに対応した拡張固有表現を回答候補として抽出し、
前記出力手段が、前記回答候補の前記質問文に対する回答としての信頼度を算出する信頼度算出式に基づいて得られた、前記解析手段により解析された回答タイプに応じた信頼度の高い回答候補を、前記質問文に対する回答として出力する
質問応答方法。 - 前記出力手段は、質問文に対する回答タイプ及び回答が既知の複数の学習用質問文について抽出された複数の学習用回答候補の各々について、該学習用回答候補の各々から抽出された学習用特徴量と、該学習用回答候補が正解の回答か否かを示すラベルとの組を学習データとして、前記回答タイプ毎に学習することにより得られた前記回答タイプ毎の信頼度算出式のうち、前記解析手段により解析された回答タイプの信頼度算出式に、前記質問文について抽出された回答候補から抽出された特徴量を入力して、前記回答候補の信頼度を算出する請求項4記載の質問応答方法。
- 前記出力手段は、質問文に対する回答タイプ及び回答が既知の複数の学習用質問文について抽出された複数の学習用回答候補の各々について、該学習用回答候補の各々から抽出された学習用特徴量に、前記学習用質問文の回答タイプを示す情報を含めた特徴量と、該学習用回答候補が正解の回答か否かを示すラベルとの組を学習データとして学習することにより得られた前記信頼度算出式に、前記質問文について抽出された回答候補から抽出された特徴量に、前記解析手段により解析された回答タイプを示す情報を含めた特徴量を入力して、前記回答候補の信頼度を算出する請求項4記載の質問応答方法。
- コンピュータを、請求項1〜請求項3のいずれか1項記載の質問応答装置を構成する各手段として機能させるための質問応答プログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2012275924A JP5710581B2 (ja) | 2012-12-18 | 2012-12-18 | 質問応答装置、方法、及びプログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2012275924A JP5710581B2 (ja) | 2012-12-18 | 2012-12-18 | 質問応答装置、方法、及びプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2014120053A true JP2014120053A (ja) | 2014-06-30 |
| JP5710581B2 JP5710581B2 (ja) | 2015-04-30 |
Family
ID=51174822
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2012275924A Active JP5710581B2 (ja) | 2012-12-18 | 2012-12-18 | 質問応答装置、方法、及びプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5710581B2 (ja) |
Cited By (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2017224180A (ja) * | 2016-06-16 | 2017-12-21 | 株式会社FiNC | 健康管理サーバおよび健康管理サーバ制御方法並びに健康管理プログラム |
| JP2018049342A (ja) * | 2016-09-20 | 2018-03-29 | ヤフー株式会社 | 生成装置、生成方法及び生成プログラム |
| JP2018049588A (ja) * | 2017-06-20 | 2018-03-29 | ヤフー株式会社 | 生成装置、生成方法及び生成プログラム |
| JP2018116447A (ja) * | 2017-01-18 | 2018-07-26 | ヤフー株式会社 | 情報提供装置、情報提供方法、およびプログラム |
| JP2018180938A (ja) * | 2017-04-13 | 2018-11-15 | 日本電信電話株式会社 | 回答候補生成装置、方法、及びプログラム |
| CN109829041A (zh) * | 2018-12-25 | 2019-05-31 | 出门问问信息科技有限公司 | 问题处理方法、装置、计算机设备及计算机可读存储介质 |
| JP2019521415A (ja) * | 2016-05-17 | 2019-07-25 | グーグル エルエルシー | メッセージ分類に基づくメッセージ交換スレッドの自動的拡張 |
| WO2019244803A1 (ja) * | 2018-06-18 | 2019-12-26 | 日本電信電話株式会社 | 回答学習装置、回答学習方法、回答生成装置、回答生成方法、及びプログラム |
| JP2020509486A (ja) * | 2017-02-28 | 2020-03-26 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 適応可能な処理コンポーネント |
| CN113449117A (zh) * | 2021-06-24 | 2021-09-28 | 武汉工程大学 | 一种基于Bi-LSTM和中文知识图谱的复合问答方法 |
| JP2021179827A (ja) * | 2020-05-14 | 2021-11-18 | エヌ・ティ・ティ・コムウェア株式会社 | 検索装置および検索方法、学習装置および学習方法、質問回答予測システムおよび質問回答予測方法、並びにプログラム |
| JP2023012522A (ja) * | 2021-12-27 | 2023-01-25 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | クロスモーダル情報に基づく文書読解モデルトレーニング方法及び装置 |
| JP2023031322A (ja) * | 2022-01-20 | 2023-03-08 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 問答処理方法、問答モデルのトレーニング方法、装置、電子機器、記憶媒体及びコンピュータプログラム |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11157829B2 (en) | 2017-07-18 | 2021-10-26 | International Business Machines Corporation | Method to leverage similarity and hierarchy of documents in NN training |
-
2012
- 2012-12-18 JP JP2012275924A patent/JP5710581B2/ja active Active
Non-Patent Citations (6)
| Title |
|---|
| CSNG200501040016; 佐々木 裕: '総合学習による質問応答システムの新しい構成法〜CLQAに向けて' 情報処理学会研究報告 Vol.2004 No.93, 20040917, 123-130ページ, 社団法人情報処理学会 * |
| CSNG200800024234; 水野 淳太: '任意の回答を対象とする質問応答のための実世界質問の分析と回答タイプ判定法の検討' 言語処理学会第13回年次大会発表論文集 , 20070319, 1002-1005ページ, 言語処理学会 * |
| CSNG201200867004; 吉村 健: 'しゃべってコンシェルと言語処理' 情報処理学会研究報告 2012(平成24)年度▲4▼ [CD-ROM] , 20121215, 1-6ページ, 一般社団法人情報処理学会 * |
| JPN6014046231; 吉村 健: 'しゃべってコンシェルと言語処理' 情報処理学会研究報告 2012(平成24)年度▲4▼ [CD-ROM] , 20121215, 1-6ページ, 一般社団法人情報処理学会 * |
| JPN6014046235; 佐々木 裕: '総合学習による質問応答システムの新しい構成法〜CLQAに向けて' 情報処理学会研究報告 Vol.2004 No.93, 20040917, 123-130ページ, 社団法人情報処理学会 * |
| JPN6014046236; 水野 淳太: '任意の回答を対象とする質問応答のための実世界質問の分析と回答タイプ判定法の検討' 言語処理学会第13回年次大会発表論文集 , 20070319, 1002-1005ページ, 言語処理学会 * |
Cited By (23)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US12093270B2 (en) | 2016-05-17 | 2024-09-17 | Google Llc | Automatically augmenting message exchange threads based on tone of message |
| US11762865B2 (en) | 2016-05-17 | 2023-09-19 | Google Llc | Automatically augmenting message exchange threads based on tone of message |
| JP2019521415A (ja) * | 2016-05-17 | 2019-07-25 | グーグル エルエルシー | メッセージ分類に基づくメッセージ交換スレッドの自動的拡張 |
| US11222030B2 (en) | 2016-05-17 | 2022-01-11 | Google Llc | Automatically augmenting message exchange threads based on tone of message |
| US10769155B2 (en) | 2016-05-17 | 2020-09-08 | Google Llc | Automatically augmenting message exchange threads based on tone of message |
| JP2017224180A (ja) * | 2016-06-16 | 2017-12-21 | 株式会社FiNC | 健康管理サーバおよび健康管理サーバ制御方法並びに健康管理プログラム |
| JP2018049342A (ja) * | 2016-09-20 | 2018-03-29 | ヤフー株式会社 | 生成装置、生成方法及び生成プログラム |
| JP2018116447A (ja) * | 2017-01-18 | 2018-07-26 | ヤフー株式会社 | 情報提供装置、情報提供方法、およびプログラム |
| US11144718B2 (en) | 2017-02-28 | 2021-10-12 | International Business Machines Corporation | Adaptable processing components |
| JP7089330B2 (ja) | 2017-02-28 | 2022-06-22 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 適応可能な処理コンポーネント |
| JP2020509486A (ja) * | 2017-02-28 | 2020-03-26 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 適応可能な処理コンポーネント |
| JP2018180938A (ja) * | 2017-04-13 | 2018-11-15 | 日本電信電話株式会社 | 回答候補生成装置、方法、及びプログラム |
| JP2018049588A (ja) * | 2017-06-20 | 2018-03-29 | ヤフー株式会社 | 生成装置、生成方法及び生成プログラム |
| WO2019244803A1 (ja) * | 2018-06-18 | 2019-12-26 | 日本電信電話株式会社 | 回答学習装置、回答学習方法、回答生成装置、回答生成方法、及びプログラム |
| CN109829041A (zh) * | 2018-12-25 | 2019-05-31 | 出门问问信息科技有限公司 | 问题处理方法、装置、计算机设备及计算机可读存储介质 |
| JP2021179827A (ja) * | 2020-05-14 | 2021-11-18 | エヌ・ティ・ティ・コムウェア株式会社 | 検索装置および検索方法、学習装置および学習方法、質問回答予測システムおよび質問回答予測方法、並びにプログラム |
| JP7614738B2 (ja) | 2020-05-14 | 2025-01-16 | エヌ・ティ・ティ・コムウェア株式会社 | 検索装置および検索方法、学習装置および学習方法、質問回答予測システムおよび質問回答予測方法、並びにプログラム |
| CN113449117A (zh) * | 2021-06-24 | 2021-09-28 | 武汉工程大学 | 一种基于Bi-LSTM和中文知识图谱的复合问答方法 |
| CN113449117B (zh) * | 2021-06-24 | 2023-09-26 | 武汉工程大学 | 一种基于Bi-LSTM和中文知识图谱的复合问答方法 |
| JP7594571B2 (ja) | 2021-12-27 | 2024-12-04 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | クロスモーダル情報に基づく文書読解モデルトレーニング方法及び装置 |
| JP2023012522A (ja) * | 2021-12-27 | 2023-01-25 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | クロスモーダル情報に基づく文書読解モデルトレーニング方法及び装置 |
| US12300012B2 (en) | 2021-12-27 | 2025-05-13 | Beijing Baidu Netcom Science Technology Co., Ltd. | Method and device for training, based on crossmodal information, document reading comprehension model |
| JP2023031322A (ja) * | 2022-01-20 | 2023-03-08 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 問答処理方法、問答モデルのトレーニング方法、装置、電子機器、記憶媒体及びコンピュータプログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| JP5710581B2 (ja) | 2015-04-30 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5710581B2 (ja) | 質問応答装置、方法、及びプログラム | |
| Tellez et al. | A case study of Spanish text transformations for twitter sentiment analysis | |
| JP5078173B2 (ja) | 多義性解消方法とそのシステム | |
| US11210468B2 (en) | System and method for comparing plurality of documents | |
| Gupta et al. | A survey of text question answering techniques | |
| US10503828B2 (en) | System and method for answering natural language question | |
| US8812504B2 (en) | Keyword presentation apparatus and method | |
| Atia et al. | Increasing the accuracy of opinion mining in Arabic | |
| JP2011118689A (ja) | 検索方法及びシステム | |
| Grütze et al. | CohEEL: Coherent and efficient named entity linking through random walks | |
| Etaiwi et al. | Statistical Arabic name entity recognition approaches: A survey | |
| Kwon | Reading customers’ minds through textual big data: Challenges, practical guidelines, and proposals | |
| CN115718791A (zh) | 文本元素的特定性排序及其应用 | |
| CN109284389A (zh) | 一种文本数据的信息处理方法、装置 | |
| Albared et al. | Arabic term extraction using combined approach on Islamic document | |
| Perikli et al. | Detecting the presence of COVID-19 vaccination hesitancy from South African twitter data using machine learning | |
| Hussain et al. | A technique for perceiving abusive bangla comments | |
| Bouhoun et al. | Information retrieval using domain adapted language models: application to resume documents for HR recruitment assistance | |
| Das et al. | A novel approach to enhance the performance of semantic search in bengali using neural net and other classification techniques | |
| Kalaimagal et al. | COVID-19 Fake News Detection in Malaysia–A Supervised Approach | |
| Oguntunde et al. | Towards an automatic text analysis and summarization in yoruba language using transfer learning approach in natural language processing | |
| Guo et al. | Deep natural language processing for linkedin search | |
| Nikolić et al. | Modelling the System of Receiving Quick Answers for e-Government Services: Study for the Crime Domain in the Republic of Serbia | |
| Sati et al. | Arabic text question answering from an answer retrieval point of view: A survey | |
| Lu et al. | Improving web search relevance with semantic features |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141023 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141104 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141226 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150203 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150304 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5710581 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
