JP7147670B2 - 書籍検索装置、書籍検索用データベース生成装置、書籍検索方法、書籍検索用データベース生成方法、およびプログラム - Google Patents
書籍検索装置、書籍検索用データベース生成装置、書籍検索方法、書籍検索用データベース生成方法、およびプログラム Download PDFInfo
- Publication number
- JP7147670B2 JP7147670B2 JP2019074577A JP2019074577A JP7147670B2 JP 7147670 B2 JP7147670 B2 JP 7147670B2 JP 2019074577 A JP2019074577 A JP 2019074577A JP 2019074577 A JP2019074577 A JP 2019074577A JP 7147670 B2 JP7147670 B2 JP 7147670B2
- Authority
- JP
- Japan
- Prior art keywords
- book
- phonetic
- notation
- search
- language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
第1実施形態の書籍検索装置は、図1に例示する書籍検索装置1のように、例えば、処理部100、入力部200、および表示部300を有する。処理部100は、例えば、書籍検索用データベース記憶部110、対象発音指定部120、および対象書籍情報生成部130を備える。第1実施形態の書籍検索装置1は、例えば、表示部300に表示された書籍検索画面を利用者が見ながら入力部200を用いて音位転倒が発生した語句の言語音仮名表記の列を設定できるようにし、利用者によって設定された音位転倒が発生した語句の言語音仮名表記の列に従って絵本を検索して検索結果を得て、表示部300に検索結果を表示することで、利用者が検索結果を把握できるようにするものである。
処理部100は、例えば、CPU(central processing unit)等のプロセッサ(ハードウェア・プロセッサ)およびRAM(random-access memory),ROM(read-only memory),ハードディスク等の記憶装置等を備える汎用または専用のコンピュータが所定のプログラムを実行することで構成される。このコンピュータは1個のプロセッサやメモリを備えていてもよいし、複数個のプロセッサやメモリを備えていてもよい。このプログラムはコンピュータにインストールされてもよいし、予めROM等に記録されていてもよい。また、CPUのようにプログラムが読み込まれることで機能構成を実現する電子回路(circuitry)ではなく、プログラムを用いることなく処理機能を実現する電子回路を用いて一部またはすべての処理部が構成されてもよい。1個の装置を構成する電子回路が複数のCPUを含んでいてもよい。入力部200は利用者による情報入力を受け付けるユーザインタフェースであり、表示部300は利用者に対する情報表示を行うユーザインタフェースである。入力部200の例は、マウス、タッチセンサ、タッチパッド、キーボードなどである。表示部300の例は、液晶ディスプレイ、投影装置などである。書籍検索装置1の例は、キーボードと液晶ディスプレイなどを備えたデスクトップ型パーソナルコンピュータ(PC)、キーボードと液晶ディスプレイなどを備えたノート型PC、タッチスクリーン(タッチセンサと液晶ディスプレイとを1つのハードウェアで実装したもの)を備えたタブレット型PC、スマートフォン、などであるが、専用端末装置等であってもよい。
以下、言語音仮名表記の二つ組のことを「言語音仮名表記ペア」と呼び、言語音仮名表記ペアのうちの1番目の言語音仮名表記を「第1言語音仮名表記」と呼び、言語音仮名表記ペアのうちの2番目の言語音仮名表記を「第2言語音仮名表記」と呼んで説明する。
以下、本実施形態の書籍検索装置1の動作について説明する。
書籍検索装置1は、動作を開始すると、まず書籍検索画面を表示する。具体的には、対象発音指定部120が書籍検索画面を表示部300に表示させる制御を行い、その制御に従って表示部300は書籍検索画面を表示する。
書籍検索装置1は、次に、検索条件を設定する。具体的には、対象発音指定部120が、表示部300に表示した書籍検索画面内の正発音語句入力領域311と誤発音語句入力領域312に対する利用者による入力部200への入力操作を受け付け、入力部200が受け付けた入力操作に対応する検索条件を設定する。対象発音指定部120が設定する検索条件は、後述する検索対象第1言語音仮名表記と検索対象第2言語音仮名表記と検索対象近傍数である。
正発音語句入力領域311に対する利用者による入力部200への入力操作は、音位転倒が発生した語句の正しい言語音仮名表記の列を指定する操作であり、誤発音語句入力領域312に対する利用者による入力部200への入力操作は、音位転倒が発生した語句の音位転倒を含む言語音仮名表記の列を指定する操作である。正発音語句入力領域311と誤発音語句入力領域312のそれぞれに対する利用者による入力部200への入力操作の受け付けは、言語音仮名表記の列のキー入力操作を受け付けるようにすればよい。
対象発音指定部120は、次に、正発音語句言語音仮名表記列と誤発音語句言語音仮名表記列において出現位置が入れ替わっている2個の言語音仮名表記を抽出し、抽出した2個の言語音仮名表記のうちの正発音語句言語音仮名表記列において先に出現するほうを検索対象第1言語音仮名表記として設定し、後に出現するほうを検索対象第2言語音仮名表記として設定する。
対象発音指定部120は、また、正発音語句言語音仮名表記列と誤発音語句言語音仮名表記列において出現位置が入れ替わっている2個の言語音仮名表記の間にある言語音仮名表記の数に1を加えた数を検索対象近傍数として設定する。
例えば、対象者である幼児が「たかしまや」を「たかしやま」と発音する音位転倒が発生している場合には、当該幼児の養育者などの利用者が、正発音語句入力領域311に「たかしまや」を入力し、誤発音語句入力領域312に「たかしやま」を入力するようにすればよい。この場合には、対象発音指定部120は、「たかしまや」を正発音語句言語音仮名表記列とし、「たかしやま」を誤発音語句言語音仮名表記列として受け付ける(ステップS201)。次に、対象発音指定部120は、正発音語句言語音仮名表記列「たかしまや」と誤発音語句言語音仮名表記列「たかしやま」において出現位置が入れ替わっている2個の言語音仮名表記「ま」と「や」を抽出し、抽出した「ま」と「や」のうちの正発音語句言語音仮名表記列「たかしまや」において先に出現する「ま」を検索対象第1言語音仮名表記として設定し、後に出現する「や」を検索対象第2言語音仮名表記として設定する(ステップS202)。また、対象発音指定部120は、正発音語句言語音仮名表記列「たかしまや」と誤発音語句言語音仮名表記列「たかしやま」において出現位置が入れ替わっている「ま」と「や」の間にある言語音仮名表記の数である0に1を加えた数である1を検索対象近傍数として設定する(ステップS203)。
検索ボタン313に対する利用者による入力部200への押下操作は、検索の実行を指示する操作である。対象発音指定部120は、検索ボタン313に対する押下操作がされた場合には、設定された検索対象第1言語音仮名表記と検索対象第2言語音仮名表記と検索対象近傍数を検索条件として対象書籍情報生成部130に対して出力する。
書籍検索装置1は、次に、検索を実行する。具体的には、対象書籍情報生成部130が、入力された検索条件に対応する検索結果を得て、検索結果を含む検索結果画面を生成して表示部300に出力する。対象書籍情報生成部130が得る検索結果の例は、検索結果の表示(ステップS5)の説明の後に例示する。なお、各例では、対象書籍情報生成部130に入力された検索条件に含まれる近傍数をM(Mは正の整数)としている。
書籍検索装置1は、次に、検索結果を表示する。具体的には、表示部300が、入力された検索結果画面を表示する。
第1実施形態の検索結果の第1例は、音位転倒が発生した言語音仮名表記の二つ組が正しい発音の順に絵本に出現する頻度についての検索結果である。
第1実施形態の検索結果の第2例も、音位転倒が発生した言語音仮名表記の二つ組が正しい発音の順に絵本に出現する頻度を含む検索結果であるが、音位転倒が発生した言語音仮名表記の二つ組が間違った発音の順、すなわち音位転倒が発生した順、に絵本に出現する頻度も検索結果に含める点が第1例とは異なる。
第1実施形態は音位転倒が発生した語句の言語音仮名表記の列に基づいて検索結果を得るものであったが、音位転倒が発生した言語音の仮名表記に基づいて検索結果を得るようにしてもよい。この形態を第2実施形態として説明する。
以下、本実施形態の書籍検索装置1の動作について説明する。
書籍検索装置1は、動作を開始すると、まず書籍検索画面を表示する。具体的には、対象発音指定部120が書籍検索画面を表示部300に表示させる制御を行い、その制御に従って表示部300は書籍検索画面を表示する。
書籍検索装置1は、次に、検索条件を設定する。具体的には、対象発音指定部120が、表示部300に表示した書籍検索画面内の第1言語音入力領域321と第2言語音入力領域322と近傍数入力領域323に対する利用者による入力部200への入力操作を受け付け、入力部200が受け付けた入力操作に対応する検索条件を設定する。対象発音指定部120が設定する検索条件は、後述する検索対象第1言語音仮名表記と検索対象第2言語音仮名表記と検索対象近傍数である。
図4の書籍検索画面の場合は、第1言語音入力領域321に対する利用者による入力部200への入力操作は、音位転倒が発生した言語音仮名表記の二つ組の正しい発音における1番目の言語音仮名表記を指定する操作であり、第2言語音入力領域322に対する利用者による入力部200への入力操作は、音位転倒が発生した言語音仮名表記の二つ組の正しい発音における2番目の言語音仮名表記を指定する操作である。また、図5の書籍検索画面の場合は、第1言語音入力領域321に対する利用者による入力部200への入力操作は、音位転倒が発生した言語音仮名表記の二つ組の間違えた発音における2番目の言語音仮名表記を指定する操作であり、第2言語音入力領域322に対する利用者による入力部200への入力操作は、音位転倒が発生した言語音仮名表記の二つ組の間違えた発音における1番目の言語音仮名表記を指定する操作である。
近傍数入力領域323に対する利用者による入力部200への入力操作は、指定した2つの言語音の近傍数を指定する操作である。対象発音指定部120は、近傍数入力領域323に対する利用者による入力部200への入力操作で指定された数値を検索対象近傍数として設定する。近傍数入力領域323に対する利用者による入力部200への入力操作の受け付けは、利用者によるキー入力などによる正の整数値の文字入力を受け付けるようにしてもよいし、候補となる複数個の正の整数値をプルダウンリストとして表示して利用者によるマウスなどによる選択入力操作を受け付けるようにしてもよい。
例えば、対象となる幼児が「たかしまや」を「たかしやま」と発音する音位転倒が発生している場合には、当該幼児の養育者などの利用者が、第1言語音入力領域321に「ま」を入力し、第2言語音入力領域322に「や」を入力し、近傍数入力領域323に「1」を入力するようにすればよい。この場合には、対象発音指定部120は、「ま」を検索対象第1言語音仮名表記として設定し、「や」を検索対象第2言語音仮名表記として設定し、「1」を検索対象近傍数として設定する。
検索ボタン324に対する利用者による入力部200への押下操作は、検索の実行を指示する操作である。対象発音指定部120は、検索ボタン324に対する押下操作がされた場合には、設定された検索対象第1言語音仮名表記と検索対象第2言語音仮名表記と検索対象近傍数を検索条件として対象書籍情報生成部130に対して出力する。
書籍検索装置1は、次に、検索を実行する。具体的には、対象書籍情報生成部130が入力された検索条件に対応する検索結果を得て、検索結果を含む検索結果画面を生成して表示部300に出力する。対象書籍情報生成部130が得る検索結果は第1実施形態の検索結果と同じであり、対象書籍情報生成部130が得る検索結果の例は第1実施形態の第1例と第2例である。
書籍検索装置1は、次に、検索結果を表示する。具体的には、表示部300が、入力された検索結果画面を表示する。
第2実施形態では二つ組における言語音仮名表記の順序を利用者に指定させる形態を説明したが、二つ組における言語音仮名表記の順序を利用者に指定させないでもよい。この形態を第2実施形態の変形例1として、第2実施形態と異なる点について説明する。
本変形例の書籍検索画面は、音位転倒が発生した言語音仮名表記の二つ組とこれら2個の言語音仮名表記の近傍数を利用者に指定させるための画面である。本変形例の書籍検索画面は、例えば図6に示す書籍検索画面320Cのように、音位転倒が発生した言語音仮名表記の二つ組の一方の言語音仮名表記を入力するための領域である第1言語音入力領域325と、音位転倒が発生した言語音仮名表記の二つ組の他方の言語音仮名表記を入力するための領域である第2言語音入力領域326と、音位転倒が発生した言語音仮名表記の二つ組の近傍数を入力するための領域である近傍数入力領域323と、を含むものであり、検索の実行を指示するためのボタンである検索ボタン324を備えてもよい。
書籍検索装置1の対象発音指定部120が、表示部300に表示した書籍検索画面内の第1言語音入力領域325と第2言語音入力領域326と近傍数入力領域323に対する利用者による入力部200への入力操作を受け付け、入力部200が受け付けた入力操作に対応する検索条件を設定する。対象発音指定部120が設定する検索条件は、後述する検索対象第1言語音仮名表記と検索対象第2言語音仮名表記と検索対象近傍数である。
図6の書籍検索画面の場合は、第1言語音入力領域325に対する利用者による入力部200への入力操作は、音位転倒が発生した言語音仮名表記の二つ組における一方の言語音仮名表記を指定する操作であり、第2言語音入力領域326に対する利用者による入力部200への入力操作は、音位転倒が発生した言語音仮名表記の二つ組における他方の言語音仮名表記を指定する操作である。
本変形例の検索結果は、音位転倒が発生した言語音仮名表記の二つ組が出現する絵本についての検索結果である。例えば、対象書籍情報生成部130は、入力された検索対象第1言語音仮名表記と検索対象第2言語音仮名表記と検索対象近傍数Mに基づいて書籍検索用データベース記憶部110に記憶された書籍検索用データベースの検索を行い、第1言語音仮名表記が入力された検索対象第1言語音仮名表記であり第2言語音仮名表記が入力された検索対象第2言語音仮名表記である言語音仮名表記ペアがM近傍以内で出現する絵本についての、絵本を特定する情報と、検索対象第1言語音仮名表記と検索対象第2言語音仮名表記がM近傍以内で正順に出現する回数と、検索対象第1言語音仮名表記と検索対象第2言語音仮名表記がM近傍以内で逆順に出現する回数、の組を検索結果として含む検索結果画面を生成して出力する。すなわち、検索結果には、音位転倒が発生した言語音仮名表記の二つ組についての、正しい順と間違った順の両方の出現回数を含める。
音位転倒が発生する言語音の二つ組を構成する2つの言語音は、子音が異なるものの母音が同じであることが多い。そこで、第2実施形態およびその変形例1において、第1言語音入力領域と第2言語音入力領域のそれぞれに対する利用者による入力操作を受け付ける構成として、候補となる言語音の仮名表記のプルダウンリストなどによる一覧表示と利用者による選択入力操作を用いる構成を採用する場合には、第1言語音入力領域と第2言語音入力領域のうちの先に入力操作を受け付けたほうの言語音と母音が同じ言語音の仮名表記のみを含む言語音仮名表記のプルダウンリストなどの一覧を他方の入力領域に表示するようにしてもよい。この形態を第2実施形態の変形例2として、第2実施形態およびその変形例1と異なる点について説明する。第2実施形態の変形例2が第2実施形態およびその変形例1と異なるのは、ステップS2の検索条件の設定における第1言語音入力領域と第2言語音入力領域に対する入力操作の受け付けと検索対象第1言語音仮名表記と検索対象第2言語音仮名表記の設定の動作である。第2実施形態の変形例2のステップS1、ステップS2の検索条件の設定における近傍数に対する入力操作の受け付けと検索対象近傍数の設定の動作、ステップS3、ステップS4、ステップS5は、第2実施形態およびその変形例1と同様である。
第2実施形態の変形例2は、第2実施形態およびその変形例1のプルダウンリストなどによる一覧表示に制約を持たせるものであったが、五十音ボタン群を備える書籍検索画面を用いて、ボタンの表示に制約を持たせるようにしてもよい。この形態を第2実施形態の変形例3として、第2実施形態およびその変形例1と異なる点について説明する。第2実施形態の変形例3が第2実施形態およびその変形例1と異なるのは、書籍検索画面と、ステップS2の検索条件の設定における第1言語音入力領域と第2言語音入力領域に対する入力操作の受け付けと検索対象第1言語音仮名表記と検索対象第2言語音仮名表記の設定の動作である。第2実施形態の変形例2のステップS1、ステップS2の検索条件の設定における近傍数に対する入力操作の受け付けと検索対象近傍数の設定の動作、ステップS3、ステップS4、ステップS5は、第2実施形態およびその変形例1と同様である。
本変形例の書籍検索画面は、音位転倒が発生した言語音仮名表記の二つ組の正しい発音における1番目の言語音仮名表記と2番目の言語音仮名表記とこれら2個の言語音仮名表記の近傍数を利用者に指定させるための画面、または、音位転倒が発生した言語音仮名表記の二つ組の間違えた発音における1番目の言語音仮名表記と2番目の言語音仮名表記とこれら2個の言語音仮名表記の近傍数を利用者に指定させるための画面、または、音位転倒が発生した言語音仮名表記の二つ組とこれら2個の言語音仮名表記の近傍数を利用者に指定させるための画面、である。
書籍検索装置1は、次に、検索条件を設定する。具体的には、対象発音指定部120が、表示部300に表示した書籍検索画面内の五十音ボタン群331と近傍数入力領域323に対する利用者による入力部200への入力操作を受け付け、入力部200が受け付けた入力操作に対応する検索条件を設定する。対象発音指定部120が設定する検索条件は、後述する検索対象第1言語音仮名表記と検索対象第2言語音仮名表記と検索対象近傍数である。
対象発音指定部120は、まず、五十音ボタン群331に含まれる何れか1つの仮名表記ボタンに対する利用者による入力部200への選択操作を受け付けて、選択操作を受け付けた仮名表記ボタンに対応する言語音仮名表記を1番目の検索対象の言語音仮名表記として設定するとともに、その言語音仮名表記を1番目の言語音仮名表記の入力領域に表示し、その言語音仮名表記を1番目の言語音仮名表記を設定したことを視認可能なように仮名表記ボタン上に表示し(ステップS221)、1番目の言語音仮名表記と母音が同じ言語音が2番目の言語音仮名表記の候補であることを視認可能なように仮名表記ボタン上に表示し、1番目の言語音仮名表記と母音が同じ言語音を2番目の言語音仮名表記の候補として設定する(ステップS222)。例えば、図7の書籍検索画面の例において仮名表記ボタン「ま」に対する利用者による入力部200への選択操作を受け付けた場合には、対象発音指定部120は、「ま」を検索対象第1言語音仮名表記として設定するとともに、図10に示すように、「ま」を第1言語音入力領域321に表示し、仮名表記ボタン「ま」の文字表記の背景を白色から濃色に変更し、「ま」と母音が同じあ段の各仮名表記ボタン(「あ」、「か」、・・・、「は」、「や」、・・・)の文字表記の背景を白色から淡色に変更し、「ま」と母音が同じあ段の各仮名表記ボタンを選択操作が可能な状態とする。
第1実施形態と第2実施形態及びその変形例は音位転倒が発生した語句の言語音仮名表記の列または音位転倒が発生した言語音の仮名表記に基づいて検索結果を得るものであったが、検索の中間検索結果を利用者に提示して、中間検索結果に対する利用者による選択操作を受け付けるようにして、受け付けた選択操作に基づく検索結果を得るようにしてもよい。この形態を第3実施形態として説明する。
書籍検索用データベース記憶部110には、書籍検索用データベースが記憶されている。本実施形態の書籍検索用データベースには、第1実施形態で説明した書籍検索用データベースと同様に、複数の絵本それぞれについて、絵本を特定する情報と、所定の言語音仮名表記ペアそれぞれについての、言語音仮名表記ペアが各n近傍(nは1以上N以下の各整数。Nは予め定めた1以上の整数。)で正順に出現する頻度の情報と、当該所定の言語音仮名表記ペアそれぞれについての言語音仮名表記ペアが各n近傍で逆順に出現する頻度の情報と、が対応付けて格納されている。
以下、本実施形態の書籍検索装置1の動作について説明する。
書籍検索装置1は、ステップS3の次に、中間検索を実行する。具体的には、中間書籍情報生成部140が、入力された検索条件に対応する中間検索結果を得て、中間検索結果と単語選択ボタンを含む単語選択画面を生成して表示部300に出力する。
書籍検索装置1は、次に、単語選択画面を表示する。具体的には、表示部300が、入力された単語選択画面350を表示する。
書籍検索装置1は、次に、検索単語を設定し、最終検索の実行を指示する。具体的には、対象単語指定部150が、表示部300に表示した単語選択画面350内の何れか1つの単語選択ボタンに対する利用者による入力部200への押下操作を受け付け、入力部200が受け付けた入力操作に対応する単語を対象単語として設定して、設定された対象単語を検索条件として対象書籍情報生成部130に対して出力する。
書籍検索装置1は、次に、最終検索を実行する。具体的には、対象書籍情報生成部130が、対象単語指定部150から入力された検索条件である対象単語に対応する検索結果を得て、検索結果を含む検索結果画面を生成して表示部300に出力する。
書籍検索装置1は、次に、最終検索結果を表示する。具体的には、表示部300が、入力された検索結果画面を表示する。
第4実施形態として、書籍検索用データベース生成装置の実施形態を説明する。第4実施形態の書籍検索用データベース生成装置は、図15に例示する書籍検索用データベース生成装置700のように、解析部710と複数音近傍情報生成部720を有する。第4実施形態の書籍検索用データベース生成装置700は、入力された書籍テキストデータベースに基づいて書籍検索用データベースを生成して出力する。書籍検索用データベース生成装置700が生成して出力した書籍検索用データベースは、上述した各実施形態及び変形例の書籍検索装置1の書籍検索用データベース記憶部110に記憶されて書籍検索に用いられる。
書籍検索用データベース生成装置700に入力される書籍テキストデータベースには、複数の絵本それぞれについて、絵本を特定する情報と絵本の全文のテキストとが対応付けて格納されている。
解析部710には、書籍検索用データベース生成装置700に入力された書籍テキストデータベースが入力される。解析部710は、入力された書籍テキストデータベースに含まれる各絵本について、全文のテキストを形態素解析して全文のテキストに対応する形態素の列を得て、得た形態素の列を絵本を特定する情報と対応付けて出力する。
「おじいさんは山に芝刈りに、おばあさんは川に洗濯に・・・」
というテキストが入力された場合には、解析部710は、形態素の列として
「おじいさん/は/やま/に/しばかり/に/、/おばあさん/は/かわ/に/せんたく/に/・・・」
を得ればよい。なお、実際の絵本の場合には入力されたテキストには漢字は含まれないが、例示する文では読み易さを考慮して漢字を含む表記としてある。
複数音近傍情報生成部720には、各絵本についての絵本を特定する情報とそれに対応付けられた形態素の列とが解析部710から入力される。複数音近傍情報生成部720は、入力された情報を用いて、上述した第1実施形態、第2実施形態、第2実施形態の各変形例、第3実施形態の少なくとも何れかの書籍検索用データベースに格納しておく情報を生成して出力する。
「おじいさん/は/やま/に/しばかり/に/、/おばあさん/は/かわ/に/せんたく/に」
が入力された場合には、言語音仮名表記ペア「やま」が1近傍で正順に出現する回数は1、言語音仮名表記ペア「やま」が1近傍で正順に出現する単語「山」の出現回数は1、言語音仮名表記ペア「やま」が1近傍で逆順に出現する回数は0、言語音仮名表記ペア「やま」が1近傍で逆順に出現する単語の出現回数は0、とする。
「かぐや/また/あそび/に/おいで」
が入力された場合には、「やま」は1近傍で正順に1回出現しているものの、読みの区切りを跨いで出現しているので、言語音仮名表記ペア「やま」が1近傍で正順に出現する回数は0とするとよい。
なお、本発明は上述の実施形態に限定されるものではない。例えば、上述の実施形態は言語が日本語であり、幼児向けの絵本を検索する場合について説明したが、文字を用いた表記と発音内容が対応する言語であれば他の言語でも適用可能であり、児童書などの書籍を検索する場合にも適用可能である。また例えば、処理部100の機能やデータが複数の装置に分散配置され、これらの装置がインターネット等を通じて互いに情報の受け渡しを行って上述の各処理が実行されてもよい。
100 処理部
110 書籍検索用データベース記憶部
120 対象発音指定部
130 対象書籍情報生成部
140 中間書籍情報生成部
150 対象単語指定部
200 入力部
300 表示部
700 書籍検索用データベース生成装置
710 解析部
720 複数音近傍情報生成部
Claims (12)
- 書籍を特定する情報と、上記書籍中で言語音仮名表記ペアが正順に出現する近傍数毎の頻度の情報と、を少なくとも関連付けた書籍検索用データベースを記憶した書籍検索用データベース記憶部と、
音位転倒が発生した語句の正しい発音を表す言語音仮名表記の列を入力するための正発音語句入力領域と、上記語句の誤った発音を表す言語音仮名表記の列を入力するための誤発音語句入力領域と、を含む書籍検索画面を表示する表示部と、
上記正発音語句入力領域に入力された言語音仮名表記の列である正発音語句言語音仮名表記列と上記誤発音語句入力領域に入力された言語音仮名表記の列である誤発音語句言語音仮名表記列とにおいて出現位置が入れ替わっている2個の言語音仮名表記と、出現位置が入れ替わっている2個の上記言語音仮名表記の上記正発音語句言語音仮名表記列と上記誤発音語句言語音仮名表記列における近傍数と、を検索条件として決定する対象発音指定部と、
上記書籍検索用データベースから、上記検索条件に含まれる2個の上記言語音仮名表記のうちの上記正発音語句言語音仮名表記列において先に出現する言語音仮名表記と、上記検索条件に含まれる2個の上記言語音仮名表記のうちの上記正発音語句言語音仮名表記列において後に出現する言語音仮名表記と、が、上記検索条件に含まれる近傍数以内で正順に出現する書籍に関する情報を含む検索結果を生成する対象書籍情報生成部と、
を含む書籍検索装置。 - 書籍を特定する情報と、上記書籍中で言語音仮名表記ペアが正順に出現する近傍数毎の頻度の情報と、を少なくとも関連付けた書籍検索用データベースを記憶した書籍検索用データベース記憶部と、
音位転倒が発生した語句に含まれる音位転倒が発生した2個の言語音仮名表記それぞれを入力するための2個の言語音入力領域と、当該2個の言語音仮名表記の近傍数を入力するための近傍数入力領域と、を含む書籍検索画面を表示する表示部と、
上記書籍検索用データベースから、上記言語音入力領域に入力された2個の上記言語音仮名表記が上記近傍数入力領域に入力された近傍数以内で出現する書籍に関する情報を含む検索結果を生成する対象書籍情報生成部と、
を含む書籍検索装置。 - 請求項2に記載の書籍検索装置であって、
上記書籍検索画面は、上記言語音入力領域に1個目の言語音仮名表記が入力されたとき、1個目の言語音仮名表記と母音が同じ言語音を2個目の言語音仮名表記の候補として表示する、または、2個目の言語音仮名表記の候補として推奨する表示を行う、
書籍検索装置。 - 請求項1から3のいずれかに記載の書籍検索装置であって、
上記書籍検索用データベース記憶部には、書籍を特定する情報と、上記書籍中で言語音仮名表記ペアが正順に出現する近傍数毎の頻度の情報と、上記書籍中で言語音仮名表記ペアが逆順に出現する近傍数毎の頻度の情報と、を関連付けた書籍検索用データベースが記憶されており、
上記検索結果は、上記言語音仮名表記ペアが正順に出現する頻度の情報と上記言語音仮名表記ペアが逆順に出現する頻度の情報との両方を含む、
書籍検索装置。 - 書籍を特定する情報と、上記書籍中で言語音仮名表記ペアが正順に出現する近傍数毎の頻度の情報と、を少なくとも関連付けた書籍検索用データベースを記憶する書籍検索用データベース記憶部と、
音位転倒が発生した語句の正しい発音を表す言語音仮名表記の列と当該語句の誤った発音を表す言語音仮名表記の列、または、音位転倒が発生した語句における音位転倒が発生した2個の言語音仮名表記と当該2個の言語音仮名表記の近傍数、を入力するための入力領域を含む書籍検索画面を表示する表示部と、
上記書籍検索用データベースから、上記語句に含まれる音位転倒が発生した2個の言語音仮名表記が正しい発音の順に出現する各単語について、上記単語の表記と上記単語を含む書籍の数とを関連付けた中間検索結果を生成して、上記単語を選択できるようにして単語選択画面に表示する中間書籍情報生成部と、
上記書籍検索用データベースから上記単語選択画面で選択された単語を含む書籍に関する情報を含む最終検索結果を生成する対象書籍情報生成部と、
を含む書籍検索装置。 - 書籍を特定する情報と、上記書籍の全文のテキストとが対応付けられた書籍テキストデータベースを入力とし、上記テキストを形態素解析した形態素の列を生成する解析部と、
上記テキストの形態素の列から得た、言語音仮名表記ペアが正順に出現する近傍数毎の頻度の情報と、上記言語音仮名表記ペアが逆順に出現する近傍数毎の頻度の情報とを、上記書籍を特定する情報と関連付けて書籍検索用データベースを生成する複数音近傍情報生成部と、
を含む書籍検索用データベース生成装置。 - 書籍検索用データベース記憶部に、書籍を特定する情報と、上記書籍中で言語音仮名表記ペアが正順に出現する近傍数毎の頻度の情報と、を少なくとも関連付けた書籍検索用データベースが記憶されており、
表示部が、音位転倒が発生した語句の正しい発音を表す言語音仮名表記の列を入力するための正発音語句入力領域と、上記語句の誤った発音を表す言語音仮名表記の列を入力するための誤発音語句入力領域と、を含む書籍検索画面を表示する表示ステップと、
対象発音指定部が、上記正発音語句入力領域に入力された言語音仮名表記の列である正発音語句言語音仮名表記列と上記誤発音語句入力領域に入力された言語音仮名表記の列である誤発音語句言語音仮名表記列とにおいて出現位置が入れ替わっている2個の言語音仮名表記と、出現位置が入れ替わっている2個の上記言語音仮名表記の上記正発音語句言語音仮名表記列と上記誤発音語句言語音仮名表記列における近傍数と、を検索条件として決定する対象発音指定ステップと、
対象書籍情報生成部が、上記書籍検索用データベースから、上記検索条件に含まれる2個の上記言語音仮名表記のうちの上記正発音語句言語音仮名表記列において先に出現する言語音仮名表記と、上記検索条件に含まれる2個の上記言語音仮名表記のうちの上記正発音語句言語音仮名表記列において後に出現する言語音仮名表記と、が、上記検索条件に含まれる近傍数以内で正順に出現する書籍に関する情報を含む検索結果を生成する対象書籍情報生成ステップと、
を含む書籍検索方法。 - 書籍検索用データベース記憶部に、書籍を特定する情報と、上記書籍中で言語音仮名表記ペアが正順に出現する近傍数毎の頻度の情報と、を少なくとも関連付けた書籍検索用データベースが記憶されており、
表示部が、音位転倒が発生した語句に含まれる音位転倒が発生した2個の言語音仮名表記それぞれを入力するための2個の言語音入力領域と、当該2個の言語音仮名表記の近傍数を入力するための近傍数入力領域と、を含む書籍検索画面を表示する表示ステップと、
対象書籍情報生成部が、上記書籍検索用データベースから、上記言語音入力領域に入力された2個の上記言語音仮名表記が上記近傍数入力領域に入力された近傍数以内で出現する書籍に関する情報を含む検索結果を生成する対象書籍情報生成ステップと、
を含む書籍検索方法。 - 書籍検索用データベース記憶部に、書籍を特定する情報と、上記書籍中で言語音仮名表記ペアが正順に出現する近傍数毎の頻度の情報と、を少なくとも関連付けた書籍検索用データベースが記憶されており、
表示部が、音位転倒が発生した語句の正しい発音を表す言語音仮名表記の列と当該語句の誤った発音を表す言語音仮名表記の列、または、音位転倒が発生した語句における音位転倒が発生した2個の言語音仮名表記と当該2個の言語音仮名表記の近傍数、を入力するための入力領域を含む書籍検索画面を表示する表示ステップと、
中間書籍情報生成部が、上記書籍検索用データベースから、上記語句に含まれる音位転倒が発生した2個の言語音仮名表記が正しい発音の順に出現する各単語について、上記単語の表記と上記単語を含む書籍の数とを関連付けた中間検索結果を生成して、上記単語を選択できるようにして単語選択画面に表示する中間書籍情報生成ステップと、
対象書籍情報生成部が、上記書籍検索用データベースから上記単語選択画面で選択された単語を含む書籍に関する情報を含む最終検索結果を生成する対象書籍情報生成ステップと、
を含む書籍検索方法。 - 解析部が、書籍を特定する情報と、上記書籍の全文のテキストとが対応付けられた書籍テキストデータベースを入力とし、上記テキストを形態素解析した形態素の列を生成する解析ステップと、
複数音近傍情報生成部が、上記テキストの形態素の列から得た、言語音仮名表記ペアが正順に出現する近傍数毎の頻度の情報と、上記言語音仮名表記ペアが逆順に出現する近傍数毎の頻度の情報とを、上記書籍を特定する情報と関連付けて書籍検索用データベースを生成する複数音近傍情報生成ステップと、
を含む書籍検索用データベース生成方法。 - 請求項1から5のいずれかに記載の書籍検索装置としてコンピュータを機能させるためのプログラム。
- 請求項6に記載の書籍検索用データベース生成装置としてコンピュータを機能させるためのプログラム。
Priority Applications (6)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019074577A JP7147670B2 (ja) | 2019-04-10 | 2019-04-10 | 書籍検索装置、書籍検索用データベース生成装置、書籍検索方法、書籍検索用データベース生成方法、およびプログラム |
| PCT/JP2020/013903 WO2020209096A1 (ja) | 2019-04-10 | 2020-03-27 | 書籍検索装置、書籍検索用データベース生成装置、書籍検索方法、書籍検索用データベース生成方法、およびプログラム |
| US17/601,876 US11947580B2 (en) | 2019-04-10 | 2020-03-27 | Book search apparatus, book search database generation apparatus, book search method, book search database generation method, and program |
| US18/584,916 US12314297B2 (en) | 2019-04-10 | 2024-02-22 | Book search apparatus, book search database generation apparatus, book search method, book search database generation method, and program |
| US18/584,934 US12314298B2 (en) | 2019-04-10 | 2024-02-22 | Book search apparatus, book search database generation apparatus, book search method, book search database generation method, and program |
| US18/584,949 US12314299B2 (en) | 2019-04-10 | 2024-02-22 | Book search apparatus, book search database generation apparatus, book search method, book search database generation method, and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019074577A JP7147670B2 (ja) | 2019-04-10 | 2019-04-10 | 書籍検索装置、書籍検索用データベース生成装置、書籍検索方法、書籍検索用データベース生成方法、およびプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2020173580A JP2020173580A (ja) | 2020-10-22 |
| JP7147670B2 true JP7147670B2 (ja) | 2022-10-05 |
Family
ID=72750822
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019074577A Active JP7147670B2 (ja) | 2019-04-10 | 2019-04-10 | 書籍検索装置、書籍検索用データベース生成装置、書籍検索方法、書籍検索用データベース生成方法、およびプログラム |
Country Status (3)
| Country | Link |
|---|---|
| US (4) | US11947580B2 (ja) |
| JP (1) | JP7147670B2 (ja) |
| WO (1) | WO2020209096A1 (ja) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7147670B2 (ja) | 2019-04-10 | 2022-10-05 | 日本電信電話株式会社 | 書籍検索装置、書籍検索用データベース生成装置、書籍検索方法、書籍検索用データベース生成方法、およびプログラム |
| US11676572B2 (en) * | 2021-03-03 | 2023-06-13 | Google Llc | Instantaneous learning in text-to-speech during dialog |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010250439A (ja) | 2009-04-13 | 2010-11-04 | Kanagawa Univ | 検索システム、データ生成方法、プログラムおよびプログラムを記録した記録媒体 |
Family Cites Families (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH01214964A (ja) * | 1988-02-23 | 1989-08-29 | Sharp Corp | コレクト機能付欧文作成装置 |
| JPH1027183A (ja) * | 1997-04-11 | 1998-01-27 | Hitachi Ltd | データ登録方法および装置 |
| KR100571835B1 (ko) * | 2004-03-04 | 2006-04-17 | 삼성전자주식회사 | 음성 코퍼스 구축을 위한 녹음 문장 생성 방법 및 장치 |
| JP2008134475A (ja) * | 2006-11-28 | 2008-06-12 | Internatl Business Mach Corp <Ibm> | 入力された音声のアクセントを認識する技術 |
| JP6387026B2 (ja) * | 2016-01-18 | 2018-09-05 | 日本電信電話株式会社 | 書籍探索装置、方法及びプログラム |
| JP7147670B2 (ja) * | 2019-04-10 | 2022-10-05 | 日本電信電話株式会社 | 書籍検索装置、書籍検索用データベース生成装置、書籍検索方法、書籍検索用データベース生成方法、およびプログラム |
-
2019
- 2019-04-10 JP JP2019074577A patent/JP7147670B2/ja active Active
-
2020
- 2020-03-27 WO PCT/JP2020/013903 patent/WO2020209096A1/ja not_active Ceased
- 2020-03-27 US US17/601,876 patent/US11947580B2/en active Active
-
2024
- 2024-02-22 US US18/584,916 patent/US12314297B2/en active Active
- 2024-02-22 US US18/584,934 patent/US12314298B2/en active Active
- 2024-02-22 US US18/584,949 patent/US12314299B2/en active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010250439A (ja) | 2009-04-13 | 2010-11-04 | Kanagawa Univ | 検索システム、データ生成方法、プログラムおよびプログラムを記録した記録媒体 |
Non-Patent Citations (1)
| Title |
|---|
| 平間 俊哉、二見 亮弘、星宮 望,幼児における音位転換の計算論理的解釈と記憶の効果に関する検討,電子情報通信学会技術研究報告 Vol.102 No.627,日本,社団法人電子情報通信学会,2003年01月27日,p.7~12 |
Also Published As
| Publication number | Publication date |
|---|---|
| US20240193194A1 (en) | 2024-06-13 |
| US11947580B2 (en) | 2024-04-02 |
| US20220197934A1 (en) | 2022-06-23 |
| WO2020209096A1 (ja) | 2020-10-15 |
| US20240193195A1 (en) | 2024-06-13 |
| US20240193193A1 (en) | 2024-06-13 |
| JP2020173580A (ja) | 2020-10-22 |
| US12314299B2 (en) | 2025-05-27 |
| US12314298B2 (en) | 2025-05-27 |
| US12314297B2 (en) | 2025-05-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Paradis et al. | Children's second language acquisition of English complex syntax: The role of age, input, and cognitive factors | |
| McBride et al. | Reading and writing words: A cross-linguistic perspective | |
| Anthony et al. | Development of phonological awareness | |
| Dickinson et al. | Language and computers | |
| Cuetos et al. | Word naming in Spanish | |
| US9548052B2 (en) | Ebook interaction using speech recognition | |
| Bosse et al. | French pupils’ lexical and grammatical spelling from sixth to ninth grade: A longitudinal study | |
| Bugert et al. | Generalizing cross-document event coreference resolution across multiple corpora | |
| US12314298B2 (en) | Book search apparatus, book search database generation apparatus, book search method, book search database generation method, and program | |
| Aljasser et al. | A Web-based interface to calculate phonotactic probability for words and nonwords in Modern Standard Arabic | |
| Llauradó et al. | Growth of text-embedded lexicon in Catalan: From childhood to adolescence | |
| White et al. | Segmentation by lexical subtraction in Hungarian speakers of second-language English | |
| Margetson et al. | Transcribing multilingual children’s and adults’ speech | |
| Smolík | Imageability and neighborhood density facilitate the age of word acquisition in Czech | |
| Kandel et al. | French and Spanish-speaking children use different visual and motor units during spelling acquisition | |
| Russak | How can a fine-grained analysis of spelling errors inform our understanding of the development of spelling in EFL? | |
| Karan | Writing system development and reform: A process | |
| Yang et al. | Assessing speech production in Mandarin–English bilingual children: Comparison of Mandarin and English sound systems and special considerations | |
| Venkatagiri | Techniques for enhancing communication productivity in AAC: A review of research | |
| JP7110742B2 (ja) | 書籍検索インタフェース装置、書籍検索方法、およびプログラム | |
| Lee et al. | Word count analysis of Malay language textbooks for the purpose of developing a Malay reading remedial programme | |
| Tenny | A linguist looks at AAC: Language representation systems for augmentative and alternative communication, compared with writing systems and natural language | |
| Ziegler | The automatic identification of languages using linguistic recognition signals | |
| JP2005250525A (ja) | 漢文解析支援装置及び異言語文処理装置及び翻訳プログラム | |
| Aljasser et al. | A web-based interface to calculate phonological neighborhood density for words and nonwords in Modern Standard Arabic |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210713 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220823 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220905 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7147670 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |