JP7820945B2 - 情報処理装置、検索方法、およびプログラム - Google Patents

情報処理装置、検索方法、およびプログラム

Info

Publication number
JP7820945B2
JP7820945B2 JP2021178518A JP2021178518A JP7820945B2 JP 7820945 B2 JP7820945 B2 JP 7820945B2 JP 2021178518 A JP2021178518 A JP 2021178518A JP 2021178518 A JP2021178518 A JP 2021178518A JP 7820945 B2 JP7820945 B2 JP 7820945B2
Authority
JP
Japan
Prior art keywords
phrase
lyrics
query
searched
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021178518A
Other languages
English (en)
Other versions
JP2023067363A (ja
Inventor
浩之 菅家
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AlphaTheta Corp
Original Assignee
AlphaTheta Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AlphaTheta Corp filed Critical AlphaTheta Corp
Priority to JP2021178518A priority Critical patent/JP7820945B2/ja
Publication of JP2023067363A publication Critical patent/JP2023067363A/ja
Application granted granted Critical
Publication of JP7820945B2 publication Critical patent/JP7820945B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報処理装置、検索方法、およびプログラムに関する。
近年、インターネットを利用した楽曲配信が一般的になり、様々な関連技術が考えられている。例えば、特許文献1には、歌詞に含まれるワードを用いて所望の楽曲を検索することのできる楽曲検索装置が開示されている。
特開2002-123270号公報
楽曲の検索に関しては、単純に所望の楽曲を検索するだけでなく、リコメンドの用途での検索、様々な目的に応じた検索等、多岐にわたる要望がある。
そこで、本発明は、検索の目的に応じて、所望の楽曲を検索することが可能な情報処理装置、検索方法、およびプログラムを提供することを目的とする。
[1]検索対象のフレーズと、楽曲の歌詞に関連するクエリとを入力する入力部と、楽曲と、楽曲の歌詞と、歌詞に関する時間情報 とが関連付けて記憶されたデータベースを参照し、データベースから、クエリに応じて検索対象のフレーズを歌詞に含む楽曲を検索する検索部とを備える情報処理装置。
[2]クエリは、フレーズの発音時間の長さを示す情報と、楽曲のBPMとの少なくとも一方を含む、[1]に記載の情報処理装置。
[3]時間情報は、歌詞の要素ごとの時間情報 、フレーズに関する拍位置または小節位置を示す情報 、フレーズに関するブレス位置を示す情報のうち、少なくとも1つを含む、[1]または[2]に記載の情報処理装置。
[4]クエリは、楽曲のジャンルに関する情報を含み、検索部は、ジャンルに応じて楽曲を検索する、[1]から[3]のいずれかに記載の情報処理装置。
[5]検索対象のフレーズは、複数の品詞を含み、検索部は、品詞ごと、または、複数の品詞の少なくとも一部の歌詞を含む楽曲を検索する、[1]から[4]のいずれかに記載の情報処理装置。
[6]検索部により検索した楽曲を出力する出力部をさらに備える、[1]から[5]のいずれかに記載の情報処理装置。
[7]クエリに応じて、検索部により検索した楽曲を加工する加工部をさらに備える、[1]から[5]のいずれに記載の情報処理装置。
[8]加工部は、クエリに応じて、検索部により検索した楽曲のうち、検索対象のフレーズを含む部分を切り出す、[7]に記載の情報処理装置。
[9]加工部は、クエリに応じて、検索部により検索した楽曲のBPMを変更する、[7]または[8]に記載の情報処理装置。
[10]加工部により加工した楽曲を出力する出力部をさらに備える、[7]から[9]のいずれかに記載の情報処理装置。
[11]データベースから楽曲を検索する検索方法であって、データベースは、楽曲と、楽曲の歌詞と、歌詞に関する時間情報とが関連付けて記憶され、検索対象のフレーズと、楽曲の歌詞に関連するクエリとを入力するステップと、データベースから、クエリに応じて検索対象のフレーズを歌詞に含む楽曲を検索するステップとを含む検索方法。
[12]検索対象のフレーズと、楽曲の歌詞に関連するクエリとを入力する入力部と、楽曲と、楽曲の歌詞と、歌詞に関する時間情報とが関連付けて記憶されたデータベースを参照し、データベースから、クエリに応じて検索対象のフレーズを歌詞に含む楽曲を検索する検索部としてコンピュータを機能させるためのプログラム。
本発明の一実施形態に係る情報処理装置の概略的な機能構成を示すブロック図である。 楽曲の歌詞に関する時間情報を説明するための図である。 本発明の一実施形態に係る検索方法を示すフローチャートである。 本発明の一実施形態に係る検索方法を示すフローチャート(続き)である。 クエリに含まれる区切り位置の解析について説明するための図である。 検索対象のフレーズが複数の品詞を含む場合の検索について説明するための図である。
以下に添付図面を参照しながら、本発明の好適な実施形態について詳細に説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
図1は、本発明の一実施形態に係る情報処理装置の概略的な機能構成を示すブロック図である。本発明の一実施形態に係る情報処理装置は、コンピュータにより構成される情報処理装置である。
図1に示されるように、情報処理装置100は、ディスプレイ110と、操作部120と、制御部130と、データベース140とを含む。上記の各部の機能は、例えばコンピュータのハードウェア構成を備える情報処理装置100において、プロセッサがプログラムに従って動作することによって実現される。本発明の一実施形態に係る情報処理装置100は、ユーザー操作に基づいて、ユーザーの所望のフレーズを含む楽曲を検索する。
以下、各部の機能についてさらに説明する。
ディスプレイ110は、情報処理装置100における各種の情報を含む画面を表示する表示装置である。ディスプレイ110としては、液晶表示装置、有機EL表示装置等、各種方式の表示装置を採用できる。
操作部120は、キーボードやマウス等の入力装置を備える。
制御部130は、例えば通信インターフェース、CPU(Central Processing Unit)等のプロセッサ、及び、作業領域となるメモリーによって情報処理装置100に実装され、情報処理装置100の動作を制御する。制御部130は、プロセッサがメモリーに格納された、又は通信インターフェースを介して受信されたプログラムに従って動作することによって実現される入力部131と、検索部132と、加工部133と、出力部134とを含む。
入力部131は、操作部120を介したユーザー操作に基づいて、検索対象のフレーズと、楽曲の歌詞に関連するクエリとを入力する。
検索対象のフレーズは、ユーザーが所望する歌詞を示すフレーズである。また、楽曲の歌詞に関連するクエリは、上述した検索対象のフレーズに関する付帯的な検索条件であり、フレーズの発音時間の長さ(以下、「フレーズ長」と称する)を示す情報、楽曲のBPM、および検索した楽曲の加工の要否のいずれかを含む。なお、クエリには、フレーズの発音時間の長さを示す情報、および、楽曲のBPM以外の情報が含まれてもよい。例えば、楽曲のジャンルに関する情報、アーティスト名、制作された年代の情報、トピック等が含まれてもよい。トピックとは、例えば「スポーツ」、「恋愛」、「旅行」、「本」、「ゲーム」、「映画」など、楽曲に関し、予めカテゴリ化されたメタ情報を示す。また、トピックは楽曲のジャンルと紐づけられていてもよい。
入力部131は、操作部120を介したユーザー操作に基づいて、以下の情報を入力する。
(1)検索対象のフレーズ
所望の歌詞の一部をテキストで指定されることにより、「どのようなフレーズを含む」楽曲を検索するかが入力される。
(2)フレーズ長
(1)で入力されたフレーズの発音時間が指定されることにより、「どのような長さで発音されるフレーズを含む」楽曲を検索するかが入力される。
ここで、発音時間とは、検索対象のフレーズが発音される所要時間を示す。例えば、検索対象のフレーズが、「グッドモーニング」であった場合、「グッドモーニング」が歌詞に含まれる楽曲ごとにその発音時間は異なる。「グッドモーニング」が発音される所要時間は、楽曲のBPM、ジャンル、曲への歌詞の載せ方等様々な要因により異なる。
そこで、ユーザーが、例えば、「1秒程度で発音される」等、フレーズ長を指定することにより、目的に応じた検索条件が入力される。例えば、テンポよく「グッドモーニング」と発音している楽曲を所望するのか、ゆっくりと明確に聴きとれるように「グッドモーニング」と発音している楽曲を所望するのか等に応じて、フレーズ長が入力される。
なお、フレーズ長は、秒数により指定されてもよいし、拍数または小節数により指定されてもよいし、その他の単位で指定されてもよい。また、フレーズ長は、上限および下限の少なくとも一方が指定されてもよいし、「1秒前後」等、所定の幅を持たせて指定されてもよい。さらに、フレーズ長は、予め定められる複数の選択肢から何れかを選択する形で指定されてもよい。
さらに、フレーズ長に関連して、フレーズの区切り位置が指定されてもよい。一般に、楽曲は拍位置または小節位置で区切られる場合が多く、その位置を区切り位置とすることにより、検索対象のフレーズが、ユーザーにとって心地よく発音されている可能性の高い楽曲を検索することが可能である。また、歌手による呼吸位置であるブレス位置は楽曲の区切りである場合が多く、その位置を区切り位置とすることにより、同様の効果が期待できる。このようなフレーズの区切り位置は、拍位置または小節位置を区切り位置とするか否か、また、ブレス位置を区切り位置とするか否かの形で指定されるとよい。
(3)楽曲のBPM
入力される楽曲のBPMは、原曲のBPMであってもよいし、後述する加工部133により加工(調整)され、出力部134から出力される楽曲のBPMであってもよい。ユーザーが、例えば、「原曲のBPMが100BPMである」と指定することにより、ユーザーが所望する楽曲の原曲のBPMが入力される。また、ユーザーが、例えば、「原曲のBPMは問わず、加工後の楽曲のBPMが100BPMである」と指定することにより、ユーザーが所望する「出力される楽曲のBPM」が入力される。なお、加工部133による加工をふまえたBPMの指定においては、BPMが大きく変わるのを防ぐために、例えば、「原曲のBPMは90から110で、加工後の楽曲のBPMが100BPMである」等、原曲とのBPMの差も指定可能とすると良い。
例えば、DJ演奏などにおいて、次曲とのつながりを鑑みた楽曲を所望するのか否か等に応じて、楽曲のBPMが入力される。
(4)楽曲の加工の要否
検索の目的等に応じて、後述する加工部133による加工の要否が入力される。加工の詳細については、後述する。
(5)その他
クエリには、上述したように、楽曲のジャンルに関する情報、アーティスト名、制作された年代の情報、トピック等が含まれてもよい。このような情報は、後述する検索部132による楽曲の検索時に検索条件として利用される。
これらの情報は、予め定められる複数の選択肢から何れかを選択する形で指定されてもよいし、ユーザーのSNS(Social Networking Service)における行動履歴や検索履歴など、ユーザーの個人情報(ID情報)に基づいて、好適な情報を利用、あるいはリコメンドする形で指定されてもよい。
なお、(1)から(4)で説明した各要件のすべてか入力されてもよいし、一部のみが入力されてもよい。
検索部132は、データベース140から、入力部131に入力されたクエリに応じて検索対象のフレーズを歌詞に含む楽曲を検索する。検索部132の詳細については、後述する。
加工部133は、入力部131で入力されたクエリに応じて、検索部132により検索した楽曲を加工する。ここで、楽曲の加工とは、例えば、検索した楽曲のうち、検索対象のフレーズを含む部分を切り出す処理、および、検索した楽曲のBPMを変更する処理を含む。入力部131においては、切り出し処理およびBPM調整処理の要否がクエリとして入力される。なお、切り出し処理については、常に行う設定としても良い。また、加工部133による処理の詳細については、後述する。
出力部134は、検索部132により検索した楽曲、あるいは、加工部133により加工した楽曲を出力する。
データベース140は、HDD(Hard Disk Drive)またはフラッシュメモリー等により、楽曲の音声データを格納可能に構成されている。データベース140には、複数の楽曲の音声データがMP3形式等の所定の形式で格納されている。音声データは、音声情報に加えて、例えば、楽曲の歌詞、歌詞に関する時間情報、楽曲のBPM、アートワーク、タイトル、アーティスト名、アルバム名、キー、DJプレイ回数及びジャンル、トピック等の情報をタグ情報として含む。
図2は、楽曲の歌詞に関する時間情報を説明するための図である。図2に示すように、楽曲の歌詞に関する時間情報は、歌詞の要素ごとの時間情報を示す歌詞時間データ141、フレーズに関する拍位置または小節位置を示す情報である拍小節位置データ142、フレーズに関するブレス位置を示す情報であるブレス位置データ143からなる。
歌詞時間データ141には、例えば、「abcdefg」という歌詞の部分については、「a」、「b」、「c」、「d」、「e」、「f」、「g」の各テキストの発音時間に対応する再生時間が記憶される。そのため、各テキストの再生時間に着目することにより、例えば、あるフレーズが発音される所要時間を把握することが可能である。
また、歌詞時間データ141には、例えば、「hij」、「klm」、「nоp」という複数のフレーズからなる歌詞の部分については、「hij」、「klm」、「nоp」の各フレーズを代表する発音時間(フレーズの先頭、中央、後尾等の発音時間)に対応する再生時間が記憶されてもよい。この場合、各フレーズが発音される所要時間をより直接的に把握することが可能である。
また、拍小節位置データ142には、楽曲内の各拍位置および小節位置に対応する再生時間が記憶される。そのため、各拍位置または各小節位置の再生時間を把握することが可能である。
また、ブレス位置データ143には、楽曲内の各ブレス位置に対応する再生時間が記憶される。そのため、各ブレス位置の再生時間を把握することが可能である。
そして、歌詞時間データ141、拍小節位置データ142、ブレス位置データ143における時間(s)は互いに対応付けられている。そのため、相互のデータの再生時間を比較することにより、フレーズの発音時間と拍位置または小節位置との関係、あるいは、フレーズの発音時間とブレス位置との関係等を把握することが可能である。
なお、情報処理装置100は、通信インターフェースを備え、外部記憶装置およびコンピュータ等に記憶された音声データを、図示しない通信インターフェースを介して取得し、データベース140に格納する構成としてもよい。この場合、情報処理装置100にはデータベース140が含まれず、外部記憶装置がデータベース140として機能する。
次に、以上説明した情報処理装置100において、ユーザー操作に基づいて、ユーザーの所望のフレーズを含む楽曲を検索する際の各部の動作について説明する。
図3および図4は、楽曲検索時の各部の動作を示すフローチャートである。
図3および図4に示された例では、まず、操作部120を介したユーザー操作に基づいて、検索対象のフレーズ、および楽曲の歌詞に関連するクエリが入力されると(ステップS101YES)、検索部132が、検索条件を決定する(ステップS102)。
検索部132は、入力された検索対象のフレーズ、および楽曲の歌詞に関連するクエリに基づいて、データベース140から楽曲を検索する際の検索条件を決定する。
検索部132は、入力された検索対象のフレーズについて、類似語などを検索条件に追加してもよい。例えば、検索対象のフレーズが、「グッドモーニング」であった場合、類似の表現である「モーニング」や「ハイ」、また、別の言語における「おはよう」や「グーテン モルゲン」などを検索対象のフレーズとして追加しても良い。類似語の検索においては、例えば公知の技術であるフレーズの意味ベクトルを利用して、近似するフレーズを検索してもよい。また、例えば各種辞書のデータベースを利用して、近似するフレーズを検索してもよい。いずれの場合においても、検索結果に対してユーザーが所望のフレーズを選択可能とするとよい。
また、上述したように、入力されたクエリに含まれる楽曲のBPMは、原曲のBPM、または加工部133による加工(調整)され、出力部134から出力される楽曲のBPMである。そこで、検索部132は、入力されたクエリに含まれる楽曲のBPMに応じて、BPMに関する検索条件を決定する。
また、上述したように、入力されたクエリに楽曲のジャンルに関する情報が含まれる場合、あるいはユーザーの個人情報(ID情報)に基づいて、ジャンル等を指定する場合、検索部132は、このような情報を検索条件に追加する。この結果、例えば、「ラブソング」のジャンルで「グッドモーニング」というフレーズを含む楽曲、などの検索条件が決定される。
また、上述したように、入力されたクエリにトピックに関する情報が含まれる場合、あるいはユーザーの個人情報(ID情報)に基づいて、トピックを指定する場合、検索部132は、このような情報を検索条件に追加する。この結果、例えば、「スポーツ」のトピックに関連し「グッド」という歌詞を含む楽曲、などの検索条件が決定される。
次に、検索部132が、ステップS102で決定した検索条件に従って、データベース140から、入力部131に検索対象のフレーズを歌詞に含む楽曲を検索する(ステップS103)。このとき、上述した類似語が検索対象のフレーズに追加されている場合、検索部132は、それぞれの検索対象のフレーズについて、データベースを参照し、検索対象のフレーズを歌詞に含む楽曲を検索する。
次に、検索部132が、入力部131に入力されたクエリに区切り位置の指定が含まれるか否かを判定し(ステップS104)、区切り位置の指定が含まれると判定すると(ステップS104YES)、検索部132が、指定された区切り位置の解析を行う(ステップS105)。
入力されたクエリに区切り位置の指定が含まれる場合、検索部132は、ステップS103で検索した各楽曲について、上述した歌詞時間データ141、拍小節位置データ142、ブレス位置データ143を参照し、クエリに含まれる区切り位置の解析を行う。
例えば、図5に示すように、検索対象のフレーズが、「グッドモーニング」であり、クエリに区切り位置をしてブレス位置が指定されている場合、検索部132は、「グッドモーニング」の歌詞時間データ141を参照し、矢印Aに示す「グッドモーニング」の発音時間に対応する再生時間を求め、ブレス位置データ143を参照し、その時間よりも後でかつ、最も早いブレス位置を求める。矢印Aに示す時間は、単純に「グッドモーニング」の発音時間に対応する再生時間であるが、矢印Bに示す時間は、ブレス位置を考慮し、ユーザーにとって心地よく発音されている可能性の高い時間となる。
なお、入力されたクエリに区切り位置として拍位置および小節位置の指定が含まれる場合も同様に考えることができる。いずれの場合も、検索部132は、検索対象のフレーズの前後に延長しつつ、内容的にユーザーにとって違和感が少ない部分を抜き出すために、検索対象のフレーズを含み、その先頭または後尾が区切り位置とするように、歌詞時間データ141、拍小節位置データ142、ブレス位置データ143を参照し、クエリに含まれる区切り位置の解析を行う。
次に、検索部132が、入力部131に入力されたクエリにフレーズ長の指定が含まれるか否かを判定し(ステップS106)、フレーズ長の指定が含まれると判定すると(ステップS106YES)、検索部132が、指定されたフレーズ長に応じて、楽曲の絞り込みを行う(ステップS107)。
入力されたクエリにフレーズ長の指定が含まれる場合、検索部132は、ステップS103で検索した各楽曲について、指定されたフレーズ長に応じて、楽曲の絞り込みを行う。検索部132は、歌詞時間データ141、拍小節位置データ142、ブレス位置データ143を参照し、クエリに含まれるフレーズ長の条件に適合しない楽曲を除外する、あるいは、クエリに含まれるフレーズ長の条件に適合しない楽曲の検索結果における優先度を下げる。
このとき、ステップS104YESにおいて区切り位置の指定が含まれると判定され、ステップS105において指定された区切り位置の解析を行った場合には、検索部132は、解析結果に基づいてフレーズ長に応じた絞り込みを行う。つまり、単純に検索対象のフレーズのフレーズ長をクエリにおいて指定されたフレーズ長と比較するのではなく、区切り位置をふまえた検索対象のフレーズのフレーズ長をクエリにおいて指定されたフレーズ長と比較する。
このような処理を行うことにより、ステップS103で検索した各楽曲について、クエリに応じた絞り込み(フィルタリング)および並び替え(ソート)を行うことができる。なお、絞り込みおよび並び替えにおいては、各楽曲に固有の情報を加味してもよい。例えば、その楽曲やアーティスト名の知名度および人気度、楽曲が制作された年代などを考慮して絞り込みおよび並び替えを行ってもよい。
次に、入力部131に入力されたクエリに楽曲の加工の指定が含まれるか否かを判定し(ステップS108)、楽曲の加工の指定が含まれると判定すると(ステップS108YES)、加工部133が、楽曲の加工処理を行う(ステップS109)。
楽曲の加工に際しては、図4に示すように、入力部131に入力されたクエリに楽曲の切り出しの指定が含まれるか否かを判定し(ステップS201)、楽曲の切り出しの指定が含まれると判定すると(ステップS201YES)、加工部133が、楽曲の切り出し処理を行う(ステップS202)。
入力されたクエリに楽曲の加工の指定が含まれる場合、加工部133は、ステップS103で検索した各楽曲について、指定された内容に応じて、楽曲の加工を行う。
このとき、ステップS104において区切り位置の指定が含まれると判定され、ステップS105において指定された区切り位置の解析を行った場合には、加工部133は、解析結果に基づいて楽曲の加工を行う。つまり、単純に検索対象のフレーズを切り出すのではなく、区切り位置をふまえて検索対象のフレーズを切り出す。
また、ステップS107において楽曲の絞り込みを行った場合には、加工部133は、絞り込み後の各楽曲について、検索対象のフレーズの切り出し処理を行う。
このような処理を行うことにより、クエリに応じたフレーズの切り出し処理を行い、所望のフレーズを抜き出すことができる。
次に、入力部131に入力されたクエリに楽曲のBPMの調整の指定が含まれるか否かを判定し(ステップS203)、楽曲のBPMの調整の指定が含まれると判定すると(ステップS203YES)、加工部133が、楽曲のBPMを調整する処理を行う(ステップS204)。
入力されたクエリに楽曲のBPMの調整の指定が含まれる場合、加工部133は、ステップS103で検索した各楽曲について、指定された内容に応じて、楽曲のBPMの調整を行う。
このとき、ステップS107において楽曲の絞り込みを行った場合には、加工部133は、絞り込み後の各楽曲について、楽曲のBPMを調整する処理を行う。
このような処理を行うことにより、クエリに応じたBPMの調整処理を行い、所望のBPMの楽曲を生成することができる。
最後に、出力部134が、楽曲を出力する(ステップS110)。なお、出力部134に出力される楽曲は、入力されたクエリに応じて、区切り位置の解析の有無、フレーズ長による絞り込みの有無、および加工処理の有無が異なる。
また、出力された楽曲は、楽曲の少なくとも一部のフレーズを抽出した歌詞サンプルであり、各種用途に活用することができる。用途の例については後述する。
なお、図3および図4を参照して説明した一連の処理は一例であり、本発明はこの例に限定されない。
例えば、ステップS103において説明した楽曲の検索において、検索対象のフレーズ以外の検索条件、例えば、フレーズ長等を検索条件として検索を行ってもよい。また、ステップS105において説明した楽曲の絞り込みにおいて、区切り位置に関する情報以外の情報、例えば、楽曲のジャンル、トピック等を絞り込みの条件として楽曲の絞り込みを行ってもよい。
また、処理の順番についても、図3および図4を参照して説明した例に限定されない。例えば、ステップS107で説明したフレーズ長に基づく楽曲の絞り込みを行った後に、ステップS105で説明した区切り位置の解析を行っても良い。つまり、検索対象のフレーズ、および楽曲の歌詞に関連するクエリに基づいて、楽曲の検索、解析、絞り込み、加工の一部または全部を順不同に行う構成としても良い。
また、上述した例において、検索対象のフレーズは複数の品詞からなる構成されてもよい。このような場合、検索部132が、品詞ごと、または、複数の品詞の少なくとも一部の歌詞を含む楽曲を独立に検索し、加工部133が、検索された楽曲ごとに加工処理を行い、出力部134が、それぞれの品詞を含む楽曲を出力する。
例えば、図6に示すように、検索対象のフレーズが、「ドリームズカムトゥルー」である場合、矢印Aに示すように、「ドリームズカムトゥルー」全体を検索対象のフレーズとして一連の処理を行ってもよいし、矢印Bに示すように、「ドリームズ」、「カム」、「トゥルー」のそれぞれについて、独立に一連の処理を行ってもよいし、両方を実行してもよい。
なお、矢印Bに示すように、品詞ごとに一連の処理を行う際には、フレーズ長を分配しても良い。例えば、「ドリームズカムトゥルー」全体に対して指定されたフレーズ長を、「ドリームズ」、「カム」、「トゥルー」のそれぞれに分配し、3つの品詞のフレーズ長の合計が、「ドリームズカムトゥルー」全体に対して指定されたフレーズ長となるようにしても良い。また、矢印Bに示すように、品詞ごとに一連の処理を行う際には、出力部134による出力時に、出力内容を互いに関連付けることが好ましい。また、検索対象のフレーズをどのように分割するかは、公知の解析技術を利用して決定してもよいし、ユーザー操作に基づいて決定しても良い。
ここまで説明した楽曲の検索について、応用例を説明する。
(1)DJ、楽曲制作、映像制作の用途
DJ、楽曲制作、映像制作の用途では、フレーズ長について精度の高い楽曲の検索のニーズがある。
例えば、「「XXX」という歌詞が2拍で歌われているフレーズを含む楽曲の検索」との要望がある場合には、検索対象のフレーズとして「XXX」を入力し、クエリとして「フレーズ長=2拍」を入力することにより、所望のフレーズを含む楽曲を精度良く検索することができる。また、例えば、「1小節で歌われている文章や単語として区切りの良いフレーズを含む楽曲の検索」との要望がある場合には、検索対象のフレーズの入力しはせず、クエリとして例えば「フレーズ長=1小節」かつ「区切り位置=小節位置」あるいは「区切り位置=ブレス位置」等の入力を行うことにより、任意のフレーズを含み、所望のフレーズ長を有する楽曲を精度良く検索することができる。
また、楽曲制作、映像制作の用途では、前後の楽曲とのつながりやタイミング等をふまえ、BPMについて精度の高い楽曲の検索のニーズがある。このような場合にも、クエリとして原曲または加工後の楽曲のBPMを入力することにより、ユーザーの所望のBPMのフレーズを精度良く出力することができる。
(2)ソーシャルサービスの用途
SNSやSMS(Social Media Service)に代表されるソーシャルサービスの用途では音楽を使ったコミュニケーション、および自己表現のニーズがある。本発明をこのような用途に応用することにより、例えば、入力テキストと同じ歌詞を持つ配信楽曲のフレーズを抽出し、抽出した歌詞をサンプルとして自動生成するサービス等を実現することができる。
例えば、「メッセージサービスにおいて入力したテキストと同じ歌詞を含む楽曲を検索し、フレーズを抽出する」との要望がある場合には、検索対象のフレーズとして「入力テキスト」を入力し、クエリとして例えば「フレーズ長>2秒」「区切り位置=小節位置」あるいは「区切り位置=ブレス位置」等の入力を行うことにより、短すぎてフレーズが聞き取れない等の問題がなく、音楽的に区切りの良いフレーズを含む楽曲を精度良く検索することができる。
(3)ダンス、モーション、アニメーションの映像に関する用途
ダンスやモーションの映像に関する用途では、(1)で説明したDJ、楽曲制作、映像制作の用途と同様に、ダンス、モーション、アニメーション等における動きに適合したフレーズ長について精度の高い楽曲の検索のニーズがある。
例えば、無音あるいはある楽曲に合わせてダンスを踊り、その映像に新たに、あるいは別の楽曲を適用する編集を行う場合には、「「XXX」という歌詞を含み、10秒で歌われているフレーズを含む楽曲の検索」との要望が考えられる。この場合、例えば、検索対象のフレーズとして「XXX」を入力し、クエリとして例えば「フレーズ長=10秒」を入力し、加工することにより、ユーザーの所望のフレーズを精度良く出力することができる。
(4)語学学習の用途
語学学習の用途では、外国語の学習において所望の単語や文章例を特定のフレーズ長の楽曲を使って学習したい等のニーズがある。
例えば、「「XXX」という歌詞を含む楽曲の検索」との要望がある場合には、検索対象のフレーズとして「XXX」を入力し、クエリとして例えば「フレーズ長>3秒」かつ「区切り位置=ブレス位置」を入力することにより、聴き取り学習に十分なフレーズ長を有し、前後の単語も含めた語学学習にふさわしい所望のフレーズを含む楽曲を精度良く検索することができる。
(5)スポーツおよびエクササイズの用途
スポーツおよびエクササイズの用途では、反復練習および動作タイミングの練習などの目的で、特定のフレーズ長およびテンポの楽曲の検索のニーズがある。
例えば、「ホップ、ステップ、ジャンプ」等の動作タイミングの練習を行う場合には、「「XXX」という歌詞を含み、10秒で歌われているフレーズを含む楽曲の検索」との要望が考えられる。この場合、例えば、検索対象のフレーズとして「XXX」を入力し、クエリとして例えば「フレーズ長=8拍」かつ「BPM=YY」を入力することにより、所望のフレーズを含む楽曲を精度良く検索することができる。
なお、(1)から(5)で説明した応用例は一例であり、本発明はこれらの例に限定されない。また、(1)から(5)で説明した各要素の一部を組み合わせて実行する構成としても良い。
以上で説明したような本発明の一実施形態によれば、検索対象のフレーズと、楽曲の歌詞に関連するクエリとを入力し、楽曲と、楽曲の歌詞と、歌詞に関する時間情報とが関連付けて記憶されたデータベースを参照し、データベースから、クエリに応じて検索対象のフレーズを歌詞に含む楽曲を検索する。したがって、検索の目的に応じて、所望の楽曲を検索することできる。
また、本発明の一実施形態によれば、クエリは、フレーズの発音時間の長さを示す情報と、楽曲のBPMとの少なくとも一方を含む。したがって、検索の目的に応じたフレーズ長、あるいは、BPMの楽曲を検索することができる。
また、本発明の一実施形態によれば、時間情報は、歌詞の要素ごとの時間情報、フレーズに関する拍位置または小節位置を示す情報、フレーズに関するブレス位置を示す情報 のうち、少なくとも1つを含む。したがって、単純に検索対象のフレーズを含む楽曲を検索するのではなく、楽曲の内容、好ましい区切り位置などをふまえて、所望の楽曲を検索することできる。
また、本発明の一実施形態によれば、クエリは、楽曲のジャンルに関する情報を含み、ジャンルに応じて楽曲を検索する。したがって、より簡便に、ユーザーの所望の楽曲を検索することできる。
また、本発明の一実施形態によれば、検索対象のフレーズは、複数の品詞を含み、品詞ごと、または、複数の品詞の少なくとも一部の歌詞を含む楽曲を検索する。したがって、検索対象のフレーズが複数の品詞を含む場合であっても、検索の目的に応じて、所望の楽曲を検索することできる。
また、本発明の一実施形態によれば、検索した楽曲を出力する。したがって、楽曲の少なくとも一部のフレーズを抽出した楽曲を、ユーザーが目的に応じて利用することができる。
また、本発明の一実施形態によれば、クエリに応じて、検索した楽曲を加工する。したがって、ユーザーの要望に応じて、楽曲をより好適に加工することができる。
また、本発明の一実施形態によれば、クエリに応じて、検索した楽曲のうち、検索対象のフレーズを含む部分を切り出す。したがって、所望のフレーズを抜き出し、新たな音声データとして各種用途に活用することができる。
また、本発明の一実施形態によれば、クエリに応じて、検索した楽曲のBPMを変更する。したがって、ユーザーの要望に応じて、楽曲のBPMをより好適に調整することができる。
また、本発明の一実施形態によれば、加工した楽曲を出力する。したがって、楽曲の少なくとも一部のフレーズを抽出し、ユーザーの所望の加工を施した楽曲を、ユーザーが目的に応じて利用することができる。
なお、上記実施形態で説明した情報処理装置における処理の一部または全部は、インターネット通信網や、無線によって通信可能に接続されたサーバにより実行されてもよい。
また、上記実施形態では、楽曲を対象とした検索を例示して説明したが、例えば、スピーチ、朗読、会話等の楽曲に分類されないスクリプト等についても、本発明を同様に適用することができる。このような場合、検索対象のフレーズと、スクリプトに関連するクエリとを入力し、スクリプトと、スクリプトに関する時間情報とが関連付けて記憶されたデータベースを参照し、データベースから、クエリに応じて検索対象のフレーズをスクリプトに含む楽曲を検索することができる。このような構成は、特に、上述した語学学習の用途において有用である。
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範囲内において、各種の変形例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
100…情報処理装置、110…ディスプレイ、120…操作部、130…制御部、131…入力部、132…検索部、133…加工部、134…出力部、140…データベース。

Claims (13)

  1. 検索対象のフレーズと、前記検索対象のフレーズの発音時間の長さを示す情報を含み、楽曲の歌詞に関連するクエリとを入力する入力部と、
    楽曲と、楽曲の歌詞と、前記歌詞に関する時間情報とが関連付けて記憶されたデータベースを参照し、前記データベースから、前記クエリに応じて前記検索対象のフレーズを歌詞に含む楽曲を検索する検索部と
    を備える情報処理装置。
  2. 前記時間情報は、前記歌詞の一字毎の再生時間を示す情報または前記歌詞のフレーズ毎の再生時間を示す情報と、前記歌詞のフレーズに関する拍位置または小節位置を示す情報、前記歌詞のフレーズに関するブレス位置を示す情報のうち、少なくとも1つを含む、請求項1に記載の情報処理装置。
  3. 検索対象のフレーズと、前記検索対象のフレーズの発音時間の長さを示す情報を含み、楽曲の歌詞に関連するクエリと、拍位置、小節位置およびブレス位置のうちいずれかの区切り位置とを入力する入力部と、
    楽曲と、楽曲の歌詞と、前記歌詞に関する時間情報とが関連付けて記憶されたデータベースを参照し、前記データベースから、前記クエリに応じて前記検索対象のフレーズを歌詞に含む楽曲を検索する検索部と
    を備え
    前記時間情報は、
    前記歌詞の一字毎の再生時間を示す情報または前記歌詞のフレーズ毎の再生時間を示す情報と、
    楽曲における前記区切り位置を示す情報と、を含み、
    前記検索部は、前記クエリに応じて検索された前記検索対象のフレーズを歌詞に含む楽曲から、前記入力部によって入力された前記区切り位置が前記検索対象のフレーズの先頭又は語尾に位置する楽曲の絞り込みを行う、情報処理装置。
  4. 前記クエリは、前記楽曲のBPMを含む、請求項1から請求項3のいずれか一項に記載の情報処理装置。
  5. 前記クエリは、前記楽曲のジャンルに関する情報を含み、
    前記検索部は、前記ジャンルに応じて前記楽曲を検索する、請求項1から請求項のいずれか一項に記載の情報処理装置。
  6. 前記検索対象のフレーズは、複数の品詞を含み、
    前記検索部は、前記品詞ごと、または、前記複数の品詞の少なくとも一部の歌詞を含む前記楽曲を検索する、請求項1から請求項のいずれか一項に記載の情報処理装置。
  7. 前記検索部により検索した楽曲を出力する出力部をさらに備える、請求項1から請求項のいずれか一項に記載の情報処理装置。
  8. 前記クエリに応じて、前記検索部により検索した楽曲を加工する加工部をさらに備える、請求項1から請求項のいずれか一項に記載の情報処理装置。
  9. 前記加工部は、前記クエリに応じて、前記検索部により検索した楽曲における前記検索対象のフレーズを含む部分を切り出す、請求項に記載の情報処理装置。
  10. 前記加工部は、前記クエリに応じて、前記検索部により検索した楽曲のBPMを変更する、請求項または請求項に記載の情報処理装置。
  11. 前記加工部により加工した楽曲を出力する出力部をさらに備える、請求項から請求項10のいずれか一項に記載の情報処理装置。
  12. コンピュータによって実行され、データベースから楽曲を検索する検索方法であって、
    索対象のフレーズと、前記検索対象のフレーズの発音時間の長さを示す情報を含み、楽曲の歌詞に関連するクエリとを入力するステップと、
    楽曲と、楽曲の歌詞と、前記歌詞に関する時間情報とが関連付けて記憶された前記データベースから、前記クエリに応じて前記検索対象のフレーズを歌詞に含む楽曲を検索するステップと
    を含む検索方法。
  13. 検索対象のフレーズと、前記検索対象のフレーズの発音時間の長さを示す情報を含み、楽曲の歌詞に関連するクエリとを入力する入力部と、
    楽曲と、楽曲の歌詞と、前記歌詞に関する時間情報とが関連付けて記憶されたデータベースを参照し、前記データベースから、前記クエリに応じて前記検索対象のフレーズを歌詞に含む楽曲を検索する検索部としてコンピュータを機能させるためのプログラム。
JP2021178518A 2021-11-01 2021-11-01 情報処理装置、検索方法、およびプログラム Active JP7820945B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021178518A JP7820945B2 (ja) 2021-11-01 2021-11-01 情報処理装置、検索方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021178518A JP7820945B2 (ja) 2021-11-01 2021-11-01 情報処理装置、検索方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2023067363A JP2023067363A (ja) 2023-05-16
JP7820945B2 true JP7820945B2 (ja) 2026-02-26

Family

ID=86326321

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021178518A Active JP7820945B2 (ja) 2021-11-01 2021-11-01 情報処理装置、検索方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP7820945B2 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002123270A (ja) 2000-10-12 2002-04-26 Pioneer Electronic Corp 楽曲検索装置及び楽曲検索方法
JP2003178077A (ja) 2001-12-12 2003-06-27 Hitachi Ltd 検索方法及び、検索システム
WO2007132627A1 (ja) 2006-05-12 2007-11-22 Pioneer Corporation 楽曲検索装置、楽曲検索方法、楽曲検索プログラムおよび楽曲検索プログラムを記録した記録媒体
US20180262452A1 (en) 2011-06-30 2018-09-13 Rednote LLC Method and system for communicating between a sender and a recipient via a personalized message including an audio clip extracted from a pre-existing recording
US10127908B1 (en) 2016-11-11 2018-11-13 Amazon Technologies, Inc. Connected accessory for a voice-controlled device
US11947774B1 (en) 2021-04-28 2024-04-02 Amazon Technologies, Inc. Techniques for utilizing audio segments for expression

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09293083A (ja) * 1996-04-26 1997-11-11 Toshiba Corp 楽曲検索装置および検索方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002123270A (ja) 2000-10-12 2002-04-26 Pioneer Electronic Corp 楽曲検索装置及び楽曲検索方法
JP2003178077A (ja) 2001-12-12 2003-06-27 Hitachi Ltd 検索方法及び、検索システム
WO2007132627A1 (ja) 2006-05-12 2007-11-22 Pioneer Corporation 楽曲検索装置、楽曲検索方法、楽曲検索プログラムおよび楽曲検索プログラムを記録した記録媒体
US20180262452A1 (en) 2011-06-30 2018-09-13 Rednote LLC Method and system for communicating between a sender and a recipient via a personalized message including an audio clip extracted from a pre-existing recording
US10127908B1 (en) 2016-11-11 2018-11-13 Amazon Technologies, Inc. Connected accessory for a voice-controlled device
US11947774B1 (en) 2021-04-28 2024-04-02 Amazon Technologies, Inc. Techniques for utilizing audio segments for expression

Also Published As

Publication number Publication date
JP2023067363A (ja) 2023-05-16

Similar Documents

Publication Publication Date Title
US8583418B2 (en) Systems and methods of detecting language and natural language strings for text to speech synthesis
US8712776B2 (en) Systems and methods for selective text to speech synthesis
US8355919B2 (en) Systems and methods for text normalization for text to speech synthesis
US8352272B2 (en) Systems and methods for text to speech synthesis
US8396714B2 (en) Systems and methods for concatenation of words in text to speech synthesis
CN102549652B (zh) 信息检索装置
US8352268B2 (en) Systems and methods for selective rate of speech and speech preferences for text to speech synthesis
JP5996734B2 (ja) 動画を自動的にアセンブリする方法およびシステム
JP3429184B2 (ja) テキスト構造解析装置および抄録装置、並びにプログラム記録媒体
US20100082328A1 (en) Systems and methods for speech preprocessing in text to speech synthesis
US20100082327A1 (en) Systems and methods for mapping phonemes for text to speech synthesis
US20100070263A1 (en) Speech data retrieving web site system
JP2005537532A (ja) 自然言語理解アプリケーションを構築するための総合開発ツール
JP2001306067A (ja) 歌詞作成装置及び歌詞作成方法並びに歌詞作成プログラムを記録した記録媒体
CN101557483A (zh) 产生媒体节目的方法与系统
CN103150356B (zh) 一种应用的泛需求检索方法及系统
TW200805095A (en) Data product search using related concepts
WO2003085550A1 (fr) Systeme et procede de commande de conversation
US20040246237A1 (en) Information access method, system and storage medium
US8478781B2 (en) Information processing apparatus, information processing method and program
KR101316627B1 (ko) 사용자 의도 자동 해석 기반의 음악 추천 방법 및 그 장치
JP7820945B2 (ja) 情報処理装置、検索方法、およびプログラム
Liu et al. Linguistic tone in Chinese rap: an interdisciplinary approach
Weitz et al. Mining MARC's hidden treasures: initial investigations into how notes of the past might shape our future
WO2004102423A1 (en) Interactive system for building and sharing databank

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240828

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20250630

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20250722

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20250922

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20251120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20260203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20260213

R150 Certificate of patent or registration of utility model

Ref document number: 7820945

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150