本発明を実施するための形態について、図1〜図10を参照して以下に説明する。なお、以下では、説明を簡潔にするために、信号の送信と信号の再生とが同じタイミングであるものとするが、信号の送信から一定の時間が経過した後、信号の再生が行われてもよい。
〔音声信号送信装置の構成〕
図1は、音声信号送信装置1の概略構成を示すブロック図である。音声信号送信装置1は、送信制御部14および記憶部15を備えている。送信制御部14は、句読点特定部6、音圧検出部7、音圧調整部8、再生開始タイミング特定/推定部9、時間調整部10、およびミキサー11を有している。記憶部15は、第1の音声信号格納部3、ノイズ音声格納部4、およびユーザ履歴記憶部5を有している。さらに、音声信号送信装置1は、再生指示受信部2、変調部12、および送信部13を備えている。
再生指示受信部2は、音声信号送信装置1に対する再生指示を受信する。当該再生指示の一例として、ユーザがリモコン(図示しない)を用いて行う遠隔指示、音声信号送信装置1に設けられた再生ボタン(図示しない)をユーザが押下することによる指示、音声信号送信装置1を備えている電子機器の操作画面をユーザが操作することによる指示等が挙げられる。
第1の音声信号格納部3は、第1の音声信号を格納している。第1の音声信号とは、上記再生指示に基づいて、ユーザによって再生が指示された音声であり、音楽、言葉、効果音、所定の合成音声、およびマイク(図示しない)等によってユーザが音声信号送信装置1に入力した音声等の種々の音声が挙げられる。
ノイズ音声格納部4は、第2の音声信号(後述)の基となるノイズ音声を格納している。ノイズ音声とは、特定波長の連続音声、または複数の波長の音がランダムまたは一定の規則により混成された音声であることが好ましい。特定波長の連続音声の一例として、正弦波が挙げられる。複数の波長の音がランダムまたは一定の規則により混成された音声の一例として、ホワイトノイズ、ブラウンノイズ、ピンクノイズ、ブルーノイズ、又はバイオレットノイズのいずれかが挙げられる。このように、第2の音声信号に用いるノイズ音声として、種々の周知のノイズ音声を利用することができる。ノイズ音声格納部4に格納されたノイズ音声は、任意の音圧および継続時間を有していてもよい。例えば、第2の音声信号により規定される音声の音量を第1の音声信号により規定される音声の音量に対して十分小さくする場合、第1の音声信号により規定される音声の最小音量に相当する音量のノイズ音声をノイズ音声格納部4に格納しておけばよい。また、例えば、第2の音声信号により規定される音声の継続時間を10秒以下とする場合、10秒分のノイズ音声をノイズ音声格納部4に格納しておけばよい。また、上記とは別の方式として、ノイズ音声格納部に代えて、ノイズ音声発信部を設けることにより、ノイズ音声を都度合成・発信する方式を採用してもよい。
ユーザ履歴記憶部5は、第1の音声信号の再生履歴をはじめとする、音声信号送信装置1の各種の使用履歴および動作履歴等を記憶している。
再生指示を受信すると、再生指示受信部2は、第1の音声信号格納部3に格納された第1の音声信号を、句読点特定部6に送信する。句読点特定部6は、再生対象の第1の音声信号に基づいて再生される音声から、句読点に該当するタイミングを特定する。句読点に該当するタイミングは、第1の音声信号に基づいて再生される音声が所定の長さ以上途切れる時間に相当する。
再生指示を受信すると、再生指示受信部2は、第1の音声信号格納部3に格納された第1の音声信号を、音圧検出部7に送信する。音圧検出部7は、再生対象の第1の音声信号によって規定される音声の冒頭の音圧を検出する。一般に、当該音声の冒頭が子音である場合の音圧は、当該音声の冒頭が母音である場合の音圧より小さい傾向にある。
再生指示を受信すると、再生指示受信部2は、ノイズ音声格納部4に格納されたノイズ音声を、音圧調整部8に送信する。また、音圧検出部7は、再生対象の第1の音声信号によって規定される音声の冒頭の音圧の検出結果を、音圧調整部8に送信する。音圧調整部8は、当該検出結果に基づいて、再生対象の第1の音声信号によって規定される音声の冒頭の音圧が小さいほど、ノイズ音声の音圧を大きくする。第1の音声信号によって規定される音声の冒頭の音圧が小さい(例えば、当該冒頭の音声が子音である)場合、第2の音声信号によって規定される音声の音圧が小さいと、第1の音声信号によって規定される音声に頭切れが生じる虞がある。音圧調整部8は、この虞を防ぐ構成であると言える。
再生指示を受信すると、再生指示受信部2は、ユーザ履歴記憶部5に記憶された各種の履歴等を、再生開始タイミング特定/推定部9に送信する。再生開始タイミング特定/推定部9は、当該履歴等に基づいて、再生対象の第1の音声信号の再生開始タイミングを事前特定または事前推定する。すなわち、再生開始タイミング特定/推定部9は、送信制御部14が第1の音声信号を送信する前に、当該再生開始タイミングを特定または推定する。
句読点特定部6は、再生対象の第1の音声信号に基づいて再生される音声の句読点に該当するタイミングの特定結果を、時間調整部10に送信する。また、音圧調整部8は、音圧が調整されたノイズ音声を、時間調整部10に送信する。さらに、再生開始タイミング特定/推定部9は、再生対象の第1の音声信号の再生開始タイミングの事前特定または事前推定の結果を、時間調整部10に送信する。時間調整部10は、当該句読点に該当するタイミングの特定結果ならびに当該事前特定または事前推定の結果に基づいて、ノイズ音声の再生タイミングを調整する。また、音声信号送信装置1は、時間調整部10にタイマー21を有している。時間調整部10がタイマー21を有している場合、時間調整部10は、上述したノイズ音声の再生タイミングの調整とは独立して、タイマー21がノイズ音声の再生タイミングを調整することができる。時間調整部10は、再生タイミングが調整されたノイズ音声を、第2の音声信号として出力する。
第2の音声信号は、ユーザによって再生が指示されていない音声信号であって、付加的な音声信号である。第2の音声信号は、第1の音声信号に基づいて再生される音声の先頭が欠けることを防止できる程度の信号強度や信号継続時間が必要であり、かつ、第1の音声信号の開始タイミングの直前に送信される必要がある。ただし、第2の音声信号によって規定される音声は、上記の条件を満足したうえで、音声が可能な限り聴取者に意識されにくい音声であることが望ましい。これは聴取者が第1の音声信号によって規定される音声を聞き取ることを阻害せず、また、聴取者に違和感を与えないためである。このため、第2の音声信号は、可能な限り強度が弱く、継続時間が短く、音声の開始タイミングを第1音声信号の開始タイミングから離すことが望ましい。ここでの意識とは聴取者がその音声を強く気にするという意味である。
また、第2の音声信号によって規定される音声が聴取者に意識されにくくするために、第2の音声信号によって規定される音声は有意でない音声であることが望ましい。ここで、有意でない音声について、以下に説明する。第1の音声信号は、例えば、何らかのメッセージや音楽など、人間の思慮、伝達情報、創作などの何らかの人間の意思を反映した有意な音声である。これに対して、第2の音声信号によって規定される音声も同じような有意な音声である場合、人間の特性として、有意な音声に反映される人間の意思により、無意識に聞き取りを行ってしまうため、聴取者に認識されやすくなってしまう。このため、第2の音声信号によって規定される音声は有意でない音声であることが望ましい。有意でない音声とは、例えば、特定波長の連続音声、または複数の波長の音がランダムまたは一定の規則により混成されたノイズ音声があげられる。上記でいう一定の規則とは、例として、複数波長それぞれの混成比率や混成の方法等についての数学的な規則などが挙げられ、人間の思慮、伝達情報、創作などの人間の意思を反映しないものである。このような有意でない音声は、聴取者にとってノイズとして認識されるため、たとえ聴取者に聞こえても意識されにくい音声である。よって、第2の音声信号によって規定される音声によって、聴取者が第1の音声信号によって規定される音声を聞き取ることを阻害されることを軽減し、また、第2の音声信号によって規定される音声が聴取者に意識されることによって、聴取者に違和感を与えることを軽減することができる。
第2の音声信号の再生タイミング、換言すれば、時間調整部10がノイズ音声の再生タイミングを具体的にどのようなタイミングとするのかについては、後述する。
再生指示を受信すると、再生指示受信部2は、第1の音声信号格納部3に格納された第1の音声信号を、ミキサー11に送信する。また、時間調整部10は、第2の音声信号を、ミキサー11に送信する。ミキサー11は、第1の音声信号と第2の音声信号とを合成し、変調部12に送信する。なお、例えば第1の音声信号の再生タイミングと第2の音声信号の再生タイミングとが大幅に異なる場合、ミキサー11を省略し、送信制御部14は、第1の音声信号と第2の音声信号とを個別に変調部12に送信してもよい。
このように、送信制御部14は、第1の音声信号を送信すると共に、第2の音声信号を自動的に送信する。
変調部12は、送信制御部14から送信された信号を変調し、送信部13に送信する。送信部13は、変調部12から送信された信号を、所定の送信形式に従って、音声信号として出力する。
音声信号送信装置1は、音声出力装置16に対して上記音声信号を送信する。なお、音声信号送信装置1および音声出力装置16においては、当該音声信号の送信を無線通信によって行っているが、当該音声信号の送信を有線通信によって行っていてもよい。
音声出力装置16は、受信部17、復調部18、D/A(デジタル/アナログ)変換器19、およびスピーカ20を備えている。
音声信号送信装置1の送信部13は、上記音声信号を受信部17に送信する。受信部17は、送信部13から送信された音声信号を、所定の受信形式に従って受信し、復調部18に送信する。復調部18は、受信部17から送信された信号を復調し、D/A変換器19に送信する。復調部18から出力される信号は、デジタル信号である。D/A変換器19は、復調部18から送信された信号を、デジタル信号からアナログ信号に変換する。スピーカ20は、当該アナログ信号を再生し、音声を出力する。
ここからは、第1の音声信号の再生タイミングおよび第2の音声信号の再生タイミングについて、下記〔実施の形態1〕〜〔実施の形態4〕を参照して、詳細な説明を行う。
〔実施の形態1〕
図2は、本実施の形態に係る、送信制御部14が送信する最初の第1の音声信号30、次の第1の音声信号31、および第2の音声信号32のタイミングチャート(図2中、送信時)、ならびに、受信部17が受信する最初の第1の音声信号34および次の第1の音声信号35のタイミングチャート(図2中、受信時)である。
図2によれば、送信制御部14が送信する音声信号は、最初の第1の音声信号30の再生終了タイミングから、期間33を空けて、次の第1の音声信号31が再生される音声信号である。なお、最初の第1の音声信号30および次の第1の音声信号31は、これらの組み合わせが1つの第1の音声信号に相当していてもよいし、それぞれ別の第1の音声信号であってもよい。
時間調整部10は、ノイズ音声の再生タイミングを調整し、最初の第1の音声信号30の再生開始に先だって、第2の音声信号32の少なくとも一部が再生されるように、第2の音声信号32を生成する。具体的に、図2においては、最初の第1の音声信号30の再生開始タイミングと第2の音声信号32の再生終了タイミングとがほぼ同じとなるように、第2の音声信号32が生成されている。
また、図2によれば、受信部17が受信する音声信号は、最初の第1の音声信号34の再生終了タイミングから、期間37を空けて、次の第1の音声信号35が再生される音声信号である。最初の第1の音声信号34、次の第1の音声信号35、および期間37は、それぞれ、最初の第1の音声信号30、次の第1の音声信号31、および期間33と対応する。
ここで、音声出力装置16の処理能力が不足していたり、音声出力装置16が省電力状態から復帰するまでに時間がかかることで、音声出力装置16から出力される音声の先頭が欠ける(頭切れする)場合を考える。
具体的には、音声出力装置16またはスピーカ20によっては、例えば消費電力の低減を目的として、時間の長さはスピーカのタイプに大きく依存するが、例えば短いものでは1秒程度、長いものでは数十秒程度の時間音声入力が無い場合に省電力状態となるものがある。音声出力装置16またはスピーカ20が省電力状態の時に音声信号が送信された場合、音声出力装置16またはスピーカ20が動作状態に復帰するまでに時間がかかるため、音声信号の最初の部分が再生されず、頭切れの原因となる場合がある。
本発明は、特に上記の原因で発生する頭切れを解消することを念頭においている。
この場合、受信部17が受信する音声信号は、送信制御部14が送信する音声信号の先頭が欠けたものとなる。この結果、図2に示す例では、受信部17が受信する音声信号において、第2の音声信号32が消失している。図2における、第2の音声信号32の消失に対応するタイミングチャートの部分を、信号欠損部36としている。
一方、最初の第1の音声信号30および次の第1の音声信号31は、第2の音声信号32に対して遅れて再生されるため、受信部17が受信する音声信号において、欠けまたは消失がほとんど生じない。つまり、最初の第1の音声信号34および次の第1の音声信号35は、それぞれ、最初の第1の音声信号30および次の第1の音声信号31と同様の信号となる。また、期間37は期間33と同様の時間となる。つまり、最初の第1の音声信号30および次の第1の音声信号31に基づいてスピーカ20から出力される音声に、頭切れは生じない。立ち上がり鈍化(音量が徐々に立ち上がるよう強制的に変更される現象)についても同様に生じない。
上記の構成によれば、最初の第1の音声信号30の再生開始に先だって、第2の音声信号32を送信する。このため、音声出力装置16から出力される音声に頭切れが生じた場合、第2の音声信号32に基づいて再生される音声の先頭が欠けてしまう虞はあるものの、最初の第1の音声信号30に基づいて再生される音声の先頭が欠けてしまう虞を低減することができる。
また、最初の第1の音声信号30の再生に先だって付加的な音声を送信するため、原理的には最初の第1の音声信号30に対して最初の第1の音声信号34に遅延が生じない。つまり、最初の第1の音声信号30に遅延時間を設けることなく、最初の第1の音声信号30に基づいて再生される音声の頭切れを防止することができる。
図3は、本実施の形態に係る別の、送信制御部14が送信する最初の第1の音声信号40、次の第1の音声信号41、最初の第2の音声信号42、および次の第2の音声信号43のタイミングチャート(図3中、送信時)、ならびに、受信部17が受信する最初の第1の音声信号45、次の第1の音声信号46、および次の第2の音声信号48のタイミングチャート(図3中、受信時)である。
なお、図3における、最初の第1の音声信号40、次の第1の音声信号41、および最初の第2の音声信号42は、それぞれ、図2における、最初の第1の音声信号30、次の第1の音声信号31、および第2の音声信号32と同様の信号である。このため、最初の第1の音声信号40、次の第1の音声信号41、および最初の第2の音声信号42については、詳細な説明を省略する。
時間調整部10は、ノイズ音声の再生タイミングを調整し、次の第1の音声信号41の再生開始に先だって、次の第2の音声信号43の少なくとも一部が再生されるように、次の第2の音声信号43を生成する。具体的に、図3においては、次の第1の音声信号41の再生開始タイミングと次の第2の音声信号43の再生終了タイミングとがほぼ同じとなるように、次の第2の音声信号43が生成されている。
また、送信制御部14が送信する音声信号は、最初の第1の音声信号40の再生終了タイミングから、期間44を空けて、次の第2の音声信号43が再生される音声信号である。
なお、図3における、最初の第1の音声信号45、次の第1の音声信号46、および信号欠損部47は、それぞれ、図2における、最初の第1の音声信号34、次の第1の音声信号35、および信号欠損部36と同様の信号(信号の欠損)である。このため、最初の第1の音声信号45、次の第1の音声信号46、および信号欠損部47については、詳細な説明を省略する。
また、図3によれば、受信部17が受信する音声信号は、最初の第1の音声信号45の再生終了タイミングから、期間49を空けて、次の第1の音声信号46が再生される音声信号である。
図3に示す例においても、図2に示す例と同様に、最初の第1の音声信号40および次の第1の音声信号41に基づいてスピーカ20から出力される音声に、頭切れは生じない。
但し、期間49は、次の第2の音声信号48(次の第2の音声信号43に対応する、受信部17が受信する音声信号)の継続時間分だけ、期間44より長い時間となっている。この結果、次の第1の音声信号41に基づいてスピーカ20から出力される音声に、当該次の第2の音声信号48の継続時間分の遅延が生じることとなる。つまり、図2に示す例においては、図3に示す例と比較して、再生遅延を抑制することができるという利点がある。
本実施の形態は主に、音声信号送信装置1に対して最初の再生指示を行った後、次の再生指示までの時間が、音声出力装置16が省電力状態に移行するまでの時間より短いことが想定される場合に、好適に実施することができる。
〔実施の形態2〕
図4は、本実施の形態に係る、送信制御部14が送信する最初の第1の音声信号50、次の第1の音声信号51、最初の第2の音声信号52、および次の第2の音声信号53のタイミングチャート(図4中、送信時)、ならびに、受信部17が受信する最初の第1の音声信号54および次の第1の音声信号55のタイミングチャート(図4中、受信時)である。
なお、図4における、最初の第1の音声信号50および次の第1の音声信号51は、それぞれ、図2における、最初の第1の音声信号30および次の第1の音声信号31と同様の信号である。このため、最初の第1の音声信号50および次の第1の音声信号51については、詳細な説明を省略する。また、図4における、次の第1の音声信号51と次の第2の音声信号53との相互関係は、図2における、最初の第1の音声信号30と第2の音声信号32との相互関係と同様である。このため、次の第1の音声信号51と次の第2の音声信号53との相互関係についても、詳細な説明を省略する。
時間調整部10は、ノイズ音声の再生タイミングを調整し、最初の第1の音声信号50の再生開始に先だって、最初の第2の音声信号52の少なくとも一部が再生されるように、最初の第2の音声信号52を生成する。具体的に、図4においては、最初の第1の音声信号50の再生開始タイミングに対して一定の期間5Aだけ前に、最初の第2の音声信号52の再生終了タイミングが来るように、最初の第2の音声信号52が生成されている。期間5Aに相当する時間は、特に限定されないが、1秒未満であれば、再生遅延をできるだけ抑制しつつ、最初の第1の音声信号50に基づいてスピーカ20から出力される音声に、頭切れが生じることを抑制することができる。
なお、最初の第2の音声信号52は、送信制御部14によって、最初の第1の音声信号50の再生開始前に適切なタイミングで送信されている。再生開始タイミング特定/推定部9による上述した事前特定または事前推定の結果を参照すれば、時間調整部10は、容易に、最初の第1の音声信号50の再生開始前に最初の第2の音声信号52が適切なタイミングで送信されるように、ノイズ音声の再生タイミングを調整することができる。
なお、図4における、最初の第1の音声信号54および次の第1の音声信号55は、それぞれ、図2における、最初の第1の音声信号34および次の第1の音声信号35と同様の信号である。このため、最初の第1の音声信号54および次の第1の音声信号55については、詳細な説明を省略する。
また、図4中、受信時は、受信部17が最初の第1の音声信号54を受信した後、音声出力装置16が省電力状態に移行することを想定している。
受信部17が受信する音声信号は、最初の第1の音声信号54の再生および次の第1の音声信号55の再生のそれぞれについて、送信制御部14が送信する音声信号の先頭が欠けたものとなる。この結果、図4に示す例では、受信部17が受信する音声信号において、最初の第2の音声信号52および次の第2の音声信号53が消失している。図4における、最初の第2の音声信号52の消失に対応するタイミングチャートの部分、および次の第2の音声信号53の消失に対応するタイミングチャートの部分を、それぞれ、信号欠損部56および信号欠損部57としている。
一方、最初の第1の音声信号50および次の第1の音声信号51は、それぞれ最初の第2の音声信号52および次の第2の音声信号53に対して遅れて再生されるため、受信部17が受信する音声信号において、欠けまたは消失がほとんど生じない。つまり、最初の第1の音声信号54および次の第1の音声信号55は、それぞれ、最初の第1の音声信号50および次の第1の音声信号51と同様の信号となる。つまり、最初の第1の音声信号50および次の第1の音声信号51に基づいてスピーカ20から出力される音声に、頭切れは生じない。
また、図4においては、送信制御部14から受信部17への音声信号の伝達に伴う、最初の第1の音声信号50に対する最初の第1の音声信号54の遅延時間を、期間58とし、次の第1の音声信号51に対する次の第1の音声信号55の遅延時間を、期間59としている。
期間59は、期間58より長くなっている。つまり、次の第1の音声信号51に基づいてスピーカ20から出力される音声に生じる遅延は、最初の第1の音声信号50に基づいてスピーカ20から出力される音声に生じる遅延より大きくなっている。
〔実施の形態3〕
図5は、本実施の形態に係る、送信制御部14が送信する最初の第1の音声信号60、次の第1の音声信号61、最初の第2の音声信号62、および次の第2の音声信号63のタイミングチャート(図5中、送信時)、ならびに、受信部17が受信する最初の第1の音声信号64、次の第1の音声信号65、および次の第2の音声信号67のタイミングチャート(図5中、受信時)である。
なお、図5における、最初の第1の音声信号60および最初の第2の音声信号62は、それぞれ、図4における、最初の第1の音声信号50および最初の第2の音声信号52と同様の信号である。このため、最初の第1の音声信号60および最初の第2の音声信号62については、詳細な説明を省略する。また、図5における、次の第1の音声信号61および次の第2の音声信号63も、それぞれ、図4における、最初の第1の音声信号50および最初の第2の音声信号52と同様の信号である。このため、次の第1の音声信号61および次の第2の音声信号63についても、詳細な説明を省略する。
図5においては、図4と同様に、最初の第1の音声信号60の再生開始タイミングに対して一定の期間6Aだけ前に、最初の第2の音声信号62の再生終了タイミングが来るように、最初の第2の音声信号62が生成されている。期間6Aに相当する時間は、特に限定されないが、1秒未満であれば、再生遅延をできるだけ抑制しつつ、最初の第1の音声信号60に基づいてスピーカ20から出力される音声に、頭切れが生じることを抑制することができる。換言すれば、送信制御部14は、最初の第1の音声信号60の再生開始1秒前以内に最初の第2の音声信号62の少なくとも一部を再生させることが好ましい。
また、最初の第2の音声信号62の再生開始タイミング(例えば、アプリ起動のタイミング)と、次の第2の音声信号63の再生開始タイミングとの間隔に相当する期間6Bは、予め定められた一定の時間となっている。期間6Bに相当する時間は、特に限定されないが、音声出力装置16が省電力状態に移行するまでの時間未満とすることが好ましく、例えば数10秒〜数分であることが好ましい。また、期間6Bに相当する最適な時間は、音声出力装置16の種類や、ユーザの感覚によって異なるので、ユーザが期間6Bに相当する時間を任意に調整することができるように、音声信号送信装置1が構成されていることが好ましい。
なお、図5における、最初の第1の音声信号64および信号欠損部66は、それぞれ、図4における、最初の第1の音声信号54および信号欠損部56と同様の信号(信号の欠損)である。このため、最初の第1の音声信号64および信号欠損部66については、詳細な説明を省略する。
また、図5における、次の第2の音声信号67は、次の第2の音声信号63に対応する、受信部17が受信する音声信号である。
〔実施の形態4〕
送信制御部14は、少なくとも1つの第1の音声信号に基づいて再生される音声が途切れる時間が所定の長さ以上であるとき、この時間の少なくとも一部において第2の音声信号が再生されるように、第2の音声信号を送信してもよい。句読点特定部6による上述した句読点に該当するタイミングの特定結果を参照すれば、時間調整部10は、容易に、当該第2の音声信号の送信を実現するように、ノイズ音声の再生タイミングを調整することができる。
上記の構成によれば、第1の音声信号によって規定される音声に句読点(音声が途切れる)が含まれている場合であっても、当該句読点のタイミングにおいて音声出力装置16が省電力状態に移行することを防ぐことができる。これにより、句読点の後の音声に頭切れが生じることを防ぐ効果を奏する。
音声信号送信装置1は、ノイズ音声格納部4に複数種類のノイズ音声が格納されており、当該複数種類のノイズ音声から、ユーザが第2の音声信号の基とすべきノイズ音声を選択することができるように構成されていてもよい。また、音声信号送信装置1は、当該複数種類のノイズ音声から、ユーザが第2の音声信号の基とすべきノイズ音声を選択することができないように構成されていてもよいし、そもそもノイズ音声格納部4に1種類のノイズ音声のみが格納されていてもよい。
また、上記の各実施の形態においては、第1の音声信号と第2の音声信号とが重なり合っていなかったが、第1の音声信号と第2の音声信号とが重なり合っていてもよい。
〔音声信号送信装置の動作の流れの一例〕
図6は、音声信号送信装置1の動作(音声信号送信方法)の流れの一例を示すフローチャートである。
まず、再生指示受信部2が再生指示を受信する(ステップS1)。
続いて、第1の音声信号の読み出しを行う(ステップS2)。具体的に、再生指示受信部2は、第1の音声信号格納部3に格納された第1の音声信号を、句読点特定部6、音圧検出部7、およびミキサー11に送信する。
続いて、ノイズ音声の読み出しを行う(ステップS3)。具体的に、再生指示受信部2は、ノイズ音声格納部4に格納されたノイズ音声を、音圧調整部8に送信する。
続いて、音圧検出部7は、第1の音声信号によって規定される音声の冒頭の音圧を検出する(ステップS4)。
続いて、音圧調整部8は、音圧検出部7による音圧の検出結果に基づいて、第1の音声信号によって規定される音声の冒頭の音圧が小さいほど、第2の音声信号によって規定される音声の音圧を大きくするように、ノイズ音声の音圧を調整する(ステップS5)。
続いて、ユーザ履歴の読み出しを行う(ステップS6)。具体的に、再生指示受信部2は、ユーザ履歴記憶部5に記憶された、音声信号送信装置1の各種の使用履歴および動作履歴等を、再生開始タイミング特定/推定部9に送信する。
続いて、再生開始タイミング特定/推定部9は、第1の音声信号の再生開始タイミングを特定または推定する(ステップS7)。
続いて、時間調整部10は、第1の音声信号の再生開始に先だって、第2の音声信号の少なくとも一部が再生されるタイミングにする(ステップS8:送信制御工程)。具体的に、時間調整部10は、音圧調整部8より受信したノイズ音声の再生タイミングを調整することによって、第2の音声信号の再生タイミングを調整する。
続いて、時間調整部10は、句読点特定部6による句読点に該当するタイミングの特定結果に基づいて、第1の音声信号に基づいて再生される音声の句読点に該当するタイミングに、第2の音声信号の再生タイミングを合わせる(ステップS9)。ステップS8と同様に、時間調整部10は、音圧調整部8より受信したノイズ音声の再生タイミングを調整することによって、第2の音声信号の再生タイミングを調整する。
最後に、ミキサー11は、第1の音声信号と第2の音声信号とを合成する(ステップS10)。
なお、音声信号送信装置1において、必須の動作は、ステップS1〜ステップS3、およびステップS8である。その他の各ステップについては、適宜省略されてもよいし、順序が適宜変更されてもよい。
〔実施の形態5〕
図7は、本実施の形態に係るスマートフォン70およびぬいぐるみ71(電子機器)の概略構成を示す図である。図7に示すスマートフォン70は、音声信号送信装置1(図1参照)を備えている。また、図7に示すぬいぐるみ71は、音声出力装置16(図1参照)を備えている。
ユーザである操作者(ここでは親)は、スマートフォン70の操作画面72から、再生すべき音声(第1の音声信号に基づいて再生される音声)を選択し、スマートフォン70の音声信号送信装置1に対する再生指示を行う。これにより、ぬいぐるみ71の音声出力装置16のスピーカ20から、頭切れの無い当該音声を出力させることができる。操作者が場面に応じて複数の当該音声を使い分けることで、聴取者(ここでは子供)に対してあたかもぬいぐるみ71と会話しているかのような感覚を与えることができる。
最初の第1の音声信号に基づいて再生される音声の頭切れを防ぎ、かつ聴取者の反応に対して遅延無く、次の第1の音声信号に基づいて再生される音声を再生させることで、聴取者とぬいぐるみ71との対話を円滑に演出することができる。
図8は、本実施の形態に係る別のスマートフォン80およびぬいぐるみ81(電子機器)の概略構成を示す図である。図8に示すスマートフォン80は、図7に示すスマートフォン70の構成に加え、音声出力装置16を備えている。また、図8に示すぬいぐるみ81は、図7に示すぬいぐるみ71の構成に加え、音声信号送信装置1を備えている。スマートフォン80の音声信号送信装置1とぬいぐるみ81の音声出力装置16とで、1つの通信系統が構成されていると共に、スマートフォン80の音声出力装置16とぬいぐるみ81の音声信号送信装置1とで、別の1つの通信系統が構成されている。
スマートフォン80およびぬいぐるみ81において、上記別の1つの通信系統を構成し、スマートフォン80の音声出力装置16を介して操作者が例えばイヤホン83を用いて聴取者の声を聴く。これにより、聴取者から離れた場所(聴取者の居る部屋とは別の部屋等)から、操作者と聴取者とが会話を行うことができる。すなわち、下記(1)〜(5)の流れで、当該会話が可能となる。
(1)スマートフォン80の操作画面82から、操作者が再生すべき音声を選択する。
(2)ぬいぐるみ81が発声(音声を出力)する。
(3)ぬいぐるみ81の発声に応じて、聴取者が返答する。
(4)上記(3)の返答を再生すべき音声として、ぬいぐるみ81からスマートフォン80に音声信号を送信する。
(5)操作者がイヤホン83を用いて、上記(4)の音声信号に基づいて再生される音声を聴く。
〔実施の形態6〕
図9は、本実施の形態に係るスマートフォン90およびヘッドホン91(電子機器)の概略構成を示す図である。図9に示すスマートフォン90は、音声信号送信装置1(図1参照)を備えている。また、図9に示すヘッドホン91は、音声出力装置16(図1参照)を備えており、スマートフォン90の音声信号送信装置1と無線通信を行う、いわゆる無線ヘッドホンである。
スマートフォン90およびヘッドホン91によれば、スマートフォン90に格納された音楽(第1の音声信号に基づいて再生される音声)をヘッドホン91から出力する。これにより、ヘッドホン91から出力される当該音楽の頭切れを防ぐことができる。
〔実施の形態7〕
図10は、本実施の形態に係るスマートフォン100およびヘッドセット101(電子機器)の概略構成を示す図である。図10に示すスマートフォン100は、音声信号送信装置1(図1参照)および音声出力装置16(図1参照)を備えている。また、図10に示すヘッドセット101も、音声信号送信装置1および音声出力装置16を備えている。スマートフォン100の音声信号送信装置1とヘッドセット101の音声出力装置16とで、1つの通信系統が構成されていると共に、スマートフォン100の音声出力装置16とヘッドセット101の音声信号送信装置1とで、別の1つの通信系統が構成されている。なお、図10に示すヘッドセット101は、スマートフォン100の音声信号送信装置1および音声出力装置16と無線通信を行う、いわゆる無線ヘッドセットである。
スマートフォン100およびヘッドセット101によれば、スマートフォン100による通話時において、ヘッドセット101を利用して通話相手の声を聴いたり、ヘッドセット101のマイクで通話相手に声を送信したりすることができる。
〔ソフトウェアによる実現例〕
音声信号送信装置1の制御ブロック(特に送信制御部14)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。
後者の場合、音声信号送信装置1は、各機能を実現するソフトウェアであるプログラムの命令を実行するCPU、上記プログラムおよび各種データがコンピュータ(またはCPU)で読み取り可能に記録されたROM(Read Only Memory)または記憶装置(これらを「記録媒体」と称する)、上記プログラムを展開するRAM(Random Access Memory)などを備えている。そして、コンピュータ(またはCPU)が上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
〔まとめ〕
本発明の態様1に係る音声信号送信装置1は、音声出力装置16に対して音声信号を送信する装置であって、ユーザによって再生が指示された第1の音声信号を送信するとともに、前記第1の音声信号の再生開始に先だって、ユーザによって再生が指示されていない音声信号であって、付加的な音声信号である第2の音声信号の少なくとも一部が再生されるように、前記第2の音声信号を自動的に送信する送信制御部14を備えている。
上記の構成によれば、第1の音声信号の再生開始に先だって、第2の音声信号を送信する。このため、音声出力装置から出力される音声に頭切れが生じた場合、第2の音声信号に基づいて再生される音声の先頭が欠けてしまう虞はあるものの、第1の音声信号に基づいて再生される音声の先頭が欠けてしまう虞を低減することができる。
また、上記の構成によれば、第1の音声信号の再生に先だって付加的な音声を送信するため、原理的には第1の音声信号に遅延が生じない。つまり、第1の音声信号に遅延時間を設けることなく、第1の音声信号に基づいて再生される音声の頭切れを防止することができる。
本発明の態様2に係る音声信号送信装置1は、上記態様1において、前記第2の音声信号は、特定波長の連続音声、または複数の波長の音がランダムまたは一定の規則により混成されたノイズ音声を含む。
上記の構成によれば、第2の音声信号によって規定される音声によって、聴取者が第1の音声信号によって規定される音声を聞き取ることを阻害されることを軽減し、また、第2の音声信号によって規定される音声が聴取者に意識されることによって、聴取者に違和感を与えることを軽減することができる。
本発明の態様3に係る音声信号送信装置1は、上記態様2において、前記ノイズ音声は、ホワイトノイズ、ブラウンノイズ、ピンクノイズ、ブルーノイズ、又はバイオレットノイズのいずれかである。
上記の構成によれば、第2の音声信号に用いるノイズ音声として、種々の周知のノイズ音声を利用することができる。
本発明の態様4に係る音声信号送信装置1は、上記態様1から3のいずれかにおいて、前記送信制御部14は、前記第1の音声信号の再生開始1秒前以内に前記第2の音声信号の少なくとも一部を再生させる。
上記の構成によれば、再生遅延をできるだけ抑制しつつ、第1の音声信号に基づいて再生される音声に、頭切れが生じることを抑制することができる。
本発明の態様5に係る音声信号送信装置1は、上記態様1から4のいずれかにおいて、前記送信制御部14は、前記第1の音声信号によって規定される音声の冒頭の音圧が小さいほど、前記第2の音声信号によって規定される音声の音圧が大きくなるように生成された、前記第2の音声信号を送信する。
第1の音声信号によって規定される音声の冒頭の音圧が小さい(例えば、当該冒頭の音声が子音である)場合、第2の音声信号によって規定される音声の音圧が小さいと、第1の音声信号によって規定される音声に頭切れが生じる虞がある。上記の構成によれば、この虞を防ぐ効果を奏する。
本発明の態様6に係る音声信号送信装置1は、上記態様1から5のいずれかにおいて、前記送信制御部14は、前記第1の音声信号の再生開始タイミングを前記第1の音声信号の送信前に事前特定または事前推定する。
上記の構成によれば、第1の音声信号の再生開始タイミングを特定または推定した上で、第2の音声信号を適切なタイミングで送信することが可能となる。
本発明の態様7に係る音声信号送信装置1は、上記態様1から6のいずれかにおいて、前記送信制御部14は、少なくとも1つの前記第1の音声信号に基づいて再生される音声が途切れる時間が所定の長さ以上であるとき、前記時間の少なくとも一部において前記第2の音声信号が再生されるように、前記第2の音声信号を送信する。
上記の構成によれば、第1の音声信号によって規定される音声に句読点(音声が途切れる)が含まれている場合であっても、当該句読点のタイミングにおいて音声出力装置が省電力状態に移行することを防ぐことができる。これにより、句読点の後の音声に頭切れが生じることを防ぐ効果を奏する。
本発明の態様8に係る音声信号送信方法は、音声出力装置16に対して音声信号を送信する音声信号送信装置1における方法であって、ユーザによって再生が指示された第1の音声信号を送信するとともに、前記第1の音声信号の再生開始に先だって、ユーザによって再生が指示されていない音声信号であって、付加的な音声信号である第2の音声信号の少なくとも一部が再生されるように、前記第2の音声信号を自動的に送信する送信制御工程を含んでいることを特徴としている。
上記の構成によれば、態様1と同様の効果を奏する。
本発明の各態様に係る各工程は、コンピュータによって実現してもよく、この場合には、コンピュータを上記工程として動作させることにより上記工程をコンピュータにて実現させる制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。