JP7564663B2 - 重要情報抽出装置、報道原稿生成装置、原稿生成支援システム及びプログラム - Google Patents

重要情報抽出装置、報道原稿生成装置、原稿生成支援システム及びプログラム Download PDF

Info

Publication number
JP7564663B2
JP7564663B2 JP2020148400A JP2020148400A JP7564663B2 JP 7564663 B2 JP7564663 B2 JP 7564663B2 JP 2020148400 A JP2020148400 A JP 2020148400A JP 2020148400 A JP2020148400 A JP 2020148400A JP 7564663 B2 JP7564663 B2 JP 7564663B2
Authority
JP
Japan
Prior art keywords
news
important information
manuscript
score
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020148400A
Other languages
English (en)
Other versions
JP2022042802A (ja
Inventor
淳 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2020148400A priority Critical patent/JP7564663B2/ja
Publication of JP2022042802A publication Critical patent/JP2022042802A/ja
Application granted granted Critical
Publication of JP7564663B2 publication Critical patent/JP7564663B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)

Description

本発明は、報道素材データから重要情報を自動的に抽出する重要情報抽出装置、自動抽出した重要情報を基に報道原稿を自動的に生成する報道原稿生成装置、原稿生成支援システム及びプログラムに関する。
一般に、報道機関(新聞社・放送局・出版社・通信社等)は、各種の電子的方法で入手した報道素材データから人的に判断した重要情報を抽出し、抽出した重要情報を基に視聴者に対して報道するための報道原稿を生成し、その報道原稿をWebニュースや報道記事として制作している。この報道原稿には、新聞、テレビ、ラジオだけでなく、Web、雑誌、メールマガジンなどの様々なメディアのための原稿を含む。
例えば、現状、報道機関は、プロ野球や相撲、或いはプロサッカーなど、様々なスポーツの競技団体から、勝敗結果及び勝敗経過を含む試合データを報道素材データとして取得しており、その報道素材データ(試合データ)から、番組制作に用いる重要プレイを重要情報として人手で判断している。そして、その重要情報(重要プレイ)を基に視聴者に対して報道するための報道原稿を、全て人手により生成している。
例えば、報道素材データは、BIP(Baseball Data Innovation Platform)と称される配信用の基盤により一般社団法人日本野球機構(NPB)から配信される試合データとすることができ、所定のAPI(Application Programming Interface)を利用して取得できる(例えば、非特許文献1参照)。このプロ野球の試合データは、一般社団法人日本野球機構(NPB)による独自のフォーマットで報道機関に配信されるようになっている。尚、報道機関は、プロ野球以外でも、フォーマットは異なるとしても、他のスポーツ競技でもよく、勝敗のある報道素材データに関して各種の電子的方法で取得できる。
一方、従来から、野球戦評に関する報道原稿を自動生成する技術が知られている(例えば、非特許文献2,3,4参照)。
例えば、非特許文献2には、野球戦評に関する報道素材データに対しWPA(Win Probability Added)と称される勝利確率を示すスコアを導出し、そのスコアの差分が大きいプレイの上位を重要プレイとして抽出し、報道原稿を自動作成するものとなっている。そして、非特許文献3には、WPAの導出に関して説明されている。
また、非特許文献4には、野球戦評に関する任意のデータからテキストを生成するための、深層学習を利用したアルゴリズムが開示されている。
"NPB BIPとは"、一般社団法人日本野球機構、[online]、[令和2年7月10日検索]、インターネット〈URL:https://sports-station.jp/info/bip_explanation〉 "WPAを用いた野球の戦評の自動生成,"情報知識学会誌, 2019, 29 巻, 2 号, p. 181-186 "Win Probability Added in Sabermetrics,"数理解析研究所講究録,第1703巻,2010. "Data-to-text Generation with Entity Modeling,"Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics,P19-1195 (2019)
上述したように、一般的には、報道機関(新聞社・放送局・出版社・通信社等)は、各種の電子的方法で入手した報道素材データから人的に判断した重要情報を抽出し、抽出した重要情報を基に視聴者に対して報道するための報道原稿を生成し、その報道原稿をWebニュースや報道記事として制作している。
しかし、大量に取得した報道素材データから重要情報を分析し、確認した上で、短時間で報道原稿を作成することは、制作者にとって負担が大きい。また、報道原稿を作成する際に報道素材データから重要情報を抽出するときに、或る程度のヒューマンエラーが危惧される。
このため、報道素材データから重要情報を自動的に抽出する技術、並びに、自動抽出した重要情報を基に報道原稿を自動的に生成する技術が望まれる。
一方、非特許文献2,3,4に開示されるように、野球戦評に関する報道原稿を自動生成する技術が知られているが、これらの技術では、ルール、勝利貢献度、選手やチーム等の注目度に関係なく無作為に、特にWPAによる評価値を基に重要情報(重要プレイ)を抽出して原稿生成するため、視聴者が期待するような重要情報(重要プレイ)の抽出確度が低く、視聴者が期待するような報道原稿の生成に改善の余地がある。
そこで、本発明の目的は、上述の問題に鑑みて、勝敗結果及び勝敗経過を含む報道素材データから重要情報を高確度で自動抽出する重要情報抽出装置、自動抽出した重要情報を基に報道原稿を編集容易に自動生成する報道原稿生成装置、原稿生成支援システム及びプログラムを提供することにある。
本発明の重要情報抽出装置は、勝敗結果及び勝敗経過を含む所定フォーマットの報道素材データから重要情報を自動抽出する重要情報抽出装置であって、処理対象の報道素材データを構成する時系列コンテキスト毎に、機械学習に利用可能な予め定めた要素で表される特徴ベクトルを生成する特徴ベクトル生成部と、前記時系列コンテキスト毎の特徴ベクトルについて、処理対象の前記報道素材データにおける重要情報の候補を抽出するための評価基準として、所定条件に合致するか否かを示すルールベーススコア、機械学習による勝利貢献度を示す勝利貢献度スコア、及び機械学習による所定の注目度を示す注目度スコアを含む予め定めた複数種類の評価計算を行い、当該複数種類のスコアを生成するスコア計算部と、前記時系列コンテキスト毎に当該複数種類のスコアの総合スコアを算出し、前記総合スコアの変動が大きい順を重要ランキングとし、前記重要ランキングに基づいて前記報道素材データを構成する時系列コンテキストの中から重要情報の候補を抽出する重要情報候補抽出部と、前記重要ランキング付きの重要情報の候補のうち、予め設定した所定の重要ランキング以上の重要情報の候補、或いは重要情報の決定に最も寄与すると推定される最重要ランキングの重要情報の候補のみを、当該処理対象の報道素材データに関する重要情報として最終決定して出力する重要情報決定部と、を備えることを特徴とする。
また、本発明の重要情報抽出装置において、前記スコア計算部は、前記予め定めた複数種類の評価計算として、WPA(Win Probability Added)アルゴリズムによる勝利確率を示す勝利確率スコアの計算を更に含むことを特徴とする。
また、本発明の重要情報抽出装置において、前記重要情報候補抽出部は、当該複数種類のスコアにおける前記ルールベーススコアをSr、前記勝利確率スコアをSwpa、前記勝利貢献度スコアをSm1、及び前記注目度スコアをSm2とし、重みα,β1、β2、β3を用いて、
S=(1-α)・Sr+α・(β1・Swpa+β2・Sm1+β3・Sm2)
とする重み付き和で正規化した評価値で表される当該総合スコアSを算出することを特徴とする。
更に、本発明の報道原稿生成装置は、本発明の重要情報抽出装置によって自動抽出した重要情報を基に報道原稿を自動生成する報道原稿生成装置であって、当該処理対象の報道素材データに関する重要情報を入力し、前記重要情報について、予め用意されている原稿テンプレートを用いるか、又は機械学習により報道原稿を自動生成する機能を有する報道原稿生成部と、前記重要情報抽出装置から得られる処理対象の報道素材データにおける勝敗結果及び勝敗経過を含むデータ、当該複数種類のスコア、前記重要情報の候補、及び当該最終決定された重要情報と、当該自動生成した報道原稿と、を含むデータを提示するユーザーインタフェースの提示制御を行うUI制御部と、を備えることを特徴とする。
また、本発明の報道原稿生成装置において、所定の抽出条件に基づき当該最終決定された重要情報に係る過去の関連情報を抽出して時系列解析を行い、時系列解析した情報を当該最終決定された重要情報に係る補足情報として生成する関連情報解析部を更に備え、前記報道原稿生成部は、当該最終決定された重要情報に加えて、前記補足情報について、予め用意されている原稿テンプレートを用いるか、又は機械学習により報道原稿を自動生成する機能を有することを特徴とする。
また、本発明の報道原稿生成装置において、前記報道原稿生成部は、前記ユーザーインタフェース上に当該重要情報の候補が提示された状態で、当該最終決定された重要情報とは別の当該重要情報の候補を追加するように前記UI制御部から指示を受け付けたときは、当該別の当該重要情報の候補を追加する新たな報道原稿を自動生成する機能を有することを特徴とする。
また、本発明の報道原稿生成装置において、前記UI制御部は、前記報道原稿生成部によって生成された当該報道原稿が得られた時に、実原稿を格納する実原稿データベースを自動的に参照し、当該自動生成された報道原稿に対応する編集後の実原稿があるときはその実原稿のデータを自動取得して前記ユーザーインタフェース上に提示するよう制御する機能を有することを特徴とする。
また、本発明の報道原稿生成装置において、前記報道原稿生成部により自動生成した報道原稿と、当該自動取得した編集後の実原稿とを比較し、前記勝利貢献度スコア、及び前記注目度スコアの計算に係る機械学習の学習モデル、及び前記過去の関連情報の抽出条件に関して、自己回帰分析を行って更新する回帰データ生成部を更に備えることを特徴とする。
また、本発明の報道原稿生成装置において、前記UI制御部は、当該処理対象の報道素材データにおける勝敗経過に対応付けた当該複数種類のスコアのうちの1以上のスコアと、その関連する予め定めた関連データを時系列に示すグラフを生成し、前記ユーザーインタフェース上に提示するよう制御する機能を有することを特徴とする。
更に、本発明の原稿生成支援システムは、本発明の重要情報抽出装置と、本発明の報道原稿生成装置と、を備えることを特徴とする。
更に、本発明のプログラムは、コンピューターを、本発明の原稿生成支援システムとして機能させるためのプログラムとして構成する。
本発明によれば、勝敗結果及び勝敗経過を含む報道素材データから重要情報を高確度で自動抽出することができ、更には、自動抽出した重要情報を基に報道原稿を編集容易に自動生成することができるので、実原稿を編集・作成するための重要情報をより正確に抽出することができ、実原稿を編集・作成するコストを軽減することができる。
本発明による一実施例の重要情報抽出装置、及び報道原稿生成装置を備える原稿生成支援システムの概略構成を示すブロック図である。 本発明による一実施例の重要情報抽出装置による重要情報抽出処理を示すフローチャートである。 本発明による一実施例の報道原稿生成装置による報道原稿生成処理を示すフローチャートである。 本発明による一実施例の原稿生成支援システムにおける報道原稿生成装置のUI(ユーザーインタフェース)を例示する図である。 本発明による一実施例の原稿生成支援システムにおける報道原稿生成装置のUIで提示する選評提示に係るグラフを例示する図である。
以下、図面を参照して、本発明による一実施例の重要情報抽出装置11、及び報道原稿生成装置12を備える原稿生成支援システム1の構成について説明する。
(原稿生成支援システム)
図1は、本発明による一実施例の重要情報抽出装置11、及び報道原稿生成装置12を備える原稿生成支援システム1の概略構成を示すブロック図である。
本発明による一実施例の重要情報抽出装置11は、特徴ベクトル生成部111、スコア計算部112、ルールDB(データベース)113、勝利確率モデルDB114、勝利貢献度学習DB115、注目度学習DB116、重要情報候補抽出部117、及び重要情報決定部118を備える。
特徴ベクトル生成部111は、勝敗結果及び勝敗経過を含む所定フォーマットの報道素材データを入力し、入力した報道素材データにおける時系列コンテキスト(試合データの例では各プレイを示す情報)毎に、機械学習に利用可能な予め定めた要素で表される特徴ベクトルを生成し、生成した特徴ベクトルをスコア計算部112に出力する。また、詳細は後述するが、特徴ベクトル生成部111は、特徴ベクトル生成の対象とした報道素材データにおける時系列コンテキストの情報について報道原稿生成装置12におけるUI制御部124に出力し、UI提示できるようになっている。
尚、報道機関は、プロ野球や相撲、或いはプロサッカーなど、様々なスポーツの競技団体から、勝敗結果及び勝敗経過を含む試合データを報道素材データとして取得しており、所定の記憶媒体である報道素材DB10に所定期間分蓄積するのが一般的である。
例えば、報道素材データは、BIPと称される配信用の基盤により日本野球機構から配信されるプロ野球の試合データとすることができ、所定のAPIを利用して取得された試合データが報道素材DB10に所定期間分蓄積されている。プロ野球の試合データは、マスタ情報(選手、球団、審判、球場)、勝敗結果、成績(打者、投手、守備、走塁、球団)及び勝敗経過を示す情報が含まれており、報道機関は、この試合データを逐次取得し、報道素材DB10に蓄積している。
そこで、本実施例では、重要情報抽出装置11が報道素材DB10に通信接続されており、外部指定(後述する報道原稿生成装置12におけるUI制御部124による操作部1240からの指定)により特定される報道素材データを報道素材DB10から読み出し、処理対象として重要情報抽出装置11における特徴ベクトル生成部111に入力するようになっている。
また、報道素材データとしてプロ野球の試合データとするときは、その試合データにおける時系列コンテキストについての機械学習に利用可能な予め定めた要素として、例えば、ホームチームID、ビジターチームID、試合開催日、ナイトゲーム、球場、ドームかどうか、天気、イニング、表・裏、延長回、打点、ランナーの状況(1塁、2塁、3塁)、アウトカウント、代打かどうか、ピッチャーが先発かどうか、ホームチーム得点、ビジターチーム得点、得点差等とすることができる。そして、特徴ベクトル生成部111は、これらの要素を持つ高次の特徴ベクトルを生成し、スコア計算部112に出力する。尚、試合データから取得できる上記の例以外の要素(例えば、注目選手の有無など)を利用することも可能である。
スコア計算部112は、特徴ベクトル生成部111によって生成した時系列コンテキスト毎の特徴ベクトルを入力し、時系列コンテキスト毎の特徴ベクトルについて、処理対象の当該報道素材データにおける重要情報(本例では重要プレイ)の候補を抽出するための評価基準として、ルールベーススコア(所定条件に合致するか否かを示すスコア)、機械学習による勝利貢献度スコア(勝利貢献度を示すスコア)、及び機械学習による注目度スコア(選手等の所定の注目度を示すスコア)を含む予め定めた複数種類の評価計算を行い、これらの重要情報特定用の複数種類の評価値(スコア)を生成し、重要情報候補抽出部117に出力する。より好適例には、スコア計算部112は、当該予め定めた複数種類の評価計算として、WPAアルゴリズムによる勝利確率を示す勝利確率スコアの計算を更に含むものとすることができ、以下、この好適例を主として説明する。また、詳細は後述するが、スコア計算部112は、計算した重要情報特定用の評価値(スコア)及びその関連データ(本例では得失点差)について時系列にグラフ生成可能とするよう報道原稿生成装置12におけるUI制御部124に出力し、UI提示できるようになっている。
ルールDB113は、重要情報の特定用に予め定めた条件設定データを格納しており、スコア計算部112におけるルールベーススコアの計算時に参照利用される。より具体的には、各種の報道素材データ毎にどのような情報を重要情報(本例では重要プレイ)とすべきかの条件(ルール)について予め人手で事前分析されており、ルールDB113には、その条件を示す条件設定データが格納されている。例えば、試合データの重要情報(本例では重要プレイ)の特定には、勝利打点に関わるプレイとして、AチームとBチームの対戦において、5対3でAチームが勝利した場合、Aチームの4点目に関わるプレイが重要プレイとされやすい。また、勝敗結果に関わらず、ホームランとなったプレイはニュースに取り上げられやすい。そこで、条件設定データは、このような人手で作成した条件(ルール)を示すものとし、スコア計算部112は、時系列コンテキスト毎の特徴ベクトルに関するルールベーススコアの計算時にはルールDB113を参照して、その条件設定データが示す所定条件に合致するか否かを示すスコアを、ルールベーススコアとして計算する。
勝利確率モデルDB114は、重要情報の特定用に予め定めたWPAモデルを格納しており、スコア計算部112における勝利確率スコアの計算時に参照利用される。即ち、スコア計算部112は、時系列コンテキスト毎の特徴ベクトルに関する勝利確率スコアの計算時には勝利確率モデルDB114を参照して、WPAアルゴリズムによるスコアを計算する。
勝利貢献度学習DB115は、重要情報の特定用に予め定めた機械学習用の勝利貢献度学習モデルを格納しており、スコア計算部112における勝利貢献度スコアの計算時に参照利用される。例えば、勝利貢献度学習DB115は、時系列コンテキストが示すプレイ毎に、その試合の結果が勝った方のチーム又は選手に正例、負けた方のチーム又は選手に負例ラベルを特徴量として付与し、サポートベクターマシン(SVM)又は深層学習(DNN)等の教師あり学習アルゴリズムにより学習させた勝利貢献度学習モデルを格納している。そして、スコア計算部112は、時系列コンテキスト毎の特徴ベクトルに関する勝利確率スコアの計算時には勝利貢献度学習DB115を参照して、SVMの場合には分離超平面からの距離を、DNNの場合には出力層のノードの重みを勝利貢献度スコアとして計算する。
注目度学習DB116は、重要情報の特定用に予め定めた機械学習用の注目度スコア(選手等の所定の注目度を示すスコア)を格納しており、スコア計算部112における注目度スコアの計算時に参照利用される。例えば、注目度学習DB116は、時系列コンテキストが示すプレイ毎に、そのプレイに係る選手やチーム等の注目度を示す特徴量を付与し、サポートベクターマシン(SVM)又は深層学習(DNN)等の教師あり学習アルゴリズムにより学習させた注目度学習モデルを格納している。そして、スコア計算部112は、時系列コンテキスト毎の特徴ベクトルに関する注目度スコアの計算時には注目度学習DB116を参照して、SVMの場合には分離超平面からの距離を、DNNの場合には出力層のノードの重みを注目度スコアとして計算する。尚、注目度を示す特徴量は、例えばプロ野球の場合、ルーキーかどうか、直近のオールスター戦の出場の有無、国際試合の出場の有無、昨シーズンのタイトルの有無などである。これは、注目度の高い選手のプレイは、その結果に関わらず、ニュースに取り上げられる場合があるためである。
重要情報候補抽出部117は、スコア計算部112から、時系列コンテキスト(試合データの例では各プレイ)毎に、ルールベーススコア(所定条件に合致するか否かを示すスコア)、勝利確率スコア(WPAによるスコア)、勝利貢献度スコア(勝利貢献度を示すスコア)、及び注目度スコア(選手等の所定の注目度を示すスコア)の予め定めた複数種類の重要情報特定用の評価値(スコア)を入力して、その総合スコアを算出し、当該総合スコアの変動が大きい順を重要ランキングとし、この重要ランキングに基づいて報道素材データを構成する時系列コンテキストの中から重要情報(本例では重要プレイ)の候補を抽出し、重要情報決定部118に出力する。また、詳細は後述するが、重要情報候補抽出部117は、時系列コンテキスト毎に抽出した各種のスコア、重要ランキングを示すスコア、及び重要情報の候補について報道原稿生成装置12におけるUI制御部124に出力し、UI提示できるようになっている。
重要情報決定部118は、重要情報候補抽出部117から得られる重要ランキング付きの重要情報(本例では重要プレイ)の候補のうち、予め設定した所定の重要ランキング以上の重要情報の候補、或いは重要情報の決定に最も寄与すると推定される最重要ランキングの重要情報の候補のみを、当該処理対象の報道素材データに関する重要情報として最終決定し、報道原稿生成装置12に出力する。また、詳細は後述するが、重要情報決定部118は、最終決定した重要情報に関する評価値(スコア)の情報について報道原稿生成装置12におけるUI制御部124に出力し、UI提示できるようになっている。
一方、本発明による一実施例の報道原稿生成装置12は、関連情報解析部121、報道原稿生成部122、原稿テンプレートDB123、UI制御部124、及び回帰データ生成部125を備える。
関連情報解析部121は、重要情報抽出装置11によって最終決定された当該処理対象の報道素材データに関する重要情報(本例では重要プレイ)を入力し、報道素材DB10を参照して、所定の抽出条件に基づき当該重要情報に係る過去の関連情報を抽出して時系列解析を行い、時系列解析した情報を当該重要情報に係る補足情報として生成し、報道原稿生成部122に出力する。例えば、関連情報解析部121は、報道素材DB10から当該重要情報に係るピッチャーの勝利数、チームの連勝・連敗などの情報を時系列解析の対象とする予め定めた過去の関連情報として抽出し、時系列解析した情報を当該重要情報に係る補足情報として生成する。
報道原稿生成部122は、重要情報抽出装置11によって最終決定された当該処理対象の報道素材データに関する重要情報(本例では重要プレイ)と、関連情報解析部121によって時系列解析した当該重要情報に係る補足情報とを入力し、その重要情報と補足情報のそれぞれについて、予め用意されている原稿テンプレートを用いるか、又は機械学習により報道原稿を自動生成し、UI制御部124に出力する。
また、報道原稿生成部122は、UI上に当該重要情報の候補が提示された状態で、当該最終決定された重要情報とは別の当該重要情報の候補を追加するようにUI制御部124から指示を受け付けたときは、当該別の当該重要情報の候補を追加する新たな報道原稿を自動生成し、UI提示するようUI制御部124に出力する機能を有する。
原稿テンプレートDB123は、1種又は複数種の原稿テンプレートを格納しており、報道原稿生成部122における報道原稿の自動生成時に参照利用される。即ち、報道原稿生成部122は、当該処理対象の報道素材データにおける当該重要情報(本例では重要プレイ)を含む時系列コンテキストの文章、及び補足情報のそれぞれの形態素解析を行い、形態素解析により分解されている形態素に最も合致する原稿テンプレートを原稿テンプレートDB123から選択し、その形態素を当てはめて報道原稿を自動生成する。
回帰データ生成部125は、必ずしも設ける必要はないが、報道原稿生成部122により自動生成した報道原稿と、後述するUI制御部124における一機能としてユーザー(実原稿の制作・編集者)による編集後の実原稿とを入力して比較し、重要情報(本例では重要プレイ)の特定に係る勝利貢献度学習DB115及び注目度学習DB116における機械学習の学習モデル、及び関連情報解析部121における過去の関連情報の抽出条件に関して、自己回帰分析を行って更新する機能部である。例えば、回帰データ生成部125は、自動生成した報道原稿と編集後の実原稿都との比較で形態素解析を経て差分が生じている場合には機械学習の学習モデルの正例・負例の修正や過去の関連情報の抽出条件の修正を行い、差分が生じていない場合には機械学習の学習モデルの正例・負例の適正度を高め、過去の関連情報の抽出条件の適正度を高めるように更新する。
UI制御部124は、原稿生成支援システム1の操作機能、及び、重要情報抽出装置11から得られる処理対象の報道素材データにおける勝敗結果及び勝敗経過を含むデータ、当該複数種類のスコア、重要情報の候補、及び当該最終決定された重要情報と、報道原稿生成部122により自動生成した報道原稿とを、ユーザー(実原稿の制作・編集者)に対して編集可能に提示するUI(ユーザーインタフェース)を表示装置20に提示するよう制御する機能、並びに、処理対象とする報道素材データの指定により自動生成した報道原稿が得られた時に、実原稿を格納する実原稿DB30を自動的に参照し、当該自動生成された報道原稿に対応する編集後の実原稿があるときはその実原稿のデータを自動取得してUI上に提示するよう制御する機能を有するUIの提示制御を行う機能部である。
より具体的には、UI制御部124は、操作部1240、報道原稿提示部1241、グラフ生成部1242、重要情報候補提示部1243、報道原稿編集部1244、及び実原稿取得提示部1245を備える。
操作部1240は、原稿生成支援システム1の操作(処理対象とする報道素材データの指定、関連する各種データの表示又は参照、及び自動生成した報道原稿の編集等)を行うためのヒューマン・マシン・インターフェースをUI上に提示する機能部である。この操作部1240の機能より、処理対象とする報道素材データの指定を行うと、その指定された報道素材データを報道素材DB10から読み出して重要情報抽出装置11に入力するようになっており、報道原稿生成装置12における報道原稿生成部122による当該指定された報道素材データについての重要情報(重要プレイ)の抽出提示・報道原稿の自動生成・関連する各種データの表示・実原稿の取得までの一連の処理が自動的に行われる。
報道原稿提示部1241は、操作部1240により指定された報道素材データについて、報道原稿生成部122により自動生成した報道原稿をUI上に提示する機能部である。また、報道原稿提示部1241は、重要情報抽出装置11における特徴ベクトル生成部111の機能により取得可能とする、特徴ベクトル生成の対象とした報道素材データにおける時系列コンテキストの情報について、UI提示する機能を有する。
グラフ生成部1242は、当該処理対象の報道素材データにおける勝敗経過に対応付けた当該複数種類のスコアのうちの1以上のスコアと、その関連する予め定めた関連データ(本例では得失点差)について時系列に示すグラフを生成し、UI提示するよう制御する機能を有する。
重要情報候補提示部1243は、操作部1240により指定された報道素材データにおける時系列コンテキストについて、重要情報抽出装置11における重要情報候補抽出部117の機能により取得可能とする、時系列コンテキスト毎に抽出した重要情報の候補をUI提示する機能を有する。また、重要情報候補提示部1243は、重要情報抽出装置11における重要情報候補抽出部117の機能により取得可能とする、最終決定した重要情報に関する評価値(スコア)の情報をUI提示する機能を有する。
報道原稿編集部1244は、報道原稿生成部122により自動生成した報道原稿について、ユーザー(実原稿の制作・編集者)が編集可能とする編集機能を提示する機能部である。特に、報道原稿編集部1244は、自動生成した報道原稿について手入力で編集できるようにするだけでなく、重要情報抽出装置11における重要情報候補抽出部117から提示された重要情報の候補をユーザー(実原稿の制作・編集者)が選択指定したときに、その選択した重要情報の候補を追加するように報道原稿生成部122に指示する機能を有する。そして、報道原稿生成部122は、UI上に当該重要情報の候補が提示された状態で、当該最終決定された重要情報とは別の当該重要情報の候補を追加するようにUI制御部124から指示を受け付けたときは、当該別の当該重要情報の候補を追加する新たな報道原稿を自動生成し、UI提示するようUI制御部124に出力する。
実原稿取得提示部1245は、処理対象とする報道素材データの指定により自動生成した報道原稿が得られた時に、実原稿を格納する実原稿DB30を自動的に参照し、当該自動生成された報道原稿に対応する編集後の実原稿があるときはその実原稿のデータを自動取得してUI上に提示する機能部である。また、実原稿取得提示部1245は、実原稿DB30から自動取得した編集後の実原稿を回帰データ生成部125に出力して、回帰データ生成部125を機能させるようになっている。
以下、図1乃至図3を参照しながら、より詳細に、本実施例の重要情報抽出装置11による重要情報抽出処理、及び本実施例の報道原稿生成装置12による報道原稿生成処理について、順に説明する。
(重要情報抽出処理)
図2は、本発明による一実施例の重要情報抽出装置11による重要情報抽出処理を示すフローチャートである。
まず、重要情報抽出装置11は、特徴ベクトル生成部111の機能により、勝敗結果及び勝敗経過を含む所定フォーマットの試合データ(即ち、報道素材データ)を入力し(ステップS1)、入力した試合データにおける時系列コンテキスト(試合データの例では各プレイを示す情報)毎に、機械学習に利用可能な予め定めた要素で表される特徴ベクトルを生成する(ステップS2)。尚、重要情報抽出装置11は、報道原稿生成装置12のUI制御部124における操作部1240の機能より、処理対象とする報道素材データの指定を行うと、その指定された報道素材データを報道素材DB10から読み出して重要情報抽出装置11における特徴ベクトル生成部111に入力するようになっている。
続いて、重要情報抽出装置11は、スコア計算部112の機能により、時系列コンテキスト毎の特徴ベクトルについて、処理対象の当該試合データにおける重要情報(本例では重要プレイ)の候補を抽出するための評価基準として、ルールベーススコア(所定条件に合致するか否かを示すスコア)、勝利確率スコア(WPAによるスコア)、勝利貢献度スコア(勝利貢献度を示すスコア)、及び注目度スコア(選手等の所定の注目度を示すスコア)の予め定めた複数種類の評価計算を行い、これらの重要情報特定用の複数種類の評価値(スコア)を生成する(ステップS3乃至S6)。
続いて、重要情報抽出装置11は、重要情報候補抽出部117の機能により、当該時系列コンテキスト毎のルールベーススコア、勝利確率スコア、勝利貢献度スコア、及び注目度スコアの予め定めた複数種類の重要情報特定用の評価値(スコア)の総合スコアの変動が大きい順を示す重要ランキングに基づいて、報道素材データを構成する時系列コンテキストの中から重要情報(本例では重要プレイ)の候補を抽出する(ステップS7)。
本例では、好適例として、重要情報(本例では重要プレイ)の候補とする総合スコアSは、式(1)に示すように、ルールベーススコアSr、勝利確率スコアSwpa、勝利貢献度スコアSm1、及び注目度スコアSm2の重み付き和で正規化した評価値で表される。ここで、重みα,β1、β2、β3は、重視する各スコアを事前設定するパラメータである。重みα,β1、β2、β3は、それぞれ0に設定可能であり、スポーツ競技に応じて選択設定することができる。尚、ルールベーススコアSrは、所定条件に合致する場合は1、そうでなければ0となるスコアである。ただし、総合スコアSの算出にあたって、勝利確率スコアSwpaを除いたルールベーススコアSr、勝利貢献度スコアSm1、及び注目度スコアSm2の重み付き和で正規化した評価値としても十分に重要情報の抽出を行うことができる。例えば勝利確率スコアSwpaを除く総合スコアSの算出時には、β1=0に設定する。尚、WPAアルゴリズムは、本来は野球用であるが、スポーツ競技に応じた勝利確率モデルを用いることで、他のスポーツ競技にも応用適用できる。
S=(1-α)・Sr+α・(β1・Swpa+β2・Sm1+β3・Sm2) (1)
そして、重要情報抽出装置11は、重要情報決定部118の機能により、重要ランキング付きの重要情報(本例では重要プレイ)の候補のうち、予め設定した所定の重要ランキング以上の重要情報の候補、或いは重要情報の決定に最も寄与すると推定される最重要ランキングの重要情報の候補のみを、当該処理対象の報道素材データに関する重要情報として最終決定し、報道原稿生成装置12に出力する(ステップS8)。
(報道原稿生成処理)
図3は、本発明による一実施例の報道原稿生成装置12による報道原稿生成処理を示すフローチャートである。
まず、報道原稿生成装置12は、関連情報解析部121、及び報道原稿生成部122の各機能により、重要情報抽出装置11によって最終決定された当該処理対象の報道素材データに関する重要情報(本例では重要プレイ)を入力する(ステップS11)。
そして、報道原稿生成装置12は、関連情報解析部121の機能により、報道素材DB10を参照して、所定の抽出条件に基づき当該重要情報に係る過去の関連情報を抽出して時系列解析を行い、時系列解析した情報を当該重要情報に係る補足情報として生成する(ステップS12)。
続いて、報道原稿生成装置12は、報道原稿生成部122の各機能により、当該試合データ(即ち、報道素材データ)に関する重要情報(本例では重要プレイ)、及び時系列解析した当該重要情報に係る補足情報を基に、その重要情報と補足情報のそれぞれについて、予め用意されている原稿テンプレートを用いるか、又は機械学習により報道原稿を自動生成する(ステップS13)。
ここで、報道原稿生成部122は、重要情報と補足情報のそれぞれについての提示文の作成のために、例えば、プロ野球の試合データであれば、アウトカウント、塁の状況、打者名、投手名、得点状況、得点の差、プレイの結果(逆転、同点、ダメ押し、得点差を縮める)などの形態素解析により分解されている形態素に最も合致する原稿テンプレートを原稿テンプレートDB123から選択し、その形態素を当てはめて報道原稿を自動生成する。以下、テンプレートの例([ ]が形態素)と、プロ野球の戦評を示す自動生成した報道原稿の例を示す。
(テンプレートの例)
『 [Ateam]対[Bteam]は[Winner]が[A_score]対[B_score]で勝ちました。
[Winner]は[Diff_score]を追う[Inning]、[Player]の[Play_Result]で
[Play_score]を挙げ逆転しました。 』
(プロ野球の戦評を示す自動生成した報道原稿の例)
『 ヤクルト対阪神は阪神が5対3で勝ちました。
阪神は2点を追う6回、原口選手のタイムリーと北條選手のツーベースで
2点を挙げ逆転しました。 』
尚、UI上で報道原稿を自然言語で出力する際に、テンプレートではなく、機械学習を用いることも可能である。例えば1プレイのデータを文字列の入力として、出力を戦評の文としたエンコーダーデコーダモデルによる文生成アルゴリズムを利用できる。ただし、ニューラルネットワークによる文出力は不完全であり、間違った情報が含まれる場合もあるため、UI上で編集可能とすることが必要となる。
そして、報道原稿生成装置12は、UI制御部124の機能により、重要情報抽出装置11から得られる処理対象の報道素材データにおける勝敗結果及び勝敗経過を含むデータ、当該複数種類のスコア、重要情報の候補、及び当該最終決定された重要情報と、報道原稿生成部122により自動生成した報道原稿とを、ユーザー(実原稿の制作・編集者)に対して編集可能に提示するUI(ユーザーインタフェース)を表示装置20に提示するよう制御する(ステップS14)。尚、UI上では、処理対象とする報道素材データの指定により自動生成した報道原稿が得られた時に、実原稿を格納する実原稿DB30を自動的に参照し、当該自動生成された報道原稿に対応する編集後の実原稿があるときはその実原稿のデータを自動取得してUI上に提示するようになっている。
即ち、UI上では、自動生成した報道原稿の提示の他に、試合データ(即ち、報道素材データ)、及び重要情報(本例では重要プレイ)をリストアップ表示することや、自然言語として作成した文により提示することができる。
(UI:ユーザーインタフェース)
図4は、本発明による一実施例の原稿生成支援システム1における報道原稿生成装置12のUI(ユーザーインタフェース)を例示する図であり、図5は、そのUIで提示する選評提示に係るグラフを例示する図である。
まず、図4を参照するに、UI制御部124の機能により提示されるUIは、本実施例の原稿生成支援システム1を「プロ野球の選評生成システム」(図示U0,U1)と称して、プロ野球に関する試合データ(即ち、報道素材データ)について、重要情報(本例では重要プレイ)を自動抽出し、報道原稿を自動生成するためのヒューマン・マシン・インターフェースとして構成される。
図4に示すUI上では、UI制御部124における操作部1240の機能として、「プロ野球日付選択欄」(図示U2)が提示され、日付をキー入力で指定するか、「<1日戻る」又は「1日進む>」ボタン(図示U3)の押下で、日付を指定することで、処理対象とする試合データ(即ち、報道素材データ)の選択を行うことができる。そして、UI上で提示される「実行ボタン」(図示U4)の押下で、選択した日付の試合データ(即ち、報道素材データ)の指定が確定し、その指定された試合データ(即ち、報道素材データ)が報道素材DB10から読み出されて重要情報抽出装置11に入力される。重要情報抽出装置11に指定された試合データ(即ち、報道素材データ)が入力されると、報道原稿生成装置12における報道原稿生成部122による当該指定された報道素材データについての重要情報(重要プレイ)の抽出提示・報道原稿の自動生成・関連する各種データの表示・実原稿の取得までの一連の処理が自動的に行われる。
尚、指定日付の試合データ(即ち、報道素材データ)には、その日に行われたプロ野球の全試合の試合データが日付・項目(図示U5,U6)別に記述されており、原稿生成支援システム1は、その日付・項目(図示U5,U6)別に、対応する試合データの重要情報(重要プレイ)の抽出提示・報道原稿の自動生成・関連する各種データの表示・実原稿の取得までの一連の処理が自動的に行う。このため、図4では、或る日付の一項目(図示U5,U6)についてのみ図示しているが、そのUI上でスクロール(図示U7)させて、その日に行われたプロ野球の全試合の試合データに関する重要情報(重要プレイ)の抽出提示・報道原稿の自動生成・関連する各種データの表示・実原稿の取得までの一連の処理結果を表示できるようになっている。
より具体的には、UI上の「報道原稿欄」(図示U8,U9)には、UI制御部124における報道原稿提示部1241の機能として、日付・項目(図示U5,U6)に対応する試合データの自動生成した報道原稿が提示され、特に、重要情報(重要プレイ)について自動生成された内容(図示U8)と、重要情報(重要プレイ)に関連する関連情報について自動生成された内容(図示U9)が提示される。
また、UI上の「グラフ欄」(図示U10)を押下すると、UI上の「報道原稿欄」(図示U8,U9)には、UI制御部124におけるグラフ生成部1242の機能として、図5に示すようなグラフGが生成提示される。グラフGには、当該試合データに関する「自動生成した報道原稿」(図示G0)と、スコア計算部112から得られる、計算した「重要情報特定用の評価値(スコア)」及びその関連データ(本例では「得失点差」)が時系列に示される。図5に示すグラフGの例では、横軸にイニング数、縦軸にスコア及び得失点差をプロットしており、勝利確率スコア(「wpaでのスコア(図示G1)」)と、勝利貢献度スコア(「機械学習でのスコア(図示G2)」)と、「得失点差(図示G3)」を選択表示された例としている。
また、図5に示すグラフGにおいて、勝利確率スコア(「wpaでのスコア(図示G1)」)、及び勝利貢献度スコア(「機械学習でのスコア(図示G2)」)の推移を示す線上には、「*:スコアが算出した試合に1番インパクトを与えたプレイ」として、重要情報候補抽出部117から得られる、重要情報の決定に最も寄与した最重要ランキングのスコア(変動が最も大きいスコア)を各種のスコア毎に視認表示させている(図示G4,G5)。尚、図5に示すグラフGでは、勝利確率スコア、及び勝利貢献度スコアにおける最重要ランキングのスコア(図示G4,G5)を示すプレイが同じであるとして検出された例を示しているが、各種のスコアによってずれることもある。このため、ユーザー(実原稿の制作・編集者)は、各種のスコアにおける最重要ランキングのスコアを示すプレイが同じであれば重要情報の抽出確度が高いと判断し、各種のスコアによって大きくずれているときは重要情報の抽出確度が低いと判断することができるので、編集に役立つようになる。
また、図4に示すUI上には、UI制御部124における報道原稿提示部1241の機能として、重要情報抽出装置11における特徴ベクトル生成部111の機能により取得可能とする、特徴ベクトル生成の対象とした報道素材データにおける時系列コンテキストの情報(本例では「得点一覧 スコアボード」)が提示される(図示U11)。
また、図4に示すUI上には、UI制御部124における重要情報候補提示部1243の機能として、重要情報抽出装置11における重要情報候補抽出部117の機能により取得可能とする、時系列コンテキスト毎に抽出した重要情報の候補(本例では「得点リスト」)が提示される(図示U12)。
更に、図4に示すUI上には、UI制御部124における重要情報候補提示部1243の機能として、重要情報抽出装置11における重要情報候補抽出部117の機能により取得可能とする、最終決定した重要情報に関する評価値(スコア)の情報が得られるので、最終決定した重要情報に対応するプレイを示す時系列コンテキストの情報(本例では「得点一覧 スコアボード(図示U11)」)、及び重要情報の候補の表示欄(図示U12)内で直ちに把握できるようにするために、重要なプレイを判別可視した状態で強調表示している(図示U13)。
このように、ユーザー(実原稿の制作・編集者)は、重要プレイがどのイニングに起こったかなど、直ちに把握できるため、自動生成された報道原稿の確度を確認しやすくなり、編集に役立つようになる。
更に、図4に示すUI上には、UI制御部124における報道原稿編集部1244の機能として、UI上の「報道原稿欄」(図示U8,U9)上に自動生成・提示された報道原稿について、ユーザー(実原稿の制作・編集者)が手入力で編集できるだけでなく、重要情報の候補の表示欄(図示U12)内の重要情報の候補を押下で選択すると、その選択した重要情報の候補を追加するように報道原稿生成部122に指示して、新たに追加された報道原稿を生成できるようになっている。これにより、ユーザー(実原稿の制作・編集者)は、重要プレイとして判別されていないプレイについても、容易に編集できる。
また、図4に示すUI上には、UI制御部124における実原稿取得提示部1245の機能として、実原稿取得提示部1245は、処理対象とする報道素材データの指定により自動生成した報道原稿が得られた時に、実原稿を格納する実原稿DB30を自動的に参照し、当該自動生成された報道原稿に対応する編集後の実原稿があるときはその実原稿のデータが自動取得されて「ニュース文」表示欄(図示U14)に提示される。また、実原稿取得提示部1245は、実原稿DB30から自動取得した編集後の実原稿を回帰データ生成部125に出力して、回帰データ生成部125を機能させる構成とすることができる。
回帰データ生成部125は、必ずしも設ける必要はないが、報道原稿生成部122により自動生成した報道原稿と、後述するUI制御部124における一機能としてユーザー(実原稿の制作・編集者)による編集後の実原稿とを入力して比較し、重要情報(本例では重要プレイ)の特定に係る勝利貢献度学習DB115及び注目度学習DB116における機械学習の学習モデル、及び関連情報解析部121における過去の関連情報の抽出条件に関して、自己回帰分析を行って更新する。例えば、回帰データ生成部125は、自動生成した報道原稿と編集後の実原稿との比較で形態素解析を経て差分が生じている場合には機械学習の学習モデルの正例・負例の修正や過去の関連情報の抽出条件の修正を行い、差分が生じていない場合には機械学習の学習モデルの正例・負例の適正度を高め、過去の関連情報の抽出条件の適正度を高めるように更新する。より具体的には、回帰データ生成部125は、自動生成した報道原稿における各特徴ベクトルが表すプレイが実原稿に表れていたか否かを判別し、図4に示すUI上の「報道原稿欄」(図示U8)及び「ニュース文」表示欄(図示U14)の双方に表されているプレイは正例とし、「報道原稿欄」(図示U8)に表れていないが「ニュース文」表示欄(図示U14)に表されているプレイも正例とし、「報道原稿欄」(図示U8)に表れているが「ニュース文」表示欄(図示U14)に表されていないプレイは負例とするよう、自己回帰分析を行って更新する。
従って、本発明に係る原稿生成支援システム1によれば、報道素材データから重要情報を高確度で自動抽出することができ、更には、自動抽出した重要情報を基に報道原稿を編集容易に自動生成することができるので、実原稿を編集・作成するための重要情報をより正確に抽出することができ、実原稿を編集・作成するコストを軽減することができる。
本発明に係る原稿生成支援システム1は、コンピューターにより構成することができ、原稿生成支援システム1の各処理部を機能させるためのプログラムを好適に用いることができる。具体的には、原稿生成支援システム1の各処理部を制御するための制御部をコンピューター内の中央演算処理装置(CPU)で構成でき、且つ、各処理部を動作させるのに必要となるプログラムを適宜記憶する記憶部を少なくとも1つのメモリで構成させることができる。即ち、そのようなコンピューターに、CPUによって該プログラムを実行させることにより、原稿生成支援システム1の各処理部の有する機能を実現させることができる。更に、原稿生成支援システム1の各処理部の有する機能を実現させるためのプログラムを、前述の記憶部(メモリ)の所定の領域に格納させることができる。そのような記憶部は、装置内部のRAM又はROMなどで構成させることができ、或いは又、外部記憶装置(例えば、ハードディスク)で構成させることもできる。また、そのようなプログラムは、コンピューターで利用されるOS上のソフトウェア(ROM又は外部記憶装置に格納される)の一部で構成させることができる。更に、そのようなコンピューターに、原稿生成支援システム1の各処理部として機能させるためのプログラムは、コンピューター読取り可能な記録媒体に記録することができる。また、原稿生成支援システム1の各処理部をハードウェア又はソフトウェアの一部として構成させ、各々を組み合わせて実現させることもできる。
以上、特定の実施形態の例を挙げて本発明を説明したが、本発明は前述の実施形態の例に限定されるものではなく、その技術思想を逸脱しない範囲で種々変形可能である。例えば、上述した実施例では、主としてプロ野球の報道素材データを処理対象とする例を説明したが、プロ野球以外の他のスポーツ競技でもよく、勝敗結果及び勝敗経過を含む報道素材データを処理対象とすることができる。ただし、原稿生成支援システム1において機械学習させる際には、プロ野球、プロサッカー等のスポーツ競技を区別してその種類別に行うことが好ましい。
本発明によれば、勝敗結果及び勝敗経過を含む報道素材データから重要情報を高確度で自動抽出することができ、更には、自動抽出した重要情報を基に報道原稿を編集容易に自動生成することができるので、報道原稿を制作する用途に有用である。
1 原稿生成支援システム
11 重要情報抽出装置
12 報道原稿生成装置
111 特徴ベクトル生成部
112 スコア計算部
113 ルールDB(データベース)
114 勝利確率モデルDB
115 勝利貢献度学習DB
116 注目度学習DB
117 重要情報候補抽出部
118 重要情報決定部
121 関連情報解析部
122 報道原稿生成部
123 原稿テンプレートDB
124 UI制御部
125 回帰データ生成部
1240 操作部
1241 報道原稿提示部
1242 グラフ生成部
1243 重要情報候補提示部
1244 報道原稿編集部
1245 実原稿取得提示部

Claims (11)

  1. 勝敗結果及び勝敗経過を含む所定フォーマットの報道素材データから重要情報を自動抽出する重要情報抽出装置であって、
    処理対象の報道素材データを構成する時系列コンテキスト毎に、機械学習に利用可能な予め定めた要素で表される特徴ベクトルを生成する特徴ベクトル生成部と、
    前記時系列コンテキスト毎の特徴ベクトルについて、処理対象の前記報道素材データにおける重要情報の候補を抽出するための評価基準として、所定条件に合致するか否かを示すルールベーススコア、機械学習による勝利貢献度を示す勝利貢献度スコア、及び機械学習による所定の注目度を示す注目度スコアを含む予め定めた複数種類の評価計算を行い、当該複数種類のスコアを生成するスコア計算部と、
    前記時系列コンテキスト毎に当該複数種類のスコアの総合スコアを算出し、前記総合スコアの変動が大きい順を重要ランキングとし、前記重要ランキングに基づいて前記報道素材データを構成する時系列コンテキストの中から重要情報の候補を抽出する重要情報候補抽出部と、
    前記重要ランキング付きの重要情報の候補のうち、予め設定した所定の重要ランキング以上の重要情報の候補、或いは重要情報の決定に最も寄与すると推定される最重要ランキングの重要情報の候補のみを、当該処理対象の報道素材データに関する重要情報として最終決定して出力する重要情報決定部と、
    を備えることを特徴とする重要情報抽出装置。
  2. 前記スコア計算部は、前記予め定めた複数種類の評価計算として、WPA(Win Probability Added)アルゴリズムによる勝利確率を示す勝利確率スコアの計算を更に含むことを特徴とする、請求項1に記載の重要情報抽出装置。
  3. 前記重要情報候補抽出部は、当該複数種類のスコアにおける前記ルールベーススコアをSr、前記勝利確率スコアをSwpa、前記勝利貢献度スコアをSm1、及び前記注目度スコアをSm2とし、重みα,β1、β2、β3を用いて、
    S=(1-α)・Sr+α・(β1・Swpa+β2・Sm1+β3・Sm2)
    とする重み付き和で正規化した評価値で表される当該総合スコアSを算出することを特徴とする、請求項2に記載の重要情報抽出装置。
  4. 請求項1から3のいずれか一項に記載の重要情報抽出装置によって自動抽出した重要情報を基に報道原稿を自動生成する報道原稿生成装置であって、
    当該処理対象の報道素材データに関する重要情報を入力し、前記重要情報について、予め用意されている原稿テンプレートを用いるか、又は機械学習により報道原稿を自動生成する機能を有する報道原稿生成部と、
    前記重要情報抽出装置から得られる処理対象の報道素材データにおける勝敗結果及び勝敗経過を含むデータ、当該複数種類のスコア、前記重要情報の候補、及び当該最終決定された重要情報と、当該自動生成した報道原稿と、を含むデータを提示するユーザーインタフェースの提示制御を行うUI制御部と、
    を備えることを特徴とする報道原稿生成装置。
  5. 所定の抽出条件に基づき当該最終決定された重要情報に係る過去の関連情報を抽出して時系列解析を行い、時系列解析した情報を当該最終決定された重要情報に係る補足情報として生成する関連情報解析部を更に備え、
    前記報道原稿生成部は、当該最終決定された重要情報に加えて、前記補足情報について、予め用意されている原稿テンプレートを用いるか、又は機械学習により報道原稿を自動生成する機能を有することを特徴とする、請求項4に記載の報道原稿生成装置。
  6. 前記報道原稿生成部は、前記ユーザーインタフェース上に当該重要情報の候補が提示された状態で、当該最終決定された重要情報とは別の当該重要情報の候補を追加するように前記UI制御部から指示を受け付けたときは、当該別の当該重要情報の候補を追加する新たな報道原稿を自動生成する機能を有することを特徴とする、請求項4又は5に記載の報道原稿生成装置。
  7. 前記UI制御部は、前記報道原稿生成部によって生成された当該報道原稿が得られた時に、実原稿を格納する実原稿データベースを自動的に参照し、当該自動生成された報道原稿に対応する編集後の実原稿があるときはその実原稿のデータを自動取得して前記ユーザーインタフェース上に提示するよう制御する機能を有することを特徴とする、請求項4から6のいずれか一項に記載の報道原稿生成装置。
  8. 前記報道原稿生成部により自動生成した報道原稿と、当該自動取得した編集後の実原稿とを比較し、前記勝利貢献度スコア、及び前記注目度スコアの計算に係る機械学習の学習モデル、及び前記過去の関連情報の抽出条件に関して、自己回帰分析を行って更新する回帰データ生成部を更に備えることを特徴とする、請求項5を引用する請求項7に記載の報道原稿生成装置。
  9. 前記UI制御部は、当該処理対象の報道素材データにおける勝敗経過に対応付けた当該複数種類のスコアのうちの1以上のスコアと、その関連する予め定めた関連データを時系列に示すグラフを生成し、前記ユーザーインタフェース上に提示するよう制御する機能を有することを特徴とする、請求項4から8のいずれか一項に記載の報道原稿生成装置。
  10. 請求項1から3のいずれか一項に記載の重要情報抽出装置と、
    請求項4から9のいずれか一項に記載の報道原稿生成装置と、
    を備えることを特徴とする原稿生成支援システム。
  11. コンピューターを、請求項10に記載の原稿生成支援システムとして機能させるためのプログラム。
JP2020148400A 2020-09-03 2020-09-03 重要情報抽出装置、報道原稿生成装置、原稿生成支援システム及びプログラム Active JP7564663B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020148400A JP7564663B2 (ja) 2020-09-03 2020-09-03 重要情報抽出装置、報道原稿生成装置、原稿生成支援システム及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020148400A JP7564663B2 (ja) 2020-09-03 2020-09-03 重要情報抽出装置、報道原稿生成装置、原稿生成支援システム及びプログラム

Publications (2)

Publication Number Publication Date
JP2022042802A JP2022042802A (ja) 2022-03-15
JP7564663B2 true JP7564663B2 (ja) 2024-10-09

Family

ID=80641515

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020148400A Active JP7564663B2 (ja) 2020-09-03 2020-09-03 重要情報抽出装置、報道原稿生成装置、原稿生成支援システム及びプログラム

Country Status (1)

Country Link
JP (1) JP7564663B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN120561355B (zh) * 2025-07-29 2025-09-19 苏州日报社 一种基于历史稿件的ai智能稿件创作方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001092815A (ja) 1999-09-22 2001-04-06 Nippon Hoso Kyokai <Nhk> 文生成装置および文生成プログラムを記憶したコンピュータ読み取り可能な記憶媒体
WO2004012100A1 (ja) 2002-07-26 2004-02-05 National Institute Of Information And Communications Technology Incorporated Administrative Agency コンテンツ要約装置及びコンテンツ要約プログラム
JP2005251018A (ja) 2004-03-05 2005-09-15 Ricoh Co Ltd 映像コンテンツ重要度解析システム
WO2015125209A1 (ja) 2014-02-18 2015-08-27 株式会社日立製作所 情報構造化システム及び情報構造化方法
WO2016098415A1 (ja) 2014-12-18 2016-06-23 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
JP2018195006A (ja) 2017-05-16 2018-12-06 日本放送協会 原稿自動生成装置及びプログラム
JP2019121139A (ja) 2017-12-29 2019-07-22 Airev株式会社 要約装置、要約方法、及び要約プログラム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001092815A (ja) 1999-09-22 2001-04-06 Nippon Hoso Kyokai <Nhk> 文生成装置および文生成プログラムを記憶したコンピュータ読み取り可能な記憶媒体
WO2004012100A1 (ja) 2002-07-26 2004-02-05 National Institute Of Information And Communications Technology Incorporated Administrative Agency コンテンツ要約装置及びコンテンツ要約プログラム
JP2005251018A (ja) 2004-03-05 2005-09-15 Ricoh Co Ltd 映像コンテンツ重要度解析システム
WO2015125209A1 (ja) 2014-02-18 2015-08-27 株式会社日立製作所 情報構造化システム及び情報構造化方法
WO2016098415A1 (ja) 2014-12-18 2016-06-23 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
JP2018195006A (ja) 2017-05-16 2018-12-06 日本放送協会 原稿自動生成装置及びプログラム
JP2019121139A (ja) 2017-12-29 2019-07-22 Airev株式会社 要約装置、要約方法、及び要約プログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
岡崎 直観,ロボットジャーナリズムの現状と課題,映像情報メディア学会誌,日本,一般社団法人映像情報メディア学会,2018年03月01日,第72巻,第2号,p.212-217
工藤 健太郎、外3名,第27回(2019年度)年次大会(研究報告会&総会),情報知識学会誌,日本,情報知識学会,2019年05月25日,第29巻,第2号,p.181-186

Also Published As

Publication number Publication date
JP2022042802A (ja) 2022-03-15

Similar Documents

Publication Publication Date Title
US10417500B2 (en) System and method for automatic generation of sports media highlights
Gómez et al. Effects of game location and final outcome on game-related statistics in each zone of the pitch in professional football
JP5118016B2 (ja) オーディオビジュアルプログラムの一部を選択するための方法及び装置
Aalbers et al. Distinguishing between roles of football players in play-by-play match event data
CN117256002A (zh) 用于生成人工智能驱动的见解的系统和方法
JP2024066435A5 (ja)
McGuckin et al. Determinants of successful possession in elite Gaelic football
US20250352879A1 (en) Live prediction of player performances in tennis
JP7564663B2 (ja) 重要情報抽出装置、報道原稿生成装置、原稿生成支援システム及びプログラム
Elyakim et al. Comparative analysis of game parameters between Italian league and Israeli league football matches
Liu et al. Strategy analysis in NFL using probabilistic reasoning
JP4326107B2 (ja) 問題作成装置及び記録媒体
Shanto et al. A sequential principal component-based algorithm for optimal lineup and batting order selection in one day international cricket for Bangladesh
JP2025120229A (ja) 試合記載生成装置、試合記載生成方法、及びコンピュータプログラム
JP7420246B2 (ja) 映像処理装置、映像処理方法、及び、プログラム
Shaju et al. Prediction of right bowlers for death overs in cricket
Salles et al. Operations research contributions for football teams formation: a systematic review
KR101484053B1 (ko) Mmorpg를 위한 퀘스트 서사 창작 지원 장치 및 방법
WO2021240678A1 (ja) 映像処理装置、映像処理方法、及び、記録媒体
CN111318024B (zh) 玩家标识系统和方法
KR102235538B1 (ko) 가이드 컨텐츠 제공 방법 및 장치
Bhatnagar FanCric: Multi-agentic framework for crafting fantasy 11 cricket teams
Andoh et al. Ashesi Football Management System: applied research project
KR102941710B1 (ko) 게임 분석영상 생성시스템 및 그 방법
US20250307692A1 (en) Systems and methods for generating summaries of sporting events using large language models

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230802

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240723

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240903

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240927

R150 Certificate of patent or registration of utility model

Ref document number: 7564663

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150