JP7782941B2 - 動画生成方法、装置、機器、記憶媒体及びプログラム製品 - Google Patents

動画生成方法、装置、機器、記憶媒体及びプログラム製品

Info

Publication number
JP7782941B2
JP7782941B2 JP2023578865A JP2023578865A JP7782941B2 JP 7782941 B2 JP7782941 B2 JP 7782941B2 JP 2023578865 A JP2023578865 A JP 2023578865A JP 2023578865 A JP2023578865 A JP 2023578865A JP 7782941 B2 JP7782941 B2 JP 7782941B2
Authority
JP
Japan
Prior art keywords
text
text information
information
candidate
wording
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023578865A
Other languages
English (en)
Other versions
JP2025518428A (ja
Inventor
リ,シンウェイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zitiao Network Technology Co Ltd
Original Assignee
Beijing Zitiao Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from CN202310424794.3A external-priority patent/CN118828105B/zh
Application filed by Beijing Zitiao Network Technology Co Ltd filed Critical Beijing Zitiao Network Technology Co Ltd
Publication of JP2025518428A publication Critical patent/JP2025518428A/ja
Application granted granted Critical
Publication of JP7782941B2 publication Critical patent/JP7782941B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44016Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for substituting a video clip
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7834Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/036Insert-editing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/34Indicating arrangements 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440236Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by media transcoding, e.g. video is transformed into a slideshow of still pictures, audio is converted into text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47205End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for manipulating displayed content, e.g. interacting with MPEG-4 objects, editing locally

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Television Signal Processing For Recording (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本開示は、動画処理の技術分野に関し、特に動画生成方法、装置、機器、記憶媒体およびプログラム製品に関する。
コンピュータ技術と移動通信技術の急速な発展に伴い、電子機器に基づく各種の動画プラットフォームは一般的に利用されようになり、人々の日常生活を大いに豊かにしている。動画プラットフォームで自分の動画作品を共有し、他のユーザが視聴できるようにすることを楽しむユーザが増えている。
ユーザは動画作品を共有する前に、自分で編集して動画を作成する必要がある。動画を作成する際には、例えば画像、文章、音楽など、大量な動画素材を自分で探す必要がある。素材探しに長い時間がかかり、動画作成の非効率化につながる。
上記技術的課題を解決するために、本発明の実施例は、ユーザが入力したキーワードに基づいて文章を自動的に生成し、生成された文章に基づいて動画を自動的に生成する動画生成方法、装置、機器、記憶媒体及びプログラム製品を提供し、効率的なワンストップ動画作成方案を提供し、動画作成効率を向上させる。
第1の態様において、本開示の実施例は、動画生成方法を提供する。当該動画生成方法は、
動画文言の作成要件を記述するための第1のテキスト情報を取得することと、
前記第1のテキスト情報に基づいて第2のテキスト情報を生成することであって、前記第2のテキスト情報は、前記第1のテキスト情報に記述された作成要件に合致する文言情報であることと、
前記第2のテキスト情報に基づいて得られた第3のテキスト情報に基づいてマルチメディア編集データを生成することであって、前記マルチメディア編集データは、少なくとも1つの動画トラッククリップと少なくとも1つの音声トラッククリップとを含み、前記少なくとも1つの動画トラッククリップと前記少なくとも1つの音声トラッククリップは、それぞれ第3のテキスト情報によって区画された少なくとも1つのテキストクリップに対応し、前記ターゲット音声トラッククリップは、ターゲットテキストクリップとマッチングする読み上げ音声を充填するために使用され、前記少なくとも1つの動画トラッククリップにおけるターゲット動画トラッククリップと前記ターゲット音声トラッククリップとは、動画編集タイムライン上で同じタイムライン位置を占めることと、
前記マルチメディア編集データに基づいてターゲット動画を生成することと、
を含む。
第2の態様において、本開示の実施例は、動画生成装置を提供する。当該動画生成装置は、
第1のテキスト情報を取得するための第1のテキスト情報取得モジュールであって、第3のテキスト情報に基づいてマルチメディア編集データを生成する第1のテキスト情報取得モジュールと、
前記第1のテキスト情報に基づいて第2のテキスト情報を生成するための第2のテキスト情報生成モジュールであって、前記第2のテキスト情報は、前記第1のテキスト情報に記述された作成要件に合致する文言情報である第2のテキスト情報生成モジュールと、
前記第2のテキスト情報に基づいて得られた第3のテキスト情報に基づいてマルチメディア編集データを生成するためのマルチメディア編集データ生成モジュールであって、前記マルチメディア編集データは、少なくとも1つの動画トラッククリップと少なくとも1つの音声トラッククリップとを含み、前記少なくとも1つの動画トラッククリップと前記少なくとも1つの音声トラッククリップは、それぞれ第3のテキスト情報によって区画された少なくとも1つのテキストクリップに対応し、前記ターゲット音声トラッククリップは、ターゲットテキストクリップとマッチングする読み上げ音声を充填するために使用され、前記少なくとも1つの動画トラッククリップにおけるターゲット動画トラッククリップと前記ターゲット音声トラッククリップとは、動画編集タイムライン上で同じタイムライン位置を占めるマルチメディア編集データ生成モジュールと、
前記マルチメディア編集データに基づいてターゲット動画を生成するためのターゲット動画生成モジュールと、
を備える。
第3の態様において、本開示の実施例は、電子機器を提供する。当該電子機器は、
少なくとも1つのプロセッサと、
少なくとも1つのプログラムを格納する記憶装置と、を備える。
前記少なくとも1つのプログラムが前記少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに上記第1の態様のいずれか一つに記載の動画生成方法を実現させる。
第4の態様において、本開示の実施例は、コンピュータ読み取り可能な記憶媒体を提供する。当該コンピュータ読み取り可能な記憶媒体には、コンピュータプログラムが格納されている。当該コンピュータプログラムがプロセッサによって実行される際に、上記第1の態様のいずれか一つに記載の動画生成方法が実現される。
第5の態様において、本開示の実施例は、コンピュータプログラム製品を提供する。当該コンピュータプログラム製品は、コンピュータプログラムまたは命令を含む。当該コンピュータプログラムまたは命令は、プロセッサによって実行される際に、上記第1の態様のいずれか1つに記載の動画生成方法を実現する。
本開示の実施例は、動画生成方法、装置、機器、記憶媒体及びプログラム製品を提供する。前記方法は、動画文言の作成要件を記述するための第1のテキスト情報を取得することと、前記第1のテキスト情報に基づいて第2のテキスト情報を生成することであって、前記第2のテキスト情報は、前記第1のテキスト情報に記述された作成要件に合致する文言情報であることと、前記第2のテキスト情報に基づいて得られた第3のテキスト情報に基づいてマルチメディア編集データを生成することであって、前記マルチメディア編集データは、少なくとも1つの動画トラッククリップと少なくとも1つの音声トラッククリップとを含み、前記少なくとも1つの動画トラッククリップと前記少なくとも1つの音声トラッククリップは、それぞれ第3のテキスト情報によって区画された少なくとも1つのテキストクリップに対応し、前記ターゲット音声トラッククリップは、ターゲットテキストクリップとマッチングする読み上げ音声を充填するために使用され、前記少なくとも1つの動画トラッククリップにおけるターゲット動画トラッククリップと前記ターゲット音声トラッククリップとは、動画編集タイムライン上で同じタイムライン位置を占めることと、前記マルチメディア編集データに基づいてターゲット動画を生成することと、を含む。本発明の実施例において、動画文言の作成要件に基づいて、記述された作成要件の文言情報を生成し、さらに、生成された文言情報によってターゲット動画を作成することによって、効率的なワンストップ動画作成方案を提供し、動画作成効率を向上させる。
図面に合わせて以下の具体的な実施形態を参照すると、本開示の各実施例の上記および他の特徴、利点、および態様がより明らかになるであろう。図面全体を通して、同一又は類似の符号は、同一又は類似の要素を表す。図面は模式的なものであり、原本及び要素は必ずしも比例的に描かれていないことが理解されるべきである。
本開示の実施例に係る動画生成方法のフロー模式図である。 本開示の実施例に係る動画作成ページの模式図である。 本開示の実施例に係る文言入力画面の模式図である。 本開示の実施例に係るマルチメディア編集ページの模式図である。 本開示の実施例に係る動画生成方法のフロー模式図である。 本開示の実施例に係る文言入力画面の模式図である。 本開示の実施例における文言入力画面の模式図である。 本開示の実施例における文言入力画面の模式図である。 本開示の実施例における文言入力画面の模式図である。 本発明の実施例における動画生成装置の構成模式図である。 本開示の実施例における電子機器の構成模式図である。
以下、図面を参照して、本開示の実施例についてより詳細に説明する。図面に本開示のいくつかの実施例が示されているが、本開示は様々な形態で実現されることができ、ここに記述された実施例に限定されるものとして解釈されるべきではなく、むしろ、本開示をよりはっきり且つ完全に理解するためにこれらの実施例が提供されることが理解されるべきである。本開示の図面および実施例は、例示のためにのみ使用され、本開示の保護の範囲を制限するために使用されるものではないことが理解されるべきである。
本開示の方法実施形態に記載された各ステップは、異なる順序で実行されても、および/または並行して実行されてもよいことが理解されるべきである。さらに、方法実施形態は、追加されたステップを包含しても、および/または示されたステップの実行を省略してもよい。本開示の範囲は、この点について限定されない。
本明細書で使用される「含む」という用語およびその変形は、非限定的な包含であり、すなわち「……を含むが、……に限定されない」である。「……に基づく」という用語は、「……に少なくとも部分的に基づく」である。「1つの実施例」という用語は、「少なくとも1つの実施例」を意味し、「別の実施例」という用語は、「少なくとも1つの別の実施例」を意味し、「いくつかの実施例」という用語は、「少なくともいくつかの実施例」を意味する。他の用語の関連する定義は、以下の説明で与えられる。
なお、本開示で言及されている「第1の」、「第2の」などの概念は、異なる装置、モジュール、またはユニットを区別するためにのみ使用され、これらの装置、モジュール、またはユニットによって実行される機能の順序または相互依存関係を限定するものではない。
なお、本開示で言及されている「1つ」、「複数」の修飾は、限定的ではなく模式的なものであり、文脈において別段の明示的な提示がない限り、「少なくとも1つ」と理解されるべきであることが、当業者であれば理解されるべきであろう。
本開示の実施形態における複数の装置間でやり取りするメッセージまたは情報の名称は、単に説明のために使用されるものであり、これらのメッセージまたは情報の範囲を限定するために使用されるものではない。
以下、図面を参照して、本開示の実施例について詳細に説明する。異なる図面における同じ符号は、記載された同じ素子を指すために使用されることに留意されたい。
図1は、本開示の実施例における動画生成方法のフローチャートである。本実施例は、キーワードから動画を生成する場合に適用可能である。当該方法は、動画生成装置によって実行可能である。当該動画生成装置は、ソフトウェアおよび/またはハードウェアの方式で実現可能である。当該動画生成方法は、電子機器に適用可能である。
上記の電子機器は、データ処理を実行可能な任意の他のタイプの電子機器であってもよく、携帯電話、サイト、ユニット、機器、マルチメディアコンピュータ、マルチメディアタブレット、インターネットノード、通信機、デスクトップコンピュータ、ラップトップコンピュータ、ノートパソコン、ネットブックコンピュータ、タブレットコンピュータ、パーソナル通信システム(PCS)機器、パーソナルナビゲーション機器、パーソナルデジタルアシスタント(PDA)、音声/動画プレーヤ、デジタルカメラ/動画カメラ、測位機器、テレビ受信機、ラジオ放送受信機、電子書籍機器、ゲーム機器、またはこれらの任意の組み合わせを含んでもよいがこれらに限定されず、これらの機器のアクセサリおよび周辺機器またはこれらの任意の組み合わせを含むことが理解されるであろう。
図1に示すように、本発明の実施例に係る動画生成方法は、主にステップS101~S104を含む。
S101において、動画文言の作成要件を記述するための第1のテキスト情報を取得する。
本開示の1つの実施形態において、動画文言の作成要件は、ユーザが生成したいターゲット動画のキーコンテンツであってもよい。具体的には、前記第1のテキスト情報は、動画文言を記述する1つまたは複数のキーワードであってもよいし、または1つまたは複数のトピックワードであってもよい。
1つの例示的な説明において、ユーザは「映画の推薦」に関する動画を作成したい。第1のテキスト情報には、「映画」、「2023年」、「受賞」、「好評」等が含まれてもよい。ユーザは「携帯電話のセールスポイント」に関する動画を作成したい。第1のテキスト情報には、「携帯電話のモデル」、「超大型画面」、「優れたバッテリの持ち」、「手頃な価格」等が含まれてもよい。
本開示の1つの実施形態において、第1のテキスト情報を取得することは、ユーザの入力操作に応じて、入力操作に対応する第1のテキスト情報を取得することを含む。具体的には、動画作成フロントページにテキスト作成動画コントロールが提示され、前記テキスト作成動画コントロールに対するトリガ操作に応じて、動画作成画面が表示される。図2に示すように、前記動画作成画面には、テキスト作成領域21と、動画カテゴリ選択領域22と、動画生成コントロール23とが含まれる。テキスト作成領域21には、テキスト表示領域とインテリジェントテキスト生成コントロールとが含まれている。前記テキスト表示領域は、マルチメディア編集データを生成する第3のテキスト情報を表示するためである。前記インテリジェントテキスト生成コントロールは、ユーザのトリガ操作に応じて、文言入力画面を表示するためである。
本開示の1つの実施形態において、図3に示すように、文言入力ページには、ユーザの入力操作に応じてユーザが入力したテキスト情報を表示する文言入力領域31が含まれる。
図3に示すように、文言入力領域31には、ユーザの入力操作に応じて第1のテキスト情報を取得するための入力ボックスが含まれる。
S102において、前記第1のテキスト情報に基づいて第2のテキスト情報を生成する。前記第2のテキスト情報は、前記第1のテキスト情報に記述された作成要件に合致する文言情報である。
本開示の実施例において、前記第2のテキスト情報は、作成要件に合致する文言情報を意味する。さらに、前記第2のテキスト情報は、前後のつながりを持ち、文句が通じる文章である。前記第2のテキスト情報は、1つの段落を有していてもよいし、複数の段落を有していてもよい。第2のテキスト情報は、インテリジェント文言生成アルゴリズムによって第1のテキスト情報に基づいて生成されてもよい。インテリジェント文言生成アルゴリズムの具体的な実施形態については、本開示の実施例においてこれ以上説明しない。
図3に示すように、文言入力領域31における入力ボックスに対する確認操作に応じて、第1のテキスト情報に基づいて第2のテキスト情報が生成され、生成された第2のテキスト情報が文言入力領域31に表示される。
S103において、前記第2のテキスト情報に基づいて得られた第3のテキスト情報に基づいてマルチメディア編集データを生成する。前記マルチメディア編集データは、少なくとも1つの動画トラッククリップと少なくとも1つの音声トラッククリップとを含む。前記少なくとも1つの動画トラッククリップと前記少なくとも1つの音声トラッククリップは、それぞれ前記第3のテキスト情報によって区画された少なくとも1つのテキストクリップに対応する。前記少なくとも1つの音声トラッククリップにおけるターゲット音声トラッククリップは、ターゲットテキストクリップとマッチングする読み上げ音声を充填するために使用される。前記少なくとも1つの動画トラッククリップにおけるターゲット動画トラッククリップと前記ターゲット音声トラッククリップとは、動画編集タイムライン上で同じタイムライン位置を占める。
本開示の1つの実施形態において、前記第3のテキスト情報は、1つまたは複数の第2のテキスト情報、編集された第2のテキスト情報、およびユーザによって編集された他のテキスト情報のうちの1つまたは複数の組み合わせを含んでもよい。
本開示の1つの実施形態において、ステップS101~S102を複数回実行し、複数の第2のテキスト情報を生成してもよいし、生成された第2のテキスト情報を編集変更してもよいし、文言入力領域31にテキスト情報をマニュアルで入力してもよい。
本開示の1つの実施形態において、図3に示すように、文言入力領域31における「完了」コントロールに対するトリガ操作に応じて、図2に示す動画作成画面に切り替えられ、前記動画作成画面に第3のテキスト情報が表示される。
本開示の1つの実施形態において、動画作成画面に第3のテキスト情報が表示されている場合に、動画生成コントロール23に対するトリガ操作に応じて、第3のテキスト情報に基づいてマルチメディア編集データが生成され、マルチメディア編集画面に前記マルチメディア編集データが表示される。
本開示の1つの実施形態において、前記マルチメディア編集データには、前記ターゲットテキストクリップとマッチングする字幕情報を充填するための少なくとも1つの字幕トラッククリップがさらに含まれる。
本開示の1つの実施形態において、前記マルチメディア編集データには、バックグラウンドミュージックを充填するための少なくとも1つのバックグラウンドミュージックトラッククリップがさらに含まれる。
本開示の1つの実施形態において、図4に示すように、マルチメディア編集画面には、マルチメディア編集データによって生成されたターゲット動画をプレビューするための動画プレビュー領域41と、マルチメディアトラック領域42とが含まれてもよい。マルチメディアトラック領域42に表示されるマルチメディア編集データには、動画トラッククリップと、音声トラッククリップと、バックグラウンドミュージックトラッククリップとが含まれてもよい。
本開示の1つの実施形態において、前記少なくとも1つの音声トラッククリップのターゲット音声トラッククリップは、前記ターゲットテキストクリップとマッチングする読み上げ音声を充填するために使用される。前記少なくとも1つの動画トラッククリップにおけるターゲット動画トラッククリップと前記ターゲット音声トラッククリップとは、動画編集タイムライン上で同じタイムライン位置を占める。
本開示の1つの実施形態において、前記ターゲットテキストクリップは、第3のテキスト情報によって区画された1つのテキストクリップであってもよい。当該テキストクリップは、1つの文であってもよく、言語の区切り規則に従って構成された不完全な文であってもよく、複数の文であってもよく、本開示の実施例において特に限定されるものではない。ターゲット動画トラッククリップは、ターゲットテキストクリップに対応する動画クリップを指す。ターゲット音声トラッククリップは、ターゲットテキストクリップに対応する音声クリップを指す。
なお、バックグラウンドミュージックトラッククリップにおけるバックグラウンドミュージックは、テキストクリップによって区画されず、完全な音声ファイルに充填される。
本開示の1つの実施形態において、前記ターゲット動画トラッククリップは空クリップである。
本開示の実施形態において、図2に示すように、動画作成画面における「第1の動画カテゴリ」コントロールに対するトリガ操作に応じて、マルチメディア編集データにおける動画トラッククリップを空クリップに設定する。即ち、動画トラッククリップにピクチャまたは動画画像を追加しない。
さらに、空クリップに対するユーザによる操作に応じて、ユーザによって選択されたピクチャを空クリップに追加する。言い換えれば、ユーザは、作成して完成されたターゲット動画がユーザの希望により合致するように、ユーザによって選択されたピクチャを空クリップに充填してもよい。
本開示の1つの実施形態において、前記ターゲット動画トラッククリップは、前記ターゲットテキストクリップにマッチングする動画画像を充填するために使用される。
本開示の実施形態において、図2に示すように、動画作成画面における「第2の動画カテゴリ」コントロールに対するトリガ操作に応じて、テキストクリップにマッチングする動画画像をマルチメディア編集データにおける動画トラッククリップに充填する。当該動画画像は、画像マッチングアルゴリズムに基づいて、予め設定されたピクチャデータベース内でテキストクリップのマッチングに基づいて得ることができる。
本開示の1つの実施形態において、動画画像は、テキストコンテンツに基づいてピクチャデータベース内で自動的にマッチングしてもよい。これにより、ユーザが時間をかけて素材を探すことを回避し、動画作成効率をさらに向上させる。
本開示の1つの実施形態において、前記ターゲット動画トラッククリップは、前記ターゲットテキストクリップにマッチングする表情画像を充填するために使用される。
本開示の実施形態において、図2に示すように、動画作成画面における「第3の動画カテゴリ」コントロールに対するトリガ操作に応じて、テキストクリップにマッチングする表情画像をマルチメディア編集データにおける動画トラッククリップに充填する。当該表情画像は、予め設定されたアルゴリズムに基づいて、予め設定された表情画像データベース内でテキストクリップのマッチングに基づいて得ることができる。
本開示の1つの実施形態において、表情画像は、テキストコンテンツに基づいて表情画像データベース内で自動的にマッチングしてもよい。これにより、テキストコンテンツに基づいてより個性のある動画を作成してもよい。
本開示の実施例において、表情画像データベースとピクチャデータベースを2つのデータベースに分けることにより、1つの動画内に通常のピクチャと表情画像の両方が存在することによって生じる動画スタイルの不統一の問題を避けることができる。
S104において、前記マルチメディア編集データに基づいてターゲット動画を生成する。
本開示の1つの実施例において、動画完成のトリガ操作に応じて、マルチメディア編集データに基づいてターゲット動画が生成される。
本開示の1つの実施形態において、動画「完了」のトリガ操作は、マルチメディア編集画面における「エクスポート」コントロールに対するトリガ操作を指す場合がある。エクスポート方式は、ターゲット動画をローカルに保存することであってもよいし、ターゲット動画を他の動画共有プラットフォームまたはウェブサイトに共有することであってもよい。本開示の実施例において、具体的には限定されない。
本開示の1つの実施形態において、マルチメディア編集画面における「インポートして編集」コントロールに対するトリガ操作に応じて、マルチメディア編集データを動画エディタにインポートし、マルチメディア編集データに対して後続の編集を行う。
上記の実施例に加えて、本開示の実施例は、動画生成方法をさらに最適化する。図5に示すように、最適化された動画生成方法は、主に以下のステップを含む。
S201において、動画文言の作成要件を記述するための第1のテキスト情報を取得する。
本開示の実施例に係るステップS201は、上記の実施例に係るステップS101における具体的な実行フローと同じであり、具体的には上記の実施例における記述を参照すればよいので、本開示の実施例においてその詳細を省略する。
S202において、前記第1のテキスト情報に基づいて、少なくとも1つの候補文言情報を生成する。前記少なくとも1つの候補文言情報は、いずれも前記第1のテキスト情報が示す作成要件に合致する。
本開示の1つの実施形態において、複数の文言カテゴリの中からターゲット文言カテゴリを特定する。前記候補文言情報は、前記ターゲット文言カテゴリと前記第1のテキスト情報に基づいて生成されたものである。前記第2のテキスト情報の文言カテゴリは、前記ターゲット文言カテゴリである。
本開示の1つの実施形態において、前記文言カテゴリは、形成された文言が属するカテゴリを指す。具体的には、文言カテゴリには、第1の文言カテゴリと、第2の文言カテゴリとが含まれてもよい。第1の文言カテゴリは、ユーザが各種のトピックに一般的に適用する文言カテゴリと理解してもよい。具体的には、各種のトピックとしては、科学技術、経済、娯楽等を含む。第2の文言カテゴリは、製品企画類又は製品マーケティング類に適用される文言カテゴリと理解してもよい。具体的には、ある携帯電話のセールスポイントの紹介であってもよいし、或いはあるアイテムのおすすめ理由の紹介であってもよい。
本開示の1つの実施形態において、ターゲット文言カテゴリは、ユーザの選択に基づいて決定されてもよい。それぞれのターゲット文言カテゴリは、1つのインテリジェント文言生成アルゴリズムモデルに対応する。
本開示の1つの実施形態において、前記文言入力画面には、「第1の文言カテゴリ」コントロールと、「第2の文言カテゴリ」コントロールとが含まれる。当該「第1の文言カテゴリ」コントロールは、ユーザのトリガ操作に応じて、第1の文言カテゴリコントロールに対応する文言カテゴリをターゲット文言カテゴリとする。当該「第2の文言カテゴリ」コントロールは、ユーザのトリガ操作に応じて、第2の文言カテゴリコントロールに対応する文言カテゴリをターゲット文言カテゴリとする。
図3に示すように、文言入力画面には「第1の文言カテゴリ」コントロールと「第2の文言カテゴリ」コントロールが表示されている。本開示の実施例において、異なる文言カテゴリコントロールは異なるプロンプト情報に対応し、異なる文言カテゴリコントロールは異なるインテリジェント文言生成アルゴリズムモデルに対応する。
本開示の1つの実施形態において、前記「第1の文言カテゴリ」コントロールに対する選択操作に応じて、文言入力領域31における「入力ボックス」に「第1のカテゴリの文言を1段落書きなさい。トピックは、」という提示情報が表示される。ユーザは、提示情報の後に第1のテキスト情報を挿入してもよい。「入力ボックス」に対する確認操作に応じて、第1のテキスト情報を取得し、第1の文言カテゴリと第1のテキスト情報とに基づいて、少なくとも1つの候補文言情報を生成する。
本開示の1つの実施形態において、第1の文言カテゴリと第1のテキスト情報とに基づいて、少なくとも1つの候補文言情報を生成することは、第1の文言カテゴリに基づいて第1の文言カテゴリに対応する第1のインテリジェント文言生成アルゴリズムを呼び出し、前記第1のインテリジェント文言生成アルゴリズムを利用して前記第1のテキスト情報を処理し、複数の候補文言情報を生成することを含む。
本開示の1つの実施形態において、前記「第2の文言カテゴリ」コントロールに対する選択操作に応じて、文言入力領域31における入力ボックスに「第2のカテゴリの文言を1段落書きなさい。製品とセールスポイントは、」という提示情報が表示される。ユーザは、提示情報の後に第1のテキスト情報を入力してもよい。「入力ボックス」に対する確認操作に応じて、第1のテキスト情報を取得し、第2の文言カテゴリと第1のテキスト情報とに基づいて、少なくとも1つの候補文言情報を生成する。
本開示の1つの実施形態において、第2の文言カテゴリと第1のテキスト情報とに基づいて、少なくとも1つの候補文言情報を生成することは、第2の文言カテゴリに基づいて第2の文言カテゴリに対応する第2のインテリジェント文言生成アルゴリズムを呼び出し、前記第2のインテリジェント文言生成アルゴリズムを利用して前記第1のテキスト情報を処理し、複数の候補文言情報を生成することを含む。
なお、第1のインテリジェント文言生成アルゴリズムと第2のインテリジェント文言生成アルゴリズムは、異なる2つのインテリジェント文言生成アルゴリズムである。
本開示の1つの実施形態において、上記2つのインテリジェント文言生成アルゴリズムが使用する基礎ネットワークモデルは、同一であってもよいし、異なってもよい。上記2つのインテリジェント文言生成アルゴリズムのトレーニング方法は、同一であってもよいし、異なってもよい。なお、第1のインテリジェント文言生成アルゴリズムと第2のインテリジェント文言のトレーニングサンプルは異なる。第1のインテリジェント文言生成アルゴリズムのトレーニングサンプルは、第1の文言カテゴリの文言情報である。第2のインテリジェント文言生成アルゴリズムのトレーニングサンプルは、第2の文言カテゴリの文言情報である。
S203において、ユーザによってトリガされた切替操作に応じて、文言入力画面において前記少なくとも1つの候補文言情報のうちの異なる候補文言情報を切り替えて表示する。
本開示の1つの実施形態において、文言入力画面には、候補文言情報を表示するための候補テキスト領域が含まれる。具体的には、前記候補文言領域は、挿入された形で文言入力領域31に表示される。
本開示の1つの実施形態において、前記文言入力画面には、前記候補文言領域において前記少なくとも1つの候補文言情報のうちの異なる候補文言情報が切り替えて提示されるように、前記切替操作をトリガするための文言「切替」コントロールが含まれる。
本開示の1つの実施形態において、図6に示すように、前記候補文言領域は挿入された形で文言入力領域31に表示されている。前記候補文言領域61には、「第1のテキスト切替」コントロール62と「第2のテキスト切替」コントロール63とが含まれる。
本開示の1つの実施形態において、複数の候補文言情報は設定された順序で配列されている。第1のテキスト切替コントロール62は、ユーザのトリガ操作に応じて、配列順序が現在の候補文言情報よりも前の候補文言情報を候補テキスト領域に表示するために使用される。第2のテキスト切替コントロール63は、ユーザのトリガ操作に応じて、列順序が現在の候補文言情報よりも配後の候補文言情報を候補テキスト領域に表示するために使用される。
本開示の1つの実施形態において、候補文言情報が5つあることを例に説明する。5つの候補文言情報は、順に候補文言情報A、候補文言情報B、候補文言情報C、候補文言情報D、候補文言情報Eである。候補文言領域には、表示順位が最上位となる文言候補情報Aが表示される。第2のテキスト切替コントロール63に対するトリガ操作に応じて、候補文言領域に候補文言情報Bが表示される。このとき、第1のテキスト切替コントロール62に対するトリガ操作に応じて、候補文言領域に候補文言情報Aが表示される。
S204において、ユーザによってトリガされた確認操作に応じて、前記少なくとも1つの候補文言情報のうち、切り替えられて前記文言入力画面に表示される候補文言情報を前記第2のテキスト情報として決定する。
本開示の1つの実施形態において、前記文言入力画面には、文言確認コントロールが含まれる。前記文言確認コントロールは、前記す少なくとも1つの候補文言情報のうち、切り替えられて前記候補文言領域に表示される候補文言情報を前記第2のテキスト情報として決定され、前記文言入力領域に前記第2のテキスト情報が表示されるように、前記確認操作をトリガするために用いられる。
本開示の1つの実施形態において、図6に示すように、候補文言領域61には、文言確認コントロールが含まれている。前記文言確認コントロールに対するトリガ操作に応じて、前記候補文言領域に表示されている候補文言情報は、前記第2のテキスト情報として決定され、前記文言入力領域31において前記第2のテキスト情報が表示される。
本開示の1つの実施形態において、前記少なくとも1つの候補文言情報が生成された後、前記候補文言領域に表示されている候補文言情報が、前記文言入力領域におけるユーザ入力位置に挿入される。前記確認操作が応答された場合に、前記候補文言領域は前記文言入力領域内から削除される。
本開示の1つの実施形態において、図6に示すように、候補文言領域61に表示されている候補文言情報(AAAAA)は、前記文言入力領域31におけるユーザ入力位置に挿入される。前記ユーザ入力位置は、候補文言情報が生成される前にカーソルがあった位置である。さらに、前記文言確認コントロールに対するユーザによるトリガ操作に応じて、候補文言領域は削除される。
本開示の1つの実施形態において、図7aに示すように、前記少なくとも1つの候補文言情報が生成される前に前記文言入力領域内に他のテキスト情報が存在しなかった場合に、前記第2のテキスト情報が決定された後に、前記文言入力領域31に前記第2のテキスト情報が表示され、候補文言領域61が削除される。
S205において、第2のテキスト情報に基づいて第3のテキストを生成する。
本開示の1つの実施形態において、前記少なくとも1つの候補文言情報が生成される前に前記文言入力領域内に第4のテキスト情報が表示されている場合に、前記第2のテキスト情報が決定された後に、前記文言入力領域において前記第2のテキスト情報と前記第4のテキスト情報とが融合した第5のテキスト情報が表示される。
本開示の実施例において、第4のテキスト情報は、ユーザが手動で入力したテキスト情報であってもよいし、ステップS201~S204で決定された第2のテキスト情報であってもよいし、ユーザが編集・変更したテキスト情報であってもよい。
本発明の実施例において、図7bに示すように、前記少なくとも1つの候補文言情報が生成される前に前記文言入力領域31内に第4のテキスト情報(#######)が表示されており、且つユーザ入力位置が第4のテキスト情報の末尾にある場合に、候補文言領域61が第4のテキスト情報の末尾に表示される。文言確認コントロールに対するユーザによるトリガ操作に応じて、候補文言領域が削除され、前記第2のテキスト情報(AAAAAA)が前記第4のテキスト情報(#######)の末尾につなぎ合わされることにより、図7bに示すように、第5のテキスト情報(#######AAAAAA)が形成される。図7bにおいて、ユーザ入力位置が第4のテキスト情報の末尾にある場合を例に説明する。
本開示の1つの実施形態において、前記ユーザ入力位置が前記第4のテキスト情報の中間位置にある場合に、前記文言入力領域において前記第4のテキスト情報が前記候補文言領域によって前記中間位置から切り分けられて前記候補文言領域の両側に表示される。前記第5のテキスト情報における前記第2のテキスト情報が前記第4のテキスト情報の中間位置に挿入される。
本開示の実施例において、図7cに示すように、前記少なくとも1つの候補文言情報が生成される前に前記文言入力領域31内に第4のテキスト情報(#######)が表示されており、且つユーザ入力位置が第4のテキスト情報の中間位置にある場合に、候補文言領域61が文言入力領域31における第4のテキスト情報をユーザ入力位置から切り分け、切り分けられた2つの部分の第4のテキスト情報を、候補文言領域61の両側にそれぞれ表示する。さらに、文言確認コントロールに対するユーザによるトリガ操作に応じて、候補文言領域が削除され、前記第2のテキスト情報(AAAAAA)が前記第4のテキスト情報(#######)の中間位置に挿入され、図7cに示すように、第5のテキスト情報(###AAAAAA####)が形成される。図7cにおいて、ユーザ入力位置が第4のテキスト情報の中間位置にある場合を例に説明する。
本開示の1つの実施形態において、ユーザの入力操作に応じて、前記第5のテキスト情報を編集して、前記第3のテキスト情報を得ることをさらに含む。
本開示の1つの実施形態において、図7a、7b、7cに示すように、文言入力領域31においてインテリジェント文言生成コントロールが含まれている。当該インテリジェント文言生成コントロールに対するトリガ操作に応じて、確認済みテキスト情報を含む図3に示すようなページが表示される。図3に示すような文言編集画面に対する操作に応じて、新たな第2のテキスト情報の生成が開始される。
本開示の1つの実施形態において、文言入力領域31に対するユーザの編集操作に応じて、第5のテキスト情報を編集し、第3のテキスト情報を得る。前記編集には、入力、削除、コピー、貼り付けなどの操作が含まれる。
本開示の1つの実施形態において、文言入力領域31における「完了」コントロールに対するトリガ操作に応じて、文言入力画面が閉じられ、(図2に示すように)第3のテキスト情報がテキスト作成領域21において表示される。
S206において、第3のテキスト情報に基づいてマルチメディア編集データを生成する。
S207において、前記マルチメディア編集データに基づいてターゲット動画を生成する。
本開示の実施例に係るステップS206~S207は、上記の実施例に係るステップS103~S104における具体的な実行フローと同じであるため、具体的には上記の実施例における記述を参照すればよいので、本開示の実施例においてその詳細を省略する。
図8は、本開示の実施例における動画生成装置の構成模式図である。本実施例は、入力テキストから動画を生成する場合に適用可能である。当該動画生成装置は、ソフトウェアおよび/またはハードウェアの方式で実現可能である。
図8に示すように、本開示の実施例に係る動画生成装置80は、主に、第1のテキスト情報取得モジュール81と、第2のテキスト情報生成モジュール82と、マルチメディア編集データ生成モジュール83と、ターゲット動画生成モジュール84とを備える。
第1のテキスト情報取得モジュール81は、第1のテキスト情報を取得するために使用される。第3のテキスト情報に基づいてマルチメディア編集データを生成する。第2のテキスト情報生成モジュール82は、前記第1のテキスト情報に基づいて第2のテキスト情報を生成するために使用される。前記第2のテキスト情報は、前記第1のテキスト情報に記述された作成要件に合致する文言情報である。マルチメディア編集データ生成モジュール83は、前記第2のテキスト情報に基づいて得られた第3のテキスト情報に基づいてマルチメディア編集データを生成するために使用される。前記マルチメディア編集データは、少なくとも1つの動画トラッククリップと少なくとも1つの音声トラッククリップとを含む。前記少なくとも1つの動画トラッククリップと前記少なくとも1つの音声トラッククリップとは、それぞれ第3のテキスト情報によって区画された少なくとも1つのテキストクリップに対応する。前記ターゲット音声トラッククリップは、ターゲットテキストクリップとマッチングする読み上げ音声を充填するために使用される。前記少なくとも1つの動画トラッククリップにおけるターゲット動画トラッククリップと前記ターゲット音声トラッククリップとは、動画編集タイムライン上で同じタイムライン位置を占める。ターゲット動画生成モジュール84は、前記マルチメディア編集データに基づいてターゲット動画を生成するために使用される。
本開示の1つの実施形態において、第2のテキスト情報生成モジュール82は、候補文言情報生成ユニットと、候補文言情報切替ユニットと、候補文言情報確認ユニットとを備える。当該候補文言情報生成ユニットは、前記第1のテキスト情報に基づいて、少なくとも1つの候補文言情報を生成するために用いられる。前記少なくとも1つの候補文言情報は、いずれも前記第1のテキスト情報が示す作成要件に合致する。当該候補文言情報切替ユニットは、ユーザによってトリガされた切替操作に応じて、文言入力画面において前記少なくとも1つの候補文言情報のうちの異なる候補文言情報を切り替えて表示するために用いられる。当該候補文言情報確認ユニットは、ユーザによってトリガされた確認操作に応じて、前記少なくとも1つの候補文言情報のうち、切り替えられて前記文言入力画面に表示される候補文言情報を前記第2のテキスト情報として決定する。
本開示の1つの実施形態において、前記文言入力画面には、文言入力領域と候補文言領域とが含まれている。前記文言入力画面には、文言切替コントロールが含まれている。前記文言切替コントロールは、前記候補文言領域において前記少なくとも1つの候補文言情報のうちの異なる候補文言情報が切り替えて表示されるように、前記切替操作をトリガするために用いられる。前記文言入力画面には、文言確認コントロールが含まれる。前記文言確認コントロールは、前記候補文言領域において提示されている候補文言情報を前記第2のテキスト情報として決定されて、前記文言入力領域において前記第2のテキスト情報が表示されるように、前記確認操作をトリガするために用いられる。
本開示の1つの実施形態において、前記少なくとも1つの候補文言情報が生成された後、前記候補文言領域に表示されている候補文言情報が、前記文言入力領域におけるユーザ入力位置に挿入される。前記確認操作が応答された場合に、前記候補文言領域は前記文言入力領域内から削除される。
本開示の1つの実施形態において、前記少なくとも1つの候補文言情報が生成される前に前記文言入力領域内に第4のテキスト情報が表示されている場合に、前記第2のテキスト情報が決定された後に、前記文言入力領域において前記第2のテキスト情報と前記第4のテキスト情報とが融合した第5のテキスト情報が表示される。
本開示の1つの実施形態において、前記ユーザ入力位置が前記第4のテキスト情報の中間位置にある場合に、前記文言入力領域において前記第4のテキスト情報が前記候補文言領域によって前記中間位置から切り分けられて前記候補文言領域の両側に表示され、前記第5のテキスト情報における前記第2のテキスト情報が前記第4のテキスト情報の中間位置に挿入される。
本開示の1つの実施形態において、ユーザの入力操作に応じて、前記第5のテキスト情報を編集し、前記第3のテキスト情報を得る。
本開示の1つの実施形態において、前記装置は、ターゲット文言カテゴリ決定モジュールをさらに備える。ターゲット文言カテゴリ決定モジュールは、複数の文言カテゴリの中からターゲット文言カテゴリを特定するために用いられる。前記候補文言情報は、前記ターゲット文言カテゴリと前記第1のテキスト情報とに基づいて生成されるものである。前記第2のテキスト情報の文言カテゴリは、前記ターゲット文言カテゴリである。
本開示の1つの実施形態において、前記文言入力画面には、第1の文言カテゴリコントロールと、第2の文言カテゴリコントロールとが含まれている。前記第1の文言カテゴリコントロールは、ユーザによるトリガ操作に応じて、第1の文言カテゴリコントロールに対応する文言カテゴリをターゲット文言カテゴリとすることに用いられる。前記第2の文言カテゴリコントロールは、ユーザによるトリガ操作に応じて、第2の文言カテゴリコントロールに対応する文言カテゴリをターゲット文言カテゴリとすることに用いられる。
本開示の1つの実施形態において、前記ターゲット動画トラッククリップは空クリップである。あるいは、前記ターゲット動画トラッククリップは、前記ターゲットテキストクリップにマッチングする動画画像を充填するために使用される。あるいは、前記ターゲット動画トラッククリップは、前記ターゲットテキストクリップにマッチングする表情画像を充填するために使用される。
本開示の実施例に係る動画生成装置は、本開示の方法実施例に係る動画生成方法において実行されるステップを実行することができ、実行ステップおよび有益な効果を備え、ここでその説明を省く。
図9は本開示の実施例における電子機器の構成模式図である。以下では、本開示の実施例における電子機器900を実現するのに適した構成模式図を示した図9を具体的に参照する。本開示の実施例における電子機器900は、例えば携帯電話、ノートパソコン、デジタル放送受信機、PDA(Personal Digital Assistant)、PAD(タブレット)、PMP(Portable Multimedia Player)、車載端末(例えばカーナビゲーション端末)、ウェアラブル端末機器等の携帯端末、および例えばデジタルTV、デスクトップコンピュータ、インテリジェントホーム機器等の固定端末を含んでもよいが、これらに限定されるものではない。図9に示す電子機器は一例にすぎず、本開示の実施例の機能および使用範囲に制限を与えるものではない。
図9に示すように、電子機器900は、読み取り専用メモリ(ROM)902に記憶されたプログラム、または記憶装置908からランダムアクセスメモリ(RAM)903にロードされたプログラムに従って、様々な適切な動作および処理を実行して、本開示に記載された実施例のピクチャレンダリング方法を実現することができる処理装置(例えば、CPU、グラフィックスプロセッサなど)901を含んでもよい。RAM 903には、端末機器900の操作に必要な各種のプログラムやデータも格納されている。処理装置901、ROM 902およびRAM 903は、バス904を介して互いに接続されている。入出力(I/O)インターフェース905もバス904に接続されている。
通常、例えばタッチスクリーン、タッチパッド、キーボード、マウス、カメラ、マイクロフォン、加速度計、ジャイロスコープなどを含む入力装置906と、例えば液晶ディスプレイ(LCD)、スピーカ、バイブレータ等を含む出力装置907と、例えば磁気テープ、ハードディスク等を含む記憶装置908と、通信装置909とは、I/Oインターフェース905に接続されてもよい。通信装置909は、データを交換するために端末機器900が他の機器と無線または有線で通信することを許容してもよい。図9は、様々な装置を有する端末機器900を示すが、示されている装置の全てを実施または備えることは必ずしも必要ではないことが理解されるべきである。より多くのまたはより少ない装置を代替的に実施し、または備えてもよい。
特に、本開示の実施例によれば、フローチャートを参照して上述したプロセスは、コンピュータソフトウェアプログラムとして実現されてもよい。例えば、本開示の実施例は、フローチャートに示される方法を実行するためのプログラムコードを含む、非一時的なコンピュータ読み取り可能な媒体に搭載されたコンピュータプログラムを含むコンピュータプログラム製品を含み、よって、上記のような動画生成方法を実現する。このような実施例において、当該コンピュータプログラムは、通信装置909によってネットワークからダウンロードされてインストールされてもよいし、記憶装置908からインストールされてもよいし、ROM 902からインストールされてもよい。当該コンピュータプログラムが処理装置901によって実行される際に、本開示の実施例に係る方法に限定される上記機能が実行される。
なお、本開示における上記のコンピュータ読み取り可能な媒体は、コンピュータ読み取り可能な信号媒体またはコンピュータ読み取り可能な記憶媒体、または上記両方の任意の組み合わせであってもよい。コンピュータ読み取り可能な記憶媒体は、例えば、電気、磁気、光、電磁、赤外線、または半導体のシステム、装置、またはデバイス、または上記の任意の組み合わせであってもよいが、これらに限定されるものではない。コンピュータ読み取り可能な記憶媒体のより具体的な例は、少なくとも1つのワイヤを有する電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能プログラム可能読み取り専用メモリ(EPROMまたはフラッシュメモリ)、光ファイバ、ポータブルコンパクトディスク読み取り専用メモリ(CD-ROM)、光学メモリデバイス、磁気メモリデバイス、または上記の任意の適切な組み合わせを含んでもよいが、これらに限定されるものではない。本開示において、コンピュータ読み取り可能な記憶媒体は、命令実行システム、装置、またはデバイスによって、またはそれらと組み合わせて使用されることができるプログラムを含むまたは格納する任意の有形媒体であってもよい。本開示において、コンピュータ読み取り可能な信号媒体は、コンピュータ読み取り可能なプログラムコードが搭載される、ベースバンドにおいて伝播されるまたは搬送波の一部として伝播されるデータ信号を含んでもよい。このような伝播されるデータ信号は、様々な形態をとってもよく、電磁信号、光信号、または上記の任意の適切な組み合わせを含むが、これらに限定されるものではない。また、コンピュータ読み取り可能な信号媒体は、命令実行システム、装置、またはデバイスによって、またはそれらと組み合わせて使用されるためのプログラムを送信、伝播、または伝送することができるコンピュータ読み取り可能な記憶媒体以外の任意のコンピュータ読み取り可能な媒体であってもよい。コンピュータ読み取り可能な媒体に含まれるプログラムコードは、任意の適切な媒体で伝送されてもよく、ワイヤ、光ケーブル、RF(無線周波数)など、または上記の任意の適切な組み合わせを含むが、これらに限定されるものではない。
いくつかの実施形態において、クライアントやサーバーは、HTTP(Hyper Text Transfer Protocol、ハイパーテキスト伝送プロトコル)などの現在知られているまたは将来研究開発される任意のネットワークプロトコルを利用して通信することができるとともに、任意の形式または媒体のデジタルデータ通信(例えば、通信ネットワーク)と互いに接続することができる。通信ネットワークの例は、ローカルエリアネットワーク(「LAN」)、ワイドエリアネットワーク(「WAN」)、エキストラネット(例えば、インターネット)、エンドツーエンドネットワーク(例えば、アドホックエンドツーエンドネットワーク)、および現在知られているまたは将来研究開発されるネットワークなどを含む。
上記コンピュータ読み取り可能な媒体は、上記電子機器に含まれるものであってもよいし、当該電子機器に組み込まれていない別個に存在されるものであってもよい。
上記コンピュータ読み取り可能な媒体は、1つまたは複数のプログラムを搭載し、上記1つまたは複数のプログラムが当該端末機器によって実行される際に、当該端末機器に、動画文言の作成要件を記述するための第1のテキスト情報を取得することと、前記第1のテキスト情報に基づいて第2のテキスト情報を生成することであって、前記第2のテキスト情報は、前記第1のテキスト情報に記述された作成要件に合致する文言情報であることと、前記第2のテキスト情報に基づいて得られた第3のテキスト情報に基づいてマルチメディア編集データを生成することであって、前記マルチメディア編集データは、少なくとも1つの動画トラッククリップと少なくとも1つの音声トラッククリップとを含み、前記少なくとも1つの動画トラッククリップと前記少なくとも1つの音声トラッククリップとは、それぞれ第3のテキスト情報によって区画された少なくとも1つのテキストクリップに対応し、前記少なくとも1つの音声トラッククリップにおけるターゲット音声トラッククリップは、ターゲットテキストクリップとマッチングする読み上げ音声を充填するために使用され、前記少なくとも1つの動画トラッククリップにおけるターゲット動画トラッククリップと前記ターゲット音声トラッククリップとは、動画編集タイムライン上で同じタイムライン位置を占めることと、前記マルチメディア編集データに基づいてターゲット動画を生成することと、を実行させる。上記1つまたは複数のプログラムが当該端末機器によって実行される際に、当該端末機器は、上記実施例に記載された他のステップを実行してもよい。
本開示の操作を実行するためのコンピュータプログラムコードは、1つまたは複数のプログラミング言語、またはこれらの組み合わせで書かれてもよい。上記プログラミング言語は、Java、Smalltalk、C++などのオブジェクト指向プログラミング言語を含むが、これらに限定されるものではなく、「C」言語または類似のプログラミング言語など、従来の手続き型プログラミング言語も含む。プログラムコードは、完全にユーザコンピュータで実行されてもよいし、部分的にユーザコンピュータで実行されてもよいし、独立したソフトウェアパッケージとして実行されてもよいし、一部がユーザコンピュータで一部がリモートコンピュータで実行されてもよいし、または完全にリモートコンピュータまたはサーバーで実行されてもよい。リモートコンピュータが関与する場合、リモートコンピュータは、ローカルエリアネットワーク(LAN)またはワイドエリアネットワーク(WAN)を含む任意の種類のネットワークを介してユーザコンピュータに接続されてもよいし、または外部コンピュータに接続されてもよい(例えばインターネットを介してインターネットサービスプロバイダを利用して接続される)。
図面におけるフローチャートおよびブロック図は、本開示の様々な実施例におけるシステム、方法、およびコンピュータプログラム製品に従って実現可能なアーキテクチャ、機能、および操作を図示する。この点について、フローチャートまたはブロック図における各ブロックは、所定のロジック機能を実現するための少なくとも1つの実行可能命令を含む1つのモジュール、プログラムセグメント、またはコードの一部を表してもよい。置換としてのいくつかの実現において、ブロック内に表記された機能は、図面に示されたものとは異なる順序で発生することもあることにも留意されたい。例えば、連続的に表示された2つのブロックは、実際には実質的に並列に実行されてもよく、関与する機能に応じて逆の順序で実行されてもよい場合がある。ブロック図および/またはフローチャートにおける各ブロック、ならびにブロック図および/またはフローチャートにおけるブロックの組み合わせは、所定の機能または操作を実行するハードウェアベースの専用システムで実現されてもよいし、または専用ハードウェアとコンピュータ命令との組み合わせで実現されてもよいことにも留意されたい。
説明された本開示の実施例に係るユニットは、ソフトウェアで実現されてもよいし、ハードウェアで実現されてもよい。ユニットの名称は、ある場合には当該ユニット自身に対する限定にならない。
本明細書において上で説明された機能は、少なくとも部分的に、少なくとも1つのハードウェアロジック部品によって実行されてもよい。例えば、非限定的に、使用され得る例示的なタイプのハードウェアロジック部品は、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、特定用途向け標準製品(ASSP)、システムオンチップ(SOC)、複雑プログラマブルロジックデバイス(CPLD)などを含む。
本開示の文脈において、機械読み取り可能な媒体は、命令実行システム、装置、またはデバイスによって使用される、または命令実行システム、装置、またはデバイスと組み合わせて使用されるプログラムを含むまたは格納することができる有形媒体であってもよい。機械読み取り可能な媒体は、機械読み取り可能な信号媒体または機械読み取り可能な記憶媒体であってもよい。機械読み取り可能な媒体は、電子的、磁気的、光学的、電磁的、赤外線的、または半導体システム、装置またはデバイス、または上記の内容の任意の適切な組み合わせを含んでもよいが、これらに限定されるものではない。機械読み取り可能な記憶媒体のより具体的な例は、少なくとも1つのワイヤに基づく電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能プログラム可能読み取り専用メモリ(EPROMまたはフラッシュメモリ)、光ファイバ、ポータブルコンパクトディスク読み取り専用メモリ(CD-ROM)、光学記憶機器、磁気記憶機器、または上記の内容の任意の適切な組み合わせを含む。
以上の説明は、本開示のより良い実施例および適用される技術原理に対する説明にすぎない。当業者は、本開示に係る開示の範囲は、上記の技術的特徴の特定の組み合わせからなる技術案に限定されるものではなく、上記の開示の発想から逸脱することなく、上記の技術的特徴又はその均等な特徴の任意の組み合わせからなる他の技術案も包含すべきであることを理解するであろう。例えば、上記の特徴と本開示で開示されたもの(ただし、それに限定されるものではない)に類似する機能を有する技術的特徴とを互いに置き換えて形成された技術案である。
また、各操作は特定の順序で描かれたが、これらの操作が示されている特定の順序で実行されるか、または順次実行されることを要求するものとして理解されるべきではない。ある環境において、マルチタスクや並列処理が有利になる場合がある。同様に、いくつかの具体的な実施の詳細が上記の論述に含まれているが、これらは本開示の範囲を制限するものとして解釈されるべきではない。個別の実施例の文脈で説明されたいくつかの特徴は、単一の実施例において組み合わせて実現されてもよい。逆に、単一の実施例の文脈で説明された様々な特徴は、複数の実施例において個別に、または任意の適切なサブ組み合わせで実現されてもよい。
本主題は、構造的特徴および/または方法的・論理的動作に固有の言語で説明されているが、添付した特許請求の範囲において限定される主題は、以上で説明された特定の特徴または動作に必ずしも限定されないことが理解されるべきである。逆に、以上で説明された特定の特徴および動作は、特許請求の範囲を実現する例示的な形態にすぎない。

Claims (14)

  1. 動画文言の作成要件を記述するための第1のテキスト情報を取得することと、
    前記第1のテキスト情報に基づいて第2のテキスト情報を生成することであって、前記第2のテキスト情報は、前記第1のテキスト情報に記述された作成要件に合致する文言情報であることと、
    前記第2のテキスト情報に基づいて得られた第3のテキスト情報に基づいてマルチメディア編集データを生成することであって、前記マルチメディア編集データは、少なくとも1つの動画トラッククリップと少なくとも1つの音声トラッククリップとを含み、前記少なくとも1つの動画トラッククリップと前記少なくとも1つの音声トラッククリップとは、それぞれ第3のテキスト情報によって区画された少なくとも1つのテキストクリップに対応し、前記少なくとも1つの音声トラッククリップにおけるターゲット音声トラッククリップは、ターゲットテキストクリップとマッチングする読み上げ音声を充填するために使用され、前記少なくとも1つの動画トラッククリップにおけるターゲット動画トラッククリップと前記ターゲット音声トラッククリップとは、動画編集タイムライン上で同じタイムライン位置を占めることと、
    前記マルチメディア編集データに基づいてターゲット動画を生成することと、
    を含む、ことを特徴とする動画生成方法。
  2. 前記第1のテキスト情報に基づいて第2のテキスト情報を生成することは、
    前記第1のテキスト情報に基づいて、少なくとも1つの候補文言情報を生成することであって、前記少なくとも1つの候補文言情報は、いずれも前記第1のテキスト情報が示す作成要件に合致することと、
    ユーザによってトリガされた切替操作に応じて、文言入力画面において前記少なくとも1つの候補文言情報のうちの異なる候補文言情報を切り替えて表示することと、
    ユーザによってトリガされた確認操作に応じて、前記少なくとも1つの候補文言情報のうち、切り替えられて前記文言入力画面に表示される候補文言情報を前記第2のテキスト情報として決定することと、
    を含む、ことを特徴とする請求項1に記載の方法。
  3. 前記文言入力画面には、文言入力領域と候補文言領域とが含まれ、
    前記文言入力画面には、文言切替コントロールが含まれ、前記文言切替コントロールは、前記候補文言領域において前記少なくとも1つの候補文言情報のうちの異なる候補文言情報が切り替えて表示されるように、前記切替操作をトリガするために用いられ、
    前記文言入力画面には、文言確認コントロールが含まれ、前記文言確認コントロールは、前記候補文言領域において表示されている候補文言情報を前記第2のテキスト情報として決定しされ、前記文言入力領域において前記第2のテキスト情報が表示されるように、前記確認操作をトリガするために用いられる、
    ことを特徴とする請求項2に記載の方法。
  4. 前記少なくとも1つの候補文言情報が生成された後、前記候補文言領域に表示されている候補文言情報が、前記文言入力領域におけるユーザ入力位置に挿入され、
    前記確認操作が応答された場合に、前記候補文言領域は前記文言入力領域内から削除される、
    ことを特徴とする請求項3に記載の方法。
  5. 前記少なくとも1つの候補文言情報が生成される前に前記文言入力領域内において第4のテキスト情報が表示されている場合に、前記第2のテキスト情報が決定された後に、前記文言入力領域において前記第2のテキスト情報と前記第4のテキスト情報とが融合した第5のテキスト情報が表示される、
    ことを特徴とする請求項4に記載の方法。
  6. 前記ユーザ入力位置が前記第4のテキスト情報の中間位置にある場合に、前記文言入力領域において前記第4のテキスト情報が前記候補文言領域によって前記中間位置から切り分けられて前記候補文言領域の両側に表示され、前記第5のテキスト情報における前記第2のテキスト情報が前記第4のテキスト情報の中間位置に挿入される、
    ことを特徴とする請求項5に記載の方法。
  7. ユーザの入力操作に応じて、前記第5のテキスト情報を編集し、前記第3のテキスト情報を得ることをさらに含む、
    ことを特徴とする請求項5に記載の方法。
  8. 複数の文言カテゴリの中からターゲット文言カテゴリを特定することであって、前記候補文言情報は、前記ターゲット文言カテゴリと前記第1のテキスト情報とに基づいて生成されたものであり、前記第2のテキスト情報の文言カテゴリは、前記ターゲット文言カテゴリであることをさらに含む、
    ことを特徴とする請求項2に記載の方法。
  9. 前記文言入力画面には、第1の文言カテゴリコントロールと、第2の文言カテゴリコントロールとが含まれ、前記第1の文言カテゴリコントロールは、ユーザのトリガ操作に応じて、第1の文言カテゴリコントロールに対応する文言カテゴリをターゲット文言カテゴリとすることに用いられ、前記第2の文言カテゴリコントロールは、ユーザのトリガ操作に応じて、第2の文言カテゴリコントロールに対応する文言カテゴリをターゲット文言カテゴリとすることに用いられる、
    ことを特徴とする請求項8に記載の方法。
  10. 前記ターゲット動画トラッククリップは空クリップである、あるいは、
    前記ターゲット動画トラッククリップは、前記ターゲットテキストクリップにマッチングする動画画像を充填するために使用される、あるいは
    前記ターゲット動画トラッククリップは、前記ターゲットテキストクリップにマッチングする表情画像を充填するために使用される、
    ことを特徴とする請求項1に記載の方法。
  11. 動画文言の作成要件を記述するための第1のテキスト情報を取得するための第1のテキスト情報取得モジュールと、
    前記第1のテキスト情報に基づいて第2のテキスト情報を生成するための第2のテキスト情報生成モジュールであって、前記第2のテキスト情報は、前記第1のテキスト情報に記述された作成要件に合致する文言情報である第2のテキスト情報生成モジュールと、
    前記第2のテキスト情報に基づいて得られた第3のテキスト情報に基づいてマルチメディア編集データを生成するためのマルチメディア編集データ生成モジュールであって、前記マルチメディア編集データは、少なくとも1つの動画トラッククリップと少なくとも1つの音声トラッククリップとを含み、前記少なくとも1つの動画トラッククリップと前記少なくとも1つの音声トラッククリップとは、それぞれ第3のテキスト情報によって区画された少なくとも1つのテキストクリップに対応し、前記少なくとも1つの音声トラッククリップにおけるターゲット音声トラッククリップは、ターゲットテキストクリップとマッチングする読み上げ音声を充填するために使用され、前記少なくとも1つの動画トラッククリップにおけるターゲット動画トラッククリップと前記ターゲット音声トラッククリップとは、動画編集タイムライン上で同じタイムライン位置を占めるマルチメディア編集データ生成モジュールと、
    前記マルチメディア編集データに基づいてターゲット動画を生成するためのターゲット動画生成モジュールと、
    を備える、ことを特徴とする動画生成装置。
  12. 少なくとも1つのプロセッサと、
    少なくとも1つのプログラムを格納する記憶装置と、を備え、
    前記少なくとも1つのプログラムが前記少なくとも1つのプロセッサによって実行されるとき、前記少なくとも1つのプロセッサに請求項1~10のいずれか一項に記載の方法を実現させる、
    ことを特徴とする電子機器。
  13. コンピュータプログラムが格納されているコンピュータ読み取り可能な記憶媒体であって、当該コンピュータプログラムがプロセッサによって実行される際に、請求項1~10のいずれか一項に記載の方法を実現する、
    コンピュータ読み取り可能な記憶媒体。
  14. プロセッサによって実行されるとき、請求項1~10のいずれか1項に記載の方法を実現する、
    ことを特徴とするコンピュータプログラム。
JP2023578865A 2023-04-19 2023-12-12 動画生成方法、装置、機器、記憶媒体及びプログラム製品 Active JP7782941B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202310424794.3A CN118828105B (zh) 2023-04-19 2023-04-19 视频生成方法、装置、设备、存储介质和程序产品
CN202310424794.3 2023-04-19
PCT/CN2023/138056 WO2024217011A1 (zh) 2023-04-19 2023-12-12 视频生成方法、装置、设备、存储介质和程序产品

Publications (2)

Publication Number Publication Date
JP2025518428A JP2025518428A (ja) 2025-06-17
JP7782941B2 true JP7782941B2 (ja) 2025-12-09

Family

ID=93121786

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023578865A Active JP7782941B2 (ja) 2023-04-19 2023-12-12 動画生成方法、装置、機器、記憶媒体及びプログラム製品

Country Status (4)

Country Link
US (2) US12148451B2 (ja)
EP (1) EP4472214A4 (ja)
JP (1) JP7782941B2 (ja)
KR (1) KR20250117699A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114513706A (zh) 2022-03-22 2022-05-17 中国平安人寿保险股份有限公司 视频生成方法和装置、计算机设备、存储介质

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120177345A1 (en) * 2011-01-09 2012-07-12 Matthew Joe Trainer Automated Video Creation Techniques
US9049259B2 (en) * 2011-05-03 2015-06-02 Onepatont Software Limited System and method for dynamically providing visual action or activity news feed
US10467918B1 (en) * 2013-03-15 2019-11-05 Study Social, Inc. Award incentives for facilitating collaborative, social online education
US11291920B2 (en) * 2013-05-22 2022-04-05 David S. Thompson Interaction interleaver
US9361714B2 (en) * 2013-08-05 2016-06-07 Globalfoundries Inc. Enhanced video description
US20150371426A1 (en) * 2014-06-20 2015-12-24 Joshua Levy Motion covers
TWI616868B (zh) * 2014-12-30 2018-03-01 Hon Hai Precision Industry Co., Ltd. 會議記錄裝置及其自動生成會議記錄的方法
US9646655B2 (en) * 2015-08-31 2017-05-09 Fuji Xerox Co., Ltd. Systems and methods for interaction-based analysis and visualization of remote collaboration sessions
US11287653B2 (en) * 2015-09-09 2022-03-29 Vantrix Corporation Method and system for selective content processing based on a panoramic camera and a virtual-reality headset
US12063380B2 (en) * 2015-09-09 2024-08-13 Vantrix Corporation Method and system for panoramic multimedia streaming enabling view-region selection
US10431216B1 (en) * 2016-12-29 2019-10-01 Amazon Technologies, Inc. Enhanced graphical user interface for voice communications
US10629223B2 (en) * 2017-05-31 2020-04-21 International Business Machines Corporation Fast playback in media files with reduced impact to speech quality
KR101968599B1 (ko) 2017-11-14 2019-04-15 한성호 입력 텍스트에 따른 스토리 동영상 생성방법 및 장치
US10867610B2 (en) * 2018-05-04 2020-12-15 Microsoft Technology Licensing, Llc Computerized intelligent assistant for conferences
CN112291614A (zh) 2019-07-25 2021-01-29 北京搜狗科技发展有限公司 一种视频生成方法及装置
CN114120992B (zh) 2020-09-01 2025-01-07 抖音视界有限公司 语音生成视频的方法、装置、电子设备及计算机可读介质
CN112232067B (zh) 2020-11-03 2024-09-27 汉海信息技术(上海)有限公司 文案生成方法、文案评估模型的训练方法、装置及设备
CN112929746B (zh) * 2021-02-07 2023-06-16 北京有竹居网络技术有限公司 视频生成方法和装置、存储介质和电子设备
CN114363531B (zh) 2022-01-14 2023-08-01 中国平安人寿保险股份有限公司 基于h5的文案解说视频生成方法、装置、设备以及介质
CN117082292A (zh) 2022-05-10 2023-11-17 北京字跳网络技术有限公司 视频生成方法、装置、设备、存储介质和程序产品
US20240386360A1 (en) * 2023-05-15 2024-11-21 Tata Consultancy Services Limited Method and system for micro-activity identification

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114513706A (zh) 2022-03-22 2022-05-17 中国平安人寿保险股份有限公司 视频生成方法和装置、计算机设备、存储介质

Also Published As

Publication number Publication date
US12148451B2 (en) 2024-11-19
EP4472214A1 (en) 2024-12-04
EP4472214A4 (en) 2026-04-08
US20250087243A1 (en) 2025-03-13
US20240355360A1 (en) 2024-10-24
JP2025518428A (ja) 2025-06-17
KR20250117699A (ko) 2025-08-05

Similar Documents

Publication Publication Date Title
CN111970577B (zh) 字幕编辑方法、装置和电子设备
CN111970571B (zh) 视频制作方法、装置、设备及存储介质
JP7113000B2 (ja) 映像を生成するための方法および装置
JP7715453B2 (ja) アイテム処理方法、装置、機器及び媒体
US20240168605A1 (en) Text input method and apparatus, and electronic device and storage medium
JP7732004B2 (ja) ビデオ生成方法、装置、デバイス、記憶媒体およびプログラム製品
JP7548678B2 (ja) オーディオとテキストとの同期方法、装置、読取可能な媒体及び電子機器
CN115269886A (zh) 媒体内容处理方法、装置、设备及存储介质
JP2025501700A (ja) 動画生成方法、装置、電子機器及び記憶媒体
WO2022184077A1 (zh) 文档编辑的方法、装置、终端及非暂时性存储介质
JP2025540813A (ja) インタラクション方法、装置、機器、記憶媒体、及びコンピュータプログラム
JP7684446B2 (ja) ビデオ生成方法、装置、機器、記憶媒体及びプログラム製品
WO2025031371A1 (zh) 特效的生成方法、装置、电子设备和存储介质
CN119364091A (zh) 视频生成方法、装置、可读介质、电子设备及程序产品
US12574614B2 (en) Method, apparatus, device, medium and program product for obtaining text material
JP7787328B2 (ja) ビデオ生成方法、装置、機器、記憶媒体及びプログラム製品
JP7782941B2 (ja) 動画生成方法、装置、機器、記憶媒体及びプログラム製品
WO2024140503A1 (zh) 一种信息显示方法、装置、设备及介质
CN118828105B (zh) 视频生成方法、装置、设备、存储介质和程序产品
US12412583B2 (en) Method, apparatus and electronic device for displaying
CN120447816A (zh) 对象信息处理方法、装置、设备、介质以及产品
CN119963291A (zh) 搜索方法、装置和电子设备
CN121309934A (zh) 一种视频生成方法、装置、设备、介质及程序产品
CN121597849A (zh) 交互方法、装置、电子设备以及存储介质
WO2021018177A1 (zh) 文字特效处理方法及装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231220

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20250708

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20251028

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20251125

R150 Certificate of patent or registration of utility model

Ref document number: 7782941

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150