JP7764632B2 - ビデオ処理方法、装置、機器及び媒体 - Google Patents
ビデオ処理方法、装置、機器及び媒体Info
- Publication number
- JP7764632B2 JP7764632B2 JP2024561603A JP2024561603A JP7764632B2 JP 7764632 B2 JP7764632 B2 JP 7764632B2 JP 2024561603 A JP2024561603 A JP 2024561603A JP 2024561603 A JP2024561603 A JP 2024561603A JP 7764632 B2 JP7764632 B2 JP 7764632B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- target
- images
- video
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—Two-dimensional [2D] image generation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/68—Control of cameras or camera modules for stable pick-up of the scene, e.g. compensating for camera body vibrations
- H04N23/682—Vibration or motion blur correction
- H04N23/684—Vibration or motion blur correction performed by controlling the image sensor readout, e.g. by controlling the integration time
- H04N23/6845—Vibration or motion blur correction performed by controlling the image sensor readout, e.g. by controlling the integration time by combination of a plurality of images sequentially taken
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/95—Computational photography systems, e.g. light-field imaging systems
- H04N23/951—Computational photography systems, e.g. light-field imaging systems by using two or more images to influence resolution, frame rate or aspect ratio
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
- H04N5/265—Mixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
- H04N5/272—Means for inserting a foreground image in a background image, i.e. inlay, outlay
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Image Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Studio Circuits (AREA)
- Studio Devices (AREA)
- Image Analysis (AREA)
Description
本願は、中国出願番号が202210705983.3であり、出願日が2022年6月21日である出願を基礎としており、その優先権を主張し、該中国出願の全ての開示内容は参照により本出願に組み込まれる。
本開示は、ビデオ処理技術分野に関し、特にビデオ処理方法、装置、機器及び媒体に関する。
ターゲット画像群における各フレーム画像に基づいて動きぼけ処理を行い、前記各フレーム画像を動きぼけ処理して得られた画像に対してフュージョンを行い、前記ターゲット画像群に対応する動きぼけ画像を得るためのぼけ処理モジュールであって、前記複数の画像群における各画像群は、いずれも前記ターゲット画像群であるぼけ処理モジュール304と、
前記ターゲット画像群における指定フレーム画像に基づいて前記ターゲット画像群に対応する主体オブジェクト領域と背景領域を決定するための領域決定モジュール306と、
前記主体オブジェクト領域と前記背景領域に応じて、前記動きぼけ画像と前記指定フレーム画像に対してフュージョンを行い、ターゲットフュージョン画像を得るためのフュージョンモジュールであって、前記ターゲットフュージョン画像の前記主体オブジェクト領域における画像部分は、前記指定フレーム画像の前記主体オブジェクト領域における画像部分であり、前記ターゲットフュージョン画像の前記背景領域における画像部分は、前記動きぼけ画像の前記背景領域における画像部分であるフュージョンモジュール308と、
前記複数の画像群の各々に対応するターゲットフュージョン画像に基づいて、ターゲットビデオを生成するためのビデオ生成モジュールであって、前記複数の画像群の各々に対応するターゲットフュージョン画像の前記ターゲットビデオにおける再生順序は、前記複数の画像群の前記初期ビデオにおける再生順序と同じであるビデオ生成モジュール310とを含む。
次式を採用して前記動きぼけ画像と前記指定フレーム画像に対して画像フュージョンを行うことを含み、
Claims (14)
- 初期ビデオのビデオフレーム系列に基づいて、複数の画像群を得ることと、
ターゲット画像群における各フレーム画像に基づいて動きぼけ処理を行い、前記各フレーム画像を動きぼけ処理して得られた画像に対してフュージョンを行い、前記ターゲット画像群に対応する動きぼけ画像を取得し、前記複数の画像群における各画像群は、いずれも前記ターゲット画像群であることと、
前記ターゲット画像群における指定フレーム画像に基づいて、前記ターゲット画像群に対応する主体オブジェクト領域と背景領域を決定することと、
前記主体オブジェクト領域と前記背景領域に応じて、前記動きぼけ画像と前記指定フレーム画像に対してフュージョンを行い、ターゲットフュージョン画像を取得し、前記ターゲットフュージョン画像の前記主体オブジェクト領域における画像部分は、前記指定フレーム画像の前記主体オブジェクト領域における画像部分であり、前記ターゲットフュージョン画像の前記背景領域における画像部分は、前記動きぼけ画像の前記背景領域における画像部分であることと、
前記複数の画像群の各々に対応するターゲットフュージョン画像に基づいて、ターゲットビデオを生成し、前記複数の画像群の各々に対応するターゲットフュージョン画像の前記ターゲットビデオにおける再生順序は、前記複数の画像群の前記初期ビデオにおける再生順序と同じであることとを含む、ビデオ処理方法。 - ターゲット画像群における各フレーム画像に基づいて動きぼけ処理を行い、前記各フレーム画像を動きぼけ処理して得られた画像に対してフュージョンを行うステップは、
オプティカルフロー補間アルゴリズムを採用して、前記ターゲット画像群における隣り合うフレーム画像間にいずれも指定された個数の中間フレーム画像を挿入し、フレーム挿入された前記ターゲット画像群における全てのフレーム画像を、前記ターゲット画像群における各フレーム画像を動きぼけ処理して得られた画像とすることと、
前記各フレーム画像を動きぼけ処理して得られた画像に対して平均フュージョンを行うこととを含む、請求項1に記載のビデオ処理方法。 - オプティカルフロー補間アルゴリズムを採用して前記ターゲット画像群における隣り合うフレーム画像間に指定された個数の中間フレーム画像を挿入するステップは、
前記ターゲット画像群における隣り合うフレーム画像間の画素ブロックの双方向動きベクトルを取得することと、
前記画素ブロックの双方向動きベクトル及びブロック動き補償アルゴリズムにより、前記隣り合うフレーム画像間に指定された個数の中間フレーム画像を挿入することとを含む、請求項2に記載のビデオ処理方法。 - 前記ターゲット画像群における隣り合うフレーム画像間の画素ブロックの双方向動きベクトルを取得するステップは、
改良された密な逆順検索に基づくDISオプティカルフローアルゴリズムにより、前記ターゲット画像群における隣り合うフレーム画像間の画素ブロックの双方向動きベクトルを取得することを含み、
改良されたDISオプティカルフローアルゴリズムに採用される画像ピラミッドの底層画像の解像度は、元のDISオプティカルフローアルゴリズムに採用される画像ピラミッドの底層画像の解像度よりも小さく、及び/又は、前記改良されたDISオプティカルフローアルゴリズムに採用される反復回数は、元のDISオプティカルフローアルゴリズムに採用される反復回数よりも小さい、請求項3に記載のビデオ処理方法。 - 前記ターゲット画像群における指定フレーム画像に基づいて、主体オブジェクト領域と背景領域を決定するステップは、
前記ターゲット画像群の中間位置に位置する画像を指定フレーム画像とすることと、
オブジェクトインスタンスセグメンテーションアルゴリズムを採用して、前記指定フレーム画像に対して処理を行うことと、
処理結果に基づいて、前記ターゲット画像群に対応する主体オブジェクト領域と背景領域を得ることとを含む、請求項1に記載のビデオ処理方法。 - 前記主体オブジェクト領域と前記背景領域に応じて、前記動きぼけ画像と前記指定フレーム画像に対して画像フュージョンを行うステップは、
前記主体オブジェクト領域と前記背景領域に応じて、主体オブジェクトマスク画像を得ることと、
前記主体オブジェクトマスク画像に対応する重み係数を取得することと、
前記重み係数に基づいて、前記主体オブジェクトマスク画像の画素値を調整して、調整された前記主体オブジェクトマスク画像を得ることと、
調整された前記主体オブジェクトマスク画像に基づいて、前記動きぼけ画像と前記指定フレーム画像に対して画像フュージョンを行うこととを含む、請求項1に記載のビデオ処理方法。 - 前記主体オブジェクトマスク画像に対応する重み係数を取得するステップは、
オプティカルフロー法により、前記ターゲット画像群における各フレーム画像に対応する全局動き幅を取得することと、
前記全局動き幅に応じて、前記主体オブジェクトマスク画像に対応する重み係数を決定することとを含む、請求項6に記載のビデオ処理方法。 - 前記全局動き幅は、前記重み係数と負の相関がある、請求項7に記載のビデオ処理方法。
- 調整された前記主体オブジェクトマスク画像に基づいて、前記動きぼけ画像と前記指定フレーム画像に対して画像フュージョンを行うステップは、
次式を採用して前記動きぼけ画像と前記指定フレーム画像に対して画像フュージョンを行うことを含み、
ここで、βは、前記重み係数であり、mask_mainは、前記主体オブジェクトマスク画像であり、β*mask_mainは、調整された前記主体オブジェクトマスク画像であり、Pnは、前記指定フレーム画像であり、Merge_Nは、前記動きぼけ画像であり、Merge_N’は、前記ターゲットフュージョン画像である、請求項6に記載のビデオ処理方法。 - 初期ビデオのビデオフレーム系列に基づいて、複数の画像群を得るステップは、
前記初期ビデオのビデオフレーム系列を指定間隔で切分けて、前記複数の画像群を取得し、隣り合う2つの画像群間には所定個数の重合フレーム画像を有することを含む、請求項1に記載のビデオ処理方法。 - 初期ビデオのビデオフレーム系列に基づいて、複数の画像群を得るための画像群取得モジュールと、
ターゲット画像群における各フレーム画像に基づいて動きぼけ処理を行い、前記各フレーム画像を動きぼけ処理して得られた画像に対してフュージョンを行い、前記ターゲット画像群に対応する動きぼけ画像を取得し、前記複数の画像群における各画像群は、いずれも前記ターゲット画像群であるぼけ処理モジュールと、
前記ターゲット画像群における指定フレーム画像に基づいて前記ターゲット画像群に対応する主体オブジェクト領域と背景領域を決定するための領域決定モジュールと、
前記主体オブジェクト領域と前記背景領域に応じて、前記動きぼけ画像と前記指定フレーム画像に対してフュージョンを行い、ターゲットフュージョン画像を得るためのフュージョンモジュールであって、前記ターゲットフュージョン画像の前記主体オブジェクト領域における画像部分は、前記指定フレーム画像の前記主体オブジェクト領域における画像部分であり、前記ターゲットフュージョン画像の前記背景領域における画像部分は、前記動きぼけ画像の前記背景領域における画像部分であるフュージョンモジュールと、
前記複数の画像群の各々に対応するターゲットフュージョン画像に基づいて、ターゲットビデオを生成し、前記複数の画像群の各々に対応するターゲットフュージョン画像の前記ターゲットビデオにおける再生順序は、前記複数の画像群の前記初期ビデオにおける再生順序と同じであるビデオ生成モジュールとを含む、ビデオ処理装置。 - プロセッサと、
前記プロセッサが実行可能な命令を記憶するためのメモリと、を含み、
前記プロセッサは、前記メモリから前記実行可能な命令を読み出し、前記命令を実行して請求項1~10のいずれか1項に記載のビデオ処理方法を実現させるためのものである、電子機器。 - プロセッサによって実行されると、前記プロセッサに請求項1~10のいずれか1項に記載のビデオ処理方法を実行させるコンピュータプログラムが記憶された、コンピュータ可読記憶媒体。
- プロセッサによって実行されると、前記プロセッサに請求項1~10のいずれか1項に記載のビデオ処理方法を実行させる命令を含む、コンピュータプログラム。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202210705983.3 | 2022-06-21 | ||
| CN202210705983.3A CN117336422A (zh) | 2022-06-21 | 2022-06-21 | 视频处理方法、装置、设备及介质 |
| PCT/CN2023/101608 WO2023246844A1 (zh) | 2022-06-21 | 2023-06-21 | 视频处理方法、装置、设备及介质 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2025515439A JP2025515439A (ja) | 2025-05-15 |
| JP7764632B2 true JP7764632B2 (ja) | 2025-11-05 |
Family
ID=89277884
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2024561603A Active JP7764632B2 (ja) | 2022-06-21 | 2023-06-21 | ビデオ処理方法、装置、機器及び媒体 |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US20250272800A1 (ja) |
| EP (1) | EP4546767A1 (ja) |
| JP (1) | JP7764632B2 (ja) |
| CN (1) | CN117336422A (ja) |
| WO (1) | WO2023246844A1 (ja) |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20250191145A1 (en) * | 2023-12-06 | 2025-06-12 | Waymo Llc | Stacked Image Processing to Reduce Blur for Autonomous Driving |
| CN119255045B (zh) * | 2024-01-04 | 2025-10-24 | 荣耀终端股份有限公司 | 一种视频插帧方法、装置、电子设备及存储介质 |
| CN118524258B (zh) * | 2024-07-25 | 2024-10-18 | 浙江嗨皮网络科技有限公司 | 离线视频背景处理方法、系统及可读存储介质 |
| CN121056747B (zh) * | 2025-11-04 | 2026-02-03 | 辽宁北斗卫星导航平台有限公司 | 高空作业监控中多摄像头图像叠加融合方法及系统 |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2018160235A (ja) | 2017-03-22 | 2018-10-11 | キヤノン株式会社 | 情報処理装置及びその制御方法及びプログラム |
| CN113313788A (zh) | 2020-02-26 | 2021-08-27 | 北京小米移动软件有限公司 | 图像处理方法和装置、电子设备以及计算机可读存储介质 |
| CN114245035A (zh) | 2021-12-17 | 2022-03-25 | 深圳市慧鲤科技有限公司 | 视频生成方法和装置、设备、介质 |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20160205291A1 (en) * | 2015-01-09 | 2016-07-14 | PathPartner Technology Consulting Pvt. Ltd. | System and Method for Minimizing Motion Artifacts During the Fusion of an Image Bracket Based On Preview Frame Analysis |
| CN111292337B (zh) * | 2020-01-21 | 2024-03-01 | 广州虎牙科技有限公司 | 图像背景替换方法、装置、设备及存储介质 |
| CN114419073B (zh) * | 2022-03-09 | 2022-08-12 | 荣耀终端有限公司 | 一种运动模糊生成方法、装置和终端设备 |
-
2022
- 2022-06-21 CN CN202210705983.3A patent/CN117336422A/zh active Pending
-
2023
- 2023-06-21 EP EP23826489.9A patent/EP4546767A1/en active Pending
- 2023-06-21 US US18/858,292 patent/US20250272800A1/en active Pending
- 2023-06-21 JP JP2024561603A patent/JP7764632B2/ja active Active
- 2023-06-21 WO PCT/CN2023/101608 patent/WO2023246844A1/zh not_active Ceased
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2018160235A (ja) | 2017-03-22 | 2018-10-11 | キヤノン株式会社 | 情報処理装置及びその制御方法及びプログラム |
| CN113313788A (zh) | 2020-02-26 | 2021-08-27 | 北京小米移动软件有限公司 | 图像处理方法和装置、电子设备以及计算机可读存储介质 |
| CN114245035A (zh) | 2021-12-17 | 2022-03-25 | 深圳市慧鲤科技有限公司 | 视频生成方法和装置、设备、介质 |
Also Published As
| Publication number | Publication date |
|---|---|
| WO2023246844A1 (zh) | 2023-12-28 |
| JP2025515439A (ja) | 2025-05-15 |
| CN117336422A (zh) | 2024-01-02 |
| US20250272800A1 (en) | 2025-08-28 |
| EP4546767A1 (en) | 2025-04-30 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7764632B2 (ja) | ビデオ処理方法、装置、機器及び媒体 | |
| Zhang et al. | Gradient-directed multiexposure composition | |
| EP3457683B1 (en) | Dynamic generation of image of a scene based on removal of undesired object present in the scene | |
| Zhang et al. | Gradient-directed composition of multi-exposure images | |
| Teodosio et al. | Salient video stills: Content and context preserved | |
| JP5762356B2 (ja) | 焦点に基づく動的シーンの深度再構成のための装置および方法 | |
| Bennett et al. | Computational time-lapse video | |
| Hajisharif et al. | Adaptive dualISO HDR reconstruction | |
| CN110084765B (zh) | 一种图像处理方法、图像处理装置及终端设备 | |
| Cho et al. | Single‐shot High dynamic range imaging using coded electronic shutter | |
| Paramanand et al. | Shape from sharp and motion-blurred image pair | |
| WO2024183388A1 (zh) | 图像处理方法、电子设备及存储介质 | |
| CN114331902A (zh) | 一种降噪方法、装置、电子设备及介质 | |
| Low et al. | Deblur e-nerf: Nerf from motion-blurred events under high-speed or low-light conditions | |
| Bae et al. | I 2-SLAM: Inverting Imaging Process for Robust Photorealistic Dense SLAM | |
| CN114390201A (zh) | 对焦方法及其装置 | |
| Luo et al. | Dynamic neural radiance field from defocused monocular video | |
| Vien et al. | Exposure-aware dynamic weighted learning for single-shot HDR imaging | |
| KR101886246B1 (ko) | 이미지 데이터에 포함된 모션 블러 영역을 찾고 그 모션 블러 영역을 처리하는 이미지 프로세싱 장치 및 그 장치를 이용한 이미지 프로세싱 방법 | |
| Mikamo et al. | A Method For Adding Motion-Blur on Arbitrary Objects By using Auto-Segmentation and Color Compensation Techniques | |
| Doner et al. | FPGA-based infrared image deblurring using angular position of IR detector | |
| Uda et al. | Variable exposure time imaging for obtaining unblurred HDR images | |
| Keinert et al. | Cost-effective multi-camera array for high quality video with very high dynamic range | |
| CN118890554B (zh) | 视频处理方法、装置、电子设备和可读存储介质 | |
| Wang et al. | A novel deghosting method for exposure fusion |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20241017 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20241017 |
|
| TRDD | Decision of grant or rejection written | ||
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20250924 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250930 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20251023 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7764632 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |