JP7403573B2 - 低ビットレートのビデオ圧縮のためのマイクロドージング - Google Patents
低ビットレートのビデオ圧縮のためのマイクロドージング Download PDFInfo
- Publication number
- JP7403573B2 JP7403573B2 JP2022062154A JP2022062154A JP7403573B2 JP 7403573 B2 JP7403573 B2 JP 7403573B2 JP 2022062154 A JP2022062154 A JP 2022062154A JP 2022062154 A JP2022062154 A JP 2022062154A JP 7403573 B2 JP7403573 B2 JP 7403573B2
- Authority
- JP
- Japan
- Prior art keywords
- decompressed data
- video frame
- frame subset
- model
- decoder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/002—Image coding using neural networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0475—Generative networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0495—Quantised networks; Sparse networks; Compressed networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/094—Adversarial learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/096—Transfer learning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Probability & Statistics with Applications (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本出願は、2021年4月8日に出願され、「Neural Network Based Video Codecs」と題する仮特許出願シリアル番号63/172,315、および2021年10月13日に出願され、「Microdosing For Low Bitrate Video Compression」と題する仮特許出願シリアル番号63/255,280の利益および優先権を主張するものである。それによって、これらは参照により完全に本出願に組み込まれている。
の推定値および
である。
図2は、ニューラル圧縮に対する既存のアプローチ232を、本出願によって紹介されるマイクロドージング圧縮アプローチ234と比較するダイヤグラム230である。本マイクロドージング圧縮アプローチ234は、以下に基づいている。1)大きなデコーダから生成されたデータで、縮小された生徒役デコーダをトレーニングする、2)縮小された生徒役デコーダモデルを、特定の画像または画像のセットにオーバーフィットさせる、3)特化されたデコーダの重みを、画像の潜在と一緒に、伸張データ236として送信する。本マイクロドージング圧縮アプローチの実現性を示すために、低ビットレート設定をターゲットとする、ニューラル画像およびビデオ圧縮のための最先端モデルへのその組み込みを説明する。
を復号化したい場合、重みの形態のサブセット固有の伸張データθSiは、サブセットごとに1回だけ送信されなければならない。本マイクロドージングKDアプローチをGANでの画像圧縮に適用し、潜在空間残差を使用するビデオ圧縮に対してそれを拡張する手順について、以下に説明する。
Claims (16)
- システム(100)であって、
機械学習(ML)モデルベースビデオエンコーダ(108,208)、および、
劣化認識ブロックに基づくマイクロ残差ネットワーク(マイクロRN)(460)を備えた機械学習(ML)モデルベースビデオデコーダ(138,238,438)であって、前記マイクロ残差ネットワークは、前記マイクロ残差ネットワークの隠れチャンネルの数および劣化認識ブロックの数によって定義される、前記機械学習(ML)モデルベースビデオデコーダを備え、
前記MLモデルベースビデオエンコーダは、
複数のビデオフレームを含む非圧縮ビデオシーケンス(116,216)を受信し、
前記複数のビデオフレームのうちから、第1ビデオフレームサブセットおよび第2ビデオフレームサブセットを決定し、
第1圧縮ビデオフレームサブセットを制作するために、前記第1ビデオフレームサブセットを符号化し、
前記第1圧縮ビデオフレームサブセットのための第1伸張データを識別し、
第2圧縮ビデオフレームサブセットを制作するために、前記第2ビデオフレームサブセットを符号化し、および、
前記第2圧縮ビデオフレームサブセットのための第2伸張データを識別するように構成される、システム。 - 請求項1に記載のシステムであって、前記第1伸張データを識別することは、前記第1ビデオフレームサブセットを符号化する間に、前記第1伸張データをオーバーフィットさせることを含み、前記第2ビデオフレームサブセットを符号化する間に、前記第2伸張データをオーバーフィットさせることを含む、システム。
- 請求項1に記載のシステムであって、
前記MLモデルベースビデオエンコーダは、
前記MLモデルベースビデオデコーダに、前記第1圧縮ビデオフレームサブセット、前記第2圧縮ビデオフレームサブセット、前記第1伸張データ、および前記第2伸張データを送信するように更に構成され、
前記MLモデルベースビデオデコーダは、
前記第1圧縮ビデオフレームサブセット、前記第2圧縮ビデオフレームサブセット、前記第1伸張データ、および前記第2伸張データを受信し、
前記第1伸張データを使用して、前記第1圧縮ビデオフレームサブセットを復号化し、
および、
前記第2伸張データを使用して、前記第2圧縮ビデオフレームサブセットを復号化するように構成される、システム。 - 請求項3に記載のシステムであって、前記第1伸張データは、前記第1圧縮ビデオフレームサブセットの復号化に固有であるが、前記第2圧縮ビデオフレームサブセットの復号化には固有ではなく、また、前記第2伸張データは、前記第2圧縮ビデオフレームサブセットの復号化に固有であるが、前記第1圧縮ビデオフレームサブセットの復号化には固有ではない、システム。
- 請求項3に記載のシステムであって、前記第1伸張データおよび前記第2伸張データは前記マイクロRN460の重みのみを含む、システム。
- 請求項3に記載のシステムであって、前記MLモデルベースビデオエンコーダは高忠実度圧縮(HiFiC)エンコーダを備え、前記MLモデルベースビデオデコーダは、前記第1伸張データおよび前記第2伸張データを使用しないHiFiCデコーダよりも少ないパラメータを含む、システム。
- 請求項3に記載のシステムであって、前記MLモデルベースビデオエンコーダはHiFiCエンコーダを備え、前記MLモデルベースビデオデコーダは、前記第1伸張データおよび前記第2伸張データを使用しないHiFiCデコーダよりも早い復号時間を達成するように構成される、システム。
- 請求項3に記載のシステムであって、前記第1圧縮ビデオフレームサブセットを復号化するために、前記第1伸張データが一度だけ受信され、前記第2圧縮ビデオフレームサブセットを復号化するために、前記第2伸張データが一度だけ受信される、システム。
- 機械学習(ML)モデルベースビデオエンコーダ、および、劣化認識ブロックに基づくマイクロ残差ネットワーク(マイクロRN)(460)を備えた機械学習(ML)モデルベースビデオデコーダ(138,238,438)であって、前記マイクロ残差ネットワークは、前記マイクロ残差ネットワークの隠れチャンネルの数および劣化認識ブロックの数によって定義される、前記機械学習(ML)モデルベースビデオデコーダを含むシステムによって使用する方法であって、前記方法は、
複数のビデオフレームを含む非圧縮ビデオシーケンスを、前記MLモデルベースビデオエンコーダによって受信するステップと、
前記複数のビデオフレームのうちから、第1ビデオフレームサブセットおよび第2ビデオフレームサブセットを、前記MLモデルベースビデオエンコーダによって決定するステップと、
第1圧縮ビデオフレームサブセットを制作するために、前記第1ビデオフレームサブセットを、前記MLモデルベースビデオエンコーダによって符号化するステップと、
前記第1圧縮ビデオフレームサブセットのための第1伸張データを、前記MLモデルベースビデオエンコーダによって識別するステップと、
第2圧縮ビデオフレームサブセットを制作するために、前記第2ビデオフレームサブセットを、前記MLモデルベースビデオエンコーダによって符号化するステップと、
前記第2圧縮ビデオフレームサブセットのための第2伸張データを、前記MLモデルベースビデオエンコーダによって識別するステップと、を含む、方法。 - 請求項9に記載の方法であって、前記第1伸張データを識別するステップは、前記第1ビデオフレームサブセットを前記符号化するステップの間に、前記第1伸張データをオーバーフィットさせるステップを含み、前記第2伸張データを識別するステップは、前記第2ビデオフレームサブセットを前記符号化するステップの間に、前記第2伸張データをオーバーフィットさせるステップを含む、方法。
- 請求項9に記載の方法であって、前記方法は、
前記MLモデルベースビデオデコーダに、第1圧縮ビデオフレームサブセット、第2圧縮ビデオフレームサブセット、第1伸張データ、および第2伸張データを、前記MLモデルベースビデオエンコーダによって送信するステップと、
第1圧縮ビデオフレームサブセット、第2圧縮ビデオフレームサブセット、第1伸張データ、および第2伸張データを、前記MLモデルベースビデオデコーダによって受信するステップと、
前記第1伸張データを使用して、前記第1圧縮ビデオフレームサブセットを、前記MLモデルベースビデオデコーダによって復号化するステップと、
前記第2伸張データを使用して、前記第2圧縮ビデオフレームサブセットを、前記MLモデルベースビデオデコーダによって復号化するステップと、を更に含む、方法。 - 請求項11に記載の方法であって、前記第1伸張データは、前記第1圧縮ビデオフレームサブセットの復号化に固有であるが、前記第2圧縮ビデオフレームサブセットの復号化には固有ではなく、また、前記第2伸張データは、前記第2圧縮ビデオフレームサブセットの復号化に固有であるが、前記第1圧縮ビデオフレームサブセットの復号化には固有でない、方法。
- 請求項11に記載の方法であって、前記第1伸張データおよび前記第2伸張データは前記マイクロRN460の重みのみを含む、方法。
- 請求項11に記載の方法であって、前記MLモデルベースビデオエンコーダは高忠実度圧縮(HiFiC)エンコーダを備え、前記MLモデルベースビデオデコーダは、前記第1伸張データおよび前記第2伸張データを使用しないHiFiCデコーダよりも少ないパラメータを含む、方法。
- 請求項11に記載の方法であって、前記MLモデルベースビデオエンコーダはHiFiCエンコーダを備え、前記MLモデルベースビデオデコーダは、前記第1伸張データおよび前記第2伸張データを使用しないHiFiCデコーダよりも早い復号時間を達成するように構成する、方法。
- 請求項11に記載の方法であって、前記第1圧縮ビデオフレームサブセットを復号化するために、前記第1伸張データを一度だけ受信し、前記第2圧縮ビデオフレームサブセットを復号化するために、前記第2伸張データを一度だけ受信する、方法。
Applications Claiming Priority (6)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US202163172315P | 2021-04-08 | 2021-04-08 | |
| US63/172,315 | 2021-04-08 | ||
| US202163255280P | 2021-10-13 | 2021-10-13 | |
| US63/255,280 | 2021-10-13 | ||
| US17/704,722 US12010335B2 (en) | 2021-04-08 | 2022-03-25 | Microdosing for low bitrate video compression |
| US17/704,722 | 2022-03-25 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2022161862A JP2022161862A (ja) | 2022-10-21 |
| JP7403573B2 true JP7403573B2 (ja) | 2023-12-22 |
Family
ID=80999742
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2022062154A Active JP7403573B2 (ja) | 2021-04-08 | 2022-04-01 | 低ビットレートのビデオ圧縮のためのマイクロドージング |
Country Status (6)
| Country | Link |
|---|---|
| US (2) | US12010335B2 (ja) |
| EP (1) | EP4072138B1 (ja) |
| JP (1) | JP7403573B2 (ja) |
| KR (1) | KR102613527B1 (ja) |
| CN (2) | CN120751154A (ja) |
| BR (1) | BR102022006511A2 (ja) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN117425013B (zh) * | 2023-12-19 | 2024-04-02 | 杭州靖安防务科技有限公司 | 一种基于可逆架构的视频传输方法和系统 |
| CN119363999B (zh) * | 2024-08-07 | 2025-11-18 | 中国科学院大学 | 自适应地基于隐表示网络的视频压缩方法 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20210099731A1 (en) | 2019-09-27 | 2021-04-01 | Apple Inc. | Neural network based image set compression |
Family Cites Families (17)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7356079B2 (en) * | 2001-11-21 | 2008-04-08 | Vixs Systems Inc. | Method and system for rate control during video transcoding |
| US10924755B2 (en) * | 2017-10-19 | 2021-02-16 | Arizona Board Of Regents On Behalf Of Arizona State University | Real time end-to-end learning system for a high frame rate video compressive sensing network |
| US11470356B2 (en) * | 2018-04-17 | 2022-10-11 | Mediatek Inc. | Method and apparatus of neural network for video coding |
| US20200021815A1 (en) * | 2018-07-10 | 2020-01-16 | Fastvdo Llc | Method and apparatus for applying deep learning techniques in video coding, restoration and video quality analysis (vqa) |
| RU2698414C1 (ru) * | 2018-09-21 | 2019-08-26 | Владимир Александрович Свириденко | Способ и устройство сжатия видеоинформации для передачи по каналам связи с меняющейся пропускной способностью и запоминания в системах хранения данных с использованием машинного обучения и нейросетей |
| CN109451308B (zh) | 2018-11-29 | 2021-03-09 | 北京市商汤科技开发有限公司 | 视频压缩处理方法及装置、电子设备及存储介质 |
| US20200242507A1 (en) * | 2019-01-25 | 2020-07-30 | International Business Machines Corporation | Learning data-augmentation from unlabeled media |
| JP7161107B2 (ja) | 2019-02-19 | 2022-10-26 | 日本電信電話株式会社 | 生成装置及びコンピュータプログラム |
| US11388416B2 (en) | 2019-03-21 | 2022-07-12 | Qualcomm Incorporated | Video compression using deep generative models |
| US11176422B2 (en) | 2019-08-08 | 2021-11-16 | Robert Bosch Gmbh | Apparatus and system for unsupervised disentangled representation learning with a residual variational autoencoder |
| US11012718B2 (en) | 2019-08-30 | 2021-05-18 | Disney Enterprises, Inc. | Systems and methods for generating a latent space residual |
| CN111405283B (zh) * | 2020-02-20 | 2022-09-02 | 北京大学 | 基于深度学习的端到端视频压缩方法、系统及存储介质 |
| CN111901596B (zh) * | 2020-06-29 | 2021-10-22 | 北京大学 | 基于深度学习的视频混合编码与解码方法及装置、介质 |
| CN112135200B (zh) * | 2020-08-13 | 2022-07-08 | 南京众智未来人工智能研究院有限公司 | 一种针对压缩视频的视频描述生成方法 |
| US11477464B2 (en) * | 2020-09-16 | 2022-10-18 | Qualcomm Incorporated | End-to-end neural network based video coding |
| US11924445B2 (en) * | 2020-09-25 | 2024-03-05 | Qualcomm Incorporated | Instance-adaptive image and video compression using machine learning systems |
| US12120359B2 (en) * | 2021-04-08 | 2024-10-15 | Disney Enterprises, Inc. | Machine learning model-based video compression |
-
2022
- 2022-03-25 US US17/704,722 patent/US12010335B2/en active Active
- 2022-03-30 EP EP22165396.7A patent/EP4072138B1/en active Active
- 2022-04-01 JP JP2022062154A patent/JP7403573B2/ja active Active
- 2022-04-04 KR KR1020220041683A patent/KR102613527B1/ko active Active
- 2022-04-04 BR BR102022006511-0A patent/BR102022006511A2/pt unknown
- 2022-04-08 CN CN202511058576.8A patent/CN120751154A/zh active Pending
- 2022-04-08 CN CN202210363618.9A patent/CN115209155B/zh active Active
-
2024
- 2024-05-02 US US18/653,776 patent/US12382069B2/en active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20210099731A1 (en) | 2019-09-27 | 2021-04-01 | Apple Inc. | Neural network based image set compression |
Non-Patent Citations (1)
| Title |
|---|
| Ties van Rozendaal, et al.,Overfitting for Fun and Profit: Instance-Adaptive Data Compression,arxiv.org,Cornell University,2021年01月21日,2101.08687v1,pp.1-6,https://arxiv.org/pdf/2101.08687v1 |
Also Published As
| Publication number | Publication date |
|---|---|
| US12010335B2 (en) | 2024-06-11 |
| CN115209155A (zh) | 2022-10-18 |
| KR102613527B1 (ko) | 2023-12-14 |
| US20240283957A1 (en) | 2024-08-22 |
| KR20220139801A (ko) | 2022-10-17 |
| EP4072138A1 (en) | 2022-10-12 |
| US20220337852A1 (en) | 2022-10-20 |
| JP2022161862A (ja) | 2022-10-21 |
| CN115209155B (zh) | 2025-07-25 |
| US12382069B2 (en) | 2025-08-05 |
| BR102022006511A2 (pt) | 2022-10-18 |
| EP4072138B1 (en) | 2025-03-05 |
| CN120751154A (zh) | 2025-10-03 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7451591B2 (ja) | 機械学習モデルベースのビデオ圧縮 | |
| TWI834087B (zh) | 用於從位元流重建圖像及用於將圖像編碼到位元流中的方法及裝置、電腦程式產品 | |
| JP7419478B2 (ja) | コーデックレート歪み補償ダウンサンプラ | |
| US10623775B1 (en) | End-to-end video and image compression | |
| TW202247650A (zh) | 使用機器學習系統進行隱式圖像和視訊壓縮 | |
| JP7688165B2 (ja) | 特徴データ符号化および復号方法および装置 | |
| WO2019001108A1 (zh) | 视频处理的方法和装置 | |
| US12382069B2 (en) | Microdosing for low bitrate video compression | |
| TW202326594A (zh) | 使用可變輔助輸入的基於變換器的神經網路 | |
| CN114222124B (zh) | 一种编解码方法及设备 | |
| KR20240064698A (ko) | 특징 맵 인코딩 및 디코딩 방법 및 장치 | |
| CN119110090A (zh) | 图像压缩模型的训练方法、图像压缩方法及装置 | |
| WO2023206420A1 (zh) | 视频编解码方法、装置、设备、系统及存储介质 | |
| US12621502B2 (en) | Machine learning model-based video compression | |
| US20250317605A1 (en) | Progressive generative face video compression with bandwidth intelligence | |
| TW202533571A (zh) | 用於圖像增強濾波器選擇的優化信令的方法和裝置 | |
| WO2025196024A1 (en) | Method and data processing system for lossy image or video encoding, transmission and decoding | |
| JP2025532413A (ja) | 可変のチャネル数を有するニューラルネットワーク及びその動作方法 | |
| WO2025168485A1 (en) | Method and data processing system for lossy image or video encoding, transmission and decoding | |
| Cheng | Artistic and semantic progressive image coding |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220707 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230822 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230829 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230913 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231121 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231212 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7403573 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |