JP7629257B2 - アプリケーション・ベースのプロファイリングを用いた機械学習ワークロードの弾力的な実行 - Google Patents
アプリケーション・ベースのプロファイリングを用いた機械学習ワークロードの弾力的な実行 Download PDFInfo
- Publication number
- JP7629257B2 JP7629257B2 JP2022538947A JP2022538947A JP7629257B2 JP 7629257 B2 JP7629257 B2 JP 7629257B2 JP 2022538947 A JP2022538947 A JP 2022538947A JP 2022538947 A JP2022538947 A JP 2022538947A JP 7629257 B2 JP7629257 B2 JP 7629257B2
- Authority
- JP
- Japan
- Prior art keywords
- execution
- resource
- application
- profile
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5072—Grid computing
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
- G06F9/4881—Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/48—Indexing scheme relating to G06F9/48
- G06F2209/482—Application
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/508—Monitor
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Stored Programmes (AREA)
- Debugging And Monitoring (AREA)
- Electrically Operated Instructional Devices (AREA)
Description
オンデマンド・セルフ・サービス:クラウド・コンシューマは、サービス・プロバイダとの人的な対話を必要とせずに自動的に必要なだけ、サーバ時間およびネットワーク・ストレージなどのコンピュータ能力を一方的にプロビジョニングすることができる。
広帯域ネットワーク・アクセス:能力は、ネットワーク越しに利用可能であり、異種シン・クライアントまたはシック・クライアント・プラットフォーム(例えば、モバイルフォン、ラップトップ、PDA)による使用を促進する標準的なメカニズムを介して、アクセスされる。
リソース・プーリング:プロバイダの計算リソースは、マルチ・テナント・モデルを用いて複数のコンシューマに提供するためにプールされ、種々の物理的および仮想的リソースが需要に従って動的に割り当てられ、また、再割り当てられる。コンシューマは、一般的に、提供されるリソースの正確な場所を管理したり、知識を有したりせず、しかし、より高度な抽象レベル(例えば国、州、またはデータセンタ)にて場所を指定することが可能であるという意味で、場所の独立感がある。
迅速な弾力性:能力は、迅速かつ柔軟に、いくつかの場合では自動的に、プロビジョニングされて素早くスケール・アウトすることができ、また、迅速にリリースされて素早くスケール・インすることができる。コンシューマにとって、プロビジョニング利用可能な能力は、しばしば外面的には無制限のように見え、任意の時間に任意の量を購入することができる。
測量されたサービス:クラウドシステムは、サービスのタイプにとって適切なある抽象レベル(例えば、ストレージ、処理、帯域幅、アクティブ・ユーザ数)での計量能力を利用することによって、自動的にリソース使用を制御し、また最適化する。リソース使用量は、監視され、制御されおよび報告されて、利用サービスのプロバイダおよびコンシューマの双方に対する透明性を提供する。
ソフトウェア・アズ・ア・サービス(SaaS):コンシューマに提供される能力は、クラウド・インフラストラクチャ上で稼働するプロバイダのアプリケーションを使用することである。アプリケーションは、ウェブ・ブラウザ(例えばウェブベースの電子メール)などのシン・クライアント・インタフェースを介して種々のクライアント・デバイスからアクセス可能である。コンシューマは、ネットワーク、サーバ、オペレーティング・システム、ストレージ、または、限定されたユーザ固有のアプリケーション構成設定の潜在的な例外を除いて個々のアプリケーション能力すらも含む下層のインフラストラクチャを管理または制御しない。
プラットフォーム・アズ・ア・サービス(PaaS):コンシューマに提供される能力は、プロバイダによってサポートされるプログラミング言語およびツールを用いて作成された、コンシューマ作成または獲得のアプリケーションをクラウド・インフラストラクチャ上にデプロイすることである。コンシューマは、ネットワーク、サーバ、オペレーティング・システムまたはストレージを含む下層のクラウド・インフラストラクチャを管理または制御しないが、デプロイされたアプリケーションおよび場合によってはアプリケーション・ホスティング環境の構成への制御を有する。
インフラストラクチャ・アズ・ア・サービス(IaaS):コンシューマに提供される能力は、処理、ストレージ、ネットワーク、および、コンシューマが、オペレーティング・システムおよびアプリケーションを含み得る任意のソフトウェアをデプロイし、稼働させることができる他の基本的な計算リソースを提供することである。コンシューマは、下層のクラウド・インフラストラクチャを管理または制御しないが、オペレーティング・システム、ストレージ、デプロイされたアプリケーションに対する制御、および、場合によっては、選択したネットワーキング・コンポーネント(例えば、ホストファイアウォール)の限定された制御を有する。
プライベート・クラウド:クラウド・インフラストラクチャは、1つの組織のためだけに使用される。これは、組織または第三者によって管理されてもよく、オンプレミスまたはオフプレミスが存在し得る。
コミュニティ・クラウド:クラウド・インフラストラクチャは、いくつかの組織により共有され、共通の懸念(例えば、ミッション、セキュリティ要件、ポリシーおよびコンプライアンスに関する考慮事項)を有する特定のコミュニティをサポートする。これは、組織または第三者によって管理されてもよく、オンプレミスまたはオフプレミスが存在し得る。
パブリック・クラウド:クラウド・インフラストラクチャは、一般公衆、または、大きな業界団体が利用可能であり、クラウド・サービスを販売する組織によって所有される。
ハイブリッド・クラウド:クラウド・インフラストラクチャは、2以上のクラウド(プライベート、コミュニティまたはパブリック)の混成であり、これらのクラウドは、固有のエンティティのままであるが、しかし、データおよびアプリケーションのポータビリティを可能とする標準化されたまたは独自の技術(例えばクラウド間の負荷分散のためのクラウド・バースティング)によって結合される。
クラウド・コンピューティング環境は、ステートレス性、低結合、モジュール性および意味論的な相互運用性に重点を置いたサービス指向である。クラウド・コンピューティングの核心は、相互接続された複数のノードのネットワークを含むインフラストラクチャである。
Claims (16)
- コンピュータ・システムであって、
処理ユニットと、
前記処理ユニットに動作可能に結合されたメモリと
を含み、前記メモリは、
1または複数の機械学習(ML)アプリケーションについてMLアプリケーション実行データおよびリソース使用データを含み構成されるプロファイルを生成することと、
生成された前記プロファイルから1または複数の特徴および1または複数のシグネチャを識別することと、
MLアプリケーション実行パフォーマンスを1または複数の計算リソースに相関させるよう構成されたML実行モデルを構築することであって、前記ML実行モデルは、識別された前記1または複数の特徴および1または複数のシグネチャを利用する、構築することと、
前記ML実行モデルによって、アプリケーション実行をサポートするためにリソース管理コンポーネントから前記1または複数のMLアプリケーションのうちの少なくも1つに1または複数のリソースを動的に割り当てることおよび要求することを行うように、後続のアプリケーション実行への1または複数の指令を適用することであって、前記ML実行モデルは、生成された前記プロファイルからの更新を受信して適用し、前記1または複数のMLアプリケーションの実行中に割り当てを変更するように構成される、適用することと
を前記処理ユニットに実行するようにさせる命令を格納する、コンピュータ・システム。 - 前記ML実行モデルは、1または複数のML技術を使用して、前記1または複数のMLアプリケーションの少なくとも1つに対する1または複数のリソース要件を評価し、前記1または複数のMLアプリケーションの実行をサポートするための1または複数の計算リソースを識別するための出力を生成するように構成され、前記1または複数の指令は、生成された前記出力に一致する、請求項1に記載のコンピュータ・システム。
- 前記動的に割り当てることは、前記ML実行モデルが、リソース利用可能性およびアプリケーション処理サポートに関してリソース割り当てアクションを実行することを含み、
前記リソース割り当てアクションは、任意のリソースを削減しまたは拡張するためのものであり、1または複数の削減または拡張された前記リソースは、同一または異なる属性を有する、請求項1または2に記載のコンピュータ・システム。 - 前記プロファイルを生成することは、1または複数のMLルーチンに関するリソース使用データを監視し、収集し、監視した前記リソース使用データを使用して将来のMLアプリケーションのための割り当てを予測する、請求項1~3のいずれか1項に記載のコンピュータ・システム。
- 前記プロファイルを生成するためおよび実行モデルを構築するための前記1または複数の特徴および1または複数のシグネチャの識別は、ユーザ入力で導出される、請求項1~4のいずれか1項に記載のコンピュータ・システム。
- コンピュータ・システムであって、
メモリに動作可能に結合された処理ユニットと、
アプリケーション・ベースのプロファイリングを用いて1または複数の機械学習ワークロードを動的に実行するためのツールを有する、前記処理ユニットと通信する人工知能(AI)プラットフォームと
を含み、前記ツールは、
機械学習(ML)アプリケーション実行データおよびリソース使用データを含み構成される結合プロファイルを生成するプロファイル・マネージャと、
生成された前記結合プロファイルから1または複数の特徴および1または複数のシグネチャを識別し、MLアプリケーション実行パフォーマンスおよびリソース使用のためのML実行モデルを構築する機械学習マネージャであって、前記ML実行モデルは、識別された前記1または複数の特徴および1または複数のシグネチャを利用する、機械学習マネージャと、
前記ML実行モデルを適用し、前記ML実行モデルが、アプリケーション実行をサポートするためにリソース管理コンポーネントからの1または複数のリソースを動的に割り当てることおよび要求することを含む、後続のアプリケーション実行への1または複数の指令を提供するディレクタと
を含み、前記動的に割り当てることは、前記ML実行モデルが、リソース利用可能性およびアプリケーション処理サポートに関してリソース割り当てアクションを実行することを含み、
前記リソース割り当てアクションは、任意のリソースを削減しまたは拡張するためのものであり、1または複数の削減または拡張された前記リソースは、同一または異なる属性を有し、前記コンピュータ・システムは、
アプリケーション実行パターンおよびリソース使用パターンに基づいて前記リソース割り当てアクションを呼び出すことを含む、1または複数のMLアプリケーションの反復にわたり計算リソースの割り当てを変更する前記ディレクタを含む、コンピュータ・システム。 - コンピュータ・システムであって、
メモリに動作可能に結合された処理ユニットと、
アプリケーション・ベースのプロファイリングを用いて1または複数の機械学習ワークロードを動的に実行するためのツールを有する、前記処理ユニットと通信する人工知能(AI)プラットフォームと
を含み、前記ツールは、
機械学習(ML)アプリケーション実行データおよびリソース使用データを含み構成される結合プロファイルを生成するプロファイル・マネージャと、
生成された前記結合プロファイルから1または複数の特徴および1または複数のシグネチャを識別し、MLアプリケーション実行パフォーマンスおよびリソース使用のためのML実行モデルを構築する機械学習マネージャであって、前記ML実行モデルは、識別された前記1または複数の特徴および1または複数のシグネチャを利用する、機械学習マネージャと、
前記ML実行モデルを適用し、前記ML実行モデルが、アプリケーション実行をサポートするためにリソース管理コンポーネントからの1または複数のリソースを動的に割り当てることおよび要求することを含む、後続のアプリケーション実行への1または複数の指令を提供するディレクタと
を含み、前記プロファイル・マネージャは、1または複数のコールバック関数を利用して、1または複数のアプリケーション関連パラメータを用いてアプリケーション実行をプロファイルし、リソース使用情報をプロファイルする、コンピュータ・システム。 - 1または複数の機械学習(ML)アプリケーションについてMLアプリケーション実行データおよびリソース使用データを含み構成されるプロファイルを生成することと、
生成された前記プロファイルから1または複数の特徴および1または複数のシグネチャを識別することと、
MLアプリケーション実行パフォーマンスを1または複数の計算リソースに相関させるように構成されたML実行モデルを構築することであって、前記ML実行モデルは、識別された前記1または複数の特徴および1または複数のシグネチャを利用する、構築することと、
前記ML実行モデルによって、アプリケーション実行をサポートするために、リソース管理コンポーネントから前記1または複数のMLアプリケーションのうちの少なくも1つに1または複数のリソースを動的に割り当てることおよび要求することを行うように、後続のアプリケーション実行への1または複数の指令を適用することであって、前記ML実行モデルは、生成された前記プロファイルからの更新を受信して適用し、前記1または複数のMLアプリケーションの実行中に割り当てを変更するように構成される、適用することと
を含む、方法。 - 前記ML実行モデルは、1または複数のML技術を使用して、前記1または複数のMLアプリケーションの少なくとも1つに対する1または複数のリソース要件を評価し、前記1または複数のMLアプリケーションの実行をサポートするための1または複数の計算リソースを識別するための出力を生成するように構成され、前記1または複数の指令は、生成された前記出力に一致する、請求項8に記載の方法。
- 前記動的に割り当てることは、リソース利用可能性およびアプリケーション処理サポートに関してリソース割り当てアクションを実行することを含み、
前記リソース割り当てアクションは、任意のリソースを削減しまたは拡張するためのものであり、1または複数の削減または拡張された前記リソースは、同一または異なる属性を有する、請求項8または9に記載の方法。 - 前記プロファイルを生成することは、1または複数のMLルーチンに関するリソース使用データを監視し、収集することと、監視した前記リソース使用データを使用して将来のMLアプリケーションのための割り当てを予測することとを含む、請求項8~10のいずれか1項に記載の方法。
- 前記プロファイルを生成するためおよび実行モデルを構築するための前記1または複数の特徴および1または複数のシグネチャの識別は、ユーザ入力で導出される、請求項8~11のいずれか1項に記載の方法。
- 機械学習(ML)アプリケーション実行データおよびリソース使用データを含み構成される結合プロファイルを生成することと、
生成された前記結合プロファイルから1または複数の特徴および1または複数のシグネチャを識別し、MLアプリケーション実行パフォーマンスおよびリソース使用のためのML実行モデルを構築することであって、前記ML実行モデルは、識別された前記1または複数の特徴および1または複数のシグネチャを利用する、構築することと、
前記ML実行モデルを適用し、アプリケーション実行をサポートするために、リソース管理コンポーネントからの1または複数のリソースを動的に割り当てることおよび要求することを含む、後続のアプリケーション実行への1または複数の指令を提供することと
を含む方法であり、
前記動的に割り当てることは、リソース利用可能性およびアプリケーション処理サポートに関してリソース割り当てアクションを実行することを含み、
前記リソース割り当てアクションは、任意のリソースを削減しまたは拡張するためのものであり、1または複数の削減または拡張された前記リソースは、同一または異なる属性を有し、前記方法は、
アプリケーション実行パターンおよびリソース使用パターンに基づいて前記リソース割り当てアクションを呼び出すことを含む、1または複数のMLアプリケーションの反復にわたり計算リソース割り当てを変更すること
をさらに含む、方法。 - 機械学習(ML)アプリケーション実行データおよびリソース使用データを含み構成される結合プロファイルを生成することと、
生成された前記結合プロファイルから1または複数の特徴および1または複数のシグネチャを識別し、MLアプリケーション実行パフォーマンスおよびリソース使用のためのML実行モデルを構築することであって、前記ML実行モデルは、識別された前記1または複数の特徴および1または複数のシグネチャを利用する、構築することと、
前記ML実行モデルを適用し、アプリケーション実行をサポートするために、リソース管理コンポーネントからの1または複数のリソースを動的に割り当てることおよび要求することを含む、後続のアプリケーション実行への1または複数の指令を提供することと
を含み、前記結合プロファイルを生成することは、1または複数のコールバック関数を利用して、1または複数のアプリケーション関連パラメータを用いてアプリケーション実行をプロファイルし、リソース使用情報をプロファイルする、方法。 - プログラムがコンピュータ上で実行されたとき、請求項8~14のいずれか1項に記載の方法を実行するように適合されたプログラム・コード手段を含む、コンピュータ・プログラム。
- アプリケーション・ベースのプロファイリングを用いて機械学習ワークロードの動的な実行をサポートするためのコンピュータ・プログラムを格納した記録媒体であって、前記コンピュータ・プログラムは、プロセッサに、請求項8~14のいずれか1項に記載の方法を実行させるためのものである、記録媒体。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US16/724,613 US11429434B2 (en) | 2019-12-23 | 2019-12-23 | Elastic execution of machine learning workloads using application based profiling |
| US16/724,613 | 2019-12-23 | ||
| PCT/IB2020/061886 WO2021130596A1 (en) | 2019-12-23 | 2020-12-14 | Elastic execution of machine learning workloads using application based profiling |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2023508076A JP2023508076A (ja) | 2023-02-28 |
| JP7629257B2 true JP7629257B2 (ja) | 2025-02-13 |
Family
ID=76437475
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2022538947A Active JP7629257B2 (ja) | 2019-12-23 | 2020-12-14 | アプリケーション・ベースのプロファイリングを用いた機械学習ワークロードの弾力的な実行 |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US11429434B2 (ja) |
| JP (1) | JP7629257B2 (ja) |
| CN (1) | CN114667507B (ja) |
| DE (1) | DE112020005323B4 (ja) |
| GB (1) | GB2605922B (ja) |
| WO (1) | WO2021130596A1 (ja) |
Families Citing this family (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11947989B2 (en) * | 2020-02-14 | 2024-04-02 | SparkCognition, Inc. | Process flow for model-based applications |
| US11605147B2 (en) * | 2020-03-27 | 2023-03-14 | Tata Consultancy Services Limited | Method and system for tuning graphics processing unit (GPU) parameters of a GPU kernel |
| EP4136559B1 (en) * | 2020-05-08 | 2024-07-10 | Ecole Polytechnique Federale De Lausanne (Epfl) | System and method for privacy-preserving distributed training of machine learning models on distributed datasets |
| US11516311B2 (en) * | 2021-01-22 | 2022-11-29 | Avago Technologies International Sales Pte. Limited | Distributed machine-learning resource sharing and request routing |
| US11789774B2 (en) * | 2021-02-22 | 2023-10-17 | International Business Machines Corporation | Optimization of workload scheduling in a distributed shared resource environment |
| US12117917B2 (en) * | 2021-04-29 | 2024-10-15 | International Business Machines Corporation | Fair simultaneous comparison of parallel machine learning models |
| US11928518B2 (en) * | 2021-08-10 | 2024-03-12 | Kyndryl, Inc. | Noisy-neighbor detection and remediation |
| US20230107221A1 (en) * | 2021-10-05 | 2023-04-06 | Cisco Technology, Inc. | Simplifying machine learning workload composition |
| KR102944923B1 (ko) * | 2021-12-09 | 2026-03-27 | 국민대학교산학협력단 | 인공지능 기반 클라우드 서비스 서버 결정 장치 및 방법 |
| US12327145B2 (en) * | 2022-04-20 | 2025-06-10 | Dell Products L.P. | Automated dynamic resource configuration for hard provisioned virtual machines |
| US20240111992A1 (en) * | 2022-09-30 | 2024-04-04 | Dell Products, L.P. | Artificial intelligence (ai) model characterization and offloading in a heterogeneous computing platform |
| CN115904740B (zh) * | 2023-02-23 | 2023-05-30 | 青岛创新奇智科技集团股份有限公司 | 一种gpu资源调用方法及系统 |
| US12294529B2 (en) * | 2023-06-27 | 2025-05-06 | Adobe Inc. | Transferable clustering of contextual bandits for cloud service resource allocation |
| DE102024200495A1 (de) * | 2024-01-19 | 2025-07-24 | Robert Bosch Gesellschaft mit beschränkter Haftung | Verfahren zum Allokieren von Rechenleistung in einem System mit wenigstens einem Maschinenlernmodell |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010533924A (ja) | 2007-07-16 | 2010-10-28 | マイクロソフト コーポレーション | リソース割り当てを拡大および縮小することによるスケジューリング |
| JP2012022558A (ja) | 2010-07-15 | 2012-02-02 | Hitachi Ltd | 分散計算システム |
| JP2017182114A (ja) | 2016-03-28 | 2017-10-05 | ソニー株式会社 | 情報処理装置、情報処理方法および情報提供方法 |
| US20190325307A1 (en) | 2018-04-20 | 2019-10-24 | EMC IP Holding Company LLC | Estimation of resources utilized by deep learning applications |
| JP2019192207A (ja) | 2018-04-25 | 2019-10-31 | 富士通株式会社 | アプリケーションプログラム生成のための深層ニューラルネットワーク訓練 |
Family Cites Families (28)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8560465B2 (en) | 2009-07-02 | 2013-10-15 | Samsung Electronics Co., Ltd | Execution allocation cost assessment for computing systems and environments including elastic computing systems and environments |
| US8631458B1 (en) | 2011-09-29 | 2014-01-14 | Symantec Corporation | Method and apparatus for elastic (re)allocation of enterprise workloads on clouds while minimizing compliance costs |
| US8732291B2 (en) * | 2012-01-13 | 2014-05-20 | Accenture Global Services Limited | Performance interference model for managing consolidated workloads in QOS-aware clouds |
| WO2014019980A2 (en) | 2012-08-03 | 2014-02-06 | Syddansk Universitet | Elastic execution of continuous mapreduce jobs over data streams |
| US9323577B2 (en) * | 2012-09-20 | 2016-04-26 | Amazon Technologies, Inc. | Automated profiling of resource usage |
| US9760351B2 (en) * | 2013-04-02 | 2017-09-12 | Google Inc. | Framework for user-directed profile-driven optimizations |
| US9645848B2 (en) | 2013-05-20 | 2017-05-09 | International Business Machines Corporation | Scheduling homogeneous and heterogeneous workloads with runtime elasticity in a parallel processing environment |
| CN103338163B (zh) * | 2013-07-16 | 2016-03-23 | 清华大学 | 支持动态弹性资源调度的软件定义网络控制器 |
| GB2519517A (en) | 2013-10-22 | 2015-04-29 | Ibm | Managing virtual appliances supporting multiple profiles |
| CN105095230A (zh) * | 2014-04-29 | 2015-11-25 | 国际商业机器公司 | 确定目标数据分析应用的性能预测模型的方法及装置 |
| US9715663B2 (en) * | 2014-05-01 | 2017-07-25 | International Business Machines Corporation | Predicting application performance on hardware accelerators |
| US10171313B2 (en) | 2015-01-23 | 2019-01-01 | International Business Machines Corporation | Managing workload to meet execution criterion in a hybrid cloud environment |
| US20170017576A1 (en) | 2015-07-16 | 2017-01-19 | Qualcomm Incorporated | Self-adaptive Cache Architecture Based on Run-time Hardware Counters and Offline Profiling of Applications |
| US9972063B2 (en) | 2015-07-30 | 2018-05-15 | International Business Machines Corporation | Pipelined approach to fused kernels for optimization of machine learning workloads on graphical processing units |
| US10412155B2 (en) * | 2015-10-29 | 2019-09-10 | Capital One Services, Llc | Automated server workload management using machine learning |
| US11449365B2 (en) | 2016-01-04 | 2022-09-20 | Trilio Data Inc. | Ubiquitous and elastic workload orchestration architecture of hybrid applications/services on hybrid cloud |
| US10733531B2 (en) | 2016-01-27 | 2020-08-04 | Bonsai AI, Inc. | Artificial intelligence engine having an architect module |
| US10063493B2 (en) | 2016-05-16 | 2018-08-28 | International Business Machines Corporation | Application-based elastic resource provisioning in disaggregated computing systems |
| US10140164B2 (en) * | 2016-07-25 | 2018-11-27 | Accenture Global Solutions Limited | Computer resource allocation to workloads in an information technology environment |
| US10176550B1 (en) | 2017-03-20 | 2019-01-08 | Nutanix, Inc. | GPU resource usage display and dynamic GPU resource allocation in a networked virtualization system |
| US11397887B2 (en) * | 2017-09-26 | 2022-07-26 | Amazon Technologies, Inc. | Dynamic tuning of training parameters for machine learning algorithms |
| JP6947981B2 (ja) * | 2017-12-21 | 2021-10-13 | 富士通株式会社 | 推定方法、推定装置および推定プログラム |
| US11200512B2 (en) * | 2018-02-21 | 2021-12-14 | International Business Machines Corporation | Runtime estimation for machine learning tasks |
| US11567807B2 (en) | 2018-03-30 | 2023-01-31 | EMC IP Holding Company LLC | Allocation of shared computing resources using source code feature extraction and machine learning |
| EP3557418B1 (en) | 2018-04-17 | 2022-03-16 | Nokia Solutions and Networks Oy | Resource management of resource-controlled system |
| US10452441B1 (en) * | 2018-10-15 | 2019-10-22 | Accenture Global Solutions Limited | Determining an allocation of computing resources for a job |
| US12067009B2 (en) * | 2018-12-10 | 2024-08-20 | Teradata Us, Inc. | Predictive query parsing time and optimization |
| US11429895B2 (en) * | 2019-04-15 | 2022-08-30 | Oracle International Corporation | Predicting machine learning or deep learning model training time |
-
2019
- 2019-12-23 US US16/724,613 patent/US11429434B2/en active Active
-
2020
- 2020-12-14 DE DE112020005323.7T patent/DE112020005323B4/de active Active
- 2020-12-14 JP JP2022538947A patent/JP7629257B2/ja active Active
- 2020-12-14 CN CN202080076568.5A patent/CN114667507B/zh active Active
- 2020-12-14 WO PCT/IB2020/061886 patent/WO2021130596A1/en not_active Ceased
- 2020-12-14 GB GB2209994.9A patent/GB2605922B/en active Active
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010533924A (ja) | 2007-07-16 | 2010-10-28 | マイクロソフト コーポレーション | リソース割り当てを拡大および縮小することによるスケジューリング |
| JP2012022558A (ja) | 2010-07-15 | 2012-02-02 | Hitachi Ltd | 分散計算システム |
| JP2017182114A (ja) | 2016-03-28 | 2017-10-05 | ソニー株式会社 | 情報処理装置、情報処理方法および情報提供方法 |
| US20190325307A1 (en) | 2018-04-20 | 2019-10-24 | EMC IP Holding Company LLC | Estimation of resources utilized by deep learning applications |
| JP2019192207A (ja) | 2018-04-25 | 2019-10-31 | 富士通株式会社 | アプリケーションプログラム生成のための深層ニューラルネットワーク訓練 |
Also Published As
| Publication number | Publication date |
|---|---|
| GB202209994D0 (en) | 2022-08-24 |
| WO2021130596A1 (en) | 2021-07-01 |
| GB2605922B (en) | 2023-04-26 |
| CN114667507A (zh) | 2022-06-24 |
| CN114667507B (zh) | 2025-01-07 |
| DE112020005323B4 (de) | 2024-10-10 |
| DE112020005323T5 (de) | 2022-08-18 |
| JP2023508076A (ja) | 2023-02-28 |
| US11429434B2 (en) | 2022-08-30 |
| US20210191759A1 (en) | 2021-06-24 |
| GB2605922A (en) | 2022-10-19 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7629257B2 (ja) | アプリケーション・ベースのプロファイリングを用いた機械学習ワークロードの弾力的な実行 | |
| JP7590088B2 (ja) | パイプライン・アーティファクトの選択の動的自動化 | |
| US11237806B2 (en) | Multi objective optimization of applications | |
| US11409564B2 (en) | Resource allocation for tuning hyperparameters of large-scale deep learning workloads | |
| US11614963B2 (en) | Machine learning based runtime optimization | |
| US11568242B2 (en) | Optimization framework for real-time rendering of media using machine learning techniques | |
| JP7620112B2 (ja) | マルチパーティ対話における談話解析のための構造自己認識モデル | |
| US20170010774A1 (en) | Usability analysis for user interface based systems | |
| JP7744720B2 (ja) | 機械学習を用いたシフトレフトトポロジ構築および情報拡張 | |
| US11789774B2 (en) | Optimization of workload scheduling in a distributed shared resource environment | |
| CN112102095A (zh) | 一种基金产品推荐方法、装置及设备 | |
| CN117716373A (zh) | 基于期望的度量值提供机器学习模型 | |
| US20220122038A1 (en) | Process Version Control for Business Process Management | |
| JP2023549661A (ja) | パーティション化されたニューラル・ネットワークのための省電力及び暗号化機能を有するメディア・キャプチャ・デバイス | |
| US20210357781A1 (en) | Efficient techniques for determining the best data imputation algorithms | |
| US20230325256A1 (en) | Deep neural network management of overbooking in a multi-tenant computing environment | |
| JP7684763B2 (ja) | マイクロサービス識別を向上させるためにリファクタリングを識別および優先順位付するためのコンピュータシステム、コンピュータプログラムおよび方法(マイクロサービス識別を向上させるためにリファクタリングを識別および優先順位付するための方法およびシステム) | |
| US10171341B2 (en) | Software defined storage stack problem diagnosis and optimization | |
| US12423591B2 (en) | Annotation of a machine learning pipeline with operational semantics to support distributed lineage tracking | |
| JP7649439B2 (ja) | データアナリティクスにおけるデータアクセスポリシの自動調整 | |
| US11164088B2 (en) | Interactive feedback and assessment experience | |
| US20190130776A1 (en) | Interactive Learning Experience | |
| US12386664B2 (en) | Determining optimal data access for deep learning applications on a cluster | |
| JP7796764B2 (ja) | プログラム・コンテキストの移行 | |
| US20220405631A1 (en) | Data quality assessment for unsupervised machine learning |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| RD16 | Notification of change of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7436 Effective date: 20220624 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220629 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230525 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240430 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240604 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240903 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250114 |
|
| RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20250115 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250128 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7629257 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |