WO2025112801A1

WO2025112801A1 - Procédé d'entraînement de modèle d'apprentissage profond et système d'entraînement de modèle d'apprentissage profond

Info

Publication number: WO2025112801A1
Application number: PCT/CN2024/118478
Authority: WO
Inventors: 林哲宇; 赵汉宇; 肖文聪; 李永
Original assignee: Hangzhou Alicloud Apsara Information Technology Co Ltd
Current assignee: Hangzhou Alicloud Apsara Information Technology Co Ltd
Priority date: 2023-11-30
Filing date: 2024-09-12
Publication date: 2025-06-05
Anticipated expiration: 2026-05-30
Also published as: CN117669700A; CN117669700B

Abstract

Des modes de réalisation de la présente divulgation concernent un procédé d'entraînement de modèle d'apprentissage profond et un système d'entraînement de modèle d'apprentissage profond. Le procédé d'entraînement de modèle d'apprentissage profond consiste à : acquérir un modèle d'apprentissage profond initial et un ensemble de données échantillon ; et effectuer un apprentissage distribué sur le modèle d'apprentissage profond sur la base de l'ensemble de données échantillon selon une politique d'apprentissage distribuée prédéfinie, et pendant le calcul de paramètre d'ajustement pour un apprentissage distribué, stocker des paramètres de modèle du modèle d'apprentissage profond sur la base de paramètres de stockage cibles, les paramètres de stockage cibles étant déterminés sur la base d'informations de spécification de modèle du modèle d'apprentissage profond et de la politique d'apprentissage distribuée prédéfinie. Les paramètres de stockage cibles sont déterminés sur la base des informations de spécification de modèle du modèle d'apprentissage profond et de la politique d'apprentissage distribuée prédéfinie, qui prend pleinement en compte les motifs d'itération d'apprentissage distribué, et pendant le calcul de paramètre d'ajustement, les paramètres de modèle du modèle d'apprentissage profond sont stockés sur la base des paramètres de stockage cibles, de telle sorte qu'une efficacité élevée est obtenue tout en permettant l'entraînement du modèle d'apprentissage profond pour obtenir une tolérance aux défauts élevée.