ES3036186T3 - Method for training a machine learning model for optical fiber sensing measurements - Google Patents
Method for training a machine learning model for optical fiber sensing measurementsInfo
- Publication number
- ES3036186T3 ES3036186T3 ES22215585T ES22215585T ES3036186T3 ES 3036186 T3 ES3036186 T3 ES 3036186T3 ES 22215585 T ES22215585 T ES 22215585T ES 22215585 T ES22215585 T ES 22215585T ES 3036186 T3 ES3036186 T3 ES 3036186T3
- Authority
- ES
- Spain
- Prior art keywords
- machine learning
- learning model
- training
- data
- fiber optic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01H—MEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
- G01H17/00—Measuring mechanical vibrations or ultrasonic, sonic or infrasonic waves, not provided for in the other groups of this subclass
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01H—MEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
- G01H9/00—Measuring mechanical vibrations or ultrasonic, sonic or infrasonic waves by using radiation-sensitive means, e.g. optical means
- G01H9/004—Measuring mechanical vibrations or ultrasonic, sonic or infrasonic waves by using radiation-sensitive means, e.g. optical means using fibre optic sensors
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0895—Weakly supervised learning, e.g. semi-supervised or self-supervised learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/096—Transfer learning
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Optical Transform (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
Un método de aprendizaje automático donde, en un primer paso, se entrena un primer modelo (general) de aprendizaje automático utilizando un primer conjunto de datos de entrenamiento que incluye datos de detección de fibra óptica sin etiquetar. Posteriormente, en un segundo paso, se aplica un proceso de aprendizaje por transferencia para adaptar o ajustar el primer modelo a una aplicación más específica (por ejemplo, para realizar un tipo específico de detección o clasificación). Debido a la gran cantidad de datos de detección de fibra óptica disponibles, el primer modelo de aprendizaje automático puede proporcionar un modelo general de aprendizaje automático con un alto nivel de generalidad y alta adaptabilidad. (Traducción automática con Google Translate, sin valor legal)
Description
DESCRIPCIÓN
Método para entrenar un modelo de aprendizaje automático para mediciones de detección de fibra ópticaCampo de la invención
La presente invención se refiere a un método para entrenar un modelo de aprendizaje automático para su uso con datos representativos de mediciones de detección de fibra óptica, tales como mediciones de detección acústica distribuida.
Antecedentes
Los sistemas de detección basados en fibra óptica típicamente usan una fuente láser que lanza un pulso de luz láser en una longitud de fibra óptica. La luz del pulso que se dispersa dentro de la fibra se detecta a continuación en un detector óptico, de modo que la luz dispersada se puede analizar para determinar diversas propiedades de la fibra óptica. En particular, se pueden determinar propiedades tales como tensión y/o temperatura en posiciones a lo largo de la fibra óptica a partir de la luz dispersada recibida.
Por ejemplo, la detección acústica distribuida (DAS) habilita que se detecte un campo acústico (por ejemplo, vibraciones) en un entorno de una fibra óptica, actuando la fibra óptica como un transductor distribuido para la medición. Con más detalle, el campo acústico puede modular la tensión a lo largo de una longitud de la fibra óptica, dando como resultado modulaciones de la longitud y el índice de refracción a lo largo de la fibra, que, a su vez, afecta a la dispersión del pulso láser a lo largo de la fibra óptica. Por consiguiente, la luz dispersada proporciona una medida del campo acústico en el entorno de la fibra óptica. Para realizar una medición de DAS, se puede lanzar un pulso láser a lo largo de la fibra óptica, y, a continuación, se registran señales dispersadas (por ejemplo, retrodispersadas) como una función del tiempo. El tiempo de recepción de una señal dispersada habilita determinar la posición de un sitio de dispersión correspondiente en la fibra óptica (por ejemplo, comparando un tiempo de recepción de la señal dispersada con un tiempo en el que se lanzó el pulso láser en la fibra), de modo que se pueda estimar la tensión en ese sitio de dispersión. De esta manera, al observar las señales dispersadas recibidas a lo largo del tiempo, se puede monitorizar la tensión y, por lo tanto, el campo acústico a lo largo de toda la longitud de la fibra. Un enfoque de este tipo se conoce como un enfoque de reflectómetro óptico en el dominio del tiempo (OTDR). En la práctica, las fibras ópticas con longitudes de 10 km a 50 km o más se pueden monitorizar con técnicas de DAS y OTDR.
Mientras que las mediciones de DAS se basan en la dispersión de Rayleigh del pulso láser en los sitios de dispersión en la fibra óptica, también se pueden usar otros mecanismos de dispersión para realizar mediciones de detección de fibra óptica. Por ejemplo, se puede medir la dispersión Raman de la luz láser en la fibra óptica para determinar la temperatura a lo largo de la longitud de la fibra óptica, usando técnicas de detección de temperatura distribuida (DTS). Como otro ejemplo, se puede medir la dispersión de Brillouin de la luz láser en la fibra óptica para determinar la tensión y/o la temperatura, usando técnicas de detección de tensión y temperatura distribuidas (DSTS). En el libro "An Introduction to Distributed Optical Fiber Sensors" de A. H. Hartog (CRC Press, 2017) se proporciona una vista global de técnicas de detección de fibra óptica conocidas.
En vista de la capacidad proporcionada por las técnicas de detección de fibra óptica para monitorizar continuamente las fibras ópticas a lo largo de distancias significativas, estas técnicas encuentran aplicaciones en una gama de diferentes campos. Por ejemplo, se pueden usar sistemas de detección de fibra óptica para monitorizar vías de tren, por ejemplo, donde se coloca una fibra óptica a lo largo de una longitud de las vías del tren. Otras posibles aplicaciones incluyen la monitorización de tuberías, líneas eléctricas o tráfico por carretera, entre otras. Se pueden aplicar técnicas de aprendizaje automático y algoritmos de clasificación a datos de medición recopilados por sistemas de detección de fibra óptica, para clasificar los datos y/o habilitar la detección de eventos. Como un ejemplo, cuando se usa un sistema de fibra óptica para monitorizar vías de tren, los datos obtenidos desde el sistema de detección de fibra óptica se pueden analizar para detectar si se produce un descarrilamiento de tren o un defecto en las vías. Como otro ejemplo, cuando el sistema de detección de fibra óptica se usa para monitorizar una tubería, los datos desde el sistema de detección de fibra óptica se pueden analizar para detectar si se produce una fuga en la tubería.
El artículo "Long-Distance Pipeline Safety Early Warning: A Distributed Optical Fiber Sensing Semi-Supervised Learning Method" de Yiyuan Yang et al. (IEEE Sensors Journal, vol. 21, n.° 17, septiembre de 2021) divulga un sistema de alerta temprana de seguridad de tuberías basado en sensores de fibra óptica distribuidos, donde se usa un modelo de aprendizaje semisupervisado para monitorizar la seguridad de las tuberías en tiempo real.
La presente invención se ha realizado en vista de las consideraciones anteriores.
Sumario de la invención
Los inventores han encontrado que una dificultad con la aplicación de técnicas de aprendizaje automático a datos de detección de fibra óptica es que típicamente puede haber únicamente un número relativamente pequeño de datos de verdad fundamental disponibles para entrenar un modelo de aprendizaje automático. Por ejemplo, cuando se usa un sistema de detección de fibra óptica para monitorizar las vías del tren, un usuario puede desear usar un modelo de aprendizaje automático para detectar cuándo se produce un descarrilamiento de tren o un defecto en las vías basándose en los datos de medición recibidos desde el sistema de detección de fibra óptica. Sin embargo, puede haber únicamente una cantidad relativamente pequeña de datos de medición disponibles que corresponden a ocurrencias reales de descarrilamiento de tren o defectos de vía para su uso en el entrenamiento del modelo de aprendizaje automático. Además, las diferencias entre diferentes vías de tren, por ejemplo, resultantes de diferentes condiciones de sitio (por ejemplo, diferentes condiciones de suelo), diferentes estructuras de vía, diferentes trenes y/o diferentes condiciones de tendido de fibra, pueden significar que un modelo desarrollado para un conjunto de vías de tren puede no ser aplicable a otro conjunto de vías de tren. Como resultado, los modelos de aprendizaje automático entrenados con técnicas convencionales para su uso con datos de detección de fibra óptica pueden tener una precisión relativamente baja, debido a la cantidad limitada de datos de verdad fundamental disponibles para su entrenamiento.
Aunque puede haber únicamente una cantidad limitada de datos de verdad fundamental disponibles para su uso en aprendizaje automático, los sistemas de fibra óptica producen típicamente grandes volúmenes de datos de medición, debido a su uso en la monitorización continua de grandes longitudes de fibra óptica. Por ejemplo, algunos sistemas de detección de fibra óptica pueden recopilar rutinariamente alrededor de 100 megabytes de datos de medición por segundo, aunque la mayoría de estos datos recopilados no se usan actualmente para fines de aprendizaje automático.
La invención se basa en la realización de que las grandes cantidades de datos no etiquetados disponibles de los sistemas de detección de fibra óptica se pueden usar en el entrenamiento de un modelo de aprendizaje automático para mejorar la precisión del modelo de aprendizaje automático. En su forma más general, la invención proporciona un método de aprendizaje automático en el que, en una primera etapa, se entrena un primer modelo de aprendizaje automático (general) usando un primer conjunto de datos de entrenamiento que incluye datos de detección de fibra óptica no etiquetados. A continuación, en una segunda etapa, se aplica un proceso de aprendizaje de transferencia para adaptar o afinar el primer modelo de aprendizaje automático a una aplicación más específica (por ejemplo, para realizar un tipo específico de detección o clasificación). Debido a los grandes volúmenes de datos de detección de fibra óptica disponibles, el primer modelo de aprendizaje automático puede proporcionar un modelo de aprendizaje automático general que tiene un alto nivel de generalidad y es altamente adaptable. Por lo tanto, por ejemplo, una vez que se entrena el primer modelo de aprendizaje automático con un conjunto de datos de entrenamiento no etiquetado, se puede adaptar usando un volumen relativamente pequeño de datos de verdad fundamental para adaptar el modelo a una tarea específica. Los inventores han descubierto que un enfoque de entrenamiento de dos etapas de este tipo puede producir un modelo de aprendizaje automático que tiene una mayor precisión, por ejemplo, en comparación con los métodos de aprendizaje automático que se basan principalmente en una cantidad restringida de datos de verdad fundamental.
De acuerdo con un primer aspecto de la invención, se proporciona un método como se establece en la reivindicación 1.
El modelo de aprendizaje automático entrenado con el método de la invención está configurado para su uso con datos representativos de una medición de detección de fibra óptica. En el presente documento, una medición de detección de fibra óptica puede corresponder a cualquier tipo de medición de detección óptica realizada en una fibra óptica. La medición de detección de fibra óptica puede ser una medición de detección distribuida. Ejemplos de mediciones de detección de fibra óptica que se pueden usar con el método de la invención comprenden (pero sin limitación) mediciones de OTDR, mediciones de DAS, mediciones de DTS y/o mediciones de DSTS.
En el presente documento, los datos representativos de una medición de detección de fibra óptica se pueden referir a cualquier tipo de datos que se pueden obtener a partir de una medición de detección de fibra óptica. Por ejemplo, los datos pueden incluir información relacionada con señales detectadas (es decir, señales dispersadas de la fibra detectadas durante la medición), tal como una amplitud de la señal, un tiempo en el que se detecta la señal, una posición de un sitio de dispersión en la fibra óptica correspondiente a la señal detectada, una frecuencia de la señal, una fase de la señal y/o una polarización de la señal. Los datos pueden comprender, adicionalmente o como alternativa, información acerca de la fibra óptica derivada de las señales detectadas, tales como tensión y/o temperatura dentro de la fibra óptica, por ejemplo, como una función del tiempo y/o la posición a lo largo de la fibra óptica.
El primer modelo de aprendizaje automático se entrena usando un primer conjunto de datos de entrenamiento que no está etiquetado. En otras palabras, el primer conjunto de datos de entrenamiento no comprende ninguna etiqueta que se use para entrenar el primer modelo de aprendizaje automático. Por lo tanto, los datos representativos de mediciones de detección de fibra óptica en el primer conjunto de datos de entrenamiento pueden no incluir ninguna etiqueta que categorice o clasifique los datos para fines de entrenamiento. De esta manera, el primer conjunto de datos de entrenamiento se puede establecer recopilando datos desde uno o más sistemas de medición de detección de fibra óptica, sin que un usuario tenga que etiquetar los datos. Esto puede habilitar que se usen los grandes volúmenes de datos que están disponibles a partir de sistemas de medición de detección de fibra óptica, ya que no se requiere proceso de etiquetado intensivo en tiempo para construir el primer conjunto de datos de entrenamiento. Los datos en el primer conjunto de datos de entrenamiento pueden corresponder a datos (sin procesar) obtenidos directamente desde el uno o más sistemas de medición de fibra óptica. En algunos casos, los datos recibidos desde el uno o más sistemas de medición de fibra óptica pueden experimentar una etapa de preparación de datos (por ejemplo, una etapa de preprocesamiento) antes de introducirse en el primer conjunto de datos de entrenamiento, por ejemplo, para poner los datos en un formato adecuado para el proceso de entrenamiento.
Por lo tanto, el método puede comprender además una etapa de recepción, desde uno o más sistemas de detección de fibra óptica, de datos representativos de mediciones de detección de fibra óptica, e incluir los datos recibidos en el primer conjunto de datos de entrenamiento.
El primer modelo de aprendizaje automático se puede entrenar usando cualquier técnica de aprendizaje automático adecuada que tome datos no etiquetados como una entrada. Por ejemplo, como se analiza con más detalle a continuación, el primer modelo de aprendizaje automático se puede entrenar usando técnicas de aprendizaje automático autosupervisadas y/o no supervisadas. El primer modelo de aprendizaje automático puede ser cualquier tipo adecuado de modelo de aprendizaje automático, tal como una red neuronal artificial (ANN), por ejemplo, una red neuronal convolucional (CNN) y/o una red de transformadores.
El segundo modelo de aprendizaje automático se entrena a continuación usando el segundo conjunto de datos de entrenamiento. El segundo modelo de aprendizaje automático incorpora al menos parte del primer modelo de aprendizaje automático entrenado. Por lo tanto, el entrenamiento del segundo modelo de aprendizaje automático se puede realizar después de que se complete el entrenamiento del primer modelo de aprendizaje automático.
El segundo modelo de aprendizaje automático que incorpora al menos parte del primer modelo de aprendizaje automático entrenado puede significar que parte o todo el primer modelo de aprendizaje automático está incluido en el segundo modelo de aprendizaje automático. Por ejemplo, una o más capas del primer modelo automático entrenado se pueden incluir en el segundo modelo de aprendizaje automático. Por lo tanto, las características del primer modelo de aprendizaje automático que se aprendieron con el primer conjunto de datos de entrenamiento se incluyen en el segundo modelo de aprendizaje automático, que a continuación se entrena usando el segundo conjunto de datos de entrenamiento.
La al menos parte del primer modelo de aprendizaje automático se puede incorporar en el segundo modelo de aprendizaje automático de diversas maneras. Por ejemplo, en algunos casos, el segundo modelo de aprendizaje automático puede comprender una o más (posiblemente todas) capas del primer modelo de aprendizaje automático, a las que se añaden una o más capas adicionales. Las una o más capas adicionales pueden a continuación tomar como entrada una salida de las una o más capas del primer modelo de aprendizaje automático. Como alternativa, todo o parte del primer modelo de aprendizaje automático se puede usar como el segundo modelo de aprendizaje automático, dando como resultado el entrenamiento del segundo modelo de aprendizaje automático que se ajusten parámetros del primer modelo de aprendizaje automático.
El segundo conjunto de datos de entrenamiento comprende datos representativos de mediciones de detección de fibra óptica, y es más pequeño que, o igual en tamaño, que el primer conjunto de datos de entrenamiento. En otras palabras, un número de elementos de datos en el segundo conjunto de datos de entrenamiento puede ser menor o igual a un número de elementos de datos en el primer conjunto de datos de entrenamiento.
El segundo conjunto de datos de entrenamiento puede ser diferente del primer conjunto de datos de entrenamiento. Por ejemplo, el segundo conjunto de datos de entrenamiento puede corresponder a un conjunto diferente de mediciones de detección de fibra óptica en comparación con el primer conjunto de datos de entrenamiento. En algunos casos, el segundo conjunto de datos de entrenamiento puede corresponder a un subconjunto de los datos en el primer conjunto de datos de entrenamiento. Como alternativa, en algunos casos, el segundo conjunto de datos de entrenamiento puede comprender los mismos datos que el primer conjunto de datos de entrenamiento.
El segundo conjunto de datos de entrenamiento se puede adaptar a una tarea que ha de realizar el segundo modelo de aprendizaje automático. Por lo tanto, mientras que el primer conjunto de datos de entrenamiento no está etiquetado y no está adaptado a ninguna tarea específica, el segundo conjunto de datos de entrenamiento se puede adaptar para entrenar el segundo modelo de aprendizaje automático para realizar una tarea específica. Como un ejemplo, el segundo conjunto de datos de entrenamiento puede comprender datos de verdad fundamental (por ejemplo, datos etiquetados) que se usan para entrenar el segundo modelo de aprendizaje automático. Por ejemplo, cuando se desea entrenar el segundo modelo de aprendizaje automático como un clasificador, el segundo conjunto de datos de entrenamiento puede comprender datos etiquetados para entrenamiento de clasificador. A continuación se proporcionan diversos ejemplos de tipos de segundo conjunto de datos de entrenamiento.
Los datos en el primer conjunto de datos de entrenamiento y el segundo conjunto de datos se pueden obtener de uno o más sistemas de detección de fibra óptica. Los datos en el primer conjunto de datos de entrenamiento y el segundo conjunto de datos se pueden obtener desde el mismo y/o diferentes sistemas de detección de fibra óptica. El sistema o sistemas de detección de fibra óptica usados para recopilar datos en el primer y segundo conjuntos de datos de entrenamiento pueden comprender cualquier tipo adecuado de sistema de detección de fibra óptica, por ejemplo, son capaces de realizar las mediciones de detección de fibra óptica mencionadas anteriormente. Adicionalmente o como alternativa, el primer conjunto de datos de entrenamiento y/o el segundo conjunto de datos de entrenamiento pueden comprender datos de detección de fibra óptica simulados (por ejemplo, generados por ordenador).
Cada uno del uno o más sistemas de detección de fibra óptica puede estar dispuesto para realizar un mismo tipo de medición de detección de fibra óptica. En otras palabras, los datos en el primer conjunto de datos de entrenamiento y los datos en el segundo conjunto de datos de entrenamiento pueden ser representativos de un mismo tipo de medición de detección de fibra óptica.
Cada uno de los uno o más sistemas de detección de fibra óptica se puede disponer para monitorizar (observar) un mismo tipo de sistema o de entorno. Los ejemplos de tipos de sistemas o de entornos que se pueden monitorizar con un sistema de detección de fibra óptica incluyen (pero sin limitación) vías de tren (ferrocarril), una tubería, una carretera, una valla, un límite (o perímetro), una línea transmisión eléctrica y una infraestructura submarina. Por lo tanto, por ejemplo, cuando se usan múltiples sistemas de detección de fibra óptica para recopilar datos en el primer y/o segundo conjuntos de datos de entrenamiento, cada uno de los sistemas de detección de fibra óptica se puede disponer para monitorizar un conjunto (respectivo) de vías de tren (o cualquier otro tipo adecuado de sistema o de entorno).
El entrenamiento del segundo modelo de aprendizaje automático se puede realizar usando cualquier técnica de aprendizaje automático adecuada. Por ejemplo, como se analiza con más detalle a continuación, el segundo modelo de aprendizaje automático se puede entrenar usando técnicas de aprendizaje automático supervisadas y/o no supervisadas. El tipo de entrenamiento usado para el segundo modelo de aprendizaje automático se puede seleccionar de acuerdo con una tarea a realizar por el segundo modelo de aprendizaje automático (por ejemplo, detección de eventos, predicción de eventos, clasificación de datos, detección de anomalías, etc.).
El segundo modelo de aprendizaje automático está configurado para generar una salida basándose en datos recibidos que son representativos de una medición de detección de fibra óptica. Por lo tanto, después del entrenamiento del segundo modelo de aprendizaje automático, el segundo modelo de aprendizaje automático puede recibir datos de detección de fibra óptica nuevos (por ejemplo, no vistos previamente) como una entrada, y generar una salida en respuesta. El tipo de salida generada por el segundo modelo de aprendizaje automático puede depender del tipo de modelo y entrenamiento usado.
A modo de ejemplo, el segundo modelo de aprendizaje automático se puede entrenar para la detección de eventos, en cuyo caso el segundo modelo de aprendizaje automático se puede configurar como salida de una indicación de si se detecta un evento basándose en los datos recibidos. Como otro ejemplo, el segundo modelo de aprendizaje automático se puede entrenar como un clasificador, en cuyo caso el segundo modelo de aprendizaje automático se puede configurar para emitir información indicativa de una clasificación basándose en los datos recibidos. Como un ejemplo adicional, el segundo modelo de aprendizaje automático se puede entrenar como un detector de anomalías, en cuyo caso el segundo modelo de aprendizaje automático se puede configurar para emitir una indicación de si se detecta una anomalía basándose en los datos recibidos.
Como un ejemplo adicional más, el segundo modelo de aprendizaje automático se puede configurar para predecir una propiedad o una variable de un sistema que se está monitorizando con el sistema de fibra óptica. Por ejemplo, cuando los datos de detección de fibra óptica se reciben desde un sistema de detección de fibra óptica dispuesto para monitorizar un conjunto de vías de tren, el modelo de aprendizaje automático se puede configurar para predecir una posición y/o una velocidad de un tren en las vías del tren, basándose en los datos recibidos.
El segundo modelo de aprendizaje automático está configurado para generar una salida basándose en datos recibidos obtenidos de un primer sistema de detección de fibra óptica, donde el segundo conjunto de datos de entrenamiento incluye datos obtenidos desde el primer sistema de detección de fibra óptica. De esta manera, el segundo modelo de aprendizaje automático se puede entrenar específicamente para su uso con datos del primer sistema de detección de fibra óptica.
En línea con el análisis anterior, el entrenamiento del primer modelo de aprendizaje automático usando el primer conjunto de datos de entrenamiento no etiquetado permite que se usen grandes volúmenes de datos de detección de fibra óptica para entrenar el primer modelo de aprendizaje automático. Como resultado, el primer modelo de aprendizaje automático puede proporcionar un modelo genérico (generalizado) de los datos de detección de fibra óptica. Por ejemplo, como resultado del entrenamiento con el primer conjunto de datos de entrenamiento, el primer modelo de aprendizaje automático puede haber aprendido mapeos de características en espacio latente para los datos de detección de fibra óptica. La etapa de entrenamiento del segundo modelo de aprendizaje automático puede actuar a continuación como una etapa de aprendizaje de transferencia, donde se reutilizan partes del primer modelo de aprendizaje automático entrenado y en el contexto de una tarea más específica.
Ventajosamente, reutilizando al menos parte del primer modelo de aprendizaje automático en el segundo modelo de aprendizaje automático, todavía se puede conseguir un entrenamiento eficaz del segundo modelo de aprendizaje automático incluso con un segundo conjunto de datos de entrenamiento relativamente pequeño. Esto se debe a que el segundo modelo de aprendizaje automático incluye características del primer modelo de aprendizaje automático genérico entrenado usando el primer conjunto de datos de entrenamiento potencialmente muy grande, de modo que los conocimientos sobre los datos de detección de fibra óptica obtenidos por el primer modelo de aprendizaje automático pueden contribuir a mejorar la precisión del segundo modelo de aprendizaje automático. Por consiguiente, la invención puede habilitar un entrenamiento eficaz de un modelo de aprendizaje automático para su uso con datos de detección de fibra óptica, incluso en situaciones en las que hay escasos datos de verdad fundamental disponibles.
Un beneficio adicional del proceso de entrenamiento de dos etapas de la invención es que el primer modelo de aprendizaje automático genérico obtenido a través del entrenamiento con el primer conjunto de datos de entrenamiento se puede usar para resolver una diversidad de problemas diferentes, adaptando el segundo conjunto de datos de entrenamiento usado para entrenar el segundo modelo de aprendizaje automático. Por ejemplo, una vez que se entrena el primer modelo de aprendizaje automático, se puede usar en diversos segundos modelos de aprendizaje automático diferentes, que se pueden adaptar para realizar diferentes tareas específicas. En otras palabras, múltiples segundos modelos de aprendizaje automático diferentes pueden reutilizar el mismo primer modelo de aprendizaje automático, de manera que el primer modelo de aprendizaje automático puede necesitar únicamente entrenarse una vez. Por lo tanto, una vez que se entrena el primer modelo de aprendizaje automático, el coste computacional de desarrollar múltiples segundos modelos de aprendizaje automático diferentes puede ser relativamente bajo.
El método puede comprender realizar un primer proceso de aprendizaje automático para entrenar el primer modelo de aprendizaje automático, y un segundo proceso de aprendizaje automático para entrenar el segundo modelo de aprendizaje automático, donde el segundo proceso de aprendizaje automático es diferente del primer proceso de aprendizaje automático. En otras palabras, se pueden aplicar diferentes procesos de aprendizaje automático para entrenar el primer y segundo modelos de aprendizaje automático. Esto puede habilitar que el primer modelo de aprendizaje automático se entrene como un modelo genérico para los datos de detección de fibra óptica, mientras se entrena el segundo modelo de aprendizaje automático para una tarea específica. El primer proceso de aprendizaje automático y el segundo proceso de aprendizaje automático se pueden basar, por ejemplo, en diferentes algoritmos de entrenamiento (aprendizaje). El primer y segundo procesos de aprendizaje automático pueden corresponder a diferentes tipos (o técnicas) de aprendizaje automático.
El segundo modelo de aprendizaje automático se puede entrenar usando un proceso de aprendizaje supervisado, y el segundo conjunto de datos de entrenamiento puede comprender datos etiquetados usados en el proceso de aprendizaje supervisado. De esta manera, el segundo modelo de aprendizaje automático se puede entrenar para una tarea específica mediante aprendizaje supervisado con los datos etiquetados en el segundo conjunto de datos de entrenamiento. El etiquetado de los datos en el segundo conjunto de datos se puede adaptar a un tipo de tarea para la que se entrena el segundo modelo de aprendizaje automático. Por ejemplo, el aprendizaje supervisado se puede usar para entrenar el segundo modelo de aprendizaje automático como un clasificador, como un modelo de detección de eventos, como un modelo de predicción de eventos, como un detector de anomalías y/o como un modelo para predecir una propiedad o una variable de un sistema que se está monitorizando con el sistema de fibra óptica. Se puede usar cualquier tipo adecuado de técnica de aprendizaje automático supervisado para entrenar el segundo modelo de aprendizaje automático.
Cuando se usa aprendizaje supervisado para entrenar el segundo modelo de aprendizaje automático, el segundo conjunto de datos de entrenamiento puede ser más pequeño (por ejemplo, tener menos elementos de datos) que el primer conjunto de datos de entrenamiento. Los datos etiquetados en el segundo conjunto de datos de entrenamiento se pueden denominar como datos de verdad fundamental. Ventajosamente, se puede requerir únicamente una cantidad relativamente pequeña de elementos de datos etiquetados para entrenar el segundo modelo de aprendizaje automático, debido al primer conjunto de datos de entrenamiento más grande usado para entrenar el primer modelo de aprendizaje automático.
Los datos etiquetados pueden comprender elementos de datos que están etiquetados para indicar un atributo de los elementos de datos; y la salida generada por el segundo modelo de aprendizaje automático puede ser indicativa de un atributo de los datos recibidos. De esta manera, el segundo modelo de aprendizaje automático puede aprender basándose en los datos etiquetados para reconocer un atributo en datos de detección de fibra óptica, de modo que, a continuación, puede determinar o predecir un atributo correspondiente en datos de detección de fibra óptica nuevos (por ejemplo, no vistos previamente).
El atributo puede corresponder a una condición predeterminada. Por lo tanto, cada elemento de datos se puede etiquetar para indicar si el elemento de datos corresponde a la condición predeterminada (por ejemplo, si la condición predeterminada tuvo lugar cuando se registraron los elementos de datos). A continuación, la salida generada por el segundo modelo de aprendizaje automático puede ser indicativa de una probabilidad de que los datos recibidos correspondan a la condición predeterminada. En otras palabras, el segundo modelo de aprendizaje automático puede aprender a reconocer y/o predecir la condición predeterminada a partir de datos de detección de fibra óptica recibidos. La condición predeterminada puede corresponder a cualquier condición o evento a lo largo de la fibra óptica (o a lo largo de un sistema monitorizado por la fibra óptica) que un usuario puede desear detectar o predecir. Por ejemplo, en el ejemplo dado anteriormente donde el sistema de detección de fibra óptica se usa para monitorizar vías de tren, la condición predeterminada puede corresponder a un descarrilamiento de tren, aparición de un defecto en las vías del tren, o una persona o animal que cruza las vías del tren.
Como alternativa, el atributo puede corresponder a un valor de un parámetro predeterminado del sistema de detección de fibra óptica y/o un sistema monitorizados por el sistema de detección de fibra óptica. Por ejemplo, cada elemento de datos se puede etiquetar con un valor del parámetro predeterminado. De esta manera, el segundo modelo de aprendizaje automático se puede entrenar para predecir un valor del parámetro predeterminado basándose en datos de detección de fibra óptica recibidos. Por ejemplo, en el ejemplo dado anteriormente donde el sistema de detección de fibra óptica se usa para monitorizar vías de tren, el atributo puede corresponder a un valor de una velocidad y/o posición de un tren que viaja a lo largo de las vías del tren.
El segundo modelo de aprendizaje automático se puede entrenar usando un proceso de aprendizaje no supervisado, y el segundo conjunto de datos de entrenamiento puede comprender datos no etiquetados usados en el proceso de aprendizaje no supervisado. Esto puede habilitar que el segundo modelo de aprendizaje automático se entrene para realizar una diversidad de tareas, sin requerir datos etiquetados. Por ejemplo, el segundo modelo de aprendizaje automático se puede entrenar como un algoritmo de agrupación, usando cualquier técnica de agrupación adecuada. Una aplicación de ejemplo donde el segundo modelo de aprendizaje automático se podría configurar como un algoritmo de agrupación es cuando el segundo conjunto de datos de entrenamiento incluye datos no etiquetados de una infraestructura de vía que tiene una línea de vía doble. A continuación, el segundo modelo de aprendizaje automático se podría entrenar para agrupar los datos en dos agrupaciones separadas, por ejemplo, un grupo por vía.
En algunos casos, tanto el proceso supervisado como el no supervisado se pueden combinar para entrenar el segundo modelo de aprendizaje automático. En un caso de este tipo, el segundo conjunto de datos de entrenamiento puede comprender elementos de datos etiquetados (usados en el aprendizaje supervisado) y elementos de datos no etiquetados (usados en el aprendizaje no supervisado).
El segundo modelo de aprendizaje automático se puede configurar como un detector de anomalías. Esto puede habilitar, por ejemplo, que el segundo modelo de aprendizaje automático detecte cuándo un sistema monitorizado por el sistema de detección de fibra óptica no se está ejecutando como se esperaba. El detector de anomalías se puede entrenar usando aprendizaje supervisado con elementos de datos etiquetados en el segundo conjunto de datos de entrenamiento. Por ejemplo, los elementos de datos se pueden etiquetar para indicar si corresponden a un comportamiento normal del sistema, o si corresponden a un comportamiento anómalo (irregular) del sistema. Como alternativa, el detector de anomalías se puede entrenar usando entrenamiento no supervisado con elementos de datos no etiquetados en el segundo conjunto de datos de entrenamiento, por ejemplo, el detector de anomalías se puede entrenar para determinar qué constituye un comportamiento normal y anómalo del sistema.
El primer conjunto de datos de entrenamiento se puede recopilar usando dos o más sistemas de detección de fibra óptica diferentes. En otras palabras, los datos en el primer conjunto de datos de entrenamiento se pueden obtener de múltiples sistemas físicos de detección de fibra óptica diferentes. Esto puede servir para aumentar un nivel de generalidad del primer modelo de aprendizaje automático, ya que los datos en el primer conjunto de datos de entrenamiento no se limitan a un único sistema físico de detección de fibra óptica. Esto puede hacer que el primer modelo de aprendizaje automático sea más flexible y adaptable, facilitando a su vez su uso en una gama más amplia de contextos. En particular, esto puede habilitar que se entrene un único primer modelo de aprendizaje automático genérico usando datos desde múltiples sistemas diferentes, que, a continuación, se pueden usar para resolver problemas con datos de entrada obtenidos de diferentes sistemas físicos de detección de fibra óptica. Por ejemplo, puede haber variaciones a través de diferentes sistemas de detección de fibra óptica que pueden afectar a los datos generados por los diferentes sistemas de detección de fibra óptica. Por lo tanto, incluir datos desde múltiples sistemas de detección de fibra óptica en el primer conjunto de datos de entrenamiento puede habilitar que el primer modelo de aprendizaje automático aprenda y tenga en cuenta diferencias entre diferentes sistemas de detección de fibra óptica. Como un ejemplo, esto puede facilitar la incorporación del mismo primer modelo de aprendizaje automático en múltiples segundos modelos de aprendizaje automático diferentes, estando configurado cada uno de los múltiples modelos de aprendizaje automático diferentes para su uso con datos recibidos desde diferentes respectivos sistemas de detección de fibra óptica. Más en general, aumentar el número de sistemas de detección de fibra óptica que contribuyen al primer conjunto de datos de entrenamiento puede aumentar un nivel de generalidad del primer modelo de aprendizaje automático, que, a su vez, mejora su flexibilidad y adaptabilidad.
En el presente documento, un sistema de detección de fibra óptica también se puede denominar como un sistema de medición.
Los dos o más sistemas de detección de fibra óptica diferentes pueden estar ubicados en diferentes sitios geográficos. Esto puede servir para mejorar adicionalmente el nivel de generalidad del primer modelo de aprendizaje automático, que puede habilitarlo para hacer frente a datos recibidos desde una diversidad más amplia de sistemas de detección de fibra óptica. Al incluir datos obtenidos desde diferentes sitios geográficos en el primer conjunto de datos de entrenamiento, se pueden aprender variaciones a través de los diferentes sitios geográficos y tenerse en cuenta por el primer modelo de aprendizaje automático. Esto puede facilitar el uso del mismo primer modelo de aprendizaje automático en el contexto de datos recibidos desde sistemas ubicados en diferentes sitios geográficos alrededor del mundo. En particular, los inventores han descubierto que con muchas aplicaciones puede haber variaciones en los datos obtenidos desde sistemas de detección de fibra óptica ubicados en diferentes sitios geográficos, que se pueden deber a diferencias en las condiciones locales. Por ejemplo, cuando los sistemas de detección de fibra óptica se usan para monitorizar vías del tren en diferentes sitios geográficos, las diferencias en las condiciones del suelo, las condiciones de tendido de fibra óptica, los trenes usados en las vías y otros factores pueden contribuir a las variaciones en los datos de detección de fibra óptica obtenidos en los diferentes sitios geográficos.
El segundo conjunto de datos de entrenamiento se puede recopilar usando menos sistemas de detección de fibra óptica que el primer conjunto de datos de entrenamiento. De esta manera, el primer modelo de aprendizaje automático se puede entrenar para tener un mayor nivel de generalidad, mientras que el entrenamiento del segundo modelo de aprendizaje automático puede ser más específico para sistemas de detección de fibra óptica particulares de interés. Esto puede contribuir a mejorar una precisión del segundo modelo de aprendizaje automático, que se puede beneficiar de características del primer modelo de aprendizaje automático aprendido basándose en el mayor número de sistemas de detección de fibra óptica. Además, en línea con el análisis anterior, el uso de datos de un número mayor de sistemas de detección de fibra óptica para entrenar el primer modelo de aprendizaje automático puede habilitar un entrenamiento efectivo incluso cuando hay datos de entrenamiento escasos disponibles para los sistemas de detección de fibra óptica particulares de interés. En otras palabras, las características aprendidas por el primer modelo de aprendizaje automático a partir del mayor número de sistemas de detección de fibra óptica se pueden aplicar por el segundo modelo de aprendizaje automático en el contexto de los sistemas de detección de fibra óptica particulares de interés.
Cuando el primer conjunto de datos de entrenamiento se recopiló usando dos o más sistemas de detección de fibra óptica ubicados en diferentes sitios geográficos, el segundo conjunto de datos de entrenamiento se puede recopilar usando sistemas de detección de fibra óptica ubicados en un número menor de sitios geográficos.
Los datos en el primer conjunto de datos de entrenamiento se pueden obtener de un primer conjunto de sistemas de detección de fibra óptica, y los datos en el segundo conjunto de datos de entrenamiento se pueden obtener de un segundo conjunto de sistemas de detección de fibra óptica, siendo el primer conjunto más grande que el segundo conjunto. El primer conjunto de sistemas de detección de fibra óptica puede incluir uno o más de los sistemas de detección de fibra óptica en el segundo conjunto. En otras palabras, el primer y segundo conjuntos de datos de entrenamiento pueden comprender datos desde uno o más mismos sistemas de detección de fibra óptica. Como alternativa, el primer conjunto de sistemas de detección de fibra óptica puede no incluir ninguno de los sistemas de detección de fibra óptica del primer conjunto, es decir, el primer y segundo conjuntos de datos de entrenamiento se pueden obtener de conjuntos completamente diferentes de sistemas de detección de fibra óptica.
En escenarios alternativos, se pueden usar datos del mismo número de sistemas de detección de fibra óptica en el primer y segundo conjuntos de datos de entrenamiento, por ejemplo, se pueden usar los mismos sistemas de detección de fibra óptica tanto para el primer como para el segundo conjuntos de datos de entrenamiento. Este puede ser el caso, por ejemplo, cuando el primer y segundo conjuntos de datos de entrenamiento tienen el mismo tamaño.
El segundo modelo de aprendizaje automático puede comprender el primer modelo de aprendizaje automático entrenado y un modelo de decisión que está conectado a una salida del primer modelo de aprendizaje automático. En otras palabras, el modelo de decisión se puede añadir al primer modelo de aprendizaje automático entrenado, para formar el segundo modelo de aprendizaje automático. Una estructura de este tipo puede facilitar la adaptación del primer modelo de aprendizaje automático a una tarea deseada, ya que se puede añadir un modelo de decisión adecuado al primer modelo de aprendizaje automático sin tener que modificar de otro modo el primer modelo de aprendizaje automático. Por lo tanto, esto puede proporcionar un enfoque flexible y adaptable para entrenar el segundo modelo de aprendizaje automático. El modelo de decisión se puede disponer para recibir (como su entrada) una o más salidas desde el primer modelo de aprendizaje automático (por ejemplo, desde una o más capas del primer modelo de aprendizaje automático), y para generar una salida basándose en la una o más entradas recibidas. Por ejemplo, el primer modelo de aprendizaje automático se puede configurar para mapear datos de detección de fibra óptica de entrada a una salida en espacio latente. El modelo de decisión se puede configurar a continuación para recibir la salida en espacio latente, y para mapear salida en espacio latente a una salida deseada (por ejemplo, una clasificación, detección de eventos, predicción de eventos, detección de anomalías, etc.).
El modelo de decisión puede ser cualquier tipo adecuado de modelo de aprendizaje automático. Ejemplos de tipos adecuados de modelo de aprendizaje automático incluyen una red neuronal artificial (ANN), una red neuronal convolucional (CNN), una red neuronal recurrente (RNN) o una red de transformadores. También se podrían usar otros tipos de modelos de aprendizaje automático tales como una máquina de vectores de soporte (SVM), un modelo de regresión logística o un modelo de agrupación de k-medias.
Una vez que el modelo de decisión se ha conectado a la salida del primer modelo de aprendizaje automático entrenado para formar el segundo modelo de aprendizaje automático, el segundo modelo de aprendizaje automático se puede entrenar usando el segundo conjunto de datos de entrenamiento, en línea con el análisis anterior. Entrenar el segundo modelo de aprendizaje automático en este caso puede implicar ajustar parámetros del primer modelo de aprendizaje automático y/o del modelo de decisión basándose en el segundo conjunto de datos de entrenamiento.
El segundo modelo de aprendizaje automático puede comprender el primer modelo de aprendizaje automático entrenado y dos o más modelos de decisión, estando cada uno de los dos o más modelos de decisión conectado a una salida del primer modelo de aprendizaje automático; y cada uno de los dos o más modelos de decisión se puede entrenar usando un segundo conjunto de datos de entrenamiento respectivo. En otras palabras, el primer modelo de aprendizaje automático entrenado se puede combinar con dos o más modelos de decisión, cada uno de los cuales se puede entrenar usando un conjunto de datos de entrenamiento respectivo. Cada modelo de decisión se puede configurar para realizar una tarea respectiva, es decir, cada modelo de decisión se puede configurar para generar una salida respectiva (por ejemplo, clasificación, detección de eventos, predicción de eventos, detección de anomalías, etc.) en respuesta a la recepción de una entrada desde el primer modelo de aprendizaje automático. Una estructura de este tipo puede aprovechar el nivel de generalidad del primer modelo de aprendizaje automático, habilitando que se realice una amplia diversidad de tareas con diferentes modelos de decisión conectados al mismo primer modelo de aprendizaje automático. Además, como se usa el mismo primer modelo de aprendizaje automático con múltiples modelos de decisión, el primer modelo de aprendizaje automático se puede necesitar entrenar únicamente una vez, reduciendo por tanto una cantidad de tiempo y recursos informáticos requeridos para el entrenamiento (por ejemplo, en contraste con un escenario donde se entrenan modelos completamente separados para cada tarea). Esto también puede evitar tener que duplicar el primer modelo de aprendizaje automático para realizar diferentes tareas, ya que una única instancia del primer modelo de aprendizaje automático puede proporcionar salidas a los múltiples modelos de decisión diferentes.
El primer modelo de aprendizaje automático puede comprender una pluralidad de salidas (por ejemplo, a partir de una pluralidad de capas en el primer modelo de aprendizaje automático). Cada uno de los dos o más modelos de decisión se puede conectar a una o más de la pluralidad de salidas del primer modelo de aprendizaje automático. En algunos casos, los dos o más modelos de decisión se pueden conectar a diferentes entradas (respectivas) del primer modelo de aprendizaje automático. En otros casos, los dos o más modelos de decisión se pueden conectar a una misma salida del primer modelo de aprendizaje automático.
El respectivo segundo conjunto de datos de entrenamiento usado para cada uno de los dos o más modelos de decisión se puede adaptar a una tarea que se ha de realizar por ese modelo de decisión. Se puede realizar cualquier proceso de entrenamiento adecuado para entrenar cada uno de los dos o más modelos de decisión. Cada uno de los dos o más modelos de decisión se puede entrenar independientemente, es decir, de modo que el entrenamiento de un modelo de decisión dado con su respectivo segundo conjunto de datos de entrenamiento no afecte a parámetros (características) en cualquiera de los otros dos o más modelos de decisión.
Cada uno de los dos o más modelos de decisión puede ser como se ha descrito anteriormente, por ejemplo, en forma de un tipo adecuado de modelo de aprendizaje automático, tal como una red neuronal artificial (ANN), una red neuronal convolucional (CNN), una red neuronal recurrente (RNN) y/o una red de transformadores. También se podrían usar otros tipos de modelos de aprendizaje automático tales como una máquina de vectores de soporte (SVM), un modelo de regresión logística o un modelo de agrupación de k-medias.
El primer modelo de aprendizaje automático entrenado puede permanecer fijo durante el entrenamiento del segundo modelo de aprendizaje automático. En otras palabras, los parámetros (por ejemplo, características, coeficientes) del primer modelo de aprendizaje automático pueden permanecer fijos (sin cambiar) durante el entrenamiento del segundo modelo de aprendizaje automático. Por ejemplo, únicamente se pueden ajustar los parámetros en un modelo de decisión conectado al primer modelo de aprendizaje automático durante el entrenamiento del segundo modelo de aprendizaje automático, mientras que los parámetros en el primer modelo de aprendizaje automático permanecen fijos. Esto puede simplificar el entrenamiento del segundo modelo de aprendizaje automático, evitando el reentrenamiento del primer modelo de aprendizaje automático que puede ser típicamente más grande y más complejo que cualquier modelo de decisión conectado al primer modelo de aprendizaje automático. Esto también puede facilitar la reutilización del primer modelo de aprendizaje automático una vez que se ha entrenado, ya que el nivel de generalidad del primer modelo de aprendizaje automático se puede mantener incluso después del entrenamiento del segundo modelo de aprendizaje automático.
Como alternativa, uno o más parámetros del primer modelo de aprendizaje automático entrenado se pueden ajustar durante el entrenamiento del segundo modelo de aprendizaje automático. De esta manera, los parámetros (por ejemplo, características, coeficientes, ponderaciones y/o sesgo) del primer modelo de aprendizaje automático se pueden adaptar basándose en el segundo conjunto de datos de entrenamiento. Esto puede posibilitar que el primer modelo de aprendizaje automático relativamente genérico se adapte específicamente a una tarea particular usando el segundo conjunto de datos de entrenamiento. Esto puede contribuir a mejorar una precisión del segundo modelo de aprendizaje automático. En un caso de este tipo donde se ajustan los parámetros del primer modelo de aprendizaje automático, el segundo modelo de aprendizaje automático puede consistir en al menos parte del primer modelo de aprendizaje automático, que se ajusta como parte del entrenamiento con el segundo conjunto de datos de entrenamiento. De lo contrario, de manera similar a los ejemplos anteriores, el segundo modelo de aprendizaje automático puede incluir el primer modelo de aprendizaje automático conectado a un modelo de decisión, en el que los parámetros tanto del primer modelo de aprendizaje automático como del modelo de decisión se ajustan durante el entrenamiento con el segundo conjunto de datos de entrenamiento.
El primer modelo de aprendizaje automático se puede entrenar con el primer conjunto de datos de entrenamiento a través de un proceso de aprendizaje autosupervisado. El aprendizaje autosupervisado puede habilitar un entrenamiento eficaz del primer modelo de aprendizaje automático usando el primer conjunto de datos de entrenamiento no etiquetado, y puede proporcionar al primer modelo de aprendizaje automático una comprensión detallada de los datos.
El proceso de aprendizaje autosupervisado puede comprender enmascarar parcialmente datos en el primer conjunto de datos de entrenamiento, y entrenar el primer modelo de aprendizaje automático para reconstruir datos en el primer conjunto de datos de entrenamiento a partir de los datos parcialmente enmascarados. Los inventores han descubierto que una técnica de este tipo puede proporcionar un entrenamiento eficaz y fiable del primer modelo de aprendizaje automático. En particular, entrenando el primer modelo de aprendizaje automático para reconstruir datos parcialmente enmascarados, el primer modelo de aprendizaje automático puede aprender eficazmente a reconocer y predecir características de datos de detección de fibra óptica. Por lo tanto, el primer modelo de aprendizaje automático puede comprender un autocodificador (o autocodificador enmascarado).
El enmascaramiento parcial de los datos en el primer conjunto de datos de entrenamiento puede implicar, por ejemplo, aplicar una o más máscaras generadas aleatoriamente a los datos. El proceso de aprendizaje autosupervisado puede ser un proceso iterativo en el que el modelo de aprendizaje automático se ajusta iterativamente para reducir (minimizar) una diferencia entre los datos reconstruidos por el primer modelo de aprendizaje automático y los datos correspondientes en el primer conjunto de datos de entrenamiento. Por ejemplo, cada iteración puede implicar generar aleatoriamente una o más máscaras, aplicar las una o más máscaras a los datos en el primer conjunto de datos de entrenamiento, reconstruir con los primeros datos de modelo de aprendizaje automático enmascarados por las una o más máscaras, y comparar los datos reconstruidos con los correspondientes datos originales (no enmascarados) en el primer conjunto de datos de entrenamiento.
El primer conjunto de datos de entrenamiento puede comprender además datos indicativos de condiciones ambientales asociadas con el registro (recopilación) de datos en el primer conjunto de datos de entrenamiento, y/o el segundo conjunto de datos de entrenamiento puede comprender además datos indicativos de condiciones ambientales asociadas con el registro (recopilación) de datos en el segundo conjunto de datos de entrenamiento. El uso de datos indicativos de condiciones ambientales en el primer conjunto de datos de entrenamiento puede habilitar que el primer modelo de aprendizaje automático relacione características en los datos de detección de fibra óptica con condiciones ambientales, lo que puede mejorar una precisión del primer modelo de aprendizaje automático. De manera similar, el uso de datos indicativos de condiciones ambientales en el segundo conjunto de datos de entrenamiento puede habilitar que el segundo modelo de aprendizaje automático relacione características en los datos de detección de fibra óptica con condiciones ambientales, lo que puede mejorar una precisión del segundo modelo de aprendizaje automático. Como ejemplo, cada entrada de datos de detección de fibra óptica en el primer conjunto de datos de entrenamiento y/o el segundo conjunto de datos de entrenamiento se puede asociar con datos del entorno respectivos, que son indicativos de condiciones ambientales en un momento y ubicación correspondientes al registro de los datos de detección de fibra óptica.
Los datos indicativos de condiciones ambientales se pueden referir a cualquier tipo de condición ambiental. Ejemplos de tipos de condiciones ambientales incluyen condiciones meteorológicas (por ejemplo, temperatura, cobertura de nubes, humedad, velocidad del viento, etc.), fecha, hora del día, ubicación geográfica, etc. Los datos indicativos de condiciones ambientales se pueden obtener usando cualquier sensor adecuado, que pueden estar separados de los sistemas de detección de fibra óptica usados para obtener los datos de detección de fibra óptica.
Cuando se usan datos indicativos de condiciones ambientales para entrenar el primer modelo de aprendizaje automático y/o el segundo modelo de aprendizaje automático, el segundo modelo de aprendizaje automático se puede configurar para generar una salida basada en datos recibidos que son representativos de una medición de fibra óptica y datos que son representativos de las condiciones ambientales asociadas con la medición de detección de fibra óptica. De esta manera, el segundo modelo de aprendizaje automático puede tener en cuenta las condiciones ambientales, que pueden mejorar una precisión de la salida del segundo modelo de aprendizaje automático.
De acuerdo con un segundo aspecto de la invención, se proporciona un método como se establece en la reivindicación 13.
El método del segundo aspecto de la invención corresponde al uso de un modelo de aprendizaje automático que se entrenó de acuerdo con un método del primer aspecto de la invención. Por consiguiente, cualquier característica descrita anteriormente en relación con el primer aspecto se puede compartir con el segundo aspecto.
En línea con el análisis anterior en relación con el primer aspecto, la salida puede comprender uno o más de una clasificación, detección de eventos, predicción de eventos, detección de anomalías, etc.
En algunos casos, la salida generada por el modelo de aprendizaje automático puede ser indicativa de una probabilidad de que los datos recibidos correspondan a una condición predeterminada, y/o la salida generada por el modelo de aprendizaje automático puede ser indicativa de un atributo de los datos.
De acuerdo con un tercer aspecto de la invención se proporciona un sistema implementado por ordenador como se establece en la reivindicación 15.
El sistema del tercer aspecto de la invención se puede usar para realizar el método del primer aspecto de la invención. Por lo tanto, cualquiera de las características descritas anteriormente en relación con el primer aspecto se puede compartir con el tercer aspecto.
El sistema implementado por ordenador puede comprender cualquier dispositivo informático adecuado o red de dispositivos informáticos que está o están configurados para realizar las etapas enumeradas. El sistema implementado por ordenador puede comprender un medio de almacenamiento que almacena instrucciones ejecutables en el mismo, y un sistema de procesamiento configurado para ejecutar las instrucciones, en donde la ejecución de las instrucciones hace que el sistema de procesamiento realice las etapas enumeradas (es decir, las etapas del método del primer aspecto).
En un aspecto más general, la invención puede proporcionar un medio de almacenamiento informático, que almacena instrucciones ejecutables, en donde, cuando las instrucciones son ejecutadas por un sistema de procesamiento, las instrucciones están dispuestas para hacer que el sistema de procesamiento realice las etapas del método del primer aspecto.
De acuerdo con un cuarto aspecto de la invención se proporciona un sistema implementado por ordenador como se establece en la reivindicación 16.
El sistema implementado por ordenador del cuarto aspecto de la invención se puede usar para realizar el método del segundo aspecto de la invención. Por consiguiente, cualquier característica descrita anteriormente en relación con el primer aspecto y/o el segundo aspecto se puede compartir con el cuarto aspecto de la invención.
El sistema implementado por ordenador del cuarto aspecto puede comprender un medio de almacenamiento en el que se almacena el modelo de aprendizaje automático. El medio de almacenamiento se puede implementar usando uno o más (por ejemplo, una matriz) de dispositivos de almacenamiento físicos.
La invención incluye la combinación de los aspectos y características preferidas descritas excepto cuando tal combinación sea claramente inadmisible o se evite expresamente.
Sumario de las figuras
A continuación se analizarán realizaciones que ilustran los principios de la invención con referencia a las figuras adjuntas, en las que:
la figura 1 es un diagrama que ilustra un método de acuerdo con una realización de la invención;
la figura 2a es un diagrama esquemático de un sistema de acuerdo con una realización de la invención;
la figura 2b es un diagrama esquemático de un sistema de acuerdo con una realización de la invención;
la figura 3a es un diagrama esquemático de un sistema de fibra óptica que se puede usar con un sistema de la invención;
la figura 3b muestra un ejemplo de datos que se pueden obtener con el sistema de la figura 3a;
la figura 3c muestra otro ejemplo de datos que se pueden obtener con el sistema de la figura 3a;
la figura 4a es un diagrama que ilustra un proceso de ejemplo para entrenar un primer modelo de aprendizaje automático en una realización de la invención;
la figura 4b muestra ejemplos de datos que corresponden a diferentes etapas en el método de la figura 4a; la figura 5 es un diagrama que ilustra un proceso de ejemplo para entrenar un segundo modelo de aprendizaje automático en una realización de la invención; y
la figura 6 es un diagrama que ilustra un proceso de ejemplo para entrenar un segundo modelo de aprendizaje automático en una realización de la invención.
Descripción detallada de la invención
A continuación, se analizarán los aspectos y realizaciones de la presente invención con referencia a las figuras adjuntas. Otros aspectos y realizaciones resultarán evidentes para los expertos en la materia.
La figura 1 ilustra un método 100 para entrenar un modelo de aprendizaje automático de acuerdo con una realización de la invención, mientras que la figura 2a muestra un diagrama esquemático de un sistema 200 que se puede usar para implementar el método 100. Para fines de ilustración, el método 100 se describirá en el contexto del sistema 200, aunque el método 100 no se limita a implementarse con el sistema 200.
En una primera etapa 102, el método 100 implica entrenar un primer modelo de aprendizaje automático usando un primer conjunto de datos de entrenamiento, donde el primer conjunto de datos de entrenamiento comprende datos representativos de mediciones de detección de fibra óptica, y donde el primer conjunto de datos de entrenamiento no está etiquetado. Volviendo a la figura 2a, los datos de detección de fibra óptica en el primer conjunto de datos de entrenamiento se pueden obtener usando uno o más sistemas de detección de fibra óptica 202a-c. En el ejemplo mostrado, los datos de detección de fibra óptica se recopilan desde tres sistemas de detección de fibra óptica 202a-c separados, sin embargo, otras realizaciones pueden usar datos desde diferentes números de sistemas. Cada uno de los sistemas de detección de fibra óptica 202a-c está configurado para realizar un mismo tipo de medición de detección de fibra óptica, por ejemplo, tales como DAS, DTS o DSTS. Adicionalmente, cada uno de los sistemas de detección de fibra óptica 202a-c está dispuesto en un mismo tipo de sistema o de entorno. De esta manera, los datos de detección de fibra óptica recopilados desde los sistemas 202a-c pueden corresponder a un mismo tipo de datos. Por ejemplo, cada uno de los sistemas de detección de fibra óptica 202a-c puede estar dispuesto para monitorizar un respectivo conjunto de vías de tren, es decir, cada sistema de detección de fibra óptica 202a-c puede comprender una fibra óptica que se extiende a lo largo de una longitud de las respectivas vías. Por supuesto, la invención no se limita a la monitorización de vías de tren, y otros tipos de sistemas o de entornos que se pueden monitorizar con los sistemas 202a-c incluyen tuberías, carreteras, vallas, límites (o perímetros), líneas de transmisión eléctrica e infraestructuras submarinas. Por consiguiente, cada uno de los sistemas de detección de fibra óptica 202a-c se puede ubicar en diferentes sitios geográficos, es decir, correspondiendo a los sistemas o los entornos respectivos monitorizados por los sistemas de detección de fibra óptica 202a-c.
Los datos de detección de fibra óptica recibidos desde los sistemas de detección de fibra óptica 202a-c pueden corresponder a datos de medición sin procesar, y pueden tomar diversas formas dependiendo del tipo específico de medición realizada con los sistemas 202a-c. Por ejemplo, los datos recibidos desde cada sistema 202a-c contienen información relacionada con una señal detectada por ese sistema, tal como una amplitud de la señal, un tiempo en el que se detecta la señal, una posición de un sitio de dispersión en la fibra óptica correspondiente a la señal detectada, una frecuencia de la señal, una fase de la señal y/o una polarización de la señal. Los datos pueden comprender, adicionalmente o como alternativa, información acerca de la fibra óptica derivada de las señales detectadas, tales como tensión y/o temperatura dentro de la fibra óptica, por ejemplo, como una función del tiempo y/o la posición a lo largo de la fibra óptica. Un ejemplo de un sistema de detección de fibra óptica y datos de detección de fibra óptica se describe con más detalle a continuación en relación con las figuras 3a y 3b. El sistema 200 se puede configurar para almacenar datos recibidos desde los sistemas de detección de fibra óptica 202a-c en una primera base de datos 204. La primera base de datos 204 se puede implementar usando cualquier sistema de almacenamiento adecuado.
Los datos de detección de fibra óptica sin procesar en la primera base de datos 204 se pueden proporcionar a continuación a un primer módulo de preparación de datos (por ejemplo, preprocesamiento) 206, que está configurado para preparar los datos de detección de fibra óptica para su uso en el entrenamiento del primer modelo de aprendizaje automático. Esto puede comprender una diversidad de etapas diferentes, dependiendo del proceso de entrenamiento específico y del modelo de aprendizaje automático a usar. En algunos casos, el primer módulo de preparación de datos 206 se puede configurar para muestrear los datos de detección de fibra óptica sin procesar desde los sistemas de detección de fibra óptica 202a-c, por ejemplo, a una tasa de muestreo predeterminada, para reducir una cantidad de potencia de procesamiento requerida para procesar los datos. El primer módulo de preparación de datos 206 también se puede configurar para convertir los datos sin procesar en la primera base de datos 204 en un formato predeterminado (o representación), donde el formato predeterminado se adapta a una entrada del primer modelo de aprendizaje automático. Otros tipos de preprocesamiento tales como reducción de ruido y/o algoritmos de suavizado también se pueden aplicar a los datos sin procesar. Los datos preparados emitidos por el primer módulo de preparación de datos 206 se pueden almacenar en una primera base de datos de entrenamiento 208. En otras palabras, la primera base de datos de entrenamiento 208 puede almacenar datos preparados por el primer módulo de preparación de datos 206 basándose en los datos sin procesar recibidos desde los sistemas de detección de fibra óptica 202a-c. Los datos almacenados en la primera base de datos de entrenamiento 208 se pueden considerar como el primer conjunto de datos de entrenamiento. El primer conjunto de datos de entrenamiento puede comprender, por lo tanto, una pluralidad de elementos de datos derivados de los datos sin procesar obtenidos desde los sistemas de detección de fibra óptica 202a-c, siendo representativa la pluralidad de elementos de datos de las mediciones de detección de fibra óptica realizadas por los sistemas 202a-c. El primer conjunto de datos de entrenamiento no está etiquetado, de manera que no es necesario realizar un etiquetado de verdad fundamental de los datos en el primer conjunto de datos de entrenamiento.
El sistema 200 comprende además un primer módulo de entrenamiento 210 que está configurado para entrenar el primer modelo de aprendizaje automático 212 usando el primer conjunto de datos de entrenamiento no etiquetado de la primera base de datos de entrenamiento 208. El primer modelo de aprendizaje automático 212 puede ser cualquier tipo adecuado de modelo de aprendizaje automático, por ejemplo, una red neuronal artificial (ANN) tal como una red neuronal convolucional (CNN) o una red de transformadores. El primer módulo de entrenamiento 210 se puede configurar para entrenar el primer modelo de aprendizaje automático 212 usando cualquier proceso de aprendizaje automático adecuado que puede tomar el primer conjunto de datos no etiquetado desde la primera base de datos de entrenamiento 208 como una entrada. Por ejemplo, el proceso de entrenamiento realizado por el primer módulo de entrenamiento 210 puede implicar una técnica de aprendizaje autosupervisado o no supervisado. Un ejemplo de una técnica de aprendizaje autosupervisado que se puede usar para entrenar el primer modelo de aprendizaje automático se describe a continuación en relación con la figura 4.
El primer modelo de aprendizaje automático entrenado 212 resultante del proceso de entrenamiento realizado por el primer módulo de entrenamiento 210 (es decir, resultante de la etapa 102 del método 100) se puede considerar como un modelo genérico que puede tener un nivel relativamente alto de generalidad, debido al uso de datos de detección de fibra óptica de varios sistemas de detección de fibra óptica 202a-c diferentes que se pueden ubicar en múltiples sitios (ubicaciones) geográficos diferentes. Además, como no se requiere etiquetado de los datos de detección de fibra óptica para el entrenamiento del primer modelo de aprendizaje automático 212, el primer conjunto de datos de entrenamiento puede comprender un volumen relativamente grande de datos, que puede servir para mejorar el nivel de generalidad del modelo. El nivel de generalidad del primer modelo de aprendizaje automático se puede aumentar aumentando la cantidad de datos incluidos en el primer conjunto de datos de entrenamiento, por ejemplo, usando datos recopilados durante períodos de tiempo más largos y/o usando datos recopilados de un mayor número de sistemas de detección de fibra óptica.
Volviendo a la figura 1, en una segunda etapa 104 del método 100, se entrena un segundo modelo de aprendizaje automático. El segundo modelo de aprendizaje automático incorpora el primer modelo de aprendizaje automático entrenado, es decir el primer modelo de aprendizaje automático entrenado en la etapa 102 (por ejemplo, el primer modelo de aprendizaje automático 212 entrenado por el primer módulo de entrenamiento 210). Se usa un segundo conjunto de datos de entrenamiento para entrenar el segundo modelo de aprendizaje automático. El segundo conjunto de datos de entrenamiento se puede etiquetar o no etiquetar, dependiendo del tipo de entrenamiento a realizar. En el ejemplo mostrado en la figura 2a, el segundo conjunto de datos de entrenamiento se obtiene usando un sistema de detección de fibra óptica 202d. El sistema de detección de fibra óptica 202d está configurado para realizar un mismo tipo de medición que los sistemas de detección de fibra óptica 202a-c, y dispuesto para monitorizar un mismo tipo de sistema o de entorno que los sistemas 202a-c. En algunos casos, el sistema de detección de fibra óptica 202d puede corresponder a uno de los sistemas 202a-c que se usa para el primer conjunto de datos de entrenamiento, es decir, un mismo sistema de detección de fibra óptica puede contribuir tanto al primer como al segundo conjuntos de datos de entrenamiento. Como alternativa, el sistema de detección de fibra óptica 202d usado para el segundo conjunto de datos de entrenamiento puede no estar incluido en los sistemas de detección de fibra óptica 202a-c usados para el primer conjunto de datos de entrenamiento. Mientras que la figura 2a muestra un único sistema de detección de fibra óptica 202d que se usa para recopilar el segundo conjunto de datos de entrenamiento, otras realizaciones pueden usar diferentes números de sistemas para recopilar el segundo conjunto de datos de entrenamiento. El número de sistemas usados para recopilar el segundo conjunto de datos de entrenamiento puede ser típicamente menor que el número de sistemas usados para recopilar el primer conjunto de datos de entrenamiento, aunque, en algunos casos, se puede usar el mismo número de sistemas para ambos conjuntos de datos de entrenamiento.
Los datos de detección de fibra óptica recibidos desde el sistema de fibra óptica 202d pueden corresponder a datos de medición sin procesar, y pueden tener una misma forma que los datos recibidos desde los sistemas 202a-c descritos anteriormente. El sistema 200 se puede configurar para almacenar los datos recibidos desde el sistema de detección de fibra óptica 202d en una segunda base de datos 214, que puede tener una configuración similar a la primera base de datos 204 mencionada anteriormente. Un segundo módulo de preparación de datos 216 se configura a continuación para preparar los datos de detección de fibra óptica desde el sistema de detección de fibra óptica 202d para su uso en el entrenamiento del segundo modelo de aprendizaje automático. El segundo módulo de preparación de datos 216 puede realizar etapas análogas a las realizadas por el primer módulo de preparación de datos 206 descrito anteriormente. En particular, el segundo módulo de preparación de datos 216 puede poner los datos sin procesar recibidos desde el sistema de detección de fibra óptica 202d en un formato que se adapta a una entrada del segundo modelo de aprendizaje automático. En algunos casos, se puede usar el mismo formato de datos tanto para el primer como para el segundo modelos de aprendizaje automático, de manera que las mismas etapas de preparación de datos se pueden realizar por el primer y segundo módulos de preparación de datos 206, 216. Los datos preparados emitidos por el segundo módulo de preparación de datos 216 se pueden almacenar en una segunda base de datos de entrenamiento 218. En otras palabras, la segunda base de datos de entrenamiento 218 puede almacenar datos preparados por el segundo módulo de preparación de datos 216 basándose en los datos sin procesar recibidos desde el sistema de detección de fibra óptica 202d. Los datos almacenados en la segunda base de datos de entrenamiento 218 se pueden considerar como el segundo conjunto de datos de entrenamiento. El segundo conjunto de datos de entrenamiento puede comprender, por lo tanto, una pluralidad de elementos de datos derivados de los datos sin procesar obtenidos desde el sistema de detección de fibra óptica 202d, siendo representativa la pluralidad de elementos de datos de las mediciones de detección de fibra óptica realizadas por el sistema 202d.
En algunos casos, el segundo conjunto de datos de entrenamiento se puede etiquetar. Por ejemplo, se puede realizar una etapa de etiquetado como parte de las etapas de preparación de datos llevadas a cabo por el segundo módulo de preparación de datos 216. El segundo módulo de preparación de datos 216 u otra parte del sistema 200 puede proporcionar una interfaz de usuario, dispuesta para habilitar que un usuario etiquete elementos de datos en el segundo conjunto de datos de entrenamiento. La segunda base de datos de entrenamiento 218 puede almacenar a continuación el segundo conjunto de datos de entrenamiento y un conjunto de etiquetas asociadas con elementos de datos en el segundo conjunto de datos de entrenamiento. Cada etiqueta puede ser indicativa de un atributo y/o una condición predeterminada que corresponde a su elemento de datos asociado. Como un ejemplo, un elemento de datos se puede etiquetar para indicar que se produjo una condición o evento predeterminado en el sistema o el entorno monitorizados por el sistema de detección de fibra óptica cor'' por el sistema de detección de fibra óptica correspondiente cuando se realizó la medición correspondiente.
El sistema 200 comprende además un segundo módulo de entrenamiento 220 que está configurado para entrenar el segundo modelo de aprendizaje automático 222. El segundo modelo de aprendizaje automático 222 incorpora al menos parte del primer modelo de aprendizaje automático 212. Por ejemplo, como se muestra en la figura 2a, el segundo modelo de aprendizaje automático 222 puede comprender un modelo de decisión 224 que está conectado a una salida del primer modelo de aprendizaje automático 212. El modelo de decisión 224 puede ser cualquier tipo adecuado de modelo de aprendizaje automático, por ejemplo, una ANN, CNN, RNN y/o red de transformadores. El modelo de decisión 224 también puede ser una SVM, un modelo de regresión logística o un modelo de agrupación de k-medias. El segundo módulo de entrenamiento 220 se puede configurar para entrenar el segundo modelo de aprendizaje automático 222 usando cualquier proceso de aprendizaje automático adecuado. Cuando el segundo conjunto de datos de entrenamiento comprende elementos de datos etiquetados, el segundo módulo de entrenamiento 220 puede emplear una técnica de aprendizaje supervisado para entrenar el segundo modelo de aprendizaje automático 222. En particular, el segundo módulo de aprendizaje automático 220 puede tratar los elementos de datos etiquetados como datos de verdad fundamental para aprendizaje supervisado del segundo modelo de aprendizaje automático 222. Un ejemplo de un segundo modelo de aprendizaje automático que se puede entrenar mediante el segundo módulo de entrenamiento 220 se describe a continuación en relación con la figura 5.
En el ejemplo de la figura 2a, el tratamiento de los datos recibidos desde el sistema de detección de fibra óptica 202d se ilustra por separado de los datos recibidos desde los sistemas de detección de fibra óptica 202a-c. Sin embargo, este no tiene que ser necesariamente el caso en la práctica. Por ejemplo, cuando un primer sistema de detección de fibra óptica (por ejemplo, el sistema 202a) contribuye tanto al primer como al segundo conjuntos de datos de entrenamiento, los datos desde el sistema de detección de fibra óptica 202a pueden necesitar únicamente que se almacenen y se preparen una vez. En otras palabras, los elementos de datos preparados por el primer módulo de preparación 206 basándose en datos de medición recibidos desde el sistema de detección de fibra óptica 202 se pueden usar tanto en el primer conjunto de datos de entrenamiento como en el segundo conjunto de datos de entrenamiento. Por consiguiente, en algunas realizaciones, la funcionalidad descrita anteriormente en relación con la segunda base de datos 214, el segundo módulo de preparación 216 y la segunda base de datos de entrenamiento 218 se pueden implementar a través de la primera base de datos 204, el primer módulo de preparación 206 y la primera base de datos de entrenamiento, respectivamente, como se ilustra por las flechas de línea discontinua en la figura 2a.
En el ejemplo de la figura 2a, el primer módulo de preparación de datos 206 se usa para preparar datos en el primer conjunto de datos de entrenamiento y el segundo módulo de preparación de datos 216 se usa para preparar datos en el segundo conjunto de datos de entrenamiento. Sin embargo, en otras realizaciones, puede que no haya etapas de preparación de datos. Por ejemplo, los datos sin procesar almacenados en la primera base de datos 204 se pueden usar como el primer conjunto de datos de entrenamiento, es decir, los datos almacenados en la primera base de datos 204 se pueden usar por el primer módulo de entrenamiento 210 para entrenar el primer modelo de aprendizaje automático 212. De manera similar, los datos sin procesar almacenados en la segunda base de datos 214 se pueden usar como el segundo conjunto de datos de entrenamiento, es decir, los datos almacenados en la segunda base de datos 214 se pueden usar por el segundo módulo de entrenamiento 220 para entrenar el segundo modelo de aprendizaje automático 222.
Debería observarse que los componentes del sistema 200 representados en la figura 2a (incluyendo las diversas bases de datos y módulos) están destinados a reflejar una funcionalidad del sistema 200, y pueden no representar necesariamente una configuración física del sistema 200. Los diversos módulos y bases de datos del sistema 200 se pueden implementar usando cualquier sistema informático adecuado (incluyendo una red de sistemas informáticos). Por ejemplo, los diversos módulos del sistema 200 se pueden implementar como módulos de software en un sistema informático que está configurado para ejecutar los módulos de software para realizar las tareas descritas en el presente documento. Las diversas bases de datos se pueden implementar usando cualquier sistema de almacenamiento (memoria) informático adecuado.
Después del entrenamiento por el segundo módulo de entrenamiento 220, el segundo modelo de aprendizaje automático 222 está configurado para generar una salida basándose en datos recibidos que son representativos de una medición de detección de fibra óptica. Un uso de ejemplo del segundo modelo de aprendizaje automático entrenado 222 se representa en la figura 2b, que muestra un diagrama esquemático de un sistema 226 de acuerdo con una realización de la invención. El sistema 226 comprende un módulo de preparación 228 que está configurado para recibir datos de medición desde un sistema de detección de fibra óptica 202e. En algunos casos, el sistema de detección de fibra óptica 202e puede ser el mismo sistema cuyos datos se usaron para entrenar el segundo modelo de aprendizaje automático 222. Por ejemplo, en el ejemplo de la figura 2a, donde se usó el sistema 202d para entrenar el segundo modelo de aprendizaje automático 222, el sistema 202e puede corresponder a (ser el mismo que) el sistema 202d. En otros casos, el sistema 202e puede ser diferente del sistema que se usó para entrenar el segundo modelo de aprendizaje automático 222.
El sistema de detección de fibra óptica 202e está configurado para realizar un mismo tipo de medición que los sistemas 202a-d descritos anteriormente, y está dispuesto para monitorizar un mismo tipo de sistema o de entorno. Por consiguiente, los datos recibidos desde el sistema 202e por el módulo de preparación 228 pueden ser datos sin procesar que tienen una misma forma que los datos recibidos desde los sistemas 202a-d como se ha descrito anteriormente. Los datos recibidos desde el sistema 202e pueden corresponder a datos que no se vieron previamente por el segundo modelo de aprendizaje automático 222, es decir, los datos recibidos pueden corresponder a datos nuevos que no se usaron para el primer o segundo conjuntos de datos de entrenamiento. En algunos casos, el módulo de preparación 228 se puede configurar para recibir un flujo de datos en directo (por ejemplo, en tiempo real) desde el sistema de detección de fibra óptica 202e. El módulo de preparación 228 está configurado para preparar los datos sin procesar recibidos para su entrada en el segundo modelo de aprendizaje automático 222. Por lo tanto, el módulo de preparación 228 puede realizar las mismas etapas que el segundo módulo de preparación 216 descrito anteriormente, tal como muestreo de datos, poner los datos en un formato predeterminado y/o aplicar algoritmos de reducción de ruido o suavizado a los datos.
El módulo de preparación 228 está configurado para proporcionar los datos preparados a una entrada del segundo modelo de aprendizaje automático 222 que, en respuesta, genera una salida 230 basándose en los datos de entrada. De esta manera, el segundo modelo de aprendizaje automático 222 puede generar una salida sustancialmente en tiempo real, basándose en datos de medición recibidos desde el sistema de detección de fibra óptica 202e. Esto puede facilitar la monitorización de un sistema con el sistema de detección de fibra óptica 202e. La salida generada por el segundo modelo de aprendizaje automático 222 puede depender de una tarea específica para la que se entrenó el segundo modelo de aprendizaje automático 222. Como ejemplo, cuando el segundo conjunto de datos de entrenamiento se etiquetó para entrenar el segundo modelo de aprendizaje automático 222 como un modelo de detección de eventos o como un modelo de predicción de eventos, la salida 230 generada por el segundo modelo de aprendizaje automático 222 puede comprender una indicación de si ha ocurrido un evento y/o una probabilidad de que ocurra el evento. Como otro ejemplo, donde el segundo conjunto de datos de entrenamiento se etiquetó para entrenar el segundo modelo de aprendizaje automático 222 como un clasificador, entonces la salida 230 generada por el segundo modelo de aprendizaje automático 222 puede comprender una clasificación de los datos recibidos. Como un ejemplo adicional, donde el segundo modelo de aprendizaje automático 222 se entrena como un detector de anomalías, la salida 230 puede ser indicativa de si el sistema o el entorno que se está monitorizando está experimentando un comportamiento normal o anómalo.
La figura 3a muestra un diagrama esquemático de un sistema de detección de fibra óptica 300 que se puede usar para obtener datos de detección de fibra óptica para su uso en un método o sistema de la invención. Por ejemplo, el sistema 300 puede corresponder a uno o más de los sistemas 202a-e descritos anteriormente. El sistema 300 es un sistema basado en OTDR que se puede adaptar para realizar diversas mediciones de detección de fibra óptica, tales como DAS, DTS o DSTS. El sistema comprende una fuente láser 302, cuya salida se divide a lo largo de dos trayectorias. La primera trayectoria comprende una etapa de generación de pulsos 304 configurada para recibir luz desde la fuente láser 302 y generar una señal de luz pulsada. La señal pulsada se transmite a través de un circulador óptico 306 a una fibra óptica 308. A medida que la señal de luz pulsada viaja a lo largo de la fibra óptica 308, partes de la señal se retrodispersan a lo largo de la fibra 308. Las señales retrodispersadas desde la fibra 308 que alcanzan el circulador óptico 306 se transmiten a continuación a una etapa de detección 310. La segunda trayectoria conectada a la fuente láser 302 proporciona una señal de oscilador local, que se puede conectar directamente a la etapa de detección 310. La etapa de detección 310 incluye componentes de detección adecuados para detectar las señales retrodispersadas y la señal de oscilador local, y para generar una señal de salida basándose en las señales recibidas. En algunos casos, la etapa de detección 310 se puede configurar para interferir las señales retrodispersadas con la señal de oscilador local, y detectar una interferencia de las señales retrodispersadas con la señal de oscilador local. Este puede ser el caso, por ejemplo, cuando se realiza una medición de DAS.
La figura 3b muestra un ejemplo de datos representativos de una medición de fibra óptica, que se puede obtener, por ejemplo, desde el sistema 300. En particular, los datos en la figura 3b corresponden a una medición de DAS, que puede ser indicativa de un entorno acústico a lo largo de la fibra óptica 308. La figura 3b muestra una representación de una magnitud de una densidad espectral de potencia (PSD) de la señal de medición de DAS como una función del tiempo y la distancia a lo largo de la fibra óptica 308 a lo largo de un cierto intervalo de frecuencia (aproximadamente 10-60 Hz). La distancia a lo largo de la fibra óptica 308 se puede determinar, por ejemplo, basándose en un tiempo de recepción de las señales retrodispersadas. La figura 3c muestra una representación de la magnitud de la PSD como una función de la distancia a lo largo de la fibra óptica 308, en un momento particular en el tiempo. En otras palabras, la representación de la figura 3c corresponde a un corte (muestra) de la representación de la figura 3b a lo largo del eje de distancia.
Las figuras 3b y 3c muestran representaciones de ejemplo de los datos de DAS. Tales representaciones de los datos de DAS se pueden generar, por ejemplo, por uno de los módulos de preparación descritos anteriormente basándose en datos sin procesar recibidos desde el sistema de detección de fibra óptica 300. La representación de datos se puede usar a continuación en uno de los conjuntos de datos de entrenamiento y/o para la entrada en el segundo modelo de aprendizaje automático. Por supuesto, son posibles otras representaciones posibles de los datos de medición y se podrían usar con la invención. Por ejemplo, se podrían usar otros tipos de representaciones o gráficos para representar los datos, o los datos se podrían proporcionar en forma de una tabla de valores numéricos.
Las figuras 4a y 4b ilustran un proceso 400 que se puede usar para entrenar el primer modelo de aprendizaje automático. El proceso 400 se puede implementar, por ejemplo, como parte de la etapa 102 del método 100, y/o implementarse por el primer módulo de entrenamiento 210 descrito anteriormente. El proceso 400 es un proceso de aprendizaje autosupervisado realizado usando el primer conjunto de datos de entrenamiento no etiquetado. La figura 4b muestra un elemento de datos 402 en el primer conjunto de datos de entrenamiento. El elemento de datos 402 corresponde a una representación (por ejemplo, imagen) de una muestra de datos de detección de fibra óptica obtenidos desde un sistema de detección de fibra óptica (por ejemplo, uno de los sistemas 202a-c). El elemento de datos 402, por ejemplo, se puede haber preparado por el primer módulo de preparación de datos 206 y almacenado como parte del primer conjunto de datos de entrenamiento en la primera base de datos de entrenamiento 208. La representación de datos usada para el elemento de datos 402 puede corresponder a la descrita anteriormente en relación con la figura 3b, es decir, puede representar la magnitud de una señal de DAS como una función del tiempo y la distancia a lo largo de la fibra. El primer conjunto de datos de entrenamiento puede comprender una pluralidad de tales elementos de datos, representando cada elemento de datos una muestra respectiva de datos de detección de fibra óptica.
Para comenzar, el proceso 400 implica aplicar una máscara generada aleatoriamente 404 al elemento de datos 402, para enmascarar parcialmente datos en el elemento de datos. La máscara 404 puede estar dispuesta de manera que se cubra una proporción predeterminada del elemento de datos 402, aunque las áreas del elemento de datos 402 que están cubiertas pueden ser aleatorias. Como un ejemplo, el elemento de datos 402 se puede dividir en una pluralidad de parches, y se enmascara un número de parches seleccionados aleatoriamente. El elemento de datos parcialmente enmascarado 402 se proporciona a continuación como una entrada al primer modelo de aprendizaje automático, que se entrena para predecir o reconstruir el elemento de datos 402. Por lo tanto, el primer modelo de aprendizaje automático se puede configurar como un autocodificador (o autocodificador enmascarado) que se entrena para reconstruir datos enmascarados.
Con más detalle, como se muestra en la figura 4a, el elemento de datos enmascarado 402 se proporciona como una entrada al primer modelo de aprendizaje automático 406, que está configurado como un autocodificador (el primer modelo de aprendizaje automático 406 puede corresponder al modelo 212 descrito anteriormente). El primer modelo de aprendizaje automático 406 codifica a continuación el elemento de datos enmascarado 402 en un espacio latente 408. Un descodificador 410 se configura a continuación para descodificar la representación en el espacio latente 408 emitida por el primer modelo de aprendizaje automático 406 para obtener una serie de parches de imagen 412, que, a continuación, se reconstruyen en un elemento de datos previsto 414. El elemento de datos previsto 414 se puede comparar a continuación con el elemento de datos original (no enmascarado) 402, para afinar el primer modelo de aprendizaje automático 406. Se pueden realizar muchas iteraciones de este proceso de entrenamiento con cada uno de los elementos de datos en el primer conjunto de datos de entrenamiento, aplicando cada vez una máscara generada aleatoriamente al elemento de datos y reconstruyendo a continuación el elemento de datos usando el primer modelo de aprendizaje automático 406 y el descodificador 410. El primer modelo de aprendizaje automático 406 se puede entrenar de esta manera, hasta que se alcance un nivel de precisión deseado de los elementos de datos previstos 414. El autocodificador puede contener una red de transformadores de visión (ViT). Una ViT de este tipo puede ser particularmente adecuada para un caso en el que los datos de detección de fibra óptica se representan como una representación o imagen, por ejemplo, como se muestra en la figura 3b.
Una vez que se ha entrenado el primer modelo de aprendizaje automático 406, se puede usar para formar un segundo modelo de aprendizaje automático 502, como se muestra en la figura 5. El segundo modelo de aprendizaje automático 502 incluye el primer modelo de aprendizaje automático 406 (es decir, el codificador desde el proceso 400), y un modelo de decisión 502 que está conectado a una salida del primer modelo de aprendizaje automático 406. En particular, el modelo de decisión 504 está dispuesto para tomar como una entrada la representación en el espacio latente 408 emitida por el primer modelo de aprendizaje automático 406. A continuación, basándose en la representación de espacio latente recibida desde el primer modelo de aprendizaje automático 406, el modelo de decisión 504 se configura para generar una salida 506. El modelo de decisión 504 puede corresponder, por ejemplo, a una ANN tal como una CNN.
La figura 5 ilustra un proceso 500 para entrenar el segundo modelo de aprendizaje automático 502. El entrenamiento del segundo modelo de aprendizaje automático 502 se realiza usando el segundo conjunto de datos de entrenamiento. Se proporciona un elemento de datos 508 a una entrada del segundo modelo de aprendizaje automático 502, que puede corresponder a la entrada del primer modelo de aprendizaje automático 406. De manera similar al elemento de datos 402 descrito anteriormente, el elemento de datos 508 es una representación (por ejemplo, imagen) de una muestra de datos de detección de fibra óptica obtenidos desde un sistema de detección de fibra óptica (por ejemplo, el sistema 202d). El elemento de datos 508, por ejemplo, se puede haber preparado por el segundo módulo de preparación de datos 216 y almacenado como parte del segundo conjunto de datos de entrenamiento en la segunda base de datos de entrenamiento 218. La representación de datos usada para el elemento de datos 508 desde el segundo conjunto de datos de entrenamiento es la misma que para el elemento de datos 402 desde el primer conjunto de datos de entrenamiento, por ejemplo, correspondiente a la representación de datos descrita anteriormente en relación con la figura 3b. Sin embargo, a diferencia del proceso 400, el elemento de datos 508 no está enmascarado, es decir, el elemento de datos 508 completo se proporciona al segundo modelo de aprendizaje automático 502. En línea con lo anterior, después de la entrada del elemento de datos 508 en el segundo modelo de aprendizaje automático 502, se genera una salida 506 por el modelo de decisión 504. La salida 506 se puede usar como realimentación en el proceso de entrenamiento, para afinar (ajustar) el segundo modelo de aprendizaje automático 502. El proceso 500 se puede realizar a lo largo de muchas iteraciones con cada uno de los elementos de datos en el segundo conjunto de datos de entrenamiento, para optimizar una precisión de la salida 506 proporcionada por el modelo. En algunos casos, el primer modelo de aprendizaje automático 406 puede permanecer fijo durante el curso de entrenamiento del segundo modelo de aprendizaje automático 502. En otras palabras, únicamente los parámetros en el modelo de decisión 504 se pueden ajustar como parte del proceso de entrenamiento 500, mientras que los parámetros en el primer modelo de aprendizaje automático 406 permanecen fijos.
Como se ha indicado anteriormente, se pueden etiquetar elementos de datos en el segundo conjunto de datos de entrenamiento. Por consiguiente, el proceso 500 puede implicar un proceso de aprendizaje supervisado, en el que los elementos de datos etiquetados se usan para el aprendizaje supervisado del segundo modelo de aprendizaje automático. En otras palabras, los elementos de datos etiquetados pueden actuar como datos de verdad fundamental para entrenar el segundo modelo de aprendizaje automático 506. Se pueden usar técnicas de aprendizaje supervisado, por ejemplo, donde el segundo modelo de aprendizaje automático 502 se entrena como un clasificador, o como un modelo de detección o predicción de eventos. Por ejemplo, los elementos de datos en el segundo conjunto de datos de entrenamiento se pueden etiquetar para clasificar los datos y/o para indicar si un elemento de datos corresponde o no a un evento predeterminado. En un caso de este tipo, el modelo de decisión 504 puede ser un modelo de regresión logística, para resolver problemas de clasificación. También se pueden usar técnicas de aprendizaje supervisado para predecir una propiedad o una variable (por ejemplo, un atributo) de un sistema o un entorno monitorizados por el sistema de detección de fibra óptica. Por ejemplo, los elementos de datos en el segundo conjunto de datos de entrenamiento se pueden etiquetar para indicar un valor de la propiedad o de la variable que corresponde a un tiempo en el que se registraron los datos. Las técnicas de aprendizaje supervisado se pueden usar además para la detección de anomalías. En un caso de este tipo, los elementos de datos en el segundo conjunto de datos de entrenamiento se pueden etiquetar para indicar si los elementos de datos corresponden a un comportamiento normal o anómalo del sistema o del entorno monitorizados por el sistema de detección de fibra óptica. Los ejemplos de modelos de aprendizaje automático supervisado adecuados que se podrían usar para el modelo de decisión 504 incluyen ANN, CNN, redes de transformadores y SVM.
Como alternativa, cuando los elementos de datos en el segundo conjunto de datos de entrenamiento no están etiquetados, se puede realizar un proceso de aprendizaje no supervisado. Por ejemplo, se puede usar aprendizaje no supervisado para entrenar el segundo modelo de aprendizaje automático 502 como un detector de anomalías, para predecir si los datos recibidos corresponden a un comportamiento normal o anómalo. Por ejemplo, se puede usar detección de anomalías de vecino más cercano. Las técnicas de detección de anomalías de vecino más cercano se basan en una suposición de que las instancias de datos 'normales' se producen en vecindades densas, mientras que las anomalías se producen lejos de sus vecinos más cercanos. Por consiguiente, se puede definir una medida de distancia o similitud entre dos instancias de datos y calcular de diversas maneras, tal como la distancia euclidiana.
La figura 6 ilustra un proceso 600 para entrenar un segundo modelo de aprendizaje automático 602. El proceso 600 se basa en los mismos principios que el proceso 500 descrito anteriormente, excepto que el segundo modelo de aprendizaje automático 602 incluye múltiples modelos de decisión 604a-n. Por lo tanto, mientras que el segundo modelo de aprendizaje automático 502 incluye un único modelo de decisión 504 conectado a la salida del primer modelo de aprendizaje automático 406, el segundo modelo de aprendizaje automático 602 incluye una pluralidad de modelos de decisión 604a-n conectados a una salida del primer modelo de aprendizaje automático 406. Cada uno de los modelos de decisión 604a-n está configurado para generar una respectiva salida 606a, basándose en una entrada recibida desde el primer modelo de aprendizaje automático 406. En el ejemplo mostrado, cada uno de los modelos de decisión 604a-n está dispuesto para tomar como su entrada la misma salida en el espacio latente 408 desde el primer modelo de aprendizaje automático 406. Sin embargo, en otros ejemplos, los modelos de decisión 604a-n pueden estar dispuestos para recibir salidas desde diferentes capas en el primer modelo de aprendizaje automático 406.
Cada uno de los modelos de decisión 604a-n se puede configurar para realizar una tarea respectiva. Por ejemplo, un primer modelo de decisión 604a se puede configurar como un clasificador, un segundo modelo de decisión 604 se puede configurar como un detector de eventos, y otro modelo de decisión 604n se puede configurar como un detector de anomalías. Por supuesto, se pueden conectar diferentes números de modelos de decisión al primer modelo de aprendizaje automático 406, dependiendo de los tipos y números de tareas a realizar. Cada uno de los modelos de decisión 604a-n se puede entrenar independientemente, usando un segundo conjunto de datos de entrenamiento respectivo. Por lo tanto, durante el entrenamiento del uno de los modelos de decisión (por ejemplo, el modelo 604a), el primer modelo de aprendizaje automático 406 y los otros modelos de decisión (por ejemplo, los modelos 604b-n) pueden permanecer fijos. De esta manera, cada uno de los modelos de decisión 604a-n se puede entrenar a su vez, usando elementos de datos 608 desde el correspondiente segundo conjunto de datos de entrenamiento para cada modelo de decisión. Cada segundo conjunto de datos de entrenamiento respectivo se puede adaptar al tipo de entrenamiento y tarea a realizar por el modelo de decisión correspondiente. Por ejemplo, el segundo conjunto de datos de entrenamiento para un modelo de decisión particular se puede etiquetar o no etiquetar, dependiendo de si el entrenamiento para ese modelo se ha de supervisar o no. Una vez que se ha entrenado el segundo modelo de aprendizaje automático 602, puede tomar un elemento de datos como una entrada, y proporcionar una pluralidad de salidas 606a-n, es decir, una desde cada modelo de decisión 604a-n.
Las características divulgadas en la descripción anterior, o en las siguientes reivindicaciones, o en los dibujos adjuntos, expresadas en sus formas específicas o en términos de un medio para realizar la función divulgada, o un método o proceso para obtener los resultados divulgados, según corresponda, se pueden utilizar, por separado o en cualquier combinación de tales características, para realizar la invención en diversas formas de la misma.
Para evitar cualquier duda, cualquier explicación teórica proporcionada en el presente documento se proporciona con el fin de mejorar la comprensión de un lector. Los inventores no desean estar vinculados por ninguna de estas explicaciones teóricas.
Cualquier encabezado de sección usado en el presente documento es solo para fines organizativos y no debe interpretarse como limitante de la materia objeto descrita.
A lo largo de esta memoria descriptiva, incluyendo en las siguientes reivindicaciones, a menos que el contexto requiera lo contrario, se entenderá que la palabra "comprende" e "incluye" y variaciones tales como "comprender", "que comprende" e "que incluye" implican la inclusión de un elemento integrante o etapa o grupo de elementos integrantes o etapas establecidos, pero no la exclusión de ningún otro elemento integrante o etapa o grupo de elementos integrantes o etapas.
Debe señalarse que, como se usa en la memoria descriptiva y en las reivindicaciones adjuntas, las formas singulares "un", "una", "el" y "la" incluyen referencias plurales a menos que el contexto dicte claramente el contexto de otra manera. Los intervalos se pueden expresar en el presente documento como de "aproximadamente" un valor particular y/o a "aproximadamente" otro valor particular. Cuando se expresa un intervalo de este tipo, otra realización incluye desde el valor particular y/o hasta el otro valor particular. De forma similar, cuando los valores se expresan como aproximaciones, mediante el uso del antecedente "aproximadamente", se entenderá que el valor particular forma otra realización. El término "aproximadamente" en relación con un valor numérico es opcional y significa, por ejemplo, /-10 %.
Claims (16)
1. Un método (100) de entrenamiento de un modelo de aprendizaje automático para su uso con datos representativos de mediciones de detección de fibra óptica, comprendiendo el método:
entrenar un primer modelo de aprendizaje automático (212) usando un primer conjunto de datos de entrenamiento, en donde el primer conjunto de datos de entrenamiento comprende datos representativos de mediciones de detección de fibra óptica, y en donde el primer conjunto de datos de entrenamiento no está etiquetado; y
usar un segundo conjunto de datos de entrenamiento, entrenar un segundo modelo de aprendizaje automático (222) que incorpora al menos parte del primer modelo de aprendizaje automático entrenado, en donde el segundo conjunto de datos de entrenamiento comprende datos representativos de mediciones de detección de fibra óptica, siendo el segundo conjunto de datos de entrenamiento más pequeño que o igual en tamaño al primer conjunto de datos de entrenamiento;
en donde el segundo modelo de aprendizaje automático está configurado para generar una salida basándose en datos recibidos que son representativos de una medición de detección de fibra óptica realizada por un sistema de detección de fibra óptica dispuesto para monitorizar un sistema o un entorno, siendo la salida indicativa de uno o más de una propiedad o una variable para el sistema o el entorno monitorizados, una detección de eventos, una predicción de eventos y una detección de anomalías;
estando el método caracterizado por que:
el primer modelo de aprendizaje automático se entrena con el primer conjunto de datos de entrenamiento a través de un proceso de aprendizaje autosupervisado; y
el proceso de aprendizaje autosupervisado comprende enmascarar parcialmente datos en el primer conjunto de datos de entrenamiento, y entrenar el primer modelo de aprendizaje automático para reconstruir datos en el primer conjunto de datos de entrenamiento a partir de los datos parcialmente enmascarados.
2. Un método de acuerdo con la reivindicación 1, en donde el segundo modelo de aprendizaje automático se entrena usando un proceso de aprendizaje supervisado, y en donde el segundo conjunto de datos de entrenamiento comprende datos etiquetados usados en el proceso de aprendizaje supervisado.
3. Un método de acuerdo con la reivindicación 2, en donde:
los datos etiquetados comprenden elementos de datos que están etiquetados para indicar un atributo de los elementos de datos; y
la salida generada por el segundo modelo de aprendizaje automático es indicativa de un atributo de los datos recibidos.
4. Un método de acuerdo con cualquier reivindicación anterior, en donde el segundo modelo de aprendizaje automático se entrena usando un proceso de aprendizaje no supervisado, y en donde el segundo conjunto de datos de entrenamiento comprende datos no etiquetados usados en el proceso de aprendizaje no supervisado.
5. Un método de acuerdo con cualquier reivindicación anterior, en donde el segundo modelo de aprendizaje automático está configurado como un detector de anomalías.
6. Un método de acuerdo con cualquier reivindicación anterior, en donde el primer conjunto de datos de entrenamiento se recopiló usando dos o más sistemas de detección de fibra óptica diferentes (202a, 202b, 202c). 7. Un método de acuerdo con la reivindicación 6, en donde los dos o más sistemas de detección de fibra óptica diferentes están ubicados en diferentes sitios geográficos; y/o
en donde el segundo conjunto de datos de entrenamiento se recopiló usando menos sistemas de detección de fibra óptica que el primer conjunto de datos de entrenamiento.
8. Un método de acuerdo con cualquier reivindicación anterior, en donde el segundo modelo de aprendizaje automático comprende el primer modelo de aprendizaje automático entrenado y un modelo de decisión (224) que está conectado a una salida del primer modelo de aprendizaje automático.
9. Un método de acuerdo con cualquiera de las reivindicaciones 1 a 7, en donde:
el segundo modelo de aprendizaje automático (602) comprende el primer modelo de aprendizaje automático entrenado (406) y dos o más modelos de decisión (604a, 604b, 604n), estando cada uno de los dos o más modelos de decisión conectados a una salida del primer modelo de aprendizaje automático; y
cada uno de los dos o más modelos de decisión está configurado para realizar una tarea respectiva y se entrena usando un segundo conjunto de datos de entrenamiento respectivo.
10. Un método de acuerdo con cualquier reivindicación anterior, en donde el primer modelo de aprendizaje automático entrenado permanece fijo durante el entrenamiento del segundo modelo de aprendizaje automático.
11. Un método de acuerdo con cualquiera de las reivindicaciones 1 a 9, en donde uno o más parámetros del primer modelo de aprendizaje automático entrenado se ajustan durante el entrenamiento del segundo modelo de aprendizaje automático.
12. Un método de acuerdo con cualquier reivindicación anterior, en donde el primer conjunto de datos de entrenamiento comprende además datos indicativos de condiciones ambientales asociadas con el registro de datos en el primer conjunto de datos de entrenamiento, y/o el segundo conjunto de datos de entrenamiento comprende además datos indicativos de condiciones ambientales asociadas con el registro de datos en el segundo conjunto de datos de entrenamiento.
13. Un método de análisis de datos representativos de una medición de detección de fibra óptica, comprendiendo el método:
recibir, por un modelo de aprendizaje automático, datos representativos de una medición de detección de fibra óptica realizada por un sistema de detección de fibra óptica dispuesto para monitorizar un sistema o un entorno, en donde el modelo de aprendizaje automático se entrenó usando un método de acuerdo con cualquier reivindicación anterior; y
en respuesta a la recepción de los datos, generar, por el modelo de aprendizaje automático, una salida que es indicativa de una o más de una propiedad o una variable para el sistema o el entorno monitorizados, una detección de eventos, una predicción de eventos y una detección de anomalías.
14. Un método de acuerdo con la reivindicación 13, en donde la salida generada por el modelo de aprendizaje automático es indicativa de una probabilidad de que los datos recibidos correspondan a una condición predeterminada, y/o la salida generada por el modelo de aprendizaje automático es indicativa de un atributo de los datos.
15. Un sistema implementado por ordenador (200) para entrenar un modelo de aprendizaje automático, estando configurado el sistema para:
entrenar un primer modelo de aprendizaje automático (212) usando un primer conjunto de datos de entrenamiento, en donde el primer conjunto de datos de entrenamiento comprende datos representativos de mediciones de detección de fibra óptica, y en donde el primer conjunto de datos de entrenamiento no está etiquetado; y
con un segundo conjunto de datos de entrenamiento, entrenar un segundo modelo de aprendizaje automático (222) que incorpora al menos parte del primer modelo de aprendizaje automático entrenado, en donde el segundo conjunto de datos de entrenamiento comprende datos representativos de mediciones de detección de fibra óptica, siendo el segundo conjunto de datos de entrenamiento más pequeño que o igual en tamaño al primer conjunto de datos de entrenamiento, y en donde el segundo modelo de aprendizaje automático está configurado para generar una salida basándose en datos recibidos que son representativos de una medición de detección de fibra óptica realizada por un sistema de detección de fibra óptica dispuesto para monitorizar un sistema o un entorno, siendo la salida indicativa de una o más de una propiedad o una variable para el sistema o el entorno monitorizados, una detección de eventos, una predicción de eventos y una detección de anomalías; caracterizado por que el sistema está configurado además para:
entrenar el primer modelo de aprendizaje automático con el primer conjunto de datos de entrenamiento a través de un proceso de aprendizaje autosupervisado; y
el proceso de aprendizaje autosupervisado comprende enmascarar parcialmente datos en el primer conjunto de datos de entrenamiento, y entrenar el primer modelo de aprendizaje automático para reconstruir datos en el primer conjunto de datos de entrenamiento a partir de los datos parcialmente enmascarados.
16. Un sistema implementado por ordenador (226) para analizar datos representativos de una medición de detección de fibra óptica realizada por un sistema de detección de fibra óptica dispuesto para monitorizar un sistema o un entorno, comprendiendo el sistema un modelo de aprendizaje automático (222) que se entrenó usando un método de acuerdo con una cualquiera de las reivindicaciones 1 a 14.
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP22215585.5A EP4390764B1 (en) | 2022-12-21 | 2022-12-21 | Method for training a machine learning model for optical fiber sensing measurements |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES3036186T3 true ES3036186T3 (en) | 2025-09-15 |
Family
ID=84569812
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES22215585T Active ES3036186T3 (en) | 2022-12-21 | 2022-12-21 | Method for training a machine learning model for optical fiber sensing measurements |
Country Status (7)
| Country | Link |
|---|---|
| US (1) | US20260030547A1 (es) |
| EP (1) | EP4390764B1 (es) |
| CN (1) | CN120283240A (es) |
| AU (1) | AU2023410991A1 (es) |
| ES (1) | ES3036186T3 (es) |
| TW (1) | TW202427280A (es) |
| WO (1) | WO2024132977A1 (es) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN121632001A (zh) * | 2025-12-05 | 2026-03-10 | 山西大学 | 一种基于光纤传感的非监督学习边坡监测方法、装置、设备及介质 |
| CN121613502A (zh) * | 2026-02-03 | 2026-03-06 | 清华大学 | 一种场地地震响应的预测方法及装置 |
-
2022
- 2022-12-21 EP EP22215585.5A patent/EP4390764B1/en active Active
- 2022-12-21 ES ES22215585T patent/ES3036186T3/es active Active
-
2023
- 2023-12-15 AU AU2023410991A patent/AU2023410991A1/en active Pending
- 2023-12-15 WO PCT/EP2023/086180 patent/WO2024132977A1/en not_active Ceased
- 2023-12-15 US US19/141,873 patent/US20260030547A1/en active Pending
- 2023-12-15 CN CN202380081218.1A patent/CN120283240A/zh active Pending
- 2023-12-21 TW TW112149962A patent/TW202427280A/zh unknown
Also Published As
| Publication number | Publication date |
|---|---|
| TW202427280A (zh) | 2024-07-01 |
| EP4390764C0 (en) | 2025-05-14 |
| US20260030547A1 (en) | 2026-01-29 |
| CN120283240A (zh) | 2025-07-08 |
| EP4390764B1 (en) | 2025-05-14 |
| WO2024132977A1 (en) | 2024-06-27 |
| AU2023410991A1 (en) | 2025-06-12 |
| EP4390764A1 (en) | 2024-06-26 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Shao et al. | Artificial intelligence-driven distributed acoustic sensing technology and engineering application | |
| Figueiredo et al. | Three decades of statistical pattern recognition paradigm for SHM of bridges | |
| Li et al. | Pattern recognition for distributed optical fiber vibration sensing: A review | |
| ES3036186T3 (en) | Method for training a machine learning model for optical fiber sensing measurements | |
| CN118981734B (zh) | 基于人工智能的文旅均匀导光照明故障诊断方法及系统 | |
| Sun et al. | Man-made threat event recognition based on distributed optical fiber vibration sensing and SE-WaveNet | |
| Luleci et al. | Generative adversarial networks for data generation in structural health monitoring | |
| Wang et al. | Intelligent detection and recognition of multi-vibration events based on distributed acoustic sensor and improved YOLOv8 model | |
| Liu et al. | Traffic dynamics exploration and incident detection using spatiotemporal graphical modeling | |
| Attarha et al. | Automated fault detection framework for reliable provision of iot applications in agriculture | |
| Bel-Hadj et al. | Structural health monitoring in a population of similar structures with self-supervised learning: a two-stage approach for enhanced damage detection and model tuning | |
| Hajializadeh | Machine-learning-based bridge damage detection using train-borne measurements | |
| Shen et al. | A Fast recognition method for DVS perimeter security intrusion signals based on transfer learning | |
| Han et al. | A semi-supervised diffusion-based paradigm for vehicle-track system health monitoring with distributed acoustic sensing | |
| Sujanthi et al. | Climate change adaptation and mitigation using deep learning for urban environments | |
| CN117496650B (zh) | 一种基于环境嵌入的分布式光纤入侵预警方法及系统 | |
| Bi et al. | A fault diagnosis algorithm for wind turbine blades based on bp neural network | |
| Yan et al. | LR-Net for Weak Vibration Event Location and Recognition with DAS | |
| Deng | Fault diagnostics on railway switches and crossings using a bat-optimised sequence-to-sequence neural model | |
| Rahman | Railroad condition monitoring using distributed acoustic sensing and deep learning techniques | |
| Jagtap et al. | Smart analysis of air pollutants in urban areas | |
| Macdonald et al. | Robust Storm Surge Forecasts for Early Warning System: A Machine Learning Approach Using Adaptive Monte Carlo Bayesian Model Selection Algorithm | |
| US20260065895A1 (en) | Audio dataset generation to specific audio domain using text-conditional generative models | |
| Jiang et al. | Vibration area localization and event recognition for underground power optical cable in multiple laying scenarios based on deep learning | |
| Kaushik et al. | Enhancing fault detection and classification in optical fiber networks with deep learning algorithms |