El Deep learning ha dejado claro en los últimos años el peso que tienen los datos a la hora de ser analizados y predecir el comportamiento de las máquinas en un momento dado. Así, se ha puesto de relieve la gran capacidad con la que cuentan las redes neuronales y en particular, nuevas metodologías como las redes Long Short Term Memory (LSTM).
¿QUÉ ES EL MANTENIMIENTO PREDICTIVO?
El mantenimiento predictivo ha puesto sobre la mesa el importante papel que tienen los datos de serie cronológica a la hora de dar con la mejor solución ante un daño o amenaza. En esa gestión, resultan claves la predicción,la clasificación y el diagnóstico así como la activación de medidas correctivas para evitar daños mayores. Una realidad que resulta esencial en campos como el industrial, entre otros.
REDES NEURONALES LSTM vs RNN:
PRINCIPALES DIFERENCIAS
En este sentido, el estudio de series temporales resulta crítico para el mantenimiento predictivo en entornos industriales. Si hasta hace unos años, la utilización de redes neuronales recurrentes (RNNs) era la tónica habitual para la resolución de estas problemáticas, la aparición de las Long Short-Term Memory (LSTM) está adquiriendo mayor importancia debido a su capacidad de aprendizaje a largo plazo.
Cabe destacar que una unidad LSTM es una unidad recurrente, es decir, una unidad (o neurona) que contiene conexiones cíclicas, por lo que una red neuronal LSTM es una red neuronal recurrente (RNN).
VENTAJAS DE LAS REDES LSTM SOBRE LAS RNN
Las redes LSTM cuentan con una ventaja clara sobre las RNN, ya que las redes LSTM pueden manejar la información en memoria durante un largo período de tiempo en comparación con las RNN. Mientras que la dependencia de largo alcance en RNN se resuelve aumentando el número de capas repetidas en LSTM.
DESVENTAJAS DE LAS RNN FRENTE A LAS LSTM
- Los RNN tienen bucles de retroalimentación en la capa recurrente. Esto les permite mantener la información en la «memoria» a lo largo del tiempo. Pero puede ser difícil entrenar RNN estándar para resolver problemas que requieren aprender dependencias temporales a largo plazo.
- Esto se debe a que el gradiente de la función de pérdida decae exponencialmente con el tiempo (llamado el problema del gradiente de fuga).
- Las redes LSTM son un tipo de RNN que utiliza unidades especiales además de las unidades estándar. Las unidades LSTM incluyen una «celda de memoria» que puede mantener la información en la memoria durante largos períodos de tiempo. Esta celda de memoria les permite aprender dependencias a más largo plazo.
- Los LSTM abordan el problema del gradiente de desaparición y explosión mediante la introducción de nuevas puertas, como las puertas de entrada y olvido, que permiten un mejor control sobre el flujo de gradiente y permiten una mejor conservación de las «dependencias de largo alcance».
¿CÓMO ACELERAR REDES NEURONALES LSTM?
Debido a los bucles de retroalimentación, la ejecución de estas redes neuronales en sistemas de computación normales como CPUs y GPUs es lenta y pesada. De forma que con estos sistemas de ejecución se complica mucho la utilización de redes LSTM para aplicaciones de tiempo real.
USO DE FPGAs PARA ACELERAR LSTM
Sin embargo, existe una tecnología que sirve para acelerar estas redes neuronales llegando a tiempos menores al tiempo real (>30 ms) y con un consumo del orden del vatio. Esta tecnología es la FPGA (Field Programable Gate Array) que permite diseñar circuitos electrónicos con la estructura de las redes neuronales.
EMPRESAS QUE OFRECEN TECNOLOGÍA FPGA
Existen varias empresas que proporcionan tecnología para el desarrollo de algoritmos propios como por ejemplo Xilinx e Intel. Algunos de los elementos de su catálogo son la familia UltraScale y Alveo (por parte de Xilinx) para las soluciones edge y servidor respectivamente.
Mediante estas soluciones, es posible conseguir aplicaciones de tiempo real con redes neuronales y en concreto redes LSTM que son especialmente pesadas.
Cabe destacar la importancia de las FPGAs en el ámbito energético. Mientras que en las FPGAs estándar, todos los bloques lógicos están diseñados para ser ejecutados a una sola velocidad; la mayor velocidad posible; lo cual genera un consumo de energía excesivo. La tecnología de energía programable permite que las FPGAs ofrezcan el menor consumo de energía y el más alto desempeño, aplicando la alta velocidad en los bloques críticos.
APLICACIONES DE LAS REDES LSTM EN LA INDUSTRIA
La aplicabilidad de las LSTM es la misma que la de las RNN siendo los resultados obtenidos mejores debido a las características explicadas previamente. Por lo que si ya se estaba utilizando las redes RNN en un proceso, la adaptación a LSTM podría dar mejores resultados predictivos.
Además la utilización de FPGA en combinación con las LSTM podría reducir considerablemente el gasto energético de un sistema de análisis de series temporales en tiempo real.
Doctora en Informática por la Universidad de Oviedo. Ingeniería Informática por la Universidad de Burgos. Miembro del grupo de Investigación de Electrónica Aplicada e Inteligencia Artificial de ITCL.
Especializada en el diseño y programación de sistemas de selección de características y clasificación y sus conocimientos de programación abarcan los lenguajes C, Java y Matlab. Además, ha participado y gestionado más de 5 proyectos industriales de I+D. Finalmente, cuenta con más de 20 publicaciones internacionales, capítulos de libros y participaciones en congresos, así como registros de software y patentes industriales.