La combinación de las capacidades del Machine Learning con la analítica en streaming proporciona capacidades realmente ricas no sólo para generar predicciones, sino aún más importante para actuar sobre las predicciones.
El aprendizaje de la máquina es acerca de dejar que el software resuelva las cosas por su cuenta.
Por ejemplo, el algoritmo de Clustering de Denstream le permite alimentar una corriente de datos y averiguar si * hay algún clúster relacionado – sin tener que saberlo antes de tiempo. Lo que es más importante, identifica los valores atípicos para usted, o para decirlo de otra manera: el algoritmo de agrupación calcula grupos de comportamientos «normales» y señala el «extraño» para que usted reaccione.
Se adapta a lo largo del tiempo, al envejecer los valores más antiguos y dar más peso a los eventos recientes – el algoritmo reconoce la «nueva normalidad» mucho antes de que los humanos podamos. Ese tipo de aprendizaje automatizado y adaptabilidad abre el potencial para hacer predicciones no sólo basadas en datos históricos sino en los datos «¡aquí mismo, ahora mismo!».
Al implementar las capacidades de aprendizaje automático en el motor de análisis de flujo, creamos la capacidad de generar y usar predicciones en tiempo real.
¿Desea predecir un fallo de la máquina basado en la temperatura y la vibración? Tire un Cluster Denstream en cada uno de los flujos de sensores de temperatura y vibración y observe los valores atípicos. Cuando las lecturas de cualquiera de los sensores aparecen como valores atípicos, usted sabe que la máquina ya no está actuando normalmente – eso es una predicción de «cosas malas por venir».
Cuando las lecturas de ambos flujos de sensores muestran valores extremos, usted sabe que algo realmente no es normal. Esa información le permite actuar. Actuar podría ser tan simple como una alerta, pero eso es la vieja escuela.
La nueva escuela es resolver el problema antes de que suceda.
¿La temperatura sube? Acelera la máquina, baja la velocidad, deja que se enfríe. ¿Está la temperatura bajo control? Acelerar de nuevo, acelerar la producción, optimizar el rendimiento. ¿Vibración subiendo pero dentro de límites? Programe el mantenimiento. ¿La temperatura y las vibraciones suben? Apágalo. Todo eso se puede hacer en milisegundos.
Ya ves, predecir es sólo la mitad del problema. La otra mitad está haciendo esa predicción con tiempo suficiente para actuar sobre ella. Cuanto más cercano al evento de origen que puede hacer la predicción, más tiempo tendrá de actuar. Al aplicar el aprendizaje automático a la analítica de flujo continuo, puede hacer predicciones antes y actuar sobre ellas antes de llegar a la base de datos. O en otras palabras necesidades predictivas de streaming.