Las aplicaciones de inteligencia artificial (IA) para análisis de datos, a menudo quieren que todo el universo de información, incluidos muchos datos de tendencias históricas, puedan formar una inteligencia futura predictiva, y SAP ha desarrollado motores de análisis que funcionan con esa capacidad.

Si bien es fácil castigar a las empresas por un discurso de marketing que va hacia el trillado mensaje de ‘solución de plataforma unificada única’, es difícil para estas empresas deconstruir rápidamente lo que hacen y explicar arquitecturas de software complejas que se acerquen remotamente a su “Elevator Pitch” de 30 segundos.

En un intento por proporcionar algo de esa aclaración, intentemos explicar algunas de las entrañas detrás de las tuercas y tornillos (del software) en funcionamiento en el producto HANA de SAP, su línea SAP Data Intelligence y su SAP Business Technology Platform (BTP) más amplia. Si no es una explicación del ascensor, podría tomar al menos algunos tramos de escaleras si estamos más saludables y ascendiendo en un formato más apropiado.

¿Qué es el aprendizaje automático a escala empresarial?

A SAP le gusta decirnos que su software SAP Data Intelligence permite proyectos de aprendizaje automático a escala empresarial, y que estos sistemas resuelven de alguna manera el aprovisionamiento arquitectónico que debe establecerse para el momento en que un proyecto comienza a crecer y necesita activar el factor de escalabilidad al tamaño de la empresa. Si es así, ¿cómo funciona eso y cómo se asegura de que el sistema no se rompa a medida que crece?

La verdad es que a medida que crecen los grandes sistemas de información, pueden sufrir la expansión de los datos, ya que los elementos no estructurados de datos se quedan en el camino y no se incorporan a la estructura ordenada de los objetivos iniciales del proyecto

Este problema de expansión de datos puede agravarse por las suposiciones iniciales que los ingenieros de datos y los programadores establecieron cuando se elaboraron los primeros planos para el diseño del sistema. Lo que parecía periféricamente importante para un proyecto de análisis de datos y software el día cero, puede ser mucho más crítico para la misión en la producción en vivo y / o después de algunos meses de implementación.

Para SAP, la respuesta está en un enfoque modular y componible. El uso de plataformas de software basadas en contenedores permite la creación de contenedores independientes para el desarrollo de pipelines o código complejos. De esta manera, las cargas de trabajo de datos individuales (o al menos la mecánica de trabajo de las mismas) se pueden separar de manera más eficiente.

La compañía explica que al crear la capacidad de especificar recursos informáticos / de memoria para cada paso, ha creado formas más eficientes de permitir que suceda una escala ascendente cuando sea necesario. Se trata de un ‘tejido de datos empresarial’ capaz de conectarse e indexar todos los activos de datos potenciales de una organización (estructurados, no estructurados, semiestructurados, audio, texto, imágenes, transmisiones / IoT, etc.) independientemente de dónde estén los datos almacenados.

Cuando parece probable que la complejidad de los datos esté aumentando, el software encuentra los datos más relevantes y confiables a través de funciones de búsqueda simples basadas en texto enriquecidas, con etiquetas de metadatos y etiquetado de activos de datos generado por el usuario, así como calificaciones y comentarios generados por el usuario. Luego, los usuarios pueden crear e implementar reglas comerciales para los datos mientras monitorean las tendencias de calidad, y la compañía tiene una gran cantidad de herramientas de la marca SAP que funcionan en este espacio.

 

¿Cómo podemos ser más inteligentes con el almacenamiento?

Un subproducto natural de todos los análisis de datos en este campo es, por supuesto, la necesidad de almacenamiento de datos. A menudo clasificado como el elemento menos interesante de la tecnología de la información, el almacenamiento se vuelve un poco más interesante cuando pensamos en el almacenamiento de datos de formas inteligentes. Esto significa que la compañía ahora está hablando de datos calientes, fríos e incluso cálidos, es decir, su temperatura denota la sensibilidad de la información.

SAP HANA tiene una extensión de almacenamiento nativa diseñada para simplificar la gestión del almacenamiento de datos. Esta es una nueva característica que proporciona un almacén de datos cálido integrado y de uso general en SAP HANA para administrar los datos a los que se accede con menos frecuencia sin cargarlos completamente en la memoria.

SAP HANA es una base de datos orientada a columnas en memoria que se optimiza para cargas de trabajo transaccionales y analíticas en un sistema híbrido a través de cargas de trabajo analítica, logrando que el enlace de optimización adquiera la capacidad de trabajar en muchos tipos diferentes de datos a la vez.

 

 

https://www.forbes.com/sites/adrianbridgwater/2021/01/14/how-sap-data-technologies-work-on-the-inside/?ss=bigdata&sh=d37efc22e015