8 febrero, 2022 | Martin Jelenek
Históricamente, los sistemas de administración de bases de datos (DBMS) eran programas de software simples y hardware asociado que permitía a los usuarios acceder a datos desde diferentes ubicaciones geográficas. Estos sistemas ofrecen a sus usuarios la capacidad de almacenar datos sin preocuparse por los cambios estructurales o la ubicación física de los datos. Además, otorgan la capacidad de establecer restricciones sobre los datos que se utilizan y los servicios disponibles para cada usuario.
Sin embargo, los DBMS están cambiando: se están expandiendo, asumiendo más responsabilidades y brindando respuestas más inteligentes.
A medida que se presentan nuevos objetivos y problemas, el deseo de encontrar nuevas formas de utilizar los sistemas de gestión de bases de datos genera soluciones únicas. Veamos cinco claves de la evolución de los datos.
La pandemia de COVID-19, que aceleró la popularidad de las compras en línea y el trabajo remoto, impulsó a las organizaciones a adoptar sistemas de administración de bases de datos y allanó el camino para un mayor uso de los sistemas de administración de bases de datos en la nube por sobre instalaciones on-premise. De hecho, los ingresos totales del mercado de DBMS fueron de u$65 mil millones en 2020, dentro de los cuales el DBMS en la nube representó u$ 26 mil millones.
Si bien cada vez más organizaciones fusionan sus almacenes de datos y data lakes en sistemas de almacenamiento en la nube, este cambio requiere un sistema de gestión de bases de datos que les permita trabajar con una amplia gama de nuevos formatos de datos.
1. Traslado acelerado a la nube
Hemos visto una oleada de movimiento a la nube en los últimos años. Las organizaciones ya no evalúan si la gestión de datos en la nube les ayudará o no; están evaluando cómo hacerlo. Están trazando su camino hacia la nube a través de almacenes de datos en la nube, lagos de datos en la nube y ecosistemas de datos en la nube.
El hardware local conlleva elevados costos de infraestructura: administradores de bases de datos, costes de ingeniería de datos, barridos de flujo y gestión de la propia infraestructura local. En un mundo post pandémico, todo eso es innecesariamente engorroso. Las organizaciones que mueven sus bases de datos y aplicaciones a la nube obtienen beneficios significativos en optimización de costos y productividad.
2. Gestión de datos aumentada o automatizada
Todas las organizaciones dependen de los datos, incluso aquellas que no cuentan con un ejército de ingenieros o científicos de datos. Es muy importante que las organizaciones de cualquier tamaño puedan implementar capacidades de gestión de datos.
Según Gartner, «la integración de datos (49 %) y la preparación de datos (37 %) se encuentran entre las tres principales tecnologías que a las organizaciones les gustaría automatizar para fines de 2022».
La gestión de datos tradicionalmente ha requerido mucho esfuerzo manual. Los pipelines de datos, especialmente los codificados a mano, pueden ser frágiles. Pueden fallar por todo tipo de razones: desviaciones del esquema cuando hay cambios entre el esquema de origen y el de destino, aplicaciones que se apagan, bases de datos que se desincronizan, o problemas de conectividad de red. Esas fallas pueden detener un negocio, sin mencionar que requieren mucho tiempo y son costosas de rastrear y reparar.
La automatización de la gestión de datos también libera recursos de ingeniería. Gartner, para 2023 la automatización habilitada por IA en la gestión e integración de datos reducirá la necesidad de especialistas en TI en un 20 %.
3. Gestión de metadatos
Dado que los metadatos son el “pegamento” que mantiene unidas las piezas necesarias de gestión de datos, no es de extrañar que las organizaciones apunten a mejorar su manejo.
A medida que las diferentes líneas de negocio desarrollan su propia Shadow IT, el ecosistema crece en complejidad: muchas empresas terminan comprando múltiples soluciones y herramientas y a menudo, necesitan pagar consultores para que trabajen juntas.
La agilidad empresarial es un requisito en el caótico panorama actual, que crea una enorme demanda de análisis. Los datos saludables ahora son imprescindibles para los usuarios con diversos niveles de habilidad técnica. Es imposible esperar que se conviertan en ingenieros y analistas de datos de la noche a la mañana para encontrar, compartir, limpiar y usar los datos que necesitan.
4. Acceso a datos en tiempo real
Los datos en tiempo real son vitales para las operaciones que van desde la fabricación hasta los servicios públicos y la experiencia del cliente minorista. Además, toda empresa necesita inteligencia operativa.
Cada vez que se crea un evento, debe poder respaldar el análisis en tiempo real.
No solo hemos visto la llegada del Internet de las cosas (IoT) y el Internet industrial de las cosas (IIoT): las empresas ahora dependen de ellos. En un mundo alimentado por datos en tiempo real, la integración por lotes y la integración masiva ya no son suficientes para mantenerse al día.
5. Propiedad de los datos de la línea de negocio
Los datos ya no están estrictamente controlados en el backend por TI o una organización de datos. En cada vez más empresas los CDO o CIO se centran en la gobernanza y el cumplimiento, mientras que los usuarios empresariales procesan los datos dentro de sus propias líneas de negocio.
A medida que los datos se convierten en el idioma de los negocios, estamos viendo la proliferación de científicos de datos ciudadanos, integradores de datos ciudadanos, ingenieros ciudadanos, analistas ciudadanos y más.