Dell Technologies presentó Dell Validated Designs for Analytics: Data Lakehouse, que permite a las empresas combinar lagos de datos y almacenes de datos, lo que da como resultado calidad, rendimiento, seguridad y gobernanza de datos para todos los tipos de datos con autoservicio a pedido.
Dell Technologies presentó Dell Validated Designs for Analytics: Data Lakehouse, que permite a las empresas combinar lagos de datos y almacenes de datos, lo que da como resultado calidad, rendimiento, seguridad y gobernanza de datos para todos los tipos de datos con autoservicio a pedido.
Lago de datos
Dell Data Lakehouse permite la evolución de la gestión de datos de sistemas aislados, rígidos, costosos y lentos a sistemas unificados que permiten inteligencia comercial (BI), análisis, aplicaciones de datos en tiempo real, ciencia de datos y aprendizaje automático (ML). La solución validada de Data Lakehouse comprende equipos de toda la cartera de Dell, incluidos PowerEdge, PowerScale, ECS Object Storage y PowerSwitch.
Sin embargo, no todo es hardware, la infraestructura funciona con Apache Spark y Kafka con tecnologías Delta Lake y Robin Cloud-Native Platform (CNP). Cuando se agrupan todos juntos, esta solución está diseñada para aprovechar más datos para transformar los conocimientos en todas las organizaciones.
Según un blog de Chhandomay Mandal, director de marketing de soluciones ISG de Dell, “los sistemas tradicionales de gestión de datos, como los almacenes de datos, se han utilizado durante décadas para almacenar datos estructurados y ponerlos a disposición para el análisis. Sin embargo, los almacenes de datos no están configurados para manejar la variedad cada vez mayor de datos Dell ha ideado un diseño de tipo de arquitectura de referencia para un lago de datos/almacén de datos combinado utilizando software de socios de terceros y su propio servidor, almacenamiento y hardware de red y software (texto, imágenes, video, Internet de las cosas (IoT)) ni pueden admitir algoritmos de inteligencia artificial (IA) y aprendizaje automático (ML) que requieren acceso directo a los datos”.
Los lagos de datos prometieron ayudar a resolver estos problemas al permitir que las empresas capturen datos estructurados, no estructurados y semiestructurados de manera más flexible y rentable que los almacenes de datos tradicionales. Las organizaciones utilizan un lago de datos junto con un almacén de datos almacenando datos en el lago y luego copiándolos en el almacén, haciéndolo más accesible y agregando complejidad y costo al panorama analítico.
Una vez que las organizaciones manejan mejor esta huella de datos masiva, Data Lakehouse admite todo tipo de casos de uso. Business Intelligence (BI), análisis, aplicaciones de datos en tiempo real, ciencia de datos y ML son los principales candidatos. El punto que Dell está haciendo más o menos es que una vez que maneja los datos en expansión, es mucho más fácil obtener beneficios comerciales.
Especificaciones técnicas de Dell Data Lakehouse
Dell Data Lakehouse reúne una gran cantidad de software, pero en última instancia es una infraestructura convergente basada en hardware subyacente. Dell ha reunido algunas de sus mejores ofertas de hardware en la cartera para armar este diseño.
La siguiente tabla destaca los componentes clave del sistema, incluidos los nodos trabajadores que pueden admitir GPU. Muchas organizaciones querrán seguir ese camino, ya que gran parte de los análisis que se realizarán con estos datos pueden beneficiarse de la mayor potencia computacional que las GPU pueden aportar.
Los diseños validados de Dell para análisis: Data Lakehouse ya están disponibles.
Folleto de Data Lakehouse de Dell (PDF) (documento en inglés)
Interactuar con StorageReview
Boletín | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | TikTok | RSS Feed