Il existe plusieurs options de stockage disponibles sur le marché aujourd'hui. La plupart des différenciateurs impliquent des vitesses différentes, plus de 9 de disponibilité ou une prise en charge variable de l'interface graphique. Dans l'ensemble, les tableaux sont très similaires ; ils offrent simplement des prix et une assistance différents ou des fonctionnalités destinées à un groupe défini de clients. DataGravity est entré dans l'image en offrant quelque chose de vraiment différent. L'accent de DataGravity n'est pas sur la vitesse à laquelle les données peuvent être stockées ou récupérées, ni sur le nombre de disques que vous pouvez intégrer dans un facteur de forme 2U ; du moins pas encore en tout cas. DataGravity consiste à être en mesure de comprendre vos données et d'aider les clients à les trouver facilement, à en faire rapport et à assurer la conformité avec les politiques du secteur ou internes.
Il existe plusieurs options de stockage disponibles sur le marché aujourd'hui. La plupart des différenciateurs impliquent des vitesses différentes, plus de 9 de disponibilité ou une prise en charge variable de l'interface graphique. Dans l'ensemble, les tableaux sont très similaires ; ils offrent simplement des prix et une assistance différents ou des fonctionnalités destinées à un groupe défini de clients. DataGravity est entré dans l'image en offrant quelque chose de vraiment différent. L'accent de DataGravity n'est pas sur la vitesse à laquelle les données peuvent être stockées ou récupérées, ni sur le nombre de disques que vous pouvez intégrer dans un facteur de forme 2U ; du moins pas encore en tout cas. DataGravity consiste à être en mesure de comprendre vos données et d'aider les clients à les trouver facilement, à en faire rapport et à assurer la conformité avec les politiques du secteur ou internes.
Comprendre la nuance de l'endroit où DataGravity s'intègre est important. Au sein de l'entreprise, il existe souvent des équipes d'analyse et de sécurité du Big Data chargées de rechercher et de sécuriser les données, mais ce n'est pas le marché que DataGravity recherche. DataGravity est destiné au marché de milieu de gamme qui, dans la plupart des cas, a un personnel informatique limité, mais les mêmes défis en matière de données que les grandes entreprises. Pourquoi DataGravity concentrerait-il un processus aussi compliqué sur quelqu'un qui semble mal équipé pour l'utiliser ? Parce que, comme le déclare Paula Long, fondatrice de DataGravity, si vous pouvez surfer sur le Web, vous pouvez utiliser ce produit. L'automatisation est la clé pour résoudre ces problèmes.
La famille DataGravity Discovery Series fonctionne en comprenant les données contenues dans les fichiers. En étant capable de sonder un document Word, par exemple, pour vérifier les numéros de sécurité sociale, le tableau DataGravity offre une visibilité immédiate sur les fichiers qu'une entreprise stocke. DataGravity peut alors comprendre ces données, en faire rapport et s'assurer que les informations sensibles ne sont pas partagées avec des parties inappropriées. En plus de comprendre les données stockées sur la baie, tous les accès aux fichiers et les activités des utilisateurs sont audités, ce qui aide les entreprises à répondre à leurs exigences de conformité et de sécurité. Il s'agit d'une distinction importante pour comprendre ce qu'est DataGravity et ce qu'il n'est pas. DataGravity est très concentré sur ce cas d'utilisation de données non structurées, qui est un terrain de jeu commun pour les NAS et autres. Bien qu'ils prennent en charge iSCSI, NFS et SMB, le cas d'utilisation principal de DataGravity n'est pas les cas d'utilisation d'applications commerciales courantes comme la messagerie électronique, la base de données transactionnelle, etc. La plate-forme finira peut-être par y aller, et le fera probablement, mais aujourd'hui, leur cible est extrêmement bien définie.
Les données telles que les numéros de sécurité sociale, les identifiants des patients, les numéros de téléphone, les numéros de carte de crédit, etc. sont faciles à définir et à comprendre. En fait, DataGravity prend en charge de nombreuses balises de conformité courantes prêtes à l'emploi. Ce n'est pas limité à ceux-là cependant. Pour les organisations qui ont des besoins uniques, comme le font de nombreuses entreprises, DataGravity propose un éditeur qui permet aux organisations d'établir leurs propres balises. Cela garantit que les utilisateurs de la plate-forme seront en mesure de répondre rapidement aux exigences de sécurité, de conformité et d'eDiscovery spécifiques à leur secteur. La visibilité sur les données stockées offre également une meilleure valeur commerciale en rendant tout consultable, en fonction des règles d'accès bien sûr.
DataGravity propose des baies dans plusieurs configurations qui exploitent les disques durs de proximité pour la capacité et la mémoire flash comme cache de lecture. Les unités sont à double contrôleur, chaque contrôleur étant "actif" et effectuant un travail spécifique dans lequel nous approfondirons ci-dessous. Le DG1100 est livré avec une capacité de disque brut de 18 To et le DG1200 est livré avec 36 To bruts. Le DG2200 offre 48 To et le DG2400 apporte 96 To à la table. Actuellement, ceux-ci ne sont pas extensibles, mais DataGravity voit clairement la nécessité de résoudre ce problème ; probablement avec des étagères d'extension et/ou une interface de gestion qui fédère plusieurs systèmes en une seule vue de gestion. Nos tests pour cette revue sont entièrement centrés sur la convivialité; nous avons passé deux jours avec DataGravity dans leur bureau de Nashua, NH et avons conclu un travail de suivi à distance. Cela nous a donné un peu de temps pratique avec une unité DG1100.
Architecture
DataGravity a deux contrôleurs actifs-actifs avec une torsion. Normalement, un contrôleur double actif-actif signifie que les deux contrôleurs sont actifs avec le traitement des E/S. Cependant, avec DataGravity, l'architecture imite l'actif-passif, le nœud principal servant les données et le nœud d'intelligence gérant l'analyse des données. DataGravity appelle cela "actif-proactif". La configuration de base ressemble à ceci : plusieurs Go de DRAM, une NVRAM sauvegardée par batterie, des SSD pour les métadonnées et le cache, puis des disques durs de proximité.
Avec une quantité non négligeable de données circulant via la DRAM et la NVRAM sauvegardée par batterie, DataGravity met en miroir les écritures entre le nœud principal et le nœud intelligent en tant que premier ordre du jour. Cela se fait via un pont PCIe interne, offrant une bande passante élevée et une communication à faible latence. Ce lien rapide est exploité dans l'architecture DataGravity pour sa protection continue des données et son analyse des données. Les données en cours sont mises en miroir jusqu'à ce que le nœud principal puisse les valider sur le disque. En mettant les deux contrôleurs au travail, la série Discovery exploite un nœud de stockage principal pour les E/S de production et fait fonctionner le nœud secondaire généralement inactif en tant que nœud d'intelligence. Le nœud d'intelligence exploite les métadonnées et les écritures fines mises en miroir sur ce contrôleur pour une protection continue et un traitement analytique sensible aux données.
Bien que l'actif-actif (ou actif-proactif dans ce cas) ait l'avantage d'utiliser ce qui a été payé (par opposition à l'actif-passif où le deuxième nœud reste inactif jusqu'à ce que le principal tombe en panne), une question a toujours tendance à se poser : qu'advient-il des performances si un nœud tombe en panne ? Si DataGravity a besoin de deux nœuds pour faire fonctionner sa magie et qu'un est perdu, qu'en est-il des clients ? En cas de panne d'un nœud, le nœud restant prend en charge les bases de la production. Les utilisateurs pourront toujours accéder aux fichiers et les utiliser comme ils le feraient dans leurs opérations quotidiennes normales. Cependant, la majeure partie des analyses est suspendue jusqu'à ce que le nœud défaillant soit restauré. En d'autres termes, la disponibilité demeure mais les fonctionnalités centrées sur les métadonnées sont réduites jusqu'à la restauration du nœud.
Convivialité
L'interface graphique DataGravity est basée sur HTML 5 et présente une mise en page très simple et utilisable. L'onglet d'accueil ne propose que trois options : Découvrir, Stockage ou Système. En haut à droite, nous voyons le panneau d'accès global, qui contient des icônes pour le tableau de bord du système et les alertes, l'espace de travail, le profil et l'aide en ligne.
Le tableau de bord du système donne aux utilisateurs un aperçu rapide des statistiques telles que le nombre de points de montage, le nombre total de fichiers protégés, l'allocation du pool et les statistiques d'utilisation des données.
L'onglet des alarmes système est tel qu'il se présente, donnant aux utilisateurs une liste des alarmes et où elles se sont produites dans le système.
À droite de l'onglet d'alarme se trouve l'onglet Espace de travail. Ici, les utilisateurs peuvent renommer ou ajouter des espaces de travail. Les espaces de travail permettent aux utilisateurs de configurer et de gérer leur vue privée du système. Les utilisateurs peuvent configurer plusieurs espaces de travail en fonction de leurs besoins.
L'icône suivante est l'icône Profils. En cliquant sur l'icône Profils, un utilisateur autorisé a la possibilité de gérer son profil ; abonnements par e-mail pour les recherches enregistrées et possibilité de se déconnecter du système. Lors de la connexion, l'interface graphique fournit plusieurs vignettes qui affichent des informations telles que le résumé de l'utilisation au fil du temps et l'activité récente (chacune ventilée par lectures, mises à jour, suppressions et, dans le cas de l'utilisation, créée. Il existe également un diagramme d'accords qui montre qui chaque utilisateur collabore avec et à quel titre.
Pour en revenir à l'onglet d'accueil, l'icône la plus à gauche est le pain et le beurre de DataGravity, l'onglet Découvrir. En cliquant sur l'onglet, les utilisateurs disposent d'options telles que la recherche, les tendances, l'analyse des fichiers, le suivi des activités et les alertes de contenu.
La recherche est comme il se doit. Une barre de recherche apparaît et les utilisateurs n'ont qu'à saisir le mot-clé ou le nom de fichier qu'ils recherchent. Avant de rechercher, les utilisateurs doivent sélectionner le point de montage dans lequel ils souhaitent effectuer la recherche. Dans l'image ci-dessous, la recherche porte sur "project woodstock". Cela a renvoyé tous les fichiers du point de montage public contenant ces termes. Les filtres sur la gauche permettent de resserrer davantage les résultats.
La tendance est similaire à la recherche, sauf qu'ici, les utilisateurs insèrent le mot-clé ou la balise qu'ils recherchent et la solution leur donnera une représentation graphique des données. Cela permet aux entreprises de voir comment les données sont consultées dans les fichiers actifs et supprimés au fil du temps. Dans la capture d'écran ci-dessous, l'étiquette de carte de crédit (CC) a été saisie dans les tendances. Les résultats montrent l'évolution des numéros de carte de crédit au fil du temps dans le point de montage public.
File Analytics est un autre endroit où DataGravity se sépare du reste des fournisseurs de stockage. Grâce à ce tableau de bord, les utilisateurs peuvent facilement voir les partages de fichiers et les machines virtuelles représentés par des blocs de couleur sur le côté droit. Plus la part est grande, en ce qui concerne la capacité consommée, plus le bloc coloré est grand. Les utilisateurs peuvent également voir les 10 premiers utilisateurs par espace consommé dans un graphique à barres, les utilisateurs les plus actifs (plus l'utilisateur est actif, plus son nom apparaît en grand), et les données inactives et la durée d'inactivité des données regroupées par 1, 3, 6 , 9 et 12 mois.
Cliquer sur un partage de fichiers individuel ou une machine virtuelle décompose davantage ces informations. À gauche se trouvent des informations sur les utilisateurs les plus actifs (tels que mesurés par les opérations de lecture/écriture/suppression) et les principaux utilisateurs par espace au sein du partage ou de la machine virtuelle. Il existe également une liste des données dormantes. À droite se trouvent quatre vignettes supplémentaires : distribution des balises, nombre de fichiers par catégorie, distribution des fichiers par taille et catégories de fichiers dans le temps. Cliquer sur chaque vignette fournit plus de détails.
L'onglet suivant dans la section découverte est Suivi d'activité. Comme son nom l'indique, les administrateurs et les utilisateurs de la sécurité peuvent rapidement voir quel utilisateur a effectué quelle activité pendant une période spécifique. Les administrateurs doivent simplement choisir le point de montage à rechercher, ainsi que l'utilisateur et la plage de dates.
Le dernier onglet de la section Découvrir permet aux administrateurs de gérer les alertes de contenu. Dans l'exemple ci-dessous, l'administrateur configure des alertes pour être averti lorsque des numéros de sécurité sociale ou de cartes de crédit sont trouvés en texte ouvert, dans des formats non cryptés et à des endroits auxquels ils n'appartiennent pas. Cela donne aux entreprises la possibilité de trouver et de déplacer rapidement des données critiques qui ont été placées dans des emplacements non sécurisés.
L'onglet principal suivant est l'onglet Stockage. Il y a 8 sous-onglets ici : Mount Points, VMs, DiscoveryPoint Schedule, Intelligence Management, Create CIFS/SMB, Create Datastore, Create iSCSI et Create NFS.
L'onglet Gérer les points de montage permet aux utilisateurs de voir les paramètres de chaque point de montage et d'en créer de nouveaux. Ici, les utilisateurs peuvent voir la capacité de chaque point de montage (ainsi que la quantité utilisée), une brève description de chacun, sa politique de protection et son statut. Chaque nouveau point de montage créé ici peut avoir ces paramètres ajustés selon les besoins.
L'onglet Gérer les machines virtuelles est similaire à celui ci-dessus. Ici, il est possible de visualiser et de configurer les informations sur les VM. Le nom de la machine virtuelle est répertorié ainsi que son emplacement, son système d'exploitation, sa capacité utilisée, sa politique de protection, son profil d'intelligence et si la machine virtuelle est en cours d'exécution ou hors tension. Cliquer sur une machine virtuelle fournit des détails supplémentaires.
L'onglet Gestion de l'intelligence permet aux administrateurs de configurer des profils d'intelligence pour des cas d'utilisation spécifiques et de les appliquer aux points de montage et aux machines virtuelles. Le bouton Balises permet aux administrateurs de définir des modèles ou des phrases de contenu contenant des données sensibles à l'aide d'un éditeur d'expressions régulières intégré.
Les quatre onglets suivants traitent tous de la création d'un point de montage et de son protocole d'accès, qu'il s'agisse de CIFS/SMB, d'un magasin de données NFS compatible VM, d'iSCSI ou de NFS (illustré ci-dessous). Les administrateurs ajoutent un nom pour le point de montage, ajoutent une description s'ils le souhaitent, sélectionnent la capacité, définissent la politique de sécurité, définissent la planification DiscoveryPoint et choisissent le profil d'intelligence.
La dernière section principale est l'onglet Système. Cliquer dessus nous donne quatre sous-onglets : Gestion du système, Accès utilisateur, Politiques de notification et Informations d'identification VMware.
L'onglet System Mgmt a plusieurs options, y compris System Health qui donne une vue de la santé du système physique. À gauche se trouve une liste de tous les composants de la solution. À droite se trouve une représentation graphique qui donnera à l'utilisateur plus d'informations en la survolant.
Également dans System Mgmt se trouve la section Pools de stockage, qui donne une vue de trois pools différents dans le système DataGravity : le pool principal ou le pool alloué pour une utilisation quotidienne, le pool d'intelligence et le pool libre pour le stockage qui a reste à allouer. À partir de cet écran, les utilisateurs peuvent redimensionner les pools selon leurs besoins.
Il existe également une option pour voir les performances du système. La vue des performances affiche à la fois les E/S de lecture et d'écriture et fournit des détails tels que le débit en Mo/s, les IOPS, la latence et la profondeur de la file d'attente. Les utilisateurs peuvent consulter les performances sur une période donnée ou consulter une lecture en temps réel des performances.
Et enfin, sous System Mgmt, les administrateurs peuvent afficher les journaux d'audit. Non seulement ils peuvent voir qui s'est connecté et ce qu'ils faisaient, mais les journaux peuvent être filtrés pour un accès plus facile et transmis à un autre système pour un traitement ultérieur.
DataGravity s'intègre également à VMware vRealize Operations Manager (vROPS) pour faire apparaître les analyses du système DataGravity dans la console centralisée fournie par vROPS. DataGravity n'a pas de présence virtuelle en soi, donc cette intégration permet à l'administrateur de la virtualisation d'avoir une vue sur le système sans être connecté à l'interface utilisateur de DataGravity. Bien que toutes les informations soient présentes, les visualisations de données sont limitées par rapport à l'interface graphique DataGravity.
L'intégration vROPS affiche des vues récapitulatives de Discovery Series, DataStore ou VM. Vous trouverez ci-dessous une vue du tableau de bord récapitulatif de la série Discovery qui montre la capacité et les performances globales du système ainsi que la latence des banques de données et des machines virtuelles stockées sur le système avec le score de risque pour chacune.
Lors de l'affichage du tableau de bord DataGravity Datastore Summary, des métriques similaires sont affichées pour les datastores NFS DataGravity.
L'intégration de vROPS affiche également des cartes "chaleur" montrant les zones de problèmes potentiels en fonction de valeurs prédéfinies pour l'utilisation de l'espace et des balises d'intelligence critiques trouvées dans les machines virtuelles, les banques de données et le système Discovery Series.
Et les administrateurs de la virtualisation peuvent voir quelles données dans lesquelles VM sont à risque. Grâce au système de marquage, ils peuvent même voir plus précisément le type de données à risque.
Conclusion
La série Discovery de DataGravity est une baie de stockage qui détourne l'attention des performances pures et des fenêtres de sauvegarde et de récupération pour être consciente des données. En d'autres termes, DataGravity a construit un système qui donne aux utilisateurs une visibilité sur toutes leurs données grâce à une interface graphique facile à utiliser. Cela ne permet pas seulement aux utilisateurs de voir où leurs données résident dans le système, cela leur donne une méthode approfondie pour suivre les données, qui y accède et si des données sensibles peuvent être exposées. DataGravity permet aux utilisateurs de baliser la plupart des types de fichiers, ce qui facilite la localisation et la surveillance rapides de fichiers de données spécifiques. Non seulement cela peut rendre les données d'une entreprise plus sûres en trouvant des problèmes (qu'ils soient involontaires ou malveillants), mais cela permet également à une entreprise d'utiliser pleinement toutes ses données stockées en comprenant la localisation des données, l'accès, les besoins de conservation et la conformité.
Normalement, chez StorageReview, nous examinons le matériel sous-jacent et testons ses performances grâce à une série de tests de performances. Dans le cas de DataGravity, le logiciel est le principal argument de vente. Alors que la société offre plusieurs capacités de 18 To à 96 To, et qu'elle a une combinaison de RAM, NVRAM, SSD et disques durs de proximité dans sa solution, le matériel sous-jacent existe pour prendre en charge la plate-forme d'analyse DataGravity. Bien sûr, tout le matériel existe pour prendre en charge les logiciels, mais la plupart des fournisseurs utilisent les deux en tandem pour fournir des capacités de stockage classiques. DataGravity ne prétend pas être la plus performante ou la latence la plus faible. Au lieu de cela, DataGravity se concentre sur la connaissance des données et la facilité d'utilisation. Sur ce point, l'entreprise excelle clairement.
L'équipe de StorageReview s'est rendue sur place pour tester la solution. Étant donné que nous nous concentrions cette fois sur la convivialité, nous n'avions pas besoin d'un appareil physique dans notre laboratoire pour exécuter nos tests de performance. Avant notre arrivée, DataGravity a ingéré une grande partie du contenu de notre site Web dans leur tableau, ce qui nous a donné des données de recherche que nous connaissions intimement. Avec juste un aperçu de base du système, nous avons pu commencer à utiliser intuitivement la solution pour rechercher des mots-clés dans différents types de fichiers, créer des partages, réaffecter des pools de données, ainsi que voir comment notre utilisation de la solution était suivie.
En fin de compte, ce que fait DataGravity est exceptionnellement différent du reste de l'industrie du stockage. L'équipe de vétérans a décidé de s'attaquer d'abord à la résolution des problèmes commerciaux légitimes, en utilisant la visibilité sur la conformité du stockage comme crochet. Cet accent mis sur l'intelligence est fondamental pour ce qu'est DataGravity, qui varie énormément des achats de stockage traditionnels basés sur un besoin de capacité ou de débit. Bien que l'approche DataGravity ait beaucoup de sens dans les industries réglementées, même notre cas d'utilisation pour les petites entreprises a vu des avantages immédiats une fois que nous avons pu avoir une vue approfondie d'une partie de notre contenu orienté vers l'extérieur. Associez cette information à la même chose pour les répertoires d'accueil des utilisateurs, les dossiers partagés pour les groupes de travail et le reste des actifs de l'entreprise, et les avantages s'accumulent rapidement. Il est également très intuitif à utiliser, ce qui fait de DataGravity un bon choix pour les petits magasins informatiques ou surchargés.
En résumé
La série Discovery de DataGravity permet aux entreprises d'utiliser pleinement toutes leurs données tout en les gardant sécurisées et exploitables via une interface facile à utiliser. L'accent mis sur l'analyse et la visibilité des données est vraiment unique dans l'industrie du stockage, donnant à DataGravity un point de différenciation majeur dans une industrie qui manque souvent de créativité.
Inscrivez-vous à la newsletter StorageReview