BlogOstraca solution
Gouvernance des données

Comment gérer les données redondantes, obsolètes ou inutiles (ROT) ?

Nicolas Verlhiac
08 février, 2021
4 min

Lorsqu’un réseau contient un excès de données redondantes, obsolètes ou inutiles (en anglais « ROT », Redundant, Obsolete, Trivial) , la productivité et les résultats souhaités peuvent en pâtir. La bonne nouvelle est que les organisations peuvent réduire considérablement l’impact des données ROT lorsqu’elles planifient correctement et investissent dans les bons outils.

Dans le monde entier, le rapport Global Databerg a constaté qu’en moyenne 52 % de toutes les données stockées par les entreprises sont de type ROT et n’ont aucune valeur pour l’entreprise…

Qu’est-ce que les données ROT exactement ?


Tout fichier inutile, périmé, désuet, non pertinent, en double, orphelin ou non commercial est une donnée ROT. Voyons cela plus en détail.

  • Les données redondantes : Ce sont des copies de fichiers qui sont stockées à plusieurs endroits sur des ordinateurs de bureau individuels, sur des serveurs de réseau, sur des serveurs SharePoint, sur des tablettes, des appareils mobiles, des ordinateurs centraux et dans le cloud.

  • Données obsolètes : Il s’agit de fichiers qui n’ont pas été utilisés depuis longtemps et dont on n’aura probablement plus jamais besoin. Il peut s’agir de données obsolètes qui ont été remplacées par de nouvelles informations.

  • Données inutiles : Il s’agit de fichiers qui ne sont pas pertinents pour l’entreprise. Un contenu qui ne contribue pas à la connaissance de l’entreprise, à la compréhension des affaires ou aux exigences en matière de tenue de registres.

À moins que les entreprises ne fassent des efforts ciblés pour gérer et atténuer les données ROT, elles continueront à accumuler des fichiers indésirables dans les dispositifs de stockage primaires.

L’Association of Information and Image Management (AIIM) signale qu’en moyenne, la moitié des informations conservées par une organisation n’a aucune valeur commerciale et le Conseil de conformité, de gouvernance et de surveillance (CGOC) estime qu’une grande entreprise possédant 10 pétaoctets de données pourrait dépenser jusqu’à 34,5 millions de dollars pour des données qui pourraient être supprimées.

Parmi les exemples courants de données redondantes, inutiles et obsolètes, on peut citer :

  • Les copies de courriers électroniques inutiles
  • Anciens cookies de session de serveur
  • Documents qui ont été remplacés par une nouvelle version
  • Contenu qui ne ferait pas l’objet d’une communication préalable dans le cadre d’un procès et qui n’a pas besoin d’être conservé pour répondre aux règlements ou aux exigences légales
  • Anciens backups de base de données ou d’anciens systèmes plus utilisés.

Pourquoi les données ROT posent-elles problème ?


La ROT est préjudiciable à cinq égards qui nous paraissent importants :

Risques liés à la sécurité des données

Plus vous avez de données dans vos bases de données et vos serveurs de fichiers, plus il est difficile de les protéger. En vous débarrassant de ce fouillis, vous pourrez comprendre quelles sont les données dont vous disposez et établir des priorités dans vos efforts de sécurité.

Comme les fichiers ROT sont laissés intacts pendant de longues périodes, leurs autorisations sont souvent dépassées ou basées sur des politiques de sécurité de fichiers obsolètes.

Cela laisse une chance étonnamment élevée que l’un d’entre eux soit accessible par des comptes d’utilisateurs inactifs et les rend susceptibles de violations de données.

Coûts de stockage élevés

Veritas Global a estimé que jusqu’à 33 % des données stockées par les organisations en 2016 étaient redondantes, obsolètes ou insignifiantes et que 52 % supplémentaires étaient considérées comme des données “sombres”, dont la valeur est indéterminée.

Si les employés continuent à stocker des fichiers autrefois critiques dans un espace de stockage de type Tier-1 et que l’on tient compte de facteurs tels que le prix du matériel de stockage, le personnel et l’administration, les logiciels de sécurité et d’analyse des données, etc., le coût annuel du stockage des fichiers ROT est d’environ 2 340 dollars par To.

Veritas a indiqué que la gestion de toutes ces données coûtera 3,3 milliards de dollars aux organisations du monde entier d’ici à la fin de 2020. Les coûts de gestion des données sont en corrélation directe avec la quantité de données stockées.

Pertes de productivité

Plus les données sont nombreuses, plus il faut de temps et de ressources pour les sauvegarder, les analyser, y accéder et les classer.

Cela crée un cercle vicieux d’inefficacité dans l’analyse du stockage et d’augmentation des coûts de gestion des données, ce qui entrave l’adoption du stockage dans le cloud et affecte l’innovation.

Des décisions mal informées

Les employés perdent du temps à chercher les bonnes données parmi tout l’encombrement, ou à corriger le travail qu’ils ont déjà fait en utilisant des données obsolètes (quand ils s’en rendent compte). Prendre des décisions basées sur l’analyse de données inexactes peut conduire à de mauvais résultats commerciaux.

Risque de sanctions pour non-conformité (👋 RGPD)

Des réglementations telles que la RGPD exigent un suivi et une élimination minutieux des informations personnelles identifiables des consommateurs, ainsi qu’une politique de confidentialité qui divulgue la manière dont vous collectez, stockez et éliminez les données des consommateurs

Par ailleurs, les informations qui sont conservées au-delà de leur période de conservation légale augmentent le risque de sanctions en cas de non-respect. Sans parler des fichiers périmés qui peuvent contenir des données personnelles sensibles comme des informations sur les cartes de paiement (PCI), des informations d’identification personnelle (IIP) et des informations électroniques de santé protégées (ePHI), sans que les mesures de sécurité mises en place pour les protéger soient suffisantes.

Comment gérer les données de type ROT ?

Si vous êtes arrivé jusqu’ici c’est que le sujet vous intéresse, et/ou que vous vous sentez concerné par ce problème de données redondantes, obsolètes ou inutiles.

C’est pourquoi nous vous proposons de suivre les étapes suivantes qui peuvent vous aider à réduire considérablement la quantité de données ROT dans votre réseau :`

1. Mettre à jour les politiques de stockage

Mettez en place des politiques de conservation des données personnalisées en fonction de vos tendances en matière de génération et de stockage des données. Il n’existe pas de solution unique et les besoins organisationnels changent constamment. Des politiques de stockage actualisées améliorent la gouvernance de l’information et limitent les données ROT à leur source.

2. Découvrez les fichiers ROT dans votre environnement de stockage

Mettre en place une solution d’analyse de fichiers pour localiser les fichiers non professionnels, les fichiers qui sont restés intacts pendant de longues périodes, les copies et autres fichiers indésirables.

3. Mettre en place des flux de travail pour gérer les fichiers inutiles

Configurer l’archivage et la suppression des fichiers indésirables en fonction des politiques. Cela permettra de libérer de l’espace disque, d’améliorer les performances des périphériques de stockage et de garantir la disponibilité continue du stockage.

4. Répéter périodiquement

La gestion des données de la ROT est un processus continu. Les RSSI doivent périodiquement scanner les base de données et les répertoires de stockages pour y rechercher des données non pertinentes et réagir en les purgeant ou en les déplaçant vers des dispositifs de stockage secondaires.

5. Source unique de vérité

Créer une source unique de vérité (SSOT : single source of truth) pour chaque type d’information. Cela permettra de réduire la confusion associée au versionnage. La “bonne” version doit toujours être celle qui est enregistrée dans le SSOT.

Ce dernier point fera l’objet d’un article spécifiquement dédié au SSOT (pour ne pas le manquer pensez à nous suivre …).


Tags

#bonnes-pratique#data#ROT#SSOT

Articles en rapport avec ce sujet

L'Europe veut réduire l’impact des centres de données sur le climat d'ici 2030

15 juin, 2021
5 min
© 2021, Ostraca Forensic Tous droits réservés.

Ostraca

Notre solutionNous contacter

Suivre l'actu