Problème de performance avec le SmartDisk. CPU peu sollicité et beaucoup d’attente sur les disques.
Forte sollicitation de l’index chunk.
L’index « Chunk » est un composant clef de la déduplication. Il est utilisé pour localiser les « Chunks » pendant que le flux est dédupliqué puis pour réinjecter le flux qui a été dédupliqué. “Garbage collection” localise aussi les « Chunks » par le biais de l’index « Chunk ».
Il est très important d’optimiser les disques sur lesquels l’index “Chunk » réside pour faciliter les rapides E/S aléatoires. L’utilisation de disque en miroir ou de SSD est conseillée. Veuillez contacter le support Quest Software si vous voulez déplacer l’index dans un autre emplacement.
La déduplication implique le fractionnement d'une sauvegarde en environ 2000 « Chunks ». Une sauvegarde de 100 Go nous donne donc 50 millions de “Chunks”. Pour chaque « Chunk » une valeur de hachage est calculée, et l'index est interrogé avec cette même valeur. De par leur nature, les valeurs de hachage sont vraiment aléatoires et cela signifie que pour 100 Go, 50 millions de lectures aléatoires pour être effectué sur potentiel index de 3 Go.
La matrice de disque qui contient l’index devra être soigneusement sélectionnée pour garantir les meilleures performances sous ces conditions. Les taux de transfert pour les grands flux de données séquentielles ne sont pas applicables à ce type d'utilisation.
Pour réinjecter ce flux de sauvegarde cela implique de lire ces informations permettant d’obtenir la liste des « Chunks », ensuite l’index « Chunk » est lu de nouveau pour obtenir l’emplacement des 50 millions de « Chunks » avant qu’ils soient lus à partir de leurs dépôts.
L’index « Chunk » est d’environ 3% de la taille du dépôt de « Chunk ». Donnant donc pour le dépôt “Chunk” de taille maximale supporté de 15 To un index « Chunk » de l’ordre de 500 Go.