Les bases du lecteur Fusion d'Apple : Organisation des données et principes de récupération
Dans un effort pour trouver un compromis et offrir de meilleures performances par rapport au lecteur dur traditionnel tout en laissant le coût par gigaoctet relativement bas, Apple Inc. a lancé Fusion Drive – une combinaison d’un disque dur à semi-conducteurs et d’un disque dur à plateaux visant à prendre le meilleur des deux mondes, c’est-à-dire le stockage moderne en flash et le stockage ordinaire sur disque rotatif. Toutefois, les gains de performances substantiels qu’il apporte s’accompagnent parfois de divers problèmes qui entraînent inévitablement la perte de données et la nécessité de les récupérer. L’article vise à expliquer les particularités de cette technologie et à suggérer quelques techniques qui peuvent être appliquées pour récupérer les données perdues.
Qu'est-ce que le "Fusion Drive"?
Apparu dans le système d’exploitation Mountain Lion fin 2012, il est désormais pris en charge par deux ordinateurs de bureau Apple – iMac et Mac Mini – fonctionnant sous MacOS 10.8 et plus.
Fusion Drive est le système intelligent de gestion automatique des données d’Apple qui intègre deux supports numériques différents – un disque dur rotatif traditionnel et un stockage non volatil basé sur la technologie SSD qui fonctionnent comme une seule unité logique et sont présentés comme un seul volume à l’utilisateur final dans Finder.
De même que le RAID 0, dans lequel les données sont réparties sur les disques de la matrice, les données d’un tel stockage sont réparties sur les deux composants du système avec une différence essentielle : l’espace de stockage peut être attribué de nouveau de manière dynamique en fonction de la fréquence d’utilisation des données pour obtenir des performances maximales – les fichiers les plus fréquemment consultés ainsi que les fichiers système résident sur le disque flash le plus rapide tandis que les fichiers rarement utilisés sont déplacés vers la partie spacieuse du disque dur. En conséquence, le système peut démarrer plus rapidement et le temps de lancement des applications régulièrement utilisées est également réduit.
La technologie repose essentiellement sur le concept de hiérarchisation automatisée du stockage, qui implique la migration des données entre les différents dispositifs de stockage connectés, conformément aux exigences de performance et de capacité, et est sa mise en œuvre purement logicielle. La seule composante logicielle sur laquelle elle repose est un gestionnaire de volume logique appelé CoreStorage. Le CoreStorage sert de couche d’abstraction supplémentaire entre les disques/parties de MacOS et de Mac qui sont organisés en groupes de volumes logiques au lieu d’être directement transférés au système d’exploitation. Il permet de créer des volumes étendus tandis que Fusion Drive est fondamentalement un groupe de volumes logiques composé d’un disque dur et de lecteurs à semi-conducteurs.
Organisation des données
Comme il a déjà été dit, le système est composé de deux lecteurs individuels : un lecteur de disque dur et un lecteur à semi-conducteurs. La capacité totale d’un tel stockage est égale à la somme de la capacité des deux disques. La configuration typique se présente comme suit :
- dev/disk0 – un SSD physique incorporé dans un groupe de volumes logiques.
- dev/disk1 – un disque dur physique incorporé dans un groupe de volumes logiques.
- dev/disk2 – un volume logique qui comprend à la fois le lecteur0 et le lecteur1.
Le lecteur 0 et le lecteur 1 sont tous deux constitués d’au moins 3 partitions : une petite partition EFI de service au début du lecteur, une grande partition de données Fusion Drive au milieu du lecteur et une partition de configuration système MacOS à la fin du lecteur.
La partition de données occupe jusqu’à 99 % de l’espace et commence généralement par le secteur 409 640. C’est la seule partition dédiée au Fusion Drive. Elle stocke également toutes les métadonnées nécessaires au bon assemblage de l’ensemble du système et à la bonne lecture de ses données. Trois grands domaines de métadonnées peuvent être distingués :
- La zone des blocs cryptés se trouve à la fin de la partition de données et comprend les métadonnées cryptées nécessaires à l’interprétation des données. Les métadonnées sur le lecteur0 et le lecteur1 sont cryptées avec des clés différentes, leur contenu ne coïncide pas complètement, mais une des copies suffit pour une reconstruction correcte des données.
- La zone d’en-tête du volume est située dans le secteur zéro et le dernier secteur de la partition de données et stocke son UUID et l’UUID du groupe de volume logique auquel il appartient, la taille de ce volume, les clés de cryptage des blocs cryptés trouvés dans la zone des blocs cryptés et la disposition des copies de l’étiquette du lecteur.
- La zone Disk label contient le Volume Descriptor qui stocke l’emplacement des blocs cryptés, diverses informations sur le groupe de volumes logiques en XML, y compris son UUID (qui correspond à la valeur de l’en-tête du volume), son nom et la liste des volumes dont il se compose.
- Toutes les données de l’utilisateur sont d’abord écrites sur le disque dur (lecteur0) jusqu’à ce qu’il soit presque plein – une « zone tampon » d’environ 4 Go est réservée aux fichiers entrants. Ensuite, le système commence à remplir le disque dur (lecteur1), tandis que les éléments peu utilisés sont transférés de la clé USB vers le lecteur magnétique (et les plus fréquemment utilisés – vers le SSD en conséquence). Le mouvement des données entre le lecteur0 et le lecteur1 s’effectue pendant les périodes d’inactivité dans des chaînes de blocs (la taille d’un bloc est de 128 Ko, le nombre de chaînes de blocs peut atteindre plusieurs millions) et dépend uniquement des modèles d’accès aux données suivis par CoreStorage : si des données rarement utilisées stockées sur le disque dur sont couramment consultées, elles seront migrées vers le SSD.
Il convient également de mentionner que « fusion » n’est pas, dans ce cas, synonyme d' »hybride » : les architectures de disques hybrides utilisent des techniques dissemblables reposant sur la mise en cache des données, dans lesquelles les informations sont principalement stockées sur l’élément du disque dur et seules certaines parties déterminées par algorithme sont copiées à partir de celui-ci pour améliorer les performances.
Avantages et inconvénients
Offrant la vitesse et le démarrage instantané d’un SSD et l’espace de stockage bon marché d’un disque dur, Fusion Drive garantit que les temps de lecture et d’écriture des données fréquemment utilisées sont aussi courts que possible. Cependant, cette technologie présente un inconvénient qui doit également être pris en compte :
- Un tel ensemble ne peut pas être aussi rapide qu’un simple SSD, surtout lorsqu’on travaille avec des fichiers anciens.
- Le lecteur Fusion Drive n’est pris en charge que par les modèles iMac et Mac Mini. Selon les rapports, cette option ne devrait pas être disponible pour les autres systèmes Mac.
- La configuration augmente considérablement les risques de perte totale de données ou de corruption si l’un des lecteurs est accidentellement déconnecté ou tombe en panne.
Qu'est-ce qui peut entraîner une perte de données ?
Comme tout périphérique de stockage, le lecteur Fusion peut rencontrer des problèmes de fonctionnement et perdre des données utilisateur critiques. Outre les situations typiques de perte de données lorsque la perte de données est causée par une erreur de suppression de fichiers ou de formatage du stockage, les problèmes les plus fréquemment rencontrés sont les suivants
Le stockage est présenté comme deux lecteurs au lieu d’un dans le Finder
Dans ce cas, les disques sont déconnectés et ne fonctionnent plus comme un disque de fusion, ce qui rend les données qu’ils contiennent inutilisables. Cela peut être dû à une mauvaise utilisation des outils de gestion des disques, à un problème de logiciel ou au remplacement d’un des disques.
Le lecteur Fusion devient non amorçable
En règle générale, ce problème apparaît lorsque le SSD ou le HDD est défaillant. Le composant HDD est plus sujet à une défaillance soudaine, tandis que le SDD tombe généralement en panne progressivement et donne des avertissements, comme des erreurs d’écriture, des notifications SMART, etc. Mais la particularité du Fusion Drive est que même si un seul lecteur tombe en panne, l’ensemble du stockage devient inutilisable et ne démarre plus, laissant les données du lecteur intact illisibles.
Des partitions disparaissent
Plusieurs raisons peuvent expliquer ce problème, de la corruption du système de fichiers due à une panne d’électricité soudaine ou à un dysfonctionnement du logiciel à l’utilisation incorrecte des utilitaires de gestion des disques.
Mauvais secteurs sur un disque dur
Les tentatives de réparation des secteurs défectueux ou de résolution des problèmes de corruption à l’aide de l’Utilitaire de disque peuvent causer de graves dommages logiques et entraîner des pertes de données irréversibles. Par conséquent, les données importantes doivent être récupérées avant la procédure de réparation.
Les spécificités de la récupération de données
Les données sur le disque Fusion sont réparties sur les deux disques sans être dupliquées ou filtrées et sont largement fragmentées. Une partie des blocs de métadonnées nécessaires à sa lecture correcte est stockée sur le SSD uniquement, et l’autre partie – sur le disque dur. Ainsi, travailler avec ce dernier sans assemblage de stockage approprié ou lorsqu’un des composants est manquant ne donnera aucun résultat utilisable, car il devient impossible de rassembler toutes les pièces. En outre, presque toutes les métadonnées du système de fichiers sont stockées sur la partie SSD, sans laquelle il est impossible de construire correctement une arborescence de fichiers et de répertoires. De plus, au moins une copie de la zone des blocs chiffrés doit être déchiffrée avec succès avec les clés de déchiffrement stockées dans l’en-tête du volume.
Par conséquent, une panne totale de l’un des disques ou une détérioration grave des métadonnées ne laisse aucune chance de récupération des données. Dans d’autres cas, les fichiers perdus peuvent être restaurés en utilisant l’une des approches suivantes :
- Les problèmes physiques du lecteur ne peuvent pas être traités par des moyens logiciels, mais certains d’entre eux peuvent être résolus si les deux lecteurs sont envoyés à un fournisseur de services de récupération fiable.
- En cas de problème logique, le stockage peut être assemblé à l’aide Hexascan.
- Apple Core Storage et ses principes d’organisation des données. Défis possibles en matière de récupération des données.
Apple a longtemps eu très peu à offrir en matière de flexibilité de stockage, en particulier pour les utilisateurs moyens de Mac, qui manquent d’expertise technique ou sont simplement réticents à se pencher sur des concepts RAID complexes pour pouvoir bénéficier de la technologie AppleRAID. L’introduction du stockage central en 2011, bien qu’elle soit passée presque inaperçue du grand public, a ouvert la voie à d’importantes fonctionnalités de gestion du stockage, dont la mise en œuvre n’a été possible que grâce à cette technologie. Cependant, outre les avantages considérables qu’elle a apportés aux ordinateurs Macintosh, la technologie Core Storage présente certains inconvénients en ce qui concerne la sécurité des données stockées et les chances de les récupérer.