Please enable JS

RECUPERAÇÃO DE ZFS

MÉTODOS
EXCLUSIVOS
Única empresa brasileira de data recovery especializada em ambientes, degradados, com sistema de arquivos ZFS.
EFICIÊNCIA E
SEGURANÇA
Ações executadas em laboratório, por equipe formada e que recupera dados de pools ZFS danificados, desde 2006.

IMPLEMENTAÇÕES ATENDIDAS

ORACLE® ZFS

CÓDIGO FECHADO

Projeto original, desenvolvido pela Sun Microsystems, lançado em 2005. Teve seu código aberto, por um período, sendo parte do OpenSolaris.

OPENZFS

CÓDIGO ABERTO

Implementação open source do ZFS, iniciada em 2013, mantida principalmente por desenvolvedores do illumos, Linux, FreeBSD e macOS.

AS ESTRUTURAS ATENDIDAS

VDEV

DISPOSITIVO

Dispositivo de armazenamento primário. Em caso de falhas físicas ou lógicas, podem danificar o pool ou dataset ZFS e inviabilizar acesso aos dados.

POOL

GRUPO LÓGICO

Conjunto de vdevs que formam um disco lógico. Pode ser configurado como Mirror, RAID-Z ou um simples volume composto de vários dispositivos.

RAID-Z

RAID ZFS

Dispositivo virtual que armazena dados e paridades em vdevs. Pode necessitar de reparo se algum de seus componentes apresentar problema.

ZVOL

VOLUME

Estrutura de dados (dataset) que representa e compõe um dispositivo de bloco (virtual), interpretado pelo sistema como um drive físico.

MIRROR

ESPELHAMENTO

Nível de pool semelhante ao RAID 1, mas com toda a inovação tecnológica que acompanha o ZFS (self-healing, blocos variáveis, modo COW, etc.)

ARQUITETURAS RECUPERADAS

NAS

Network-Attached Storage

SAN

Storage Area network

DAS

Direct-Attached Storage

HÍBRIDA

NAS, SAN e DAS

PLATAFORMAS RECUPERADAS

Oracle®, System V, illumos (OpenIndiana, OmniOS, ZFS-Guru, etc.), sistemas BSD (FreeBSD, FreeNAS, XigmaNAS, DragonFly, macOS, etc.), sistemas Linux (Debian, Ubuntu, CentOS, openSUSE, Slackware, etc.) e Windows (OpenZFS on Windows).

Oracle®

Solaris (SunOS v5.10/11)

SVR4

OpenSolaris e derivados

illumos

Napp-it, NexentaStor, etc.

BSD

[Free/Net/Open]BSD, etc.

LINUX

Arch, Debian, Red Hat, etc.

WINDOWS

OpenZFS para Windows

ESTADOS DO
POOL ZFS

ONLINE: POOL funcionando perfeitamente

OFFLINE: Vdev excluído com comando zpool

REMOVED: Vdev removido em funcionamento

UNAVAIL: Vdev, RAID-Z ou Pool, indisponível

DEGRADED: Pool operacional, mas avariado

FAULTED: Vdev, zpool ou zvol, corrompido

Um Pool deve ter os dispositivos desligados ao primeiro sinal de dano

CONCEITOS
BÁSICOS

O ZFS é um poderoso sistema de arquivos e gerenciador de volumes, lançado pela Sun, em 2005, no Solaris 10 U2. Teve seu código aberto até 2009, quando integrava o OpenSolaris. Em 2013 surge o projeto OpenZFS, que reúne implementações open-source (illumos, FreeBSD, ZFS on Linux e OpenZFS on OS X) do ZFS original.

Dentre os atributos notáveis do ZFS, destacam-se a alta capacidade de resiliência e reparo (self-healing) perante inconsistência de dados. As gravações de bloco geram checksums (fletcher-4 ou sha-256) na área de metadados para verificação de integridade. Havendo divergência entre hashes, o sistema tenta executar correções com bloco redundante ou paridade. Outro recurso importante é a tecnologia copy-on-write (COW), integrada ao ZFS para reduzir I/O, diminuir índices duplicados e aumentar a redundância em nível de arquivos.

A integração entre filesystem e gerenciador de volumes facilita o trabalho de gestores, permitindo diversas operações com poucas linhas de comando. Todo o processamento é coordenado por software, ou seja, o próprio ZFS.

As qualidades do ZFS têm estimulado fabricantes e desenvolvedores a inseri-lo em plataformas modernas de storage NAS (FreeNAS, NexentaStor, OpenMediaVault, etc.) e SAN (como os appliances ZFS Storage ZS5-2 e Fire X4540).


Principais Características do ZFS:
  • Alta capacidade, com endereçamento 128 bits
  • Integração de filesystem e gestor de volume
  • Alocação e escrita em modo copy-on-write
  • Imunidade ao fenômeno de write hole error
  • Data block distribuído e de tamanho variável
  • Capacidade de auto recuperação (sel-healing)
  • Snapshots instantâneos, clones e replicações
  • Independe de hardware específico ou dedicado

Recursos de snapshot, clones, espelhamentos e duplicações, tornam o ZFS mais resistente a erros diversos. Porém, qualquer sistema de arquivos está sujeito a falhas de hardware, ações humanas indevidas e eventuais acidentes, que geram paralisação de serviços ou perda de dados, podendo desencadear prejuízos significativos.

HISTÓRICO
COM O ZFS

A Hosco continua sendo a única empresa brasileira com recuperação de dados profissional em ZFS. Seu primeiro contato com este filesystem ocorreu, em 2005, devido a um processo de migração (por questões de escalabilidade) de seu próprio storage NAS, com Linux Debian, para Unix OpenSolaris. Em 2006, ocorreu o primeiro trabalho de recuperação em ZFS, envolvendo um zvol que ficou corrompido por causa de um HD danificado. Embora a documentação fosse escassa, o código original do ZFS ainda era aberto, facilitando o entendimento das operações de read/write registradas nos logs transacionais, criação e validação de blocos (checksums armazenados em merkle4), etc. O resultado positivo trouxe experiência para a equipe, ocasionando a inclusão dessa categoria de recuperação nos serviços da empresa. Desde então, a equipe Hosco acumula diversos casos de sucesso com esses ambientes.

SOLUÇÕES
OFERECIDAS

Recuperação de ZFS (recuperação de dados em ZFS) é o nome dado aos procedimentos, usados por pessoal capacitado e munido de equipamentos apropriados, para recuperar dados em dispositivos com sistema de arquivos ZFS (pool, zvol ou qualquer dataset). Em inglês, os termos mais usados são ZFS repair e ZFS recovery.

Os profissionais têm experiência com programação em sistemas de arquivos, portanto, entendem a dinâmica das operações de read/write (registradas por logs transacionais), a forma como blocos são validados (conferência de checksums organizados em merkle4) em uma arquitetura ZFS, etc. Eles também conhecem as diferenças entre as implementações (Oracle e OpenZFS). Tudo isso reflete nas ações individualizadas executadas dentro da Hosco.

Os trabalhos ocorrem de modo seguro (preservação de vdevs, estrutura de dados, etc.), consciente (procedimentos corretos e programados) e com ferramentas apropriadas, sendo executado em laboratório controlado, com equipamentos próprios para manusear HDs danificados que necessitam ser abertos e estabilizados. Além disso, há um longo histórico real em implementação, administração e proteção de arquiteturas Unix, o qual influencia nos melhores resultados obtidos ao reparar dados perdidos em um pool ZFS.

Todo ambiente de armazenamento digital está sujeito a fatalidades, levando empresas a utilizarem a recuperação profissional como forma de resposta a desastres ocorridos em sistemas com ZFS. Essas empresas costumam recorrer a Hosco.

ORIENTAÇÃO PARA
GESTORES E USUÁRIOS

Aqueles que buscam soluções para recuperação em ZFS, precisam ter ciência que qualquer tentativa executada por pessoal não especializado, poderá resultar na perda definitiva dos dados, restando apenas a possibilidade de tentar alguma reparação judicial de quem cometeu o ato de imperícia e/ou imprudência.

A primeira etapa da análise, que precede o trabalho de recuperação, é a verificação de logs e o histórico de ações (que ocorreram antes do material chegar na Hosco) executadas nas estruturas do pool ZFS. Tentativas forçadas de importação, resilvering e utilização do scrub, agravam danos físicos e lógicos. Portanto, podem diminuir a probabilidade de recuperação e elevar o custo do trabalho.

Procedimentos executados por pessoal não capacitado podem levar a perda definitiva de dados, restando ao cliente buscar reparação judicial de quem cometeu o ato de imperícia e/ou imprudência. Portanto, prevalece a recomendação de desligar imediatamente os componentes do Pool, assim que ele apresentar qualquer problema, e encaminhá-lo para uma empresa especializada.