Please enable JS

RECUPERAÇÃO DE ZFS

PROFISSIONAIS
QUALIFICADOS

Dezenas de recuperações em ambientes complexos. Equipe com certificações LPI, LPI-Japan, LPIC e Oracle ZFSSA.

ESTRUTURA
ENTERPRISE

Laboratório para reparo em HDs danificados. Data center para agilizar processos e absorver grandes ambientes.


AMBIENTES

ORACLE® ZFS

CÓDIGO FECHADO

Reversão de desastres em cenários com ZFS original (desenvolvido pela Sun Microsystems), contido em sistemas Solaris e appliances Oracle.

OPENZFS

CÓDIGO ABERTO

Recuperação de dados nas implementações baseadas em illumos (OpenSolaris e OpenIndiana), Linux, FreeBSD (FreeNAS, OVM, etc.) e macOS.

ESTRUTURAS

VDEV

DISPOSITIVO

Dispositivo de armazenamento primário. Em caso de falhas físicas ou lógicas, podem danificar o pool ou dataset ZFS e inviabilizar acesso aos dados.

POOL

GRUPO LÓGICO

Conjunto de vdevs que formam um disco lógico. Pode ser configurado como Mirror, RAID-Z ou um simples volume composto de vários dispositivos.

RAID-Z

RAID ZFS

Dispositivo virtual que armazena dados e paridades em vdevs. Pode necessitar de reparo se algum de seus componentes apresentar problema.

ZVOL

VOLUME

Estrutura de dados (dataset) que representa e compõe um dispositivo de bloco (virtual), interpretado pelo sistema como um drive físico.

MIRROR

ESPELHAMENTO

Nível de pool semelhante ao RAID 1, mas com toda a inovação tecnológica que acompanha o ZFS (self-healing, blocos variáveis, modo COW, etc.)

ARQUITETURAS RECUPERADAS

NAS

Network-Attached Storage

SAN

Storage Area network

DAS

Direct-Attached Storage

HÍBRIDA

NAS, SAN e DAS

PLATAFORMAS RECUPERADAS

Oracle®, System V, illumos (OpenIndiana, OmniOS, ZFS-Guru, etc.), sistemas BSD (FreeBSD, FreeNAS, XigmaNAS, DragonFly, macOS, etc.), sistemas Linux (Debian, Ubuntu, CentOS, openSUSE, Slackware, etc.) e Windows (OpenZFS on Windows).

Oracle®

Solaris (SunOS v5.10/11)

SVR4

OpenSolaris e derivados

illumos

Napp-it, NexentaStor, etc.

BSD

[Free/Net/Open]BSD, etc.

LINUX

Arch, Debian, Red Hat, etc.

WINDOWS

OpenZFS para Windows

ESTADOS DO
POOL ZFS

ONLINE: POOL funcionando perfeitamente

OFFLINE: Vdev excluído com comando zpool

REMOVED: Vdev removido em funcionamento

UNAVAIL: Vdev, RAID-Z ou Pool, indisponível

DEGRADED: Pool operacional, mas avariado

FAULTED: Vdev, zpool ou zvol, corrompido

Um Pool deve ter os dispositivos desligados ao primeiro sinal de dano

CONCEITOS
BÁSICOS

O ZFS é um poderoso sistema de arquivos e gerenciador de volumes, lançado pela Sun, em 2005, no Solaris 10 U2. Teve seu código aberto até 2009, quando integrava o OpenSolaris. Em 2013 surge o projeto OpenZFS, que reúne implementações open-source (illumos, FreeBSD, ZFS on Linux e OpenZFS on OS X) do ZFS original.

Dentre os atributos notáveis do ZFS, destacam-se a alta capacidade de resiliência e reparo (self-healing) perante inconsistência de dados. As gravações de bloco geram checksums (fletcher-4 ou sha-256) na área de metadados para verificação de integridade. Havendo divergência entre hashes, o sistema tenta executar correções com bloco redundante ou paridade. Outro recurso importante é a tecnologia copy-on-write (COW), integrada ao ZFS para reduzir I/O, diminuir índices duplicados e aumentar a redundância em nível de arquivos.

A integração entre filesystem e gerenciador de volumes facilita o trabalho de gestores, permitindo diversas operações com poucas linhas de comando. Todo o processamento é coordenado por software, ou seja, o próprio ZFS.

As qualidades do ZFS têm estimulado fabricantes e desenvolvedores a inseri-lo em plataformas modernas de storage NAS (FreeNAS, NexentaStor, OpenMediaVault, etc.) e SAN (como os appliances ZFS Storage ZS5-2 e Fire X4540).


Principais Características do ZFS:
  • Alta capacidade, com endereçamento 128 bits
  • Integração de filesystem e gestor de volume
  • Alocação e escrita em modo copy-on-write
  • Imunidade ao fenômeno de write hole error
  • Data block distribuído e de tamanho variável
  • Capacidade de auto recuperação (sel-healing)
  • Snapshots instantâneos, clones e replicações
  • Independe de hardware específico ou dedicado

Recursos de snapshot, clones, espelhamentos e duplicações, tornam o ZFS mais resistente a erros diversos. Porém, qualquer sistema de arquivos está sujeito a falhas de hardware, ações humanas indevidas e eventuais acidentes, que geram paralisação de serviços ou perda de dados, podendo desencadear prejuízos significativos.

HISTÓRICO
COM O ZFS

A Hosco continua sendo a única empresa brasileira com recuperação de dados profissional em ZFS. Seu primeiro contato com este filesystem ocorreu, em 2005, devido a um processo de migração (por questões de escalabilidade) de seu próprio storage NAS, com Linux Debian, para Unix OpenSolaris. Em 2006, ocorreu o primeiro trabalho de recuperação em ZFS, envolvendo um zvol que ficou corrompido por causa de um HD danificado. Embora a documentação fosse escassa, o código original do ZFS ainda era aberto, facilitando o entendimento das operações de read/write registradas nos logs transacionais, criação e validação de blocos (checksums armazenados em merkle4), etc. O resultado positivo trouxe experiência para a equipe, ocasionando a inclusão dessa categoria de recuperação nos serviços da empresa. Desde então, a equipe Hosco acumula diversos casos de sucesso com esses ambientes.

SOLUÇÕES
OFERECIDAS

Recuperação de ZFS (recuperação de dados em ZFS) é o nome dado aos procedimentos, usados por pessoal capacitado e munido de equipamentos apropriados, para recuperar dados em dispositivos com sistema de arquivos ZFS (pool, zvol ou qualquer dataset). Em inglês, os termos mais usados são ZFS repair e ZFS recovery.

Os profissionais têm experiência com programação em sistemas de arquivos, portanto, entendem a dinâmica das operações de read/write (registradas por logs transacionais), a forma como blocos são validados (conferência de checksums organizados em merkle4) em uma arquitetura ZFS, etc. Eles também conhecem as diferenças entre as implementações (Oracle e OpenZFS). Tudo isso reflete nas ações individualizadas executadas dentro da Hosco.

Os trabalhos ocorrem de modo seguro (preservação de vdevs, estrutura de dados, etc.), consciente (procedimentos corretos e programados) e com ferramentas apropriadas, sendo executado em laboratório controlado, com equipamentos próprios para manusear HDs danificados que necessitam ser abertos e estabilizados. Além disso, há um longo histórico real em implementação, administração e proteção de arquiteturas Unix, o qual influencia nos melhores resultados obtidos ao reparar dados perdidos em um pool ZFS.

Todo ambiente de armazenamento digital está sujeito a fatalidades, levando empresas a utilizarem a recuperação profissional como forma de resposta a desastres ocorridos em sistemas com ZFS. Essas empresas costumam recorrer a Hosco.

ORIENTAÇÃO PARA
GESTORES E USUÁRIOS

Aqueles que buscam soluções para recuperação em ZFS, precisam ter ciência que qualquer tentativa executada por pessoal não especializado, poderá resultar na perda definitiva dos dados, restando apenas a possibilidade de tentar alguma reparação judicial de quem cometeu o ato de imperícia e/ou imprudência.

A primeira etapa da análise, que precede o trabalho de recuperação, é a verificação de logs e o histórico de ações (que ocorreram antes do material chegar na Hosco) executadas nas estruturas do pool ZFS. Tentativas forçadas de importação, resilvering e utilização do scrub, agravam danos físicos e lógicos. Portanto, podem diminuir a probabilidade de recuperação e elevar o custo do trabalho.

Procedimentos executados por pessoal não capacitado podem levar a perda definitiva de dados, restando ao cliente buscar reparação judicial de quem cometeu o ato de imperícia e/ou imprudência. Portanto, prevalece a recomendação de desligar imediatamente os componentes do Pool, assim que ele apresentar qualquer problema, e encaminhá-lo para uma empresa especializada.