fbpx

Comandos Linux – Comando lzma

Comando Linux xz, unxz, xzcat, lzma, unlzma, lzcat

comando xz

xz , unxz , xzcat , lzma , unlzma e lzcat compactam ou descompactam arquivos .xz e .lzma .

Descrição

O xz é uma ferramenta de compactação de dados de uso geral com sintaxe de linha de comando semelhante ao gzip e bzip2 . O formato de arquivo nativo é o formato .xz , mas o formato .lzma herdado usado pelo LZMA Utils e os fluxos compactados brutos sem cabeçalhos de formato de contêiner também são suportados.

xz compacta ou descomprime cada arquivo de acordo com o modo de operação selecionado. Se nenhum arquivo for fornecido ou o arquivo for especificado como um traço (”  “), xz lê da entrada padrão e grava os dados processados ​​na saída padrão. O xz recusará (exibirá um erro e pulará o arquivo) para gravar dados compactados na saída padrão, se for um terminal . Da mesma forma, o xz se recusará a ler dados compactados da entrada padrão, se for um terminal.

A menos que –stdout seja especificado, arquivos diferentes de ”  ” são gravados em um novo arquivo cujo nome é derivado do nome do arquivo de origem:

  • Ao compactar, o sufixo do formato do arquivo de destino ( .xz ou .lzma ) é anexado ao nome do arquivo de origem para obter o nome do arquivo de destino.
  • Ao descompactar, o sufixo .xz ou .lzma é removido do nome do arquivo para obter o nome do arquivo de destino. O xz também reconhece os sufixos .txz e .tlz e os substitui pelo sufixo .tar .

Se o arquivo de destino já existir, um erro será exibido e o arquivo será ignorado.

A menos que grave na saída padrão, xz exibe um aviso e pula o arquivo se qualquer um dos seguintes itens se aplicar:

  • O arquivo não é um arquivo regular. Links simbólicos não são seguidos e, portanto, não são considerados arquivos regulares.
  • O arquivo possui mais de um link físico .
  • O arquivo está definido como setuid , setgid ou sticky bit.
  • O modo de operação está definido para compactar e o arquivo já possui um sufixo do formato de arquivo de destino ( .xz ou .txz ao compactar no formato .xz e .lzma ou .tlz ao compactar no formato .lzma ).
  • O modo de operação está definido para descompactar e o arquivo não possui um sufixo de nenhum dos formatos de arquivo suportados ( .xz , .txz , .lzma ou .tlz ).

Após compactar ou descompactar o arquivo, xz copia o proprietário, o grupo, as permissões, o tempo de acesso e o tempo de modificação do arquivo de origem para o arquivo de destino. Se a cópia do grupo falhar, as permissões serão modificadas para que o arquivo de destino não se torne acessível aos usuários que não tiveram permissão para acessar o arquivo de origem. O xz ainda não suporta a cópia de outros metadados, como listas de controle de acesso ou atributos estendidos.

Depois que o arquivo de destino é fechado com sucesso, o arquivo de origem é removido, a menos que –keep tenha sido especificado. O arquivo de origem nunca será removido se a saída for gravada na saída padrão.

O envio de sinais SIGINFO ou SIGUSR1 para o processo xz faz com que as informações de progresso sejam impressas com erro padrão. Isso tem uso limitado, já que quando o erro padrão é um terminal, o uso de –verbose exibe um indicador de progresso com atualização automática.

Uso de memória

O uso da memória do xz varia de algumas centenas de kilobytes a vários gigabytes, dependendo das configurações de compactação. As configurações usadas ao compactar um arquivo determinam os requisitos de memória do descompactador. Normalmente, o descompactador precisa de 5% a 20% da quantidade de memória necessária para o compressor ao criar o arquivo. Por exemplo, descompactar um arquivo criado com xz -9 atualmente requer 65 MiB de memória. Ainda assim, é possível ter arquivos .xz que requerem vários gigabytes de memória para descompactar.

Especialmente usuários de sistemas mais antigos podem achar irritante a possibilidade de uso de memória muito grande. Para evitar surpresas desconfortáveis, o xz possui um limitador de uso de memória embutido, que é desativado por padrão. Embora alguns sistemas operacionais forneçam maneiras de limitar o uso de processos na memória, confiar neles não foi considerado suficientemente flexível.

O limitador de uso de memória pode ser ativado com a opção de linha de comando –memlimit = limit . Freqüentemente, é mais conveniente ativar o limitador por padrão, configurando a variável de ambiente XZ_DEFAULTS, por exemplo, XZ_DEFAULTS = – memlimit = 150MiB . É possível definir os limites separadamente para compactação e descompactação usando –memlimit-compress = limit e –memlimit-decompress = limit . O uso dessas duas opções fora de XZ_DEFAULTS raramente é útil porque uma única execução de xz não pode fazer compactação e descompactação e –memlimit = limit (ou -M limit) é mais curto para digitar na linha de comandos.

Se o limite de uso de memória especificado for excedido ao descompactar, xz exibirá um erro e a descompactação do arquivo falhará. Se o limite for excedido ao compactar, xz tentará reduzir as configurações para que o limite não seja mais excedido (exceto ao usar –format = bruto ou – sem ajuste ). Dessa forma, a operação não falhará, a menos que o limite seja muito pequeno. O dimensionamento das configurações é feito em etapas que não correspondem às predefinições do nível de compactação, por exemplo, se o limite for apenas ligeiramente menor que o valor necessário para xz -9 , as configurações serão reduzidas apenas um pouco, xz -8 .

Concatenando e preenchendo com arquivos .xz

É possível concatenar arquivos .xz como estão. O xz descompactará esses arquivos como se fossem um único arquivo .xz .

É possível inserir preenchimento entre as partes concatenadas ou após a última parte. O preenchimento deve consistir em bytes nulos e o tamanho do preenchimento deve ser um múltiplo de quatro bytes. Isso pode ser útil, por exemplo, se o arquivo .xz for armazenado em uma mídia que mede o tamanho dos arquivos em blocos de 512 bytes.

Concatenação e preenchimento não são permitidos com arquivos .lzma ou fluxos brutos.

Sintaxe

  xz [ opção ] ... [ arquivo ] ...

unxz é equivalente a xz – descompress .

xzcat é equivalente a xz –decompress –stdout .

lzma é equivalente a xz –format = lzma .

unlzma é equivalente a xz –format = lzma – descomprimir .

lzcat é equivalente a xz –format = lzma – descompress –stdout .

Opções: modos de operação

Essas opções informam ao xz qual modo usar. Se mais de um modo for especificado, o último entrará em vigor.

-z , –compressComprimir. Esta opção é o modo de operação padrão quando nenhuma opção de modo de operação é especificada e nenhum outro modo de operação está implícito no nome do comando (por exemplo, unxz implica em  descomprimir ).
-d , –dcompress , –uncompressDescomprimir.
-t , –testTeste a integridade dos arquivos compactados. Esta opção é equivalente a –decompress –stdout, exceto que os dados descompactados são descartados em vez de gravados na saída padrão. Nenhum arquivo é criado ou removido.
-l , –listImprima informações sobre arquivos compactados. Nenhuma saída não compactada é produzida e nenhum arquivo é criado ou removido. No modo de lista, o programa não pode ler os dados compactados da entrada padrão ou de outras fontes não observáveis.

A listagem padrão mostra informações básicas sobre arquivos, um arquivo por linha. Para obter informações mais detalhadas, use também a opção –verbose . Para obter mais informações, use –verbose duas vezes, mas observe que isso pode ser lento, porque obter todas as informações extras requer muitas buscas. A largura da saída detalhada excede 80 caracteres , portanto, canalizar a saída para, por exemplo, ” less -S ” pode ser conveniente se o terminal não for largo o suficiente.

A saída exata pode variar entre as versões xz e diferentes localidades. Para saída legível por máquina, –robot –list deve ser usada.

Opções: modificadores de operação

-k , –keepNão exclua os arquivos de entrada.
-f , –forceEsta opção tem vários efeitos:

• Se o arquivo de destino já existir, exclua-o antes de compactar ou descompactar.

• Compacte ou descompacte, mesmo que a entrada seja um link simbólico para um arquivo comum, tenha mais de um link físico ou o conjunto de bits setuid, setgid ou sticky bit. Os bits setuid, setgid e sticky não são copiados para o arquivo de destino.

• Quando usado com –decompress –stdout e xz não pode reconhecer o tipo do arquivo de origem, copie o arquivo de origem como está na saída padrão. Isso permite que o xzcat –force seja usado como cat para arquivos que não foram compactados com o xz . Observe que, no futuro, o xz poderá suportar novos formatos de arquivo compactado, o que pode fazer com que o xz descompacte mais tipos de arquivos, em vez de copiá-los, como na saída padrão. –format = formato pode ser usado para restringir xz para descomprimir apenas um único formato de arquivo.

-c , –stdout , –to-stdoutEscreva os dados compactados ou descompactados na saída padrão em vez de em um arquivo. Isso implica – manutenção .
– único fluxoDescompacte apenas o primeiro fluxo .xz e ignore silenciosamente os possíveis dados de entrada restantes após o fluxo. Normalmente esse lixo final faz com que xz exiba um erro.

O xz nunca descompacta mais de um fluxo de arquivos .lzma ou fluxos brutos, mas essa opção ainda faz com que o xz ignore os possíveis dados finais após o arquivo .lzma ou fluxo bruto.

Esta opção não tem efeito se o modo de operação não for  descomprimir ou  test .

–no-sparseDesative a criação de arquivos esparsos. Por padrão, ao descompactar em um arquivo normal, o xz tenta tornar o arquivo escasso se os dados descompactados contiverem longas sequências de zeros binários . Também funciona ao gravar na saída padrão, desde que a saída padrão esteja conectada a um arquivo regular e certas condições adicionais sejam atendidas para torná-lo seguro. Criar arquivos esparsos pode economizar espaço em disco e acelerar a descompactação, reduzindo a quantidade de E / S do disco .
-S. suf , –suffix =. sufAo comprimir, use . suf como o sufixo do arquivo de destino em vez de .xz ou .lzma . Se não estiver gravando na saída padrão e o arquivo de origem já tiver o sufixo .suf , um aviso será exibido e o arquivo será ignorado.

Ao descompactar, reconheça os arquivos com o sufixo . suf , além de arquivos com o sufixo .xz , .txz , .lzma ou .tlz . Se o arquivo de origem tiver o sufixo . suf , o sufixo é removido para obter o nome do arquivo de destino.

Ao compactar ou descompactar fluxos brutos ( –format = bruto ), o sufixo sempre deve ser especificado, a menos que seja gravado na saída padrão, porque não há sufixo padrão para fluxos brutos.

–files [ = arquivo ]Leia os nomes dos arquivos para processar a partir do arquivo ; se o arquivo for omitido, os nomes dos arquivos serão lidos a partir da entrada padrão. Os nomes dos arquivos devem ser finalizados com o caractere de nova linha . Um traço (”  “) é usado como um nome de arquivo normal; isso não significa entrada padrão. Se os nomes dos arquivos também forem fornecidos como argumentos da linha de comando, eles serão processados ​​antes da leitura dos nomes dos arquivos .
–files0 [ = arquivo ]Esta opção é idêntica a –files [ = file ], exceto que cada nome de arquivo deve ser finalizado com o caractere nulo.

Opções: formato básico de arquivo e opções de compactação

-F formato , –format = formatoEspecifique o formato do arquivo para compactar ou descompactar:

autoEste formato é o padrão. Ao compactar, auto é equivalente a xz . Ao descompactar, o formato do arquivo de entrada é detectado automaticamente. Observe que os fluxos brutos (criados com –format = bruto ) não podem ser detectados automaticamente.
xzCompacte no formato de arquivo .xz ou aceite apenas arquivos .xz ao descompactar.
lzma , sozinhoCompacte no formato de arquivo .lzma herdado ou aceite apenas arquivos .lzma ao descompactar. Somente o nome alternativo é fornecido para compatibilidade com versões anteriores do LZMA Utils.
cruCompacte ou descompacte um fluxo bruto (sem cabeçalhos). Este formato é destinado apenas a usuários avançados. Para decodificar fluxos brutos, você precisa usar –format = raw e especificar explicitamente a cadeia de filtros, que normalmente seria armazenada nos cabeçalhos do contêiner.
-C cheque , –check = chequeEspecifique o tipo da verificação de integridade. A verificação é calculada a partir dos dados não compactados e armazenada no arquivo .xz . Esta opção tem efeito apenas ao compactar no formato .xz ; o formato .lzma não suporta verificações de integridade. A verificação de integridade (se houver) é verificada quando o arquivo .xz é descompactado.

Tipos de verificação suportados:

NenhumNão calcule uma verificação de integridade. Essa verificação geralmente é uma má ideia. Isso pode ser útil quando a integridade dos dados é verificada por outros meios de qualquer maneira.
crc32Calcule o CRC32 usando o polinômio de IEEE-802.3 (Ethernet).
crc64Calcule CRC64 usando o polinômio de ECMA-182. Essa verificação é o padrão, pois é um pouco melhor que o CRC32 na detecção de arquivos danificados e a diferença de velocidade é insignificante.
sha256Calcule SHA-256. Essa verificação é um pouco mais lenta que CRC32 e CRC64.

A integridade dos cabeçalhos .xz é sempre verificada com o CRC32. Não é possível alterá-lo ou desativá-lo.

-0 … -9Selecione um nível predefinido de compactação. O padrão é -6 . Se vários níveis predefinidos forem especificados, o último entrará em vigor. Se uma cadeia de filtros personalizada já foi especificada, a configuração de um nível predefinido de compactação limpa a cadeia de filtros personalizada.

As diferenças entre as predefinições são mais significativas do que com gzip e bzip2 . As configurações de compactação selecionadas determinam os requisitos de memória do descompactador, portanto, o uso de um nível predefinido muito alto pode dificultar a descompactação do arquivo em um sistema antigo com pouca RAM. Especificamente, não é uma boa ideia usar cegamente -9 para tudo como costuma acontecer com gzip e bzip2 .

-0 … -3Essas são predefinições um tanto rápidas. -0 às vezes é mais rápido que gzip -9 enquanto comprime muito melhor. Os mais altos geralmente têm velocidade comparável ao bzip2 com taxa de compactação comparável ou melhor, embora os resultados dependam muito do tipo de dados que está sendo compactado.
-4 … -6Compressão boa a muito boa, mantendo o uso da memória descompressor razoável, mesmo para sistemas antigos. -6 é o padrão, o que geralmente é uma boa escolha, por exemplo, para a distribuição de arquivos que precisam ser descompactáveis, mesmo em sistemas com apenas 16 MiB de RAM. -5e ou -6e também pode ser considerado. Consulte – extremo .)
-7 … -9São como -6, mas com requisitos mais altos de memória para compressor e descompressor. Eles são úteis apenas ao compactar arquivos maiores que 8 MiB, 16 MiB e 32 MiB, respectivamente.

No mesmo hardware, a velocidade de descompressão é aproximadamente um número constante de bytes de dados compactados por segundo. Em outras palavras, quanto melhor a compactação, mais rápida será a descompactação. Isso também significa que a quantidade de saída não compactada produzida por segundo pode variar muito.

A tabela a seguir resume os recursos das predefinições:

PredefiniçãoDictSizeCompCPUCompMemDecMem
-0256 KiB0 03 MiB1 MiB
-11 MiB19 MiB2 MiB
-22 MiB217 MiB3 MiB
-34 MiB332 MiB5 MiB
-44 MiB448 MiB5 MiB
-58 MiB594 MiB9 MiB
-68 MiB694 MiB9 MiB
-716 MiB6186 MiB17 MiB
-832 MiB6370 MiB33 MiB
-964 MiB6674 MiB65 MiB

Descrições da coluna:

• DictSize é o tamanho do dicionário LZMA2. É perda de memória usar um dicionário maior que o tamanho do arquivo descompactado. É por isso que é bom evitar o uso das predefinições -7 … -9 quando não há uma necessidade real delas. Em -6 e inferior, a quantidade de memória desperdiçada geralmente é baixa o suficiente para não importar.

• CompCPU é uma representação simplificada das configurações do LZMA2 que afetam a velocidade de compactação. O tamanho do dicionário também afeta a velocidade, portanto, enquanto a CompCPU é a mesma para os níveis -6 … -9 , os níveis mais altos ainda tendem a ser um pouco mais lentos. Para obter uma compactação ainda mais lenta e, portanto, possivelmente melhor, consulte –extreme .

• CompMem contém os requisitos de memória do compressor no modo de rosca única. Pode variar um pouco entre as versões xz . Os requisitos de memória de alguns dos futuros modos multithread podem ser dramaticamente mais altos que os do modo single-threaded.

• DecMem contém os requisitos de memória do descompactador. Ou seja, as configurações de compactação determinam os requisitos de memória do descompactador. O uso exato da memória do descompressor é um pouco maior que o tamanho do dicionário LZMA2, mas os valores na tabela foram arredondados para o próximo MiB completo.

-e , –extremeUse uma variante mais lenta do nível predefinido de compactação selecionado ( -0 … -9 ) para obter uma taxa de compactação um pouco melhor, mas com azar isso também pode piorar. O uso da memória do descompressor não é afetado, mas o uso da memória do compressor aumenta um pouco nos níveis predefinidos -0 … -3 .

Como existem duas predefinições com tamanhos de dicionário 4 MiB e 8 MiB, as predefinições -3e e -5e usam configurações um pouco mais rápidas (CompCPU inferior) que -4e e -6e , respectivamente. Dessa forma, não há duas predefinições idênticas.

PredefiniçãoDictSizeCompCPUCompMemDecMem
-0e256 KiB84 MiB1 MiB
-1e1 MiB813 MiB2 MiB
-2e2 MiB825 MiB3 MiB
-3e4 MiB748 MiB5 MiB
-4e4 MiB848 MiB5 MiB
-5e8 MiB794 MiB9 MiB
-6e8 MiB894 MiB9 MiB
-7e16 MiB8186 MiB17 MiB
-8e32 MiB8370 MiB33 MiB
-9e64 MiB8674 MiB65 MiB

Por exemplo, há um total de quatro predefinições que usam o dicionário 8 MiB, cuja ordem do mais rápido ao mais lento é -5 , -6 , -5e e -6e .

–fast , –bestEsses são aliases um tanto enganosos para -0 e -9 , respectivamente. Eles são fornecidos apenas para compatibilidade com versões anteriores do LZMA Utils. Evite usar essas opções.
–block-size = sizeAo compactar para o formato .xz , divida os dados de entrada em blocos de bytes de tamanho. Os blocos são compactados independentemente um do outro.
–memlimit-compress = limitDefina um limite de uso de memória para compactação. Se esta opção for especificada várias vezes, a última entrará em vigor.

Se as configurações de compactação excederem o limite, xz ajustará as configurações para baixo para que o limite não seja mais excedido e exibirá um aviso de que o ajuste automático foi feito. Esses ajustes não são feitos ao compactar com –format = raw ou se –no- Adjust for especificado. Nesses casos, um erro é exibido e xz sai com o status de saída 1 .

O limite pode ser especificado de várias maneiras:

• O limite pode ser um valor absoluto em bytes. Usar um sufixo inteiro como MiB pode ser útil. Exemplo: –memlimit-compress = 80MiB

• O limite pode ser especificado como uma porcentagem da memória física total (RAM). Isso pode ser útil especialmente ao definir a variável de ambiente XZ_DEFAULTS em um script de inicialização do shell que é compartilhado entre computadores diferentes. Dessa forma, o limite é automaticamente maior em sistemas com mais memória. Exemplo: –memlimit-compress = 70%

• O limite pode ser redefinido de volta ao seu valor padrão, definindo-o como 0 , que atualmente é equivalente a definir o limite para max (sem limite de uso de memória). Depois que o suporte a multithreading é implementado, pode haver uma diferença entre 0 e max para o caso multithread, portanto, é recomendável usar 0 em vez de max até que os detalhes sejam decididos.

–memlimit-decompress = limitDefina um limite de uso de memória para descompactação. Isso também afeta o modo –list . Se a operação não for possível sem exceder o limite, xz exibirá um erro e a descompactação do arquivo falhará. Veja –memlimit-compress = limit para formas possíveis de especificar o limite.
-M limite , –memlimit = limite , –memory = limiteEsta opção é equivalente a especificar –memlimit-compress = limit –memlimit-decompress = limit .
– sem ajusteExiba um erro e saia se as configurações de compactação excederem o limite de uso de memória. O padrão é ajustar as configurações para baixo, para que o limite de uso da memória não seja excedido. O ajuste automático é sempre desativado ao criar fluxos brutos ( –format = bruto ).
-T threads , –threads = threadsEspecifique o número de threads de trabalho a serem usados. O número real de threads pode ser menor que threads, se o uso de mais threads exceder o limite de uso de memória.

A compactação e descompactação multithread ainda não foram implementadas, portanto, esta opção não tem efeito no momento.

Correntes de filtro de compressor personalizadas

Uma cadeia de filtros personalizada permite especificar as configurações de compactação em detalhes, em vez de depender das configurações associadas aos níveis predefinidos. Quando uma cadeia de filtros personalizada é especificada, as opções de nível de predefinição de compactação ( -0 … -9 e –extreme ) são ignoradas silenciosamente.

Uma cadeia de filtros é comparável à tubulação na linha de comando. Ao compactar, a entrada não compactada vai para o primeiro filtro, cuja saída vai para o próximo filtro (se houver). A saída do último filtro é gravada no arquivo compactado. O número máximo de filtros na cadeia é quatro, mas geralmente uma cadeia de filtros possui apenas um ou dois filtros.

Muitos filtros têm limitações sobre onde eles podem estar na cadeia de filtros: alguns filtros podem funcionar apenas como o último filtro da cadeia, outros apenas como um filtro não-último e alguns funcionam em qualquer posição na cadeia. Dependendo do filtro, essa limitação é inerente ao design do filtro ou existe para evitar problemas de segurança.

Uma cadeia de filtros personalizada é especificada usando uma ou mais opções de filtro na ordem em que são desejadas na cadeia de filtros. Ou seja, a ordem das opções de filtro é significativa! Ao decodificar fluxos brutos ( –format = bruto ), a cadeia do filtro é especificada na mesma ordem em que foi especificada ao compactar.

Os filtros aceitam opções específicas de filtro como uma lista separada por vírgula. Vírgulas extras nas opções são ignoradas. Cada opção tem um valor padrão, portanto, você precisa especificar apenas aqueles que deseja alterar.

–lzma1 [ = opções ], –lzma2 [ = opções ]Adicione o filtro LZMA1 ou LZMA2 à cadeia de filtros. Esses filtros podem ser usados ​​apenas como o último filtro na cadeia.

O LZMA1 é um filtro herdado, suportado quase exclusivamente devido ao formato de arquivo .lzma herdado, que suporta apenas o LZMA1. LZMA2 é uma versão atualizada do LZMA1 para corrigir alguns problemas práticos do LZMA1. O formato .xz usa LZMA2 e não oferece suporte a LZMA1. A velocidade de compressão e as proporções de LZMA1 e LZMA2 são praticamente as mesmas.

LZMA1 e LZMA2 compartilham o mesmo conjunto de opções:

predefinição = predefiniçãoRedefina todas as opções LZMA1 ou LZMA2 para predefinir . A predefinição consiste em um número inteiro, que pode ser seguido por modificadores de predefinição de uma letra. O número inteiro pode ser de 0 a 9 , correspondendo às opções de linha de comando -0 … -9 . O único modificador suportado atualmente é e , que corresponde a –extreme . A predefinição padrão é 6 , da qual os valores padrão para o restante das opções LZMA1 ou LZMA2 são obtidos.
dict = sizeO tamanho do dicionário (buffer de histórico) indica quantos bytes dos dados não compactados processados ​​recentemente são mantidos na memória. O algoritmo tenta encontrar sequências de bytes repetidas (correspondências) nos dados não compactados e substituí-los por referências aos dados atualmente no dicionário. Quanto maior o dicionário, maior a chance de encontrar uma correspondência. Portanto, aumentar o tamanho do dicionário geralmente melhora a taxa de compactação, mas um dicionário maior que o arquivo não compactado é desperdício de memória.

O tamanho típico do dicionário é de 64 KiB a 64 MiB. O mínimo é 4 KiB. O máximo para compactação atualmente é de 1,5 GiB (1536 MiB). O descompactador já suporta dicionários de até um byte a menos de 4 GiB, que é o máximo para os formatos de fluxo LZMA1 e LZMA2.

O tamanho do dicionário e o localizador de correspondência (mf) juntos determinam o uso de memória do codificador LZMA1 ou LZMA2. O mesmo tamanho (ou maior) de dicionário é necessário para descompactar que foi usado durante a compactação, portanto, o uso de memória do decodificador é determinado pelo tamanho do dicionário usado durante a compactação. Os cabeçalhos .xz armazenam o tamanho do dicionário como 2 ^ n ou 2 ^ n + 2 ^ (n-1), portanto esses tamanhos são preferidos para compactação. Outros tamanhos serão arredondados quando armazenados nos cabeçalhos .xz.

lc = lcEspecifique o número de bits de contexto literais. O mínimo é 0 e o máximo é 4 ; o padrão é 3 . Além disso, a soma de lc e lp não deve exceder 4 .

Todos os bytes que não podem ser codificados como correspondências são codificados como literais. Ou seja, literais são bytes de 8 bits codificados um de cada vez.

A codificação literal assume que os bits lc mais altos do byte descompactado anterior se correlacionam com o próximo byte. Por exemplo, no texto típico em inglês, uma letra maiúscula é geralmente seguida por uma letra minúscula e uma letra minúscula é geralmente seguida por outra letra minúscula. No conjunto de caracteres US-ASCII, os três bits mais altos são 010 para letras maiúsculas e 011 para letras minúsculas. Quando lc é pelo menos 3, a codificação literal pode tirar proveito dessa propriedade nos dados não compactados.

O valor padrão ( 3 ) geralmente é bom. Se você deseja uma compressão máxima, teste lc = 4 . Às vezes, ajuda um pouco e às vezes piora a compactação. Se piorar, teste, por exemplo, lc = 2 também.

lp = lpEspecifique o número de bits de posição literais. O mínimo é 0 e o máximo é 4 ; o padrão é 0 .

Lp afeta que tipo de alinhamento nos dados não compactados é assumido ao codificar literais. Veja a pb abaixo para obter mais informações sobre alinhamento.

pb = pbEspecifique o número de bits de posição. O mínimo é 0 e o máximo é 4 ; o padrão é 2 .

O Pb afeta em geral o tipo de alinhamento nos dados não compactados. O padrão significa alinhamento de quatro bytes (2 ^ pb = 2 ^ 2 = 4), o que geralmente é uma boa opção quando não há melhor estimativa.

Quando o alinhamento é conhecido, definir pb adequadamente pode reduzir um pouco o tamanho do arquivo. Por exemplo, com arquivos de texto com alinhamento de um byte (US-ASCII, ISO-8859- *, UTF-8), a configuração pb = 0 pode melhorar um pouco a compactação. Para texto UTF-16, pb = 1 é uma boa escolha. Se o alinhamento for um número ímpar, como 3 bytes, pb = 0 pode ser a melhor opção.

Embora o alinhamento assumido possa ser ajustado com pb e lp , o LZMA1 e o LZMA2 ainda favorecem levemente o alinhamento de 16 bytes. Vale a pena levar em consideração ao projetar formatos de arquivo que provavelmente são compactados com o LZMA1 ou LZMA2.

mf = mfO Match Finder tem um efeito importante na velocidade do codificador, no uso da memória e na taxa de compactação. Normalmente, os localizadores de correspondências Hash Chain são mais rápidos que os localizadores de correspondências da Árvore Binária. O padrão depende da predefinição: 0 usa hc3 , 1 – 3 usa hc4 e o restante usa bt4 .

Os seguintes localizadores de correspondência são suportados. As fórmulas de uso de memória abaixo são aproximações aproximadas, mais próximas da realidade quando o ditado é uma potência de dois.

hc3Cadeia de hash com hash de 2 e 3 bytes
Valor mínimo para nice: 3
Uso de memória:
dict * 7,5 (se dict <= 16 MiB);
dict * 5.5 + 64 MiB (se dict> 16 MiB)
hc4Cadeia de hash com hash de 2, 3 e 4 bytes
Valor mínimo para nice: 4
Uso de memória:
dict * 7,5 (se dict <= 32 MiB);
dict * 6.5 (se dict> 32 MiB)
bt2Árvore binária com hash de 2 bytes
Valor mínimo para nice: 2
Uso de memória: dict * 9.5
bt3Árvore binária com hash de 2 e 3 bytes
Valor mínimo para nice: 3
Uso de memória:
dict * 11,5 (se dict <= 16 MiB);
dict * 9.5 + 64 MiB (se dict> 16 MiB)
bt4Árvore binária com hash de 2, 3 e 4 bytes
Valor mínimo para nice: 4
Uso de memória:
dict * 11,5 (se dict <= 32 MiB);
dict * 10.5 (se dict> 32 MiB)
mode = modeO modo de compactação especifica o método para analisar os dados produzidos pelo localizador de correspondências. Os modos suportados são rápidos e normais . O padrão é rápido para as predefinições 0 – 3 e normal para as predefinições 4 – 9 .

Geralmente, o fast é usado com os localizadores de correspondências Hash Chain e o normal com os localizadores de correspondências da Árvore Binária, que também é o que as predefinições fazem.

nice = niceEspecifique o que é considerado um bom comprimento para uma partida. Uma vez encontrada uma correspondência de pelo menos bytes agradáveis, o algoritmo para de procurar correspondências possivelmente melhores.

Nice pode ter 2-273 bytes. Valores mais altos tendem a fornecer uma melhor taxa de compressão às custas da velocidade. O padrão depende da predefinição.

profundidade = profundidadeEspecifique a profundidade máxima de pesquisa no localizador de correspondências. O padrão é o valor especial de 0 , que faz o compressor determinar uma profundidade razoável de mf e agradável .

A profundidade razoável para cadeias de hash é de 4 a 100 e 16 a 1000 para árvores binárias. O uso de valores muito altos para profundidade pode tornar o codificador extremamente lento em alguns arquivos. Evite definir a profundidade acima de 1000, a menos que esteja preparado para interromper a compactação, caso esteja demorando muito.

Ao decodificar fluxos brutos ( –format = bruto ), o LZMA2 precisa apenas do tamanho do dicionário. O LZMA1 também precisa de lc , lp e pb .

–x86 [ = opções ]

–powerpc [ = opções ]

–ia64 [ = opções ]

–arm [ = opções ]

–armthumb [ = opções ]

–sparc [ = opções ]

Adicione um filtro de ramificação / chamada / salto (BCJ) à cadeia de filtros. Esses filtros podem ser usados ​​apenas como um filtro não-último na cadeia de filtros.

Um filtro BCJ converte endereços relativos no código da máquina em seus equivalentes absolutos. Isso não altera o tamanho dos dados, mas aumenta a redundância, o que pode ajudar o LZMA2 a produzir um arquivo .xz 0-15% menor. Os filtros BCJ são sempre reversíveis; portanto, o uso de um filtro BCJ para dados incorretos não causa perda de dados, embora possa piorar um pouco a taxa de compactação.

É bom aplicar um filtro BCJ em um executável inteiro; não há necessidade de aplicá-lo apenas na seção executável. A aplicação de um filtro BCJ em um archive que contém arquivos executáveis ​​e não executáveis ​​pode ou não dar bons resultados; portanto, geralmente não é bom aplicar cegamente um filtro BCJ ao compactar pacotes binários para distribuição.

Esses filtros BCJ são muito rápidos e usam uma quantidade insignificante de memória. Se um filtro BCJ melhorar a taxa de compactação de um arquivo, ele poderá melhorar a velocidade de descompactação ao mesmo tempo. Isso ocorre porque, no mesmo hardware, a velocidade de descompressão do LZMA2 é aproximadamente um número fixo de bytes de dados compactados por segundo.

Esses filtros BCJ têm problemas conhecidos relacionados à taxa de compactação:

• Alguns tipos de arquivos que contêm código executável (por exemplo, arquivos de objeto, bibliotecas estáticas e módulos de kernel do Linux) têm os endereços nas instruções preenchidos com valores de preenchimento. Esses filtros BCJ ainda farão a conversão de endereço, o que tornará a compactação pior com esses arquivos.

• A aplicação de um filtro BCJ em um arquivo contendo vários executáveis ​​semelhantes pode piorar a taxa de compactação do que não usar um filtro BCJ. Isso ocorre porque o filtro BCJ não detecta os limites dos arquivos executáveis ​​e não redefine o contador de conversão de endereços para cada executável.

Ambos os problemas acima serão corrigidos no futuro em um novo filtro. Os antigos filtros BCJ ainda serão úteis em sistemas embarcados, porque o decodificador do novo filtro será maior e usará mais memória.

Conjuntos de instruções diferentes têm alinhamento diferente:

filtroalinhamentonotas
x861X86 de 32 ou 64 bits
PowerPC4Apenas Big Endian
BRAÇO4Apenas Little Endian
ARM-Thumb2Apenas Little Endian
IA-6416Grande ou pequeno endian
SPARC4Grande ou pequeno endian

Como os dados filtrados por BCJ geralmente são compactados com LZMA2, a taxa de compactação pode ser ligeiramente melhorada se as opções de LZMA2 estiverem definidas para corresponder ao alinhamento do filtro BCJ selecionado. Por exemplo, com o filtro IA-64, é bom definir pb = 4 com LZMA2 (2 ^ 4 = 16). O filtro x86 é uma exceção; geralmente é bom manter o alinhamento padrão de quatro bytes do LZMA2 ao compactar executáveis ​​x86.

Todos os filtros BCJ suportam as mesmas opções:

start = offsetEspecifique o deslocamento inicial que é usado ao converter entre endereços relativos e absolutos. O deslocamento deve ser múltiplo do alinhamento do filtro (consulte a tabela acima). O padrão é zero. Na prática, o padrão é bom; especificar um deslocamento personalizado quase nunca é útil.
–delta [ = opções ]Adicione o filtro Delta à cadeia de filtros. O filtro Delta pode ser usado apenas como um filtro não-último na cadeia de filtros.

Atualmente, apenas o cálculo simples do delta em bytes é suportado. Pode ser útil ao compactar, por exemplo, imagens bitmap não compactadas ou áudio PCM não compactado. No entanto, algoritmos de finalidade especial podem fornecer resultados significativamente melhores que o Delta + LZMA2. Isso é verdade especialmente com o áudio, que comprime mais rápido e melhor, por exemplo, com flac . Opções suportadas:

dist = distânciaEspecifique a distância do cálculo delta em bytes. distância deve ser de 1 a 256 . O padrão é 1 .

Por exemplo, com dist = 2 e entrada de oito bytes A1 B1 A2 B3 A3 B5 A4 B7 , a saída será A1 B1 01 02 01 02 01 02 .

Outras opções

-q , –quietSuprimir avisos e avisos. Especifique isso duas vezes para suprimir erros também. This option has no effect on the exit status. That is, even if a warning was suppressed, the exit status to indicate a warning is still used.
-v , –verboseSeja detalhado . Se um erro padrão estiver conectado a um terminal, xz exibirá um indicador de progresso. A especificação de –verbose duas vezes fornece uma saída ainda mais detalhada.

O indicador de progresso mostra as seguintes informações:

• A porcentagem de conclusão é mostrada se o tamanho do arquivo de entrada for conhecido. Ou seja, a porcentagem não pode ser mostrada nos tubos.

• Quantidade de dados compactados produzidos (compactando) ou consumidos (descompactando).

• Quantidade de dados não compactados consumidos (compactados) ou produzidos (descompactados).

• Taxa de compactação, calculada dividindo a quantidade de dados compactados processados ​​até o momento pela quantidade de dados não compactados processados ​​até o momento.

• Velocidade de compressão ou descompressão. Isso é medido como a quantidade de dados não compactados consumidos (compactação) ou produzidos (descompactação) por segundo. É mostrado após alguns segundos desde que o xz começou a processar o arquivo.

• Tempo decorrido no formato M: SS ou H: MM: SS .

• O tempo restante estimado é mostrado apenas quando o tamanho do arquivo de entrada é conhecido e já se passaram alguns segundos desde que o xz começou a processar o arquivo. A hora é mostrada em um formato menos preciso, que nunca possui dois pontos, por exemplo, 2 min 30 s.

Quando o erro padrão não é um terminal, –verbose fará xzimprima o nome do arquivo, tamanho compactado, tamanho descompactado, taxa de compactação e, possivelmente, também a velocidade e o tempo decorrido em uma única linha para erro padrão após compactar ou descompactar o arquivo. A velocidade e o tempo decorrido são incluídos apenas quando a operação leva pelo menos alguns segundos. Se a operação não foi concluída, por exemplo, devido à interrupção do usuário, também a porcentagem de conclusão será impressa se o tamanho do arquivo de entrada for conhecido.

-Q , –no-warnNão defina o status de saída como 2, mesmo que uma condição que valha um aviso tenha sido detectada. Esta opção não afeta o nível de verbosidade, portanto, –quiet e –no-warn devem ser usados ​​para não exibir avisos e não alterar o status de saída.
–robôImprima mensagens em um formato analisável por máquina. Isso visa facilitar a criação de front-end que desejam usar xz em vez de liblzma, o que pode ser o caso de vários scripts. A saída com esta opção ativada deve ser estável nas versões xz . Veja a seção MODO ROBÔ para detalhes.
–info-memoryExiba, em formato legível por humanos, a quantidade de memória física (RAM) xz que o sistema possui e os limites de uso de memória para compactação e descompactação, e saia com êxito.
-h , –helpExiba uma mensagem de ajuda descrevendo as opções mais usadas e saia com sucesso.
-H , –long-helpExiba uma mensagem de ajuda descrevendo todos os recursos do xz e saia com sucesso.
-V , –versionExibir o número da versão xz e liblzma em formato legível. Para obter a saída de máquina-parsable, especifique –robot antes –version .

Modo robô

O modo robô é ativado com a opção –robot . Torna a saída do xz mais fácil de analisar por outros programas. Atualmente –robot é suportado apenas junto com –version , –info-memory e –list . Ele será suportado para compactação e descompactação normal no futuro.

Modo robô: versão

xz –robot –version imprimirá o número da versão de xz e liblzma no seguinte formato:

XZ_VERSION = XYYYZZZS 
LIBLZMA_VERSION = XYYYZZZS

Aqui está o que o número da versão significa, parte por parte:

XVersão principal.
AAAAVersão secundária. Números pares são estáveis. Os números ímpares são versões alfa ou beta.
ZZZNível de patch para versões estáveis ​​ou um contador para versões de desenvolvimento.
SEstabilidade. 0 é alfa, 1 é beta e 2 é estável. S deve ser sempre 2 quando AA for igual.
XYYYZZZSSão iguais nas duas linhas se xz e liblzma forem da mesma versão do XZ Utils.

Exemplos: 4.999.9beta é 49990091 e 5.0.0 é 50000002 .

Modo de robô: informações de limite de memória

xz –robot –info-memory imprime uma única linha com três colunas separadas por tabulação:

  • Quantidade total de memória física (RAM) em bytes
  • Limite de uso de memória para compactação em bytes. Um valor especial de zero indica a configuração padrão, que para o modo de thread único é igual a sem limite.
  • Limite de uso de memória para descompactação em bytes. Um valor especial de zero indica a configuração padrão, que para o modo de thread único é igual a sem limite.

No futuro, a saída do xz –robot –info-memory pode ter mais colunas, mas nunca mais do que uma única linha.

Modo de robô: modo de lista

xz –robot –list usa saída separada por tabulação. A primeira coluna de cada linha possui uma sequência que indica o tipo de informação encontrada nessa linha:

nomeEssa é sempre a primeira linha ao iniciar a lista de um arquivo. A segunda coluna na linha é o nome do arquivo.
ArquivoEsta linha contém informações gerais sobre o arquivo .xz . Esta linha é sempre impressa após a linha de nome.
correnteEsse tipo de linha é usado apenas quando –verbose foi especificado. Existem tantas linhas de fluxo quanto o arquivo .xz .
quadraEsse tipo de linha é usado apenas quando –verbose foi especificado. Existem tantas linhas de blocos quanto blocos no arquivo .xz . As linhas de bloco são mostradas após todas as linhas de fluxo; tipos de linhas diferentes não são intercalados.
resumoEsse tipo de linha é usado apenas quando –verbose foi especificado duas vezes. Esta linha é impressa após todas as linhas de bloco. Como a linha do arquivo, a linha de resumo contém informações gerais sobre o arquivo .xz .
totaisEssa linha é sempre a última linha da saída da lista. Mostra o total de contagens e tamanhos.

As colunas das linhas do arquivo são:

  1. Número de fluxos no arquivo.
  2. Número total de blocos no fluxo (s).
  3. Tamanho compactado do arquivo.
  4. Tamanho não compactado do arquivo.
  5. Taxa de compressão, por exemplo, 0,123. Se a proporção for superior a 9.999, três traços (—) serão exibidos em vez da proporção.
  6. Lista separada por vírgula de nomes de verificação de integridade. As seguintes seqüências de caracteres são usadas para os tipos de verificação conhecidos: Nenhum , CRC32 , CRC64 e SHA-256 . Para tipos de verificação desconhecidos, Desconhecido-N é usado, onde N é o ID da verificação como um número decimal (um ou dois dígitos).
  7. Tamanho total do preenchimento de fluxo no arquivo.

As colunas das linhas de fluxo são:

  1. Número do fluxo (o primeiro fluxo é 1).
  2. Número de blocos no fluxo.
  3. Deslocamento de partida compactado.
  4. Deslocamento inicial não compactado.
  5. Tamanho compactado (não inclui preenchimento de fluxo).
  6. Tamanho não compactado.
  7. Taxa de compressão.
  8. Nome da verificação de integridade.
  9. Tamanho do preenchimento do fluxo.

As colunas das linhas de bloco são:

  1. Número do fluxo que contém este bloco.
  2. Número do bloco relativo ao início do fluxo (o primeiro bloco é 1).
  3. Número do bloco relativo ao início do arquivo.
  4. Deslocamento inicial compactado em relação ao início do arquivo.
  5. Deslocamento inicial não compactado em relação ao início do arquivo.
  6. Tamanho total compactado do bloco (inclui cabeçalhos).
  7. Tamanho não compactado.
  8. Taxa de compressão.
  9. Nome da verificação de integridade.

Se –verbose foi especificado duas vezes, colunas adicionais serão incluídas nas linhas de bloco . Eles não são exibidos com um único –verbose , porque obter essas informações requer muitas buscas e, portanto, pode ser lento:

  1. Valor da verificação de integridade em hexadecimal.
  2. Bloquear tamanho do cabeçalho.
  3. Sinalizadores de bloco: c indica que o tamanho compactado está presente e u indica que o tamanho não compactado está presente. Se o sinalizador não estiver definido, um traço (-) será mostrado para manter o comprimento da string fixo. Novos sinalizadores podem ser adicionados ao final da string no futuro.
  4. Tamanho dos dados compactados reais no bloco (isso exclui os campos de cabeçalho, preenchimento e verificação).
  5. Quantidade de memória (em bytes) necessária para descompactar esse bloco com esta versão xz.
  6. Corrente do filtro. Observe que a maioria das opções usadas no momento da compactação não pode ser conhecida, porque apenas as opções necessárias para descompactação são armazenadas nos cabeçalhos .xz.

As colunas das linhas de resumo são:

  1. Quantidade de memória (em bytes) necessária para descompactar este arquivo com esta versão xz.
  2. sim ou não, indicando se todos os cabeçalhos de bloco têm tamanho compactado e não compactado armazenados desde o xz 5.1.2alpha.
  3. Versão mínima xz necessária para descompactar o arquivo.

As colunas da linha de totais :

  1. Número de fluxos.
  2. Número de blocos.
  3. Tamanho comprimido.
  4. Tamanho não compactado.
  5. Taxa de compressão média.
  6. Lista separada por vírgula de nomes de verificação de integridade que estavam presentes nos arquivos.
  7. Tamanho do preenchimento de fluxo.
  8. Número de arquivos. Está aqui para manter a ordem das colunas anteriores igual à das linhas de arquivo.

Se –verbose foi especificado duas vezes, colunas adicionais serão incluídas na linha de totais:

  1. Quantidade máxima de memória (em bytes) necessária para descompactar os arquivos com esta versão xz .
  2. yes or no indicating if all block headers have both compressed size and uncompressed size stored in them.
  3. Minimum xz version required to decompress the file.

Status de saída

0 0Everything was successful.
1Um erro ocorreu.
2Something worthy of a warning occurred, but no errors.

Meio Ambiente

xz parses space-separated lists of options from the environment variables XZ_DEFAULTS and XZ_OPT , in this order, before parsing the options from the command line. Note that only options are parsed from the environment variables; all non-options are silently ignored.

XZ_DEFAULTSOpções padrão específicas do usuário ou do sistema. Geralmente, isso é definido em um script de inicialização do shell para ativar o limitador de uso de memória do xz por padrão. Excluindo scripts de inicialização de shell e casos especiais semelhantes, os scripts nunca devemos definir ou unset XZ_DEFAULTS .
XZ_OPTIsso serve para passar opções para xz quando não é possível definir as opções diretamente na linha de comando xz . Este é o caso, por exemplo, quando xz é executado por um script ou ferramenta, por exemplo, GNU tar :

 XZ_OPT = -2v tar caf foo.tar.xz foo

Os scripts podem usar XZ_OPT, por exemplo, para definir opções de compactação padrão específicas do script. Ainda é recomendável permitir que os usuários substituam XZ_OPT se isso for razoável, por exemplo, nos scripts sh, pode-se usar algo como isto:

XZ_OPT = $ {XZ_OPT - "- 7e"}; exportar XZ_OPT

Exemplos

 xz foo

Compacte o arquivo foo em foo.xz usando o nível de compactação padrão ( -6 ) e remova foo se a compactação for bem-sucedida.

 xz -dk bar.xz

Descomprimir bar.xz em bar e não remova bar.xz mesmo se descompressão é bem sucedida.

tar cf - baz | xz -4e> baz.tar.xz

Crie baz.tar.xz com a predefinição -4e ( -4 –extreme ), que é mais lenta que o padrão -6 , mas precisa de menos memória para compactação e descompactação (48 MiB e 5 MiB, respectivamente).

 xz -dcf a.txt b.txt.xz c.txt d.txt.lzma> abcd.txt

Descompacte uma mistura de arquivos compactados e descompactados na saída padrão, usando um único comando.

compactar – Comprime um arquivo ou arquivos.
gzip – Crie, modifique, liste o conteúdo e extraia arquivos dos arquivos zip do GNU.
zip – Um utilitário de compactação e arquivamento.

20 de novembro de 2019

Sobre nós

A Linux Force Brasil é uma empresa que ama a arte de ensinar. Nossa missão é criar talentos para a área de tecnologia e atender com excelência nossos clientes.

CNPJ: 13.299.207/0001-50
SAC:         0800 721 7901

[email protected]

Comercial  Comercial: (11) 3796-5900

Suporte:    (11) 3796-5900
[email protected]

Copyright © Linux Force Security  - Desde 2011.