Comando Linux xz, unxz, xzcat, lzma, unlzma, lzcat

comando xz

xz , unxz , xzcat , lzma , unlzma e lzcat compactam ou descompactam arquivos .xz e .lzma .

Descrição

O xz é uma ferramenta de compactação de dados de uso geral com sintaxe de linha de comando semelhante ao gzip e bzip2 . O formato de arquivo nativo é o formato .xz , mas o formato .lzma herdado usado pelo LZMA Utils e os fluxos compactados brutos sem cabeçalhos de formato de contêiner também são suportados.

xz compacta ou descomprime cada arquivo de acordo com o modo de operação selecionado. Se nenhum arquivo for fornecido ou o arquivo for especificado como um traço (” – “), xz lê da entrada padrão e grava os dados processados na saída padrão. O xz recusará (exibirá um erro e pulará o arquivo) para gravar dados compactados na saída padrão, se for um terminal . Da mesma forma, o xz se recusará a ler dados compactados da entrada padrão, se for um terminal.

A menos que –stdout seja especificado, arquivos diferentes de ” – ” são gravados em um novo arquivo cujo nome é derivado do nome do arquivo de origem:

Ao compactar, o sufixo do formato do arquivo de destino ( .xz ou .lzma ) é anexado ao nome do arquivo de origem para obter o nome do arquivo de destino.
Ao descompactar, o sufixo .xz ou .lzma é removido do nome do arquivo para obter o nome do arquivo de destino. O xz também reconhece os sufixos .txz e .tlz e os substitui pelo sufixo .tar .

Se o arquivo de destino já existir, um erro será exibido e o arquivo será ignorado.

A menos que grave na saída padrão, xz exibe um aviso e pula o arquivo se qualquer um dos seguintes itens se aplicar:

O arquivo não é um arquivo regular. Links simbólicos não são seguidos e, portanto, não são considerados arquivos regulares.
O arquivo possui mais de um link físico .
O arquivo está definido como setuid , setgid ou sticky bit.
O modo de operação está definido para compactar e o arquivo já possui um sufixo do formato de arquivo de destino ( .xz ou .txz ao compactar no formato .xz e .lzma ou .tlz ao compactar no formato .lzma ).
O modo de operação está definido para descompactar e o arquivo não possui um sufixo de nenhum dos formatos de arquivo suportados ( .xz , .txz , .lzma ou .tlz ).

Após compactar ou descompactar o arquivo, xz copia o proprietário, o grupo, as permissões, o tempo de acesso e o tempo de modificação do arquivo de origem para o arquivo de destino. Se a cópia do grupo falhar, as permissões serão modificadas para que o arquivo de destino não se torne acessível aos usuários que não tiveram permissão para acessar o arquivo de origem. O xz ainda não suporta a cópia de outros metadados, como listas de controle de acesso ou atributos estendidos.

Depois que o arquivo de destino é fechado com sucesso, o arquivo de origem é removido, a menos que –keep tenha sido especificado. O arquivo de origem nunca será removido se a saída for gravada na saída padrão.

O envio de sinais SIGINFO ou SIGUSR1 para o processo xz faz com que as informações de progresso sejam impressas com erro padrão. Isso tem uso limitado, já que quando o erro padrão é um terminal, o uso de –verbose exibe um indicador de progresso com atualização automática.

Uso de memória

O uso da memória do xz varia de algumas centenas de kilobytes a vários gigabytes, dependendo das configurações de compactação. As configurações usadas ao compactar um arquivo determinam os requisitos de memória do descompactador. Normalmente, o descompactador precisa de 5% a 20% da quantidade de memória necessária para o compressor ao criar o arquivo. Por exemplo, descompactar um arquivo criado com xz -9 atualmente requer 65 MiB de memória. Ainda assim, é possível ter arquivos .xz que requerem vários gigabytes de memória para descompactar.

Especialmente usuários de sistemas mais antigos podem achar irritante a possibilidade de uso de memória muito grande. Para evitar surpresas desconfortáveis, o xz possui um limitador de uso de memória embutido, que é desativado por padrão. Embora alguns sistemas operacionais forneçam maneiras de limitar o uso de processos na memória, confiar neles não foi considerado suficientemente flexível.

O limitador de uso de memória pode ser ativado com a opção de linha de comando –memlimit = limit . Freqüentemente, é mais conveniente ativar o limitador por padrão, configurando a variável de ambiente XZ_DEFAULTS, por exemplo, XZ_DEFAULTS = – memlimit = 150MiB . É possível definir os limites separadamente para compactação e descompactação usando –memlimit-compress = limit e –memlimit-decompress = limit . O uso dessas duas opções fora de XZ_DEFAULTS raramente é útil porque uma única execução de xz não pode fazer compactação e descompactação e –memlimit = limit (ou -M limit) é mais curto para digitar na linha de comandos.

Se o limite de uso de memória especificado for excedido ao descompactar, xz exibirá um erro e a descompactação do arquivo falhará. Se o limite for excedido ao compactar, xz tentará reduzir as configurações para que o limite não seja mais excedido (exceto ao usar –format = bruto ou – sem ajuste ). Dessa forma, a operação não falhará, a menos que o limite seja muito pequeno. O dimensionamento das configurações é feito em etapas que não correspondem às predefinições do nível de compactação, por exemplo, se o limite for apenas ligeiramente menor que o valor necessário para xz -9 , as configurações serão reduzidas apenas um pouco, xz -8 .

Concatenando e preenchendo com arquivos .xz

É possível concatenar arquivos .xz como estão. O xz descompactará esses arquivos como se fossem um único arquivo .xz .

É possível inserir preenchimento entre as partes concatenadas ou após a última parte. O preenchimento deve consistir em bytes nulos e o tamanho do preenchimento deve ser um múltiplo de quatro bytes. Isso pode ser útil, por exemplo, se o arquivo .xz for armazenado em uma mídia que mede o tamanho dos arquivos em blocos de 512 bytes.

Concatenação e preenchimento não são permitidos com arquivos .lzma ou fluxos brutos.

Sintaxe

  xz [ opção ] ... [ arquivo ] ...

unxz é equivalente a xz – descompress .

xzcat é equivalente a xz –decompress –stdout .

lzma é equivalente a xz –format = lzma .

unlzma é equivalente a xz –format = lzma – descomprimir .

lzcat é equivalente a xz –format = lzma – descompress –stdout .

Opções: modos de operação

Essas opções informam ao xz qual modo usar. Se mais de um modo for especificado, o último entrará em vigor.

-z , –compress	Comprimir. Esta opção é o modo de operação padrão quando nenhuma opção de modo de operação é especificada e nenhum outro modo de operação está implícito no nome do comando (por exemplo, unxz implica em – descomprimir ).
-d , –dcompress , –uncompress	Descomprimir.
-t , –test	Teste a integridade dos arquivos compactados. Esta opção é equivalente a –decompress –stdout, exceto que os dados descompactados são descartados em vez de gravados na saída padrão. Nenhum arquivo é criado ou removido.
-l , –list	Imprima informações sobre arquivos compactados. Nenhuma saída não compactada é produzida e nenhum arquivo é criado ou removido. No modo de lista, o programa não pode ler os dados compactados da entrada padrão ou de outras fontes não observáveis. A listagem padrão mostra informações básicas sobre arquivos, um arquivo por linha. Para obter informações mais detalhadas, use também a opção –verbose . Para obter mais informações, use –verbose duas vezes, mas observe que isso pode ser lento, porque obter todas as informações extras requer muitas buscas. A largura da saída detalhada excede 80 caracteres , portanto, canalizar a saída para, por exemplo, ” less -S ” pode ser conveniente se o terminal não for largo o suficiente. A saída exata pode variar entre as versões xz e diferentes localidades. Para saída legível por máquina, –robot –list deve ser usada.

Opções: modificadores de operação

-k , –keep	Não exclua os arquivos de entrada.
-f , –force	Esta opção tem vários efeitos: • Se o arquivo de destino já existir, exclua-o antes de compactar ou descompactar. • Compacte ou descompacte, mesmo que a entrada seja um link simbólico para um arquivo comum, tenha mais de um link físico ou o conjunto de bits setuid, setgid ou sticky bit. Os bits setuid, setgid e sticky não são copiados para o arquivo de destino. • Quando usado com –decompress –stdout e xz não pode reconhecer o tipo do arquivo de origem, copie o arquivo de origem como está na saída padrão. Isso permite que o xzcat –force seja usado como cat para arquivos que não foram compactados com o xz . Observe que, no futuro, o xz poderá suportar novos formatos de arquivo compactado, o que pode fazer com que o xz descompacte mais tipos de arquivos, em vez de copiá-los, como na saída padrão. –format = formato pode ser usado para restringir xz para descomprimir apenas um único formato de arquivo.
-c , –stdout , –to-stdout	Escreva os dados compactados ou descompactados na saída padrão em vez de em um arquivo. Isso implica – manutenção .
– único fluxo	Descompacte apenas o primeiro fluxo .xz e ignore silenciosamente os possíveis dados de entrada restantes após o fluxo. Normalmente esse lixo final faz com que xz exiba um erro. O xz nunca descompacta mais de um fluxo de arquivos .lzma ou fluxos brutos, mas essa opção ainda faz com que o xz ignore os possíveis dados finais após o arquivo .lzma ou fluxo bruto. Esta opção não tem efeito se o modo de operação não for – descomprimir ou – test .
–no-sparse	Desative a criação de arquivos esparsos. Por padrão, ao descompactar em um arquivo normal, o xz tenta tornar o arquivo escasso se os dados descompactados contiverem longas sequências de zeros binários . Também funciona ao gravar na saída padrão, desde que a saída padrão esteja conectada a um arquivo regular e certas condições adicionais sejam atendidas para torná-lo seguro. Criar arquivos esparsos pode economizar espaço em disco e acelerar a descompactação, reduzindo a quantidade de E / S do disco .
-S. suf , –suffix =. suf	Ao comprimir, use . suf como o sufixo do arquivo de destino em vez de .xz ou .lzma . Se não estiver gravando na saída padrão e o arquivo de origem já tiver o sufixo .suf , um aviso será exibido e o arquivo será ignorado. Ao descompactar, reconheça os arquivos com o sufixo . suf , além de arquivos com o sufixo .xz , .txz , .lzma ou .tlz . Se o arquivo de origem tiver o sufixo . suf , o sufixo é removido para obter o nome do arquivo de destino. Ao compactar ou descompactar fluxos brutos ( –format = bruto ), o sufixo sempre deve ser especificado, a menos que seja gravado na saída padrão, porque não há sufixo padrão para fluxos brutos.
–files [ = arquivo ]	Leia os nomes dos arquivos para processar a partir do arquivo ; se o arquivo for omitido, os nomes dos arquivos serão lidos a partir da entrada padrão. Os nomes dos arquivos devem ser finalizados com o caractere de nova linha . Um traço (” – “) é usado como um nome de arquivo normal; isso não significa entrada padrão. Se os nomes dos arquivos também forem fornecidos como argumentos da linha de comando, eles serão processados antes da leitura dos nomes dos arquivos .
–files0 [ = arquivo ]	Esta opção é idêntica a –files [ = file ], exceto que cada nome de arquivo deve ser finalizado com o caractere nulo.

Opções: formato básico de arquivo e opções de compactação

-F formato , –format = formato

Especifique o formato do arquivo para compactar ou descompactar:

auto	Este formato é o padrão. Ao compactar, auto é equivalente a xz . Ao descompactar, o formato do arquivo de entrada é detectado automaticamente. Observe que os fluxos brutos (criados com –format = bruto ) não podem ser detectados automaticamente.
xz	Compacte no formato de arquivo .xz ou aceite apenas arquivos .xz ao descompactar.
lzma , sozinho	Compacte no formato de arquivo .lzma herdado ou aceite apenas arquivos .lzma ao descompactar. Somente o nome alternativo é fornecido para compatibilidade com versões anteriores do LZMA Utils.
cru	Compacte ou descompacte um fluxo bruto (sem cabeçalhos). Este formato é destinado apenas a usuários avançados. Para decodificar fluxos brutos, você precisa usar –format = raw e especificar explicitamente a cadeia de filtros, que normalmente seria armazenada nos cabeçalhos do contêiner.

-C cheque , –check = cheque

Especifique o tipo da verificação de integridade. A verificação é calculada a partir dos dados não compactados e armazenada no arquivo .xz . Esta opção tem efeito apenas ao compactar no formato .xz ; o formato .lzma não suporta verificações de integridade. A verificação de integridade (se houver) é verificada quando o arquivo .xz é descompactado.

Tipos de verificação suportados:

Nenhum	Não calcule uma verificação de integridade. Essa verificação geralmente é uma má ideia. Isso pode ser útil quando a integridade dos dados é verificada por outros meios de qualquer maneira.
crc32	Calcule o CRC32 usando o polinômio de IEEE-802.3 (Ethernet).
crc64	Calcule CRC64 usando o polinômio de ECMA-182. Essa verificação é o padrão, pois é um pouco melhor que o CRC32 na detecção de arquivos danificados e a diferença de velocidade é insignificante.
sha256	Calcule SHA-256. Essa verificação é um pouco mais lenta que CRC32 e CRC64.

A integridade dos cabeçalhos .xz é sempre verificada com o CRC32. Não é possível alterá-lo ou desativá-lo.

-0 … -9

Selecione um nível predefinido de compactação. O padrão é -6 . Se vários níveis predefinidos forem especificados, o último entrará em vigor. Se uma cadeia de filtros personalizada já foi especificada, a configuração de um nível predefinido de compactação limpa a cadeia de filtros personalizada.

As diferenças entre as predefinições são mais significativas do que com gzip e bzip2 . As configurações de compactação selecionadas determinam os requisitos de memória do descompactador, portanto, o uso de um nível predefinido muito alto pode dificultar a descompactação do arquivo em um sistema antigo com pouca RAM. Especificamente, não é uma boa ideia usar cegamente -9 para tudo como costuma acontecer com gzip e bzip2 .

-0 … -3	Essas são predefinições um tanto rápidas. -0 às vezes é mais rápido que gzip -9 enquanto comprime muito melhor. Os mais altos geralmente têm velocidade comparável ao bzip2 com taxa de compactação comparável ou melhor, embora os resultados dependam muito do tipo de dados que está sendo compactado.
-4 … -6	Compressão boa a muito boa, mantendo o uso da memória descompressor razoável, mesmo para sistemas antigos. -6 é o padrão, o que geralmente é uma boa escolha, por exemplo, para a distribuição de arquivos que precisam ser descompactáveis, mesmo em sistemas com apenas 16 MiB de RAM. ( -5e ou -6e também pode ser considerado. Consulte – extremo .)
-7 … -9	São como -6, mas com requisitos mais altos de memória para compressor e descompressor. Eles são úteis apenas ao compactar arquivos maiores que 8 MiB, 16 MiB e 32 MiB, respectivamente.

No mesmo hardware, a velocidade de descompressão é aproximadamente um número constante de bytes de dados compactados por segundo. Em outras palavras, quanto melhor a compactação, mais rápida será a descompactação. Isso também significa que a quantidade de saída não compactada produzida por segundo pode variar muito.

A tabela a seguir resume os recursos das predefinições:

Predefinição	DictSize	CompCPU	CompMem	DecMem
-0	256 KiB	0 0	3 MiB	1 MiB
-1	1 MiB	1	9 MiB	2 MiB
-2	2 MiB	2	17 MiB	3 MiB
-3	4 MiB	3	32 MiB	5 MiB
-4	4 MiB	4	48 MiB	5 MiB
-5	8 MiB	5	94 MiB	9 MiB
-6	8 MiB	6	94 MiB	9 MiB
-7	16 MiB	6	186 MiB	17 MiB
-8	32 MiB	6	370 MiB	33 MiB
-9	64 MiB	6	674 MiB	65 MiB

Descrições da coluna:

• DictSize é o tamanho do dicionário LZMA2. É perda de memória usar um dicionário maior que o tamanho do arquivo descompactado. É por isso que é bom evitar o uso das predefinições -7 … -9 quando não há uma necessidade real delas. Em -6 e inferior, a quantidade de memória desperdiçada geralmente é baixa o suficiente para não importar.

• CompCPU é uma representação simplificada das configurações do LZMA2 que afetam a velocidade de compactação. O tamanho do dicionário também afeta a velocidade, portanto, enquanto a CompCPU é a mesma para os níveis -6 … -9 , os níveis mais altos ainda tendem a ser um pouco mais lentos. Para obter uma compactação ainda mais lenta e, portanto, possivelmente melhor, consulte –extreme .

• CompMem contém os requisitos de memória do compressor no modo de rosca única. Pode variar um pouco entre as versões xz . Os requisitos de memória de alguns dos futuros modos multithread podem ser dramaticamente mais altos que os do modo single-threaded.

• DecMem contém os requisitos de memória do descompactador. Ou seja, as configurações de compactação determinam os requisitos de memória do descompactador. O uso exato da memória do descompressor é um pouco maior que o tamanho do dicionário LZMA2, mas os valores na tabela foram arredondados para o próximo MiB completo.

-e , –extreme

Use uma variante mais lenta do nível predefinido de compactação selecionado ( -0 … -9 ) para obter uma taxa de compactação um pouco melhor, mas com azar isso também pode piorar. O uso da memória do descompressor não é afetado, mas o uso da memória do compressor aumenta um pouco nos níveis predefinidos -0 … -3 .

Como existem duas predefinições com tamanhos de dicionário 4 MiB e 8 MiB, as predefinições -3e e -5e usam configurações um pouco mais rápidas (CompCPU inferior) que -4e e -6e , respectivamente. Dessa forma, não há duas predefinições idênticas.

Predefinição	DictSize	CompCPU	CompMem	DecMem
-0e	256 KiB	8	4 MiB	1 MiB
-1e	1 MiB	8	13 MiB	2 MiB
-2e	2 MiB	8	25 MiB	3 MiB
-3e	4 MiB	7	48 MiB	5 MiB
-4e	4 MiB	8	48 MiB	5 MiB
-5e	8 MiB	7	94 MiB	9 MiB
-6e	8 MiB	8	94 MiB	9 MiB
-7e	16 MiB	8	186 MiB	17 MiB
-8e	32 MiB	8	370 MiB	33 MiB
-9e	64 MiB	8	674 MiB	65 MiB

Por exemplo, há um total de quatro predefinições que usam o dicionário 8 MiB, cuja ordem do mais rápido ao mais lento é -5 , -6 , -5e e -6e .

–fast , –best

Esses são aliases um tanto enganosos para -0 e -9 , respectivamente. Eles são fornecidos apenas para compatibilidade com versões anteriores do LZMA Utils. Evite usar essas opções.

–block-size = size

Ao compactar para o formato .xz , divida os dados de entrada em blocos de bytes de tamanho. Os blocos são compactados independentemente um do outro.

–memlimit-compress = limit

Defina um limite de uso de memória para compactação. Se esta opção for especificada várias vezes, a última entrará em vigor.

Se as configurações de compactação excederem o limite, xz ajustará as configurações para baixo para que o limite não seja mais excedido e exibirá um aviso de que o ajuste automático foi feito. Esses ajustes não são feitos ao compactar com –format = raw ou se –no- Adjust for especificado. Nesses casos, um erro é exibido e xz sai com o status de saída 1 .

O limite pode ser especificado de várias maneiras:

• O limite pode ser um valor absoluto em bytes. Usar um sufixo inteiro como MiB pode ser útil. Exemplo: –memlimit-compress = 80MiB

• O limite pode ser especificado como uma porcentagem da memória física total (RAM). Isso pode ser útil especialmente ao definir a variável de ambiente XZ_DEFAULTS em um script de inicialização do shell que é compartilhado entre computadores diferentes. Dessa forma, o limite é automaticamente maior em sistemas com mais memória. Exemplo: –memlimit-compress = 70%

• O limite pode ser redefinido de volta ao seu valor padrão, definindo-o como 0 , que atualmente é equivalente a definir o limite para max (sem limite de uso de memória). Depois que o suporte a multithreading é implementado, pode haver uma diferença entre 0 e max para o caso multithread, portanto, é recomendável usar 0 em vez de max até que os detalhes sejam decididos.

–memlimit-decompress = limit

Defina um limite de uso de memória para descompactação. Isso também afeta o modo –list . Se a operação não for possível sem exceder o limite, xz exibirá um erro e a descompactação do arquivo falhará. Veja –memlimit-compress = limit para formas possíveis de especificar o limite.

-M limite , –memlimit = limite , –memory = limite

Esta opção é equivalente a especificar –memlimit-compress = limit –memlimit-decompress = limit .

– sem ajuste

Exiba um erro e saia se as configurações de compactação excederem o limite de uso de memória. O padrão é ajustar as configurações para baixo, para que o limite de uso da memória não seja excedido. O ajuste automático é sempre desativado ao criar fluxos brutos ( –format = bruto ).

-T threads , –threads = threads

Especifique o número de threads de trabalho a serem usados. O número real de threads pode ser menor que threads, se o uso de mais threads exceder o limite de uso de memória.

A compactação e descompactação multithread ainda não foram implementadas, portanto, esta opção não tem efeito no momento.

Correntes de filtro de compressor personalizadas

Uma cadeia de filtros personalizada permite especificar as configurações de compactação em detalhes, em vez de depender das configurações associadas aos níveis predefinidos. Quando uma cadeia de filtros personalizada é especificada, as opções de nível de predefinição de compactação ( -0 … -9 e –extreme ) são ignoradas silenciosamente.

Uma cadeia de filtros é comparável à tubulação na linha de comando. Ao compactar, a entrada não compactada vai para o primeiro filtro, cuja saída vai para o próximo filtro (se houver). A saída do último filtro é gravada no arquivo compactado. O número máximo de filtros na cadeia é quatro, mas geralmente uma cadeia de filtros possui apenas um ou dois filtros.

Muitos filtros têm limitações sobre onde eles podem estar na cadeia de filtros: alguns filtros podem funcionar apenas como o último filtro da cadeia, outros apenas como um filtro não-último e alguns funcionam em qualquer posição na cadeia. Dependendo do filtro, essa limitação é inerente ao design do filtro ou existe para evitar problemas de segurança.

Uma cadeia de filtros personalizada é especificada usando uma ou mais opções de filtro na ordem em que são desejadas na cadeia de filtros. Ou seja, a ordem das opções de filtro é significativa! Ao decodificar fluxos brutos ( –format = bruto ), a cadeia do filtro é especificada na mesma ordem em que foi especificada ao compactar.

Os filtros aceitam opções específicas de filtro como uma lista separada por vírgula. Vírgulas extras nas opções são ignoradas. Cada opção tem um valor padrão, portanto, você precisa especificar apenas aqueles que deseja alterar.

–lzma1 [ = opções ], –lzma2 [ = opções ]

Adicione o filtro LZMA1 ou LZMA2 à cadeia de filtros. Esses filtros podem ser usados apenas como o último filtro na cadeia.

O LZMA1 é um filtro herdado, suportado quase exclusivamente devido ao formato de arquivo .lzma herdado, que suporta apenas o LZMA1. LZMA2 é uma versão atualizada do LZMA1 para corrigir alguns problemas práticos do LZMA1. O formato .xz usa LZMA2 e não oferece suporte a LZMA1. A velocidade de compressão e as proporções de LZMA1 e LZMA2 são praticamente as mesmas.

LZMA1 e LZMA2 compartilham o mesmo conjunto de opções:

predefinição = predefinição

Redefina todas as opções LZMA1 ou LZMA2 para predefinir . A predefinição consiste em um número inteiro, que pode ser seguido por modificadores de predefinição de uma letra. O número inteiro pode ser de 0 a 9 , correspondendo às opções de linha de comando -0 … -9 . O único modificador suportado atualmente é e , que corresponde a –extreme . A predefinição padrão é 6 , da qual os valores padrão para o restante das opções LZMA1 ou LZMA2 são obtidos.

dict = size

O tamanho do dicionário (buffer de histórico) indica quantos bytes dos dados não compactados processados recentemente são mantidos na memória. O algoritmo tenta encontrar sequências de bytes repetidas (correspondências) nos dados não compactados e substituí-los por referências aos dados atualmente no dicionário. Quanto maior o dicionário, maior a chance de encontrar uma correspondência. Portanto, aumentar o tamanho do dicionário geralmente melhora a taxa de compactação, mas um dicionário maior que o arquivo não compactado é desperdício de memória.

O tamanho típico do dicionário é de 64 KiB a 64 MiB. O mínimo é 4 KiB. O máximo para compactação atualmente é de 1,5 GiB (1536 MiB). O descompactador já suporta dicionários de até um byte a menos de 4 GiB, que é o máximo para os formatos de fluxo LZMA1 e LZMA2.

O tamanho do dicionário e o localizador de correspondência (mf) juntos determinam o uso de memória do codificador LZMA1 ou LZMA2. O mesmo tamanho (ou maior) de dicionário é necessário para descompactar que foi usado durante a compactação, portanto, o uso de memória do decodificador é determinado pelo tamanho do dicionário usado durante a compactação. Os cabeçalhos .xz armazenam o tamanho do dicionário como 2 ^ n ou 2 ^ n + 2 ^ (n-1), portanto esses tamanhos são preferidos para compactação. Outros tamanhos serão arredondados quando armazenados nos cabeçalhos .xz.

lc = lc

Especifique o número de bits de contexto literais. O mínimo é 0 e o máximo é 4 ; o padrão é 3 . Além disso, a soma de lc e lp não deve exceder 4 .

Todos os bytes que não podem ser codificados como correspondências são codificados como literais. Ou seja, literais são bytes de 8 bits codificados um de cada vez.

A codificação literal assume que os bits lc mais altos do byte descompactado anterior se correlacionam com o próximo byte. Por exemplo, no texto típico em inglês, uma letra maiúscula é geralmente seguida por uma letra minúscula e uma letra minúscula é geralmente seguida por outra letra minúscula. No conjunto de caracteres US-ASCII, os três bits mais altos são 010 para letras maiúsculas e 011 para letras minúsculas. Quando lc é pelo menos 3, a codificação literal pode tirar proveito dessa propriedade nos dados não compactados.

O valor padrão ( 3 ) geralmente é bom. Se você deseja uma compressão máxima, teste lc = 4 . Às vezes, ajuda um pouco e às vezes piora a compactação. Se piorar, teste, por exemplo, lc = 2 também.

lp = lp

Especifique o número de bits de posição literais. O mínimo é 0 e o máximo é 4 ; o padrão é 0 .

Lp afeta que tipo de alinhamento nos dados não compactados é assumido ao codificar literais. Veja a pb abaixo para obter mais informações sobre alinhamento.

pb = pb

Especifique o número de bits de posição. O mínimo é 0 e o máximo é 4 ; o padrão é 2 .

O Pb afeta em geral o tipo de alinhamento nos dados não compactados. O padrão significa alinhamento de quatro bytes (2 ^ pb = 2 ^ 2 = 4), o que geralmente é uma boa opção quando não há melhor estimativa.

Quando o alinhamento é conhecido, definir pb adequadamente pode reduzir um pouco o tamanho do arquivo. Por exemplo, com arquivos de texto com alinhamento de um byte (US-ASCII, ISO-8859- *, UTF-8), a configuração pb = 0 pode melhorar um pouco a compactação. Para texto UTF-16, pb = 1 é uma boa escolha. Se o alinhamento for um número ímpar, como 3 bytes, pb = 0 pode ser a melhor opção.

Embora o alinhamento assumido possa ser ajustado com pb e lp , o LZMA1 e o LZMA2 ainda favorecem levemente o alinhamento de 16 bytes. Vale a pena levar em consideração ao projetar formatos de arquivo que provavelmente são compactados com o LZMA1 ou LZMA2.

mf = mf

O Match Finder tem um efeito importante na velocidade do codificador, no uso da memória e na taxa de compactação. Normalmente, os localizadores de correspondências Hash Chain são mais rápidos que os localizadores de correspondências da Árvore Binária. O padrão depende da predefinição: 0 usa hc3 , 1 – 3 usa hc4 e o restante usa bt4 .

Os seguintes localizadores de correspondência são suportados. As fórmulas de uso de memória abaixo são aproximações aproximadas, mais próximas da realidade quando o ditado é uma potência de dois.

hc3	Cadeia de hash com hash de 2 e 3 bytes Valor mínimo para nice: 3 Uso de memória: dict * 7,5 (se dict <= 16 MiB); dict * 5.5 + 64 MiB (se dict> 16 MiB)
hc4	Cadeia de hash com hash de 2, 3 e 4 bytes Valor mínimo para nice: 4 Uso de memória: dict * 7,5 (se dict <= 32 MiB); dict * 6.5 (se dict> 32 MiB)
bt2	Árvore binária com hash de 2 bytes Valor mínimo para nice: 2 Uso de memória: dict * 9.5
bt3	Árvore binária com hash de 2 e 3 bytes Valor mínimo para nice: 3 Uso de memória: dict * 11,5 (se dict <= 16 MiB); dict * 9.5 + 64 MiB (se dict> 16 MiB)
bt4	Árvore binária com hash de 2, 3 e 4 bytes Valor mínimo para nice: 4 Uso de memória: dict * 11,5 (se dict <= 32 MiB); dict * 10.5 (se dict> 32 MiB)

mode = mode

O modo de compactação especifica o método para analisar os dados produzidos pelo localizador de correspondências. Os modos suportados são rápidos e normais . O padrão é rápido para as predefinições 0 – 3 e normal para as predefinições 4 – 9 .

Geralmente, o fast é usado com os localizadores de correspondências Hash Chain e o normal com os localizadores de correspondências da Árvore Binária, que também é o que as predefinições fazem.

nice = nice

Especifique o que é considerado um bom comprimento para uma partida. Uma vez encontrada uma correspondência de pelo menos bytes agradáveis, o algoritmo para de procurar correspondências possivelmente melhores.

Nice pode ter 2-273 bytes. Valores mais altos tendem a fornecer uma melhor taxa de compressão às custas da velocidade. O padrão depende da predefinição.

profundidade = profundidade

Especifique a profundidade máxima de pesquisa no localizador de correspondências. O padrão é o valor especial de 0 , que faz o compressor determinar uma profundidade razoável de mf e agradável .

A profundidade razoável para cadeias de hash é de 4 a 100 e 16 a 1000 para árvores binárias. O uso de valores muito altos para profundidade pode tornar o codificador extremamente lento em alguns arquivos. Evite definir a profundidade acima de 1000, a menos que esteja preparado para interromper a compactação, caso esteja demorando muito.

Ao decodificar fluxos brutos ( –format = bruto ), o LZMA2 precisa apenas do tamanho do dicionário. O LZMA1 também precisa de lc , lp e pb .

–x86 [ = opções ]

–powerpc [ = opções ]

–ia64 [ = opções ]

–arm [ = opções ]

–armthumb [ = opções ]

–sparc [ = opções ]

Adicione um filtro de ramificação / chamada / salto (BCJ) à cadeia de filtros. Esses filtros podem ser usados apenas como um filtro não-último na cadeia de filtros.

Um filtro BCJ converte endereços relativos no código da máquina em seus equivalentes absolutos. Isso não altera o tamanho dos dados, mas aumenta a redundância, o que pode ajudar o LZMA2 a produzir um arquivo .xz 0-15% menor. Os filtros BCJ são sempre reversíveis; portanto, o uso de um filtro BCJ para dados incorretos não causa perda de dados, embora possa piorar um pouco a taxa de compactação.

É bom aplicar um filtro BCJ em um executável inteiro; não há necessidade de aplicá-lo apenas na seção executável. A aplicação de um filtro BCJ em um archive que contém arquivos executáveis e não executáveis pode ou não dar bons resultados; portanto, geralmente não é bom aplicar cegamente um filtro BCJ ao compactar pacotes binários para distribuição.

Esses filtros BCJ são muito rápidos e usam uma quantidade insignificante de memória. Se um filtro BCJ melhorar a taxa de compactação de um arquivo, ele poderá melhorar a velocidade de descompactação ao mesmo tempo. Isso ocorre porque, no mesmo hardware, a velocidade de descompressão do LZMA2 é aproximadamente um número fixo de bytes de dados compactados por segundo.

Esses filtros BCJ têm problemas conhecidos relacionados à taxa de compactação:

• Alguns tipos de arquivos que contêm código executável (por exemplo, arquivos de objeto, bibliotecas estáticas e módulos de kernel do Linux) têm os endereços nas instruções preenchidos com valores de preenchimento. Esses filtros BCJ ainda farão a conversão de endereço, o que tornará a compactação pior com esses arquivos.

• A aplicação de um filtro BCJ em um arquivo contendo vários executáveis semelhantes pode piorar a taxa de compactação do que não usar um filtro BCJ. Isso ocorre porque o filtro BCJ não detecta os limites dos arquivos executáveis e não redefine o contador de conversão de endereços para cada executável.

Ambos os problemas acima serão corrigidos no futuro em um novo filtro. Os antigos filtros BCJ ainda serão úteis em sistemas embarcados, porque o decodificador do novo filtro será maior e usará mais memória.

Conjuntos de instruções diferentes têm alinhamento diferente:

filtro	alinhamento	notas
x86	1	X86 de 32 ou 64 bits
PowerPC	4	Apenas Big Endian
BRAÇO	4	Apenas Little Endian
ARM-Thumb	2	Apenas Little Endian
IA-64	16	Grande ou pequeno endian
SPARC	4	Grande ou pequeno endian

Como os dados filtrados por BCJ geralmente são compactados com LZMA2, a taxa de compactação pode ser ligeiramente melhorada se as opções de LZMA2 estiverem definidas para corresponder ao alinhamento do filtro BCJ selecionado. Por exemplo, com o filtro IA-64, é bom definir pb = 4 com LZMA2 (2 ^ 4 = 16). O filtro x86 é uma exceção; geralmente é bom manter o alinhamento padrão de quatro bytes do LZMA2 ao compactar executáveis x86.

Todos os filtros BCJ suportam as mesmas opções:

start = offset

Especifique o deslocamento inicial que é usado ao converter entre endereços relativos e absolutos. O deslocamento deve ser múltiplo do alinhamento do filtro (consulte a tabela acima). O padrão é zero. Na prática, o padrão é bom; especificar um deslocamento personalizado quase nunca é útil.

–delta [ = opções ]

Adicione o filtro Delta à cadeia de filtros. O filtro Delta pode ser usado apenas como um filtro não-último na cadeia de filtros.

Atualmente, apenas o cálculo simples do delta em bytes é suportado. Pode ser útil ao compactar, por exemplo, imagens bitmap não compactadas ou áudio PCM não compactado. No entanto, algoritmos de finalidade especial podem fornecer resultados significativamente melhores que o Delta + LZMA2. Isso é verdade especialmente com o áudio, que comprime mais rápido e melhor, por exemplo, com flac . Opções suportadas:

dist = distância

Especifique a distância do cálculo delta em bytes. A distância deve ser de 1 a 256 . O padrão é 1 .

Por exemplo, com dist = 2 e entrada de oito bytes A1 B1 A2 B3 A3 B5 A4 B7 , a saída será A1 B1 01 02 01 02 01 02 .

Outras opções

-q , –quiet	Suprimir avisos e avisos. Especifique isso duas vezes para suprimir erros também. This option has no effect on the exit status. That is, even if a warning was suppressed, the exit status to indicate a warning is still used.
-v , –verbose	Seja detalhado . Se um erro padrão estiver conectado a um terminal, xz exibirá um indicador de progresso. A especificação de –verbose duas vezes fornece uma saída ainda mais detalhada. O indicador de progresso mostra as seguintes informações: • A porcentagem de conclusão é mostrada se o tamanho do arquivo de entrada for conhecido. Ou seja, a porcentagem não pode ser mostrada nos tubos. • Quantidade de dados compactados produzidos (compactando) ou consumidos (descompactando). • Quantidade de dados não compactados consumidos (compactados) ou produzidos (descompactados). • Taxa de compactação, calculada dividindo a quantidade de dados compactados processados até o momento pela quantidade de dados não compactados processados até o momento. • Velocidade de compressão ou descompressão. Isso é medido como a quantidade de dados não compactados consumidos (compactação) ou produzidos (descompactação) por segundo. É mostrado após alguns segundos desde que o xz começou a processar o arquivo. • Tempo decorrido no formato M: SS ou H: MM: SS . • O tempo restante estimado é mostrado apenas quando o tamanho do arquivo de entrada é conhecido e já se passaram alguns segundos desde que o xz começou a processar o arquivo. A hora é mostrada em um formato menos preciso, que nunca possui dois pontos, por exemplo, 2 min 30 s. Quando o erro padrão não é um terminal, –verbose fará xzimprima o nome do arquivo, tamanho compactado, tamanho descompactado, taxa de compactação e, possivelmente, também a velocidade e o tempo decorrido em uma única linha para erro padrão após compactar ou descompactar o arquivo. A velocidade e o tempo decorrido são incluídos apenas quando a operação leva pelo menos alguns segundos. Se a operação não foi concluída, por exemplo, devido à interrupção do usuário, também a porcentagem de conclusão será impressa se o tamanho do arquivo de entrada for conhecido.
-Q , –no-warn	Não defina o status de saída como 2, mesmo que uma condição que valha um aviso tenha sido detectada. Esta opção não afeta o nível de verbosidade, portanto, –quiet e –no-warn devem ser usados para não exibir avisos e não alterar o status de saída.
–robô	Imprima mensagens em um formato analisável por máquina. Isso visa facilitar a criação de front-end que desejam usar xz em vez de liblzma, o que pode ser o caso de vários scripts. A saída com esta opção ativada deve ser estável nas versões xz . Veja a seção MODO ROBÔ para detalhes.
–info-memory	Exiba, em formato legível por humanos, a quantidade de memória física (RAM) xz que o sistema possui e os limites de uso de memória para compactação e descompactação, e saia com êxito.
-h , –help	Exiba uma mensagem de ajuda descrevendo as opções mais usadas e saia com sucesso.
-H , –long-help	Exiba uma mensagem de ajuda descrevendo todos os recursos do xz e saia com sucesso.
-V , –version	Exibir o número da versão xz e liblzma em formato legível. Para obter a saída de máquina-parsable, especifique –robot antes –version .

Modo robô

O modo robô é ativado com a opção –robot . Torna a saída do xz mais fácil de analisar por outros programas. Atualmente –robot é suportado apenas junto com –version , –info-memory e –list . Ele será suportado para compactação e descompactação normal no futuro.

Modo robô: versão

xz –robot –version imprimirá o número da versão de xz e liblzma no seguinte formato:

XZ_VERSION = XYYYZZZS 
LIBLZMA_VERSION = XYYYZZZS

Aqui está o que o número da versão significa, parte por parte:

X	Versão principal.
AAAA	Versão secundária. Números pares são estáveis. Os números ímpares são versões alfa ou beta.
ZZZ	Nível de patch para versões estáveis ou um contador para versões de desenvolvimento.
S	Estabilidade. 0 é alfa, 1 é beta e 2 é estável. S deve ser sempre 2 quando AA for igual.
XYYYZZZS	São iguais nas duas linhas se xz e liblzma forem da mesma versão do XZ Utils.

Exemplos: 4.999.9beta é 49990091 e 5.0.0 é 50000002 .

Modo de robô: informações de limite de memória

xz –robot –info-memory imprime uma única linha com três colunas separadas por tabulação:

Quantidade total de memória física (RAM) em bytes
Limite de uso de memória para compactação em bytes. Um valor especial de zero indica a configuração padrão, que para o modo de thread único é igual a sem limite.
Limite de uso de memória para descompactação em bytes. Um valor especial de zero indica a configuração padrão, que para o modo de thread único é igual a sem limite.

No futuro, a saída do xz –robot –info-memory pode ter mais colunas, mas nunca mais do que uma única linha.

Modo de robô: modo de lista

xz –robot –list usa saída separada por tabulação. A primeira coluna de cada linha possui uma sequência que indica o tipo de informação encontrada nessa linha:

nome	Essa é sempre a primeira linha ao iniciar a lista de um arquivo. A segunda coluna na linha é o nome do arquivo.
Arquivo	Esta linha contém informações gerais sobre o arquivo .xz . Esta linha é sempre impressa após a linha de nome.
corrente	Esse tipo de linha é usado apenas quando –verbose foi especificado. Existem tantas linhas de fluxo quanto o arquivo .xz .
quadra	Esse tipo de linha é usado apenas quando –verbose foi especificado. Existem tantas linhas de blocos quanto blocos no arquivo .xz . As linhas de bloco são mostradas após todas as linhas de fluxo; tipos de linhas diferentes não são intercalados.
resumo	Esse tipo de linha é usado apenas quando –verbose foi especificado duas vezes. Esta linha é impressa após todas as linhas de bloco. Como a linha do arquivo, a linha de resumo contém informações gerais sobre o arquivo .xz .
totais	Essa linha é sempre a última linha da saída da lista. Mostra o total de contagens e tamanhos.

As colunas das linhas do arquivo são:

Número de fluxos no arquivo.
Número total de blocos no fluxo (s).
Tamanho compactado do arquivo.
Tamanho não compactado do arquivo.
Taxa de compressão, por exemplo, 0,123. Se a proporção for superior a 9.999, três traços (—) serão exibidos em vez da proporção.
Lista separada por vírgula de nomes de verificação de integridade. As seguintes seqüências de caracteres são usadas para os tipos de verificação conhecidos: Nenhum , CRC32 , CRC64 e SHA-256 . Para tipos de verificação desconhecidos, Desconhecido-N é usado, onde N é o ID da verificação como um número decimal (um ou dois dígitos).
Tamanho total do preenchimento de fluxo no arquivo.

As colunas das linhas de fluxo são:

Número do fluxo (o primeiro fluxo é 1).
Número de blocos no fluxo.
Deslocamento de partida compactado.
Deslocamento inicial não compactado.
Tamanho compactado (não inclui preenchimento de fluxo).
Tamanho não compactado.
Taxa de compressão.
Nome da verificação de integridade.
Tamanho do preenchimento do fluxo.

As colunas das linhas de bloco são:

Número do fluxo que contém este bloco.
Número do bloco relativo ao início do fluxo (o primeiro bloco é 1).
Número do bloco relativo ao início do arquivo.
Deslocamento inicial compactado em relação ao início do arquivo.
Deslocamento inicial não compactado em relação ao início do arquivo.
Tamanho total compactado do bloco (inclui cabeçalhos).
Tamanho não compactado.
Taxa de compressão.
Nome da verificação de integridade.

Se –verbose foi especificado duas vezes, colunas adicionais serão incluídas nas linhas de bloco . Eles não são exibidos com um único –verbose , porque obter essas informações requer muitas buscas e, portanto, pode ser lento:

Valor da verificação de integridade em hexadecimal.
Bloquear tamanho do cabeçalho.
Sinalizadores de bloco: c indica que o tamanho compactado está presente e u indica que o tamanho não compactado está presente. Se o sinalizador não estiver definido, um traço (-) será mostrado para manter o comprimento da string fixo. Novos sinalizadores podem ser adicionados ao final da string no futuro.
Tamanho dos dados compactados reais no bloco (isso exclui os campos de cabeçalho, preenchimento e verificação).
Quantidade de memória (em bytes) necessária para descompactar esse bloco com esta versão xz.
Corrente do filtro. Observe que a maioria das opções usadas no momento da compactação não pode ser conhecida, porque apenas as opções necessárias para descompactação são armazenadas nos cabeçalhos .xz.

As colunas das linhas de resumo são:

Quantidade de memória (em bytes) necessária para descompactar este arquivo com esta versão xz.
sim ou não, indicando se todos os cabeçalhos de bloco têm tamanho compactado e não compactado armazenados desde o xz 5.1.2alpha.
Versão mínima xz necessária para descompactar o arquivo.

As colunas da linha de totais :

Número de fluxos.
Número de blocos.
Tamanho comprimido.
Tamanho não compactado.
Taxa de compressão média.
Lista separada por vírgula de nomes de verificação de integridade que estavam presentes nos arquivos.
Tamanho do preenchimento de fluxo.
Número de arquivos. Está aqui para manter a ordem das colunas anteriores igual à das linhas de arquivo.

Se –verbose foi especificado duas vezes, colunas adicionais serão incluídas na linha de totais:

Quantidade máxima de memória (em bytes) necessária para descompactar os arquivos com esta versão xz .
yes or no indicating if all block headers have both compressed size and uncompressed size stored in them.
Minimum xz version required to decompress the file.

Status de saída

0 0	Everything was successful.
1	Um erro ocorreu.
2	Something worthy of a warning occurred, but no errors.

Meio Ambiente

xz parses space-separated lists of options from the environment variables XZ_DEFAULTS and XZ_OPT , in this order, before parsing the options from the command line. Note that only options are parsed from the environment variables; all non-options are silently ignored.

XZ_DEFAULTS

Opções padrão específicas do usuário ou do sistema. Geralmente, isso é definido em um script de inicialização do shell para ativar o limitador de uso de memória do xz por padrão. Excluindo scripts de inicialização de shell e casos especiais semelhantes, os scripts nunca devemos definir ou unset XZ_DEFAULTS .

XZ_OPT

Isso serve para passar opções para xz quando não é possível definir as opções diretamente na linha de comando xz . Este é o caso, por exemplo, quando xz é executado por um script ou ferramenta, por exemplo, GNU tar :

 XZ_OPT = -2v tar caf foo.tar.xz foo

Os scripts podem usar XZ_OPT, por exemplo, para definir opções de compactação padrão específicas do script. Ainda é recomendável permitir que os usuários substituam XZ_OPT se isso for razoável, por exemplo, nos scripts sh, pode-se usar algo como isto:

XZ_OPT = $ {XZ_OPT - "- 7e"}; exportar XZ_OPT

Exemplos

 xz foo

Compacte o arquivo foo em foo.xz usando o nível de compactação padrão ( -6 ) e remova foo se a compactação for bem-sucedida.

 xz -dk bar.xz

Descomprimir bar.xz em bar e não remova bar.xz mesmo se descompressão é bem sucedida.

tar cf - baz | xz -4e> baz.tar.xz

Crie baz.tar.xz com a predefinição -4e ( -4 –extreme ), que é mais lenta que o padrão -6 , mas precisa de menos memória para compactação e descompactação (48 MiB e 5 MiB, respectivamente).

 xz -dcf a.txt b.txt.xz c.txt d.txt.lzma> abcd.txt

Descompacte uma mistura de arquivos compactados e descompactados na saída padrão, usando um único comando.

compactar – Comprime um arquivo ou arquivos.
gzip – Crie, modifique, liste o conteúdo e extraia arquivos dos arquivos zip do GNU.
zip – Um utilitário de compactação e arquivamento.

20 de novembro de 2019

LOGIN

Comandos Linux – Comando lzma