4 ferramentas úteis para encontrar e excluir arquivos duplicados no Linux

4 ferramentas úteis para encontrar e excluir arquivos duplicados no Linux

Organizar seu diretório doméstico ou mesmo o sistema pode ser particularmente difícil se você tiver o hábito de baixar todos os tipos de coisas da Internet.

Muitas vezes, você pode achar que baixou o mesmo MP3, PDF, EPUB (e todos os tipos de outras extensões de arquivo) e copiaram para diferentes diretórios. Isso pode fazer com que seus diretórios fiquem confusos com todos os tipos de coisas duplicadas inúteis.

Neste tutorial, você aprenderá a encontrar e excluir arquivos duplicados no Linux usando rdfind e FDUPES Ferramentas da linha de comando, além de usar ferramentas GUI chamadas Dupequiru e fslint.

Uma nota de cautela - sempre tenha cuidado com o que você exclui em seu sistema, pois isso pode levar a perda de dados indesejada. Se você estiver usando uma nova ferramenta, primeiro experimente em um diretório de teste onde a exclusão de arquivos não será um problema.

1. Rdfind - encontra arquivos duplicados no Linux

Rdfind Vem de dados redundantes encontrar. É uma ferramenta gratuita usada para encontrar arquivos duplicados em ou dentro de vários diretórios. Ele usa soma de verificação e encontra duplicatas com base no arquivo não apenas nomes.

Rdfind Usa um algoritmo para classificar os arquivos e detectar qual das duplicatas é o arquivo original e considera o restante como duplicado. As regras do ranking são:

  • Se A foi encontrado enquanto examinava um argumento de entrada mais cedo do que B, A está mais alto.
  • Se A foi encontrado a uma profundidade inferior a B, A está mais alto.
  • Se A foi encontrado antes B, A está mais alto.

A última regra é usada particularmente quando dois arquivos são encontrados no mesmo diretório.

Para instalar rdfind No Linux, use o seguinte comando conforme sua distribuição Linux.

$ sudo apt-get install rdfind [on on Debian/Ubuntu] $ sudo yum install epel-release && $ sudo yum install rdfind [on on CENTOS/RHEL] $ sudo dnf install rdfind [on on Fedora 22+] $ sudo pacman -s rdfind [no arch Linux] 

Para correr rdfind Em um diretório, basta digitar rdfind e o diretório de destino. Aqui está um exemplo:

$ rdfind /home /usuário 
Encontre arquivos duplicados no Linux

Como você pode ver rdfind salvará os resultados em um arquivo chamado resultados.TXT Localizado no mesmo diretório de onde você executou o programa. O arquivo contém todos os arquivos duplicados que o RDFind encontrou. Você pode revisar o arquivo e remover os arquivos duplicados manualmente, se quiser.

Outra coisa que você pode fazer é usar o -funcionamento a seco Uma opção que fornecerá uma lista de duplicatas sem tomar nenhuma ação:

$ rdfind -dryrun true /home /usuário 

Quando você encontra as duplicatas, você pode optar por substituí -las por links rígidos.

$ rdfind -MakeHardLinks True /Home /Usuário 

E se você deseja excluir as duplicatas que você pode executar.

$ rdfind -deleteDuplicates true /home /usuário 

Para verificar outras opções úteis de rdfind você pode usar o rdfind manual com.

$ man Rdfind 

2. FDUPES - Digitalizar arquivos duplicados no Linux

O FDUPES é outro programa que permite identificar arquivos duplicados em seu sistema. É gratuito e de código aberto e escrito em c. Ele usa os seguintes métodos para determinar arquivos duplicados:

  • Comparando assinaturas parciais de md5sum
  • Comparando assinaturas completas de md5sum
  • Verificação de comparação de byte por bytes

Assim como rdfind tem opções semelhantes:

  • Pesquise recursivamente
  • Exclua arquivos vazios
  • Mostra o tamanho dos arquivos duplicados
  • Excluir duplica imediatamente
  • Exclua arquivos com um proprietário diferente

Para instalar FDUPES No Linux, use o seguinte comando conforme sua distribuição Linux.

$ sudo apt-get install fdupes [on Debian/Ubuntu] $ sudo yum install elease-lançando && $ sudo yum install fdupes [on on CENTOS/RHEL] $ sudo dnf install fdupes [on Fedora 22+] $ sudo pacman -s fdupes [no arch Linux] 

FDUPES A sintaxe é semelhante a rdfind. Basta digitar o comando seguido pelo diretório que você deseja digitalizar.

$ fdUPES  

Para pesquisar arquivos recursivamente, você terá que especificar o -r uma opção como esta.

$ fdUPES -R  

Você também pode especificar vários diretórios e especificar um dir ser pesquisado recursivamente.

$ fdUPES -R  

Para que os fdupes calculem o tamanho dos arquivos duplicados, use o -S opção.

$ fdUPES -S  

Para reunir informações resumidas sobre os arquivos encontrados, use o -m opção.

$ fdUPES -M  
Digitam arquivos duplicados no Linux

Finalmente, se você deseja excluir todas as duplicatas, use o -d uma opção como esta.

$ fdUPES -D  

FDUPES perguntará qual dos arquivos encontrados excluir. Você precisará inserir o número do arquivo:

Excluir arquivos duplicados no Linux

Uma solução que definitivamente não é recomendada é usar o -N opção que resultará na preservação do primeiro arquivo.

$ fDUPES -DN  

Para obter uma lista de opções disponíveis para usar FDUPES Revise a página de ajuda executando.

$ fdUPES -HELP 

3. Dupequiru - Encontre arquivos duplicados em um Linux

Dupequiru é uma ferramenta de código aberto e de plataforma cruzada que pode ser usada para encontrar arquivos duplicados em um sistema Linux. A ferramenta pode digitalizar nomes de arquivos ou conteúdo em uma ou mais pastas. Ele também permite que você encontre o nome do arquivo semelhante aos arquivos que você está pesquisando.

Dupequiru vem em diferentes versões para plataformas Windows, Mac e Linux. Seu recurso rápido de algoritmo combinando difuso ajuda a encontrar arquivos duplicados em um minuto. É personalizável, você pode puxar os arquivos duplicados exatos que deseja e limpar arquivos indesejados do sistema.

Para instalar Dupequiru No Linux, use o seguinte comando conforme sua distribuição Linux.

--------------- Em Debian/Ubuntu/Mint --------------- $ sudo add-aprop-repositório 
--------------- No Arch Linux --------------- $ sudo pacman -s dupeguru 
Dupequiru - Encontre arquivos duplicados no Linux

4. FSLINT - Localizador de arquivos duplicado para Linux

Fslint é um utilitário gratuito usado para encontrar e limpar várias formas de fiapo em um sistema de arquivos. Ele também relata arquivos duplicados, diretórios vazios, arquivos temporários, nomes duplicados/conflitantes (binários), links simbólicos ruins e muito mais. Tem modos de linha de comando e GUI.

Para instalar Fslint No Linux, use o seguinte comando conforme sua distribuição Linux.

$ sudo apt-get install fslint [on Debian/Ubuntu] $ sudo yum install epel-release && $ sudo yum install fslint [on on CENTOS/RHEL] $ sudo dnf install fslint [on Fedora 22+] $ sudo pacman -s fslint [no arch Linux] 
FSLINT - Localizador de arquivos duplicado para -linux
Conclusão

Essas são as ferramentas muito úteis para encontrar arquivos duplicados no seu sistema Linux, mas você deve ter muito cuidado ao excluir esses arquivos.

Se você não tiver certeza se precisar de um arquivo ou não, seria melhor criar um backup desse arquivo e lembre -se de seu diretório antes de excluí -lo. Se você tiver alguma dúvida ou comentário, envie -os na seção de comentários abaixo.