Como encontrar e remover arquivos duplicados no Linux

Você está com pouco espaço em sua máquina Linux, mas não tem ideia do que está consumindo seu precioso armazenamento? Arquivos duplicados podem ser um dos principais motivos pelos quais você está enfrentando problemas de armazenamento insuficiente. Não se preocupe mais, pois discutiremos algumas ferramentas incríveis para encontrar e remover arquivos duplicados no Linux neste artigo. Isso pode ajudá-lo a otimizar seu armazenamento e melhorar o desempenho de seu sistema. Índice

Ferramentas de linha de comando para remover arquivos duplicados no Linux

1. Usando o comando fdupes

Escrito em linguagem C, o comando fdupes é uma ferramenta de linha de comando gratuita e de código aberto para localizar e excluir arquivos duplicados em seu sistema de arquivos Linux. Com o fdupes, você pode procurar duplicatas com base em vários parâmetros, como nomes de arquivo, hash MD5, tamanho do arquivo etc. Para instalar o fdupes em seu sistema Linux, use o seguinte comando de acordo com sua distribuição Linux :

  • Para sistemas baseados em Debian:
 sudo apt-get install fdupes
  • Para sistemas baseados em RHEL/Cent-OS:
 sudo yum install epel-releasesudo yum install fdupes
  • Para sistemas baseados em Arch:
 sudo pacman -S fdupes

Agora que você instalou o fdupes em seu sistema, vamos passar para sua sintaxe e opções:

 fdupes  

Algumas das opções comuns para emparelhar com o comando fdupes são:

Opções Descrição
-r Atravesse todos os subdiretórios presentes no diretório pai
-s Siga diretórios vinculados a links simbólicos
-A Excluir arquivos ocultos da consideração
-m Resumir a comparação de arquivos duplicados
-d Solicita aos usuários os arquivos a serem preservados ao excluir todos os outros arquivos

Digamos que você queira procurar arquivos duplicados e excluí-los no diretório ~/Documents/test/testing, use este comando:

 fdupes -rd ~/Documents/test/testing

Em seguida, ele solicitará os números definidos a serem preservados; digite os números definidos que você não deseja que sejam excluídos. Outros arquivos, exceto estes, serão excluídos. Os arquivos preservados serão indicados pelo símbolo “[+]” na frente, enquanto o símbolo ‘[-]’ denota os conjuntos de arquivos excluídos.

2. Usando o comando Rdfind

O comando rdfind, que significa “Redundant Data Find”, é uma ferramenta de linha de comando gratuita e de código aberto usada para remover arquivos duplicados no Linux. Ele usa um “algoritmo de classificação” para classificar os arquivos com base em seus inodes antes de ler o disco para comparar arquivos, tornando-o muito mais rápido do que qualquer outra ferramenta. Use o seguinte comando para instalar o rdfind de acordo com sua distro:

  • Para sistemas Linux baseados em Debian:
 sudo apt install rdfind
  • Para sistemas Linux baseados em Fedora:
 sudo dnf install rdfind
  • Para sistemas Linux baseados em Arch:
 sudo pacman -S rdfind

A sintaxe para usar o rdfind é bem fácil:

 rdfind   

Algumas das opções comuns para emparelhar com o comando rdfind são:

Opções Descrição
-ignorevazio Ignora arquivos vazios enquanto procura por arquivos duplicados
-makesymlinks/-makehardlinks Substitui arquivos duplicados por links simbólicos/físicos, respectivamente
-excluir duplicatas Exclui arquivos duplicados
-removeidentinode Remove itens que possuem inode e ID de dispositivo idênticos

Vamos agora ver como usar o comando rdfind para localizar e excluir arquivos duplicados no Linux. Digamos que você queira encontrar todos os arquivos duplicados no diretório ~/Documents/test/testing, use este comando:

 rdfind ~/Documents/test/testing

Depois de executar o comando, ele começará a verificar se há arquivos duplicados e armazenará seus detalhes em um arquivo gerado automaticamente chamado “results.txt” em sua máquina Linux.

Você pode visualizar o conteúdo do arquivo results.txt usando o comando cat no Linux da seguinte maneira:

Para excluir as duplicatas encontradas pelo comando rdfind, basta adicionar o sinalizador -deleteduplicates, como:

 rdfind -deleteduplicates true ~/Documents/test/

Em vez disso, se você quiser substituir os arquivos duplicados por links físicos, use este comando:

 rdfind -makehardlinks true ~/Documents/test/

Ferramenta GUI para localizar e remover arquivos duplicados no Linux

As ferramentas Graphical User Interface (GUI) fornecem uma abordagem muito fácil de usar e amigável para gerenciar arquivos duplicados no Linux. Com alguns cliques, você pode localizar e excluir arquivos duplicados em seu sistema de arquivos Linux, liberando memória e aumentando a velocidade do sistema.

O FSlint é uma GUI e uma ferramenta baseada em linha de comando, voltada para iniciantes e usuários avançados. Com alguns cliques, você pode identificar e eliminar duplicatas, liberando um valioso espaço de armazenamento em seu sistema. Siga estas etapas para instalar o FSlint em qualquer distro Linux:

Passo 1: Instale o Snap Package Manager

  • Para sistemas baseados em Debian:
 sudo apt update && sudo apt install snapd
  • Para sistemas baseados em Cent OS ou RHEL:
 sudo yum install snapdsudo systemctl enable --now snapd.socketsudo ln -s /var/lib/snapd/snap /snap
  • Para sistemas baseados em Arch:
 sudo pacman -S snapdsudo systemctl enable --now snapd.socketsudo ln -s /var/lib/snapd/snap /snap

Passo 2: Instale o FSlint Janitor com Snap

 sudo snap install fslint-unofficial

Para localizar e excluir duplicatas usando FSlint, siga estas etapas:

  • Inicie o FSlint Janitor no menu de aplicativos.

  • Clique no botão “+Adicionar” no canto superior esquerdo.

  • Agora, selecione o diretório onde deseja filtrar as duplicatas e clique no botão “OK” no canto inferior direito.

  • Selecione a opção “Duplicatas” no painel esquerdo e clique no botão “Localizar”.

  • O painel central agora exibirá os arquivos duplicados junto com a memória ocupada por eles. Mantenha pressionado o botão “CTRL” no teclado enquanto clica nos nomes dos arquivos que deseja excluir para selecionar os arquivos. Quando terminar, clique no botão “Excluir”.

  • Em seguida, selecione “Sim” na janela pop-up de confirmação para excluir os arquivos duplicados.

Scroll to Top