[Script] Deduplicação de Dados

Scripts diversos para automatizar tarefas em servidores ou auxilio com tarefas administrativas.
viniciuscwb
Newbie
Newbie
Mensagens: 11
Registrado em: 19 Nov 2015 11:08
Status: Offline

[Script] Deduplicação de Dados

Mensagem por viniciuscwb »

Salve galera !

Tive uma necessidade recente para buscar arquivos duplicados no meu FileServer e tinha que apresentar em forma de relatório para cada gestor do departamento. Existem vários softwares gratuitos para tal finalidade mas procurei fazer em powershell :D

O script faz a comparação do Hash MD5 dos arquivos e imprime apenas quando houver duplicidade. Na saída ele vai armazenar o nome do arquivo, localização, data da criação, data da modificação, tamanho e o Hash do MD5.

Edite a linha 3 para inserir o path de entrada e a linha 4 para saída do arquivo.

Código: Selecionar todos

function get-md5hash {[System.BitConverter]::ToString((new-object -TypeName System.Security.Cryptography.MD5CryptoServiceProvider).ComputeHash([System.IO.File]::ReadAllBytes($args)))}
 
$procurar = "d:\dados"
$resultado = "c:\temp\teste.csv"
Get-ChildItem $procurar -Recurse|`
?{!$_.psiscontainer}|`
Select-Object Name,Fullname,CreationTime,LastWriteTime,Length,@{Name="MD5";Expression={Get-md5hash $_.fullname}}|`
group MD5|?{$_.Count -gt 1}|%{$_.Group}|sort MD5|`
Export-Csv $resultado -NoTypeInformation -Encoding "Unicode"
Bom proveito !
Você não está autorizado a ver ou baixar esse anexo.
Editado pela última vez por viniciuscwb em 27 Jan 2016 12:33, em um total de 1 vez.



Voltar para “Scripts”