13 октября 2023 Bash awk while read
Имеет большое количество файлов которые могут повторяться по содержимому и стоит задача оставить только уникальные файлы по содержимому. Для определения уникальности будем использовать контрольную сумму md5, а для автоматизации bash скрипт
#!/bin/bash
echo Чистка от дублей
x=""
ls /tmp/base_1s-202* |sort | while read f; do
_x=$(md5sum $f|awk '{print $1}')
if [ $_x == "$x" ]; then
echo удаление $f $_x
rm $f
else
x=$_x
echo сохранение $_x $f
fi
done