fslint, fslint-gui - find dublet filer

Her postes alt, som ikke direkte har noget med Ubuntu at gøre.
lath
Indlæg: 5095
Tilmeldt: 27. apr 2008, 02:16
IRC nickname: lars_t_h
Geografisk sted: Fyn

fslint, fslint-gui - find dublet filer

Indlæg af lath »

Jeg er i gang med en fuld backup, sådan mere manuelt.

Jeg tænkte at det måske kunne være en god ide at gennemgå kun mine BACKUPS - fra en monteret USB harddisk, samt den indbyggede i min netbook computer.

fslint er CLI ugaven til terminalen, og fslint-gui er en grafisk frontend til fslint.
I fslint-gui skal du bruge det øverste faneblad i den venstre lodrette liste af faneblade.
I Øverste faneblad til højre kan du tilføje og slette mapper der ikke skal kigges i, og i faneblade øverst til venstre kan du tilføje og slette filer der skal kigge i.

Husk flueben ud for rekursivt, hvis alle mapper under en mappe også skal scannes for dubletter.

Jeg tilføjede */lost+found til steder der ikke skal kigges på, så fslint ikke kigger i lost+found mappen på en monteret disk.
Jeg bruger ext4 filsystemet i stedet for FAT filsystemet på USB diske, da ext4 er meget mere robust end FAT.

Antal filer og pladsforbrug
Jeg har 80293 filer der fylder 93,5 GB på den monterede harddisk, samt 40503 filer der fylder 27,2 GB i ~/BACKUPS mappen.

I min hjemmemappe uden ~/BACKUPS har jeg 154481 filer der i alt fylder 42,2 GB.

Resultat fra fslint
fslint skriver efter en scanning af de 2 backup mapper på hver sin harddisk:

Kode: Vælg alt

10.774.364.160 byte bortødslet i 17415 filer (i 10261 grupper)


10.774.364.160 byte er lidt mere end 10 GiB (10 GiB + 35 MiB for at være præcis).

Det er meget!

/Lars
Jeg er Software ingeniør (Diplomingeniør) i Informationsteknologi og indlejede systemer, hvor indlejrede systemer er computer (microcontroller) + elektronik i for eksempel et TV, en router, en vaskemaskine og den slags
lath
Indlæg: 5095
Tilmeldt: 27. apr 2008, 02:16
IRC nickname: lars_t_h
Geografisk sted: Fyn

Re: fslint, fslint-gui - find dublet filer

Indlæg af lath »

Jeg kunne ikke rigtig få fslint-gui til at slette filer, når man trykker på Slet knappen, og markeret filer der skal slettes.

Jeg er i gang med at bruges fdupes til at finde filer.
Da jeg godt selv bestemme hvorfra der slettes filer, så laver jeg et program der kan parse (oversætte) output fra en fdupes kommando der ser nogenlunde sådan ud:

Kode: Vælg alt

fdupes -r -A DIR1 DIR2 ... DIRN > /$HOME/Sti/til/fdupes-out-YYYYMMDD-HHMM.txt


Hvis du skal bruges den, så skal du erstatte:

Kode: Vælg alt

DIR1 DIR2 ... DIRN

med din egen liste af filer, samt erstatte:

Kode: Vælg alt

/$HOME/Sti/til/fdupes-out-YYYYMMDD-HHMM.txt

med den mappe og den fil som du vil gemme output fra fdupes i. Filen må ikke eksistere i forvejen.

ADVARSEL!: Ikke noget med at bruge 2 til flere indgange i filsystemet, der peger på de samme fil for ellers tror fdupes at den samme fil er en kopi af sig selv! Af samme årsag må du heller ikke skrive den samme mappe 2 eller flere gange. Undtagelsen er symlinks og hardlinks til samme fil, men ikke et symlink eller et hardlink til en mappe. Tag en komplet BACKUP før du begynder og pas på.
Problemet med "samme fil er en kopi af sig selv" kunne løses hvis fdiupes gad kigge på de tilsyneladende ens filers inode.
Hvis 2 eller flere forskellige filnavne peger på den samme inode (et tal), så er indholdet af en fil det samme for alle filerne, og indholdet er kun gemt 1 sted i filsystemet. Det gøres via stat(2) systemkaldet.

Derefter vil jeg i programmet bruge en liste af linjeskift adskilte mappe navne/stier som er en prioritets liste over hvilke mapper/stier, hvorfra der først skal slettes filer fra.

F.eks.
Filer i mappen, og filer i mapper under den mappe, der er nævnt i linie 1 slettes før alle andre mapper der følger efter den.

/Lars
Jeg er Software ingeniør (Diplomingeniør) i Informationsteknologi og indlejede systemer, hvor indlejrede systemer er computer (microcontroller) + elektronik i for eksempel et TV, en router, en vaskemaskine og den slags