omdan tekst i jpg billede til en txt fil?

Søger du et bestemt program? Mangler du et alternativ til dit Windowsprogram? Program-spørgsmål kan stilles her.
zob
Redaktør
Indlæg: 4430
Tilmeldt: 6. jan 2009, 22:01
Geografisk sted: København

Re: omdan tekst i jpg billede til en txt fil?

Indlæg af zob »

Husk at installere tessearct-ocr-dan og bruge parametret -l for at specificere sprog til dansk (dan) så får du også æøå med.

Kode: Vælg alt

sudo apt-get install tesseract-ocr-dan

Og bruge den danske ordbog

Kode: Vælg alt

tesseract -l dan navn_på_screenshot.jpg navn_på_output_tekst_fil
AJenbo
Admin
Indlæg: 20878
Tilmeldt: 15. nov 2009, 15:04
IRC nickname: AJenbo
Geografisk sted: Vanløse, København

Re: omdan tekst i jpg billede til en txt fil?

Indlæg af AJenbo »

gtr skrev:Hvis man fx har en folder alene med jpg billeder, er der en teminal kommando, så alle
billederne i folderen bliver omdannet til en tekstfil pr billede, på en gang?

Kode: Vælg alt

find . -type f -name '*.jpg' -exec tesseract -l dan {} {}.txt \;


@gtr: Jeg har ændret dit indlæg så teksterne står i et citat så man kan skelne dem fra de du selv skriver.
gtr

Re: omdan tekst i jpg billede til en txt fil?

Indlæg af gtr »

zob

Jeg installerede tesseract-ocr-dan med synaptic package manager.

tesseract Dr._Jekyll_and_Mr._Hyde_Text.jpg jekyll og
cat jekyll.txt
ved jeg ikke, hvad gør.

Jeg så en utube video med tesseract.
Han skrev
tesseract billede.jpg output
Det gjorde jeg, med det viste resultat.

Hvis den skal omdanne med dansk, skal jeg skrive?
tesseract -l dan billede.jpg output

ajenbo

Hvis folderen med danske billeder hedder flerebilleder og er placeret i home folderen,
skal jeg skrive?

find . -type f -flerebilleder '*.jpg' -exec tesseract -l dan {} {}.txt \;
AJenbo
Admin
Indlæg: 20878
Tilmeldt: 15. nov 2009, 15:04
IRC nickname: AJenbo
Geografisk sted: Vanløse, København

Re: omdan tekst i jpg billede til en txt fil?

Indlæg af AJenbo »

gtr skrev:Hvis den skal omdanne med dansk, skal jeg skrive?
tesseract -l dan billede.jpg output

ja
gtr skrev:Hvis folderen med danske billeder hedder flerebilleder og er placeret i home folderen,
skal jeg skrive?

find . -type f -flerebilleder '*.jpg' -exec tesseract -l dan {} {}.txt \;

Nej, du skal først navigere til flerebilleder med kommandoen cd og der efter køre kommandoen som jeg skrev den.

Kode: Vælg alt

cd flerebilleder
find . -type f -name '*.jpg' -exec tesseract -l dan {} {}.txt \;


når noget starter med "-" i en kommando er det navnet på et parameter, efterfølgende kan der så være en værdi. I det her tilfælde sættes parameret -name til værdien "*.jpg". Mappen specificeres faktisk også i kommandoen som det første. Den er sat til . som betyder "den nuværrende mappe", så hvis du vil kan du godt skrive den som en kommando:

Kode: Vælg alt

find ~/flerebilleder -type f -name '*.jpg' -exec tesseract -l dan {} {}.txt \;

(jeg har tilføjet ~/ som betyder "hjemmemappen" så den virker korrekt uanset hvilken mappe du befinder dig i når du køre den)
gtr

Re: omdan tekst i jpg billede til en txt fil?

Indlæg af gtr »

Tak for svaret.

Tesseract er en nyttig funktion.