Udtræk af tal i kolonner fra rå tekstdokumenter

Alle tekniske spørgsmål som ikke hører ind under de andre fora.
Brugeravatar
NickyThomassen
Admin
Indlæg: 3652
Tilmeldt: 5. mar 2010, 19:58
IRC nickname: nicky
Geografisk sted: 192.168.20.42

Udtræk af tal i kolonner fra rå tekstdokumenter

Indlæg af NickyThomassen »

Først lidt baggrund:
I skolen, som alle andre steder i disse dage, køre klimadebatten højt, og efter vi arbejdede med klimaet sidste gang blev jeg lidt nysgerrig. Så jeg fandt de rå data for både temperaturmålinger og CO2 målinger så jeg selv kan lave mine grafer, og på den måde fokuserer dem på det jeg syntes er vigtigt.

Men men, rå data af den slags ligger i ren tekst, én kolonne med det estimeret tidspunkt for målingen, og én for mållingens data. Det ser sådan her ud:
(Det bliver vist uden indrykning (tab) her, se links nedenunder)
1927 -1.765
1928 -0.519
1929 1.207

(Se http://ubuntuone.com/p/UkD/ for eksempel)
(Hent hele filen her http://ubuntuone.com/p/UkE/)

Min første tanke var at jeg bare ville skrive tallene over i OpenOffice, men da der er omkring 700 linjer i hvert dokument, 5 dokumenter fra hver station og X antal stationer, bliver jeg aldrig færdig hvis jeg skal gøre det manuelt.

Jeg har prøvet med grep og awk, og lidt C, men jeg kan ikke få det til at virke. Det jeg prøver på er at strikke en kommando eller et lille script sammen til at tage første kolonne og gemme i et andet dokument, og bagefter det samme med anden kolonne. Evt. bare ved at ændre kommandoen. Der er 1 indrykningsplads (tab) imellem linjestart og første kolonne, og imellem første og anden kolonne. Når tallene så er ovre i et dokument hvor der kun er én række, er det ikke noget problem at trække dem ind i OO og arbejde med dem.

Alternativt har jeg også prøvet at trække alle tallene direkte ind i OO, men det ser ikke ud til at man kan få skilt de to kolonner ad.

Jeg håber ikke at det er helt hen i vejret at spørge om det her, men jeg kan simpelthen ikke gennemskue syntaksen for grep og awk. Jeg har ellers læst man-filerne, og de er godt skrevet, men når man står på bar bund syntes jeg det er svært at komme i gang.

Hilsen Nicky
Senest rettet af NickyThomassen 22. dec 2010, 12:11, rettet i alt 1 gang.
AJenbo
Admin
Indlæg: 20878
Tilmeldt: 15. nov 2009, 15:04
IRC nickname: AJenbo
Geografisk sted: Vanløse, København

Re: Udtræk af tal i kolonner fra rå tekstdokumenter, hvordan?

Indlæg af AJenbo »

omdøb filerne til *.csv
Åben dem i calc (regneark), sæt hak ud for "Flet skilletegn" hvis der kommer for mange koloner, hvis der kun kommer en kolone så sæt hak ud for "Tabulator".

Det ser ikke ud til at være tabs, men flere mellem rummer. Du må lige selv se på hvordan du fjerner header fra filerne. Men jeg vil tro det hele kan gøres med

Kode: Vælg alt

cat *.txt | grep \ \ \ \ \ > *.csv
Brugeravatar
NickyThomassen
Admin
Indlæg: 3652
Tilmeldt: 5. mar 2010, 19:58
IRC nickname: nicky
Geografisk sted: 192.168.20.42

Re: Udtræk af tal i kolonner fra rå tekstdokumenter, hvordan?

Indlæg af NickyThomassen »

AJenbo skrev:omdøb filerne til *.csv

Tusind tak for hjælpen, tænk at det kunne være så simpelt.

Du ved vel tilfældigvis ikke hvordan at det kan være at OpenOffice laver en " ' " i starten af hver celle, hvis man formatere cellerne fra tekst til tal?

Hilsen Nicky
AJenbo
Admin
Indlæg: 20878
Tilmeldt: 15. nov 2009, 15:04
IRC nickname: AJenbo
Geografisk sted: Vanløse, København

Re: Udtræk af tal i kolonner fra rå tekstdokumenter, hvordan?

Indlæg af AJenbo »

' bliver indsat for at den skal skrive nøjaktig hvad der står og ikke prøve at være inteligent omkring værdien.

Jeg tror du kan undgå det ved at fra vælge "Citeret felt som tekst". Måske tilvælge dedekter special tal neden under.
Brugeravatar
NickyThomassen
Admin
Indlæg: 3652
Tilmeldt: 5. mar 2010, 19:58
IRC nickname: nicky
Geografisk sted: 192.168.20.42

Re: Udtræk af tal i kolonner fra rå tekstdokumenter, hvordan

Indlæg af NickyThomassen »

Tak for hjælpen.
Jeg fik ikke ' til at gå væk, men jeg kan sagtens arbejde med tallene nu, og få lavet grafer osv. på dem, så jeg markere tråden løst og prøver at læse hjælpefilerne til OpenOffice.

Hilsen Nicky