home *** CD-ROM | disk | FTP | other *** search
- HJELP.TXT
- =========
-
- << This help file exists in Norwegian only. >>
- << Denne hjelpefilen finnes bare p} norsk. >>
-
- Denne filen inneholder sp|rsm}l og svar omkring bruken av pep.
- I all hovedsak er den basert p} min email-korrespondanse med
- brukere av programmet. Den inneholder bl.a. en del tips om
- mer eksotiske anvendelsesomr}der for pep.
-
- Innhold
- -------
-
- Grovvask
- Ekstra linjeskift
- VMS Record format
- Word Perfect til ASCII
- Displaywrite til ASCII
- MacIntosh til Digital multinasjonalt tegnsett
- Nye konverteringstabeller
- Hvilke kontrolltegn finnes i filen
- Konvertering av database
- Skjermbilder til dokumentasjon
- \delagt FAT
- Norske tegn
- Forslag til filtersettinger
-
- =======================================================================
-
-
- Grovvask
- --------
-
- Sp|rsm}l:
- Jeg har en s|lete fil med med navn "foo.bar". Den er full av
- sorte blokker og greske tegn osv.
-
- Holder det da } bruke kommandoen:
-
- pep -o -b foo.bar
-
- eller m} jeg ogs} kj|re
-
- pep -o -d- foo.bar
-
-
- Svar:
- I slike tilfelle er det best } fors|ke seg fram.
- Ta en kopi av den s|lete filen og fors|k pep med forskjellige
- innstillinger p} opsjonene. Her er noen eksempler p}
- hva som vil skje:
-
- pep -o -b foo.bar
- *Fjern* alt grums kjapt og brutalt. Dette er "hvit tornado"
- instillingen. Dersom den ikke fjerner data som det er viktig
- for deg } bevare er den sannsynligvis den beste l|sningen.
-
- pep -o -b -x foo.bar
- Ved } legge til "-x" oppn}r du at de tegnene som i eksemplet
- over ble fjernet i steden blir ekspandert til tekst p} formen
- "<??h>". Denne varianten anbefales dersom du ikke er sikker
- p} hva slags tegn filen inneholder, og hvor viktige de er for
- sammenhengen. Etter at du har ekspandert "grumset" kan du
- studere de ekspanderte tegnene og eventuellt bytte dem ut med
- meningsfyllte tegn vha. en vanlig editor.
-
- pep -o -d- foo.bar
- Denne kommandoen er for } konvertere [\] fra DEC-representasjon
- til 7-bits ASCII. Du bruker den dersom filen er skrevet med
- DEC-tegnsett, ellers ikke.
-
-
- Ekstra linjeskift
- -----------------
-
- Sp|rsm}l:
- Jeg fikk en liten overraskelse da jeg kj|rte pep p} en av mine
- SINTRAN-filer. Jeg fikk flere linjer enn jeg if|lge DDPP-loggen
- skulle hatt. Ved n{rmere unders|kelser viste det seg at pep hadde
- satt inn linjeskift p} de stedene der det forekom ASCII 127 desimalt!
- Verdien 127 burde selvf|lgelig ikke ha v{rt i dataene. Som bruker
- lurer jeg likevel hvorfor jeg fikk ny linje. Er det vanlig i
- bransjen } tolke verdien 127 slik, eller er dette en bug i pep?
-
- Svar:
- Det er ingen bug -- det er en feature!
- Det er riktignok ikke vanlig } tolke ASCII 127 (DEL) som linjeskift,
- men fordi det finnes s} mange rare linje-separatorer ute i verden
- (QNX bruker f.eks. CTRL-T) lar jeg pep tolke "ukjente" kontroll-tegn
- som linjeskift. Det har f|lgende fordeler:
- * Dersom det virkelig er ment som en ukurant linjeseparator blir
- folk stort sett forn|yde.
- * Dersom det ikke er ment slik er i all fall en slik ekstra linjeskift
- tydelig nok til at brukere legger fort merke til det, og kan g}
- inn og fikse tingene manuellt i en editor.
- * Dersom man vasker tekst ut av en virkelig bin{r fil (f.eks. et
- eksekverbart program) gj|r det seg godt med hver ekstraherte streng
- p} en linje for seg.
-
-
- VMS Record format
- -----------------
-
- Sp|rsm}l
- Etter } ha vasket en fil med pep vil en del VMS program ikke lenger
- vite av den. F|r vaskingen sa dir/full at filen hadde:
-
- Record format: Variable length, maximum 72 bytes
-
- Den filen pep har laget har imidlertid:
-
- Record format: Stream_LF
-
- Svar:
- Du kan f} tilbake "variable length" record format med VMS-programmet
- CONVERT. Dette er mer inng}ende behandlet i filen "pepvms.txt", som
- er en av de dokumentasjonsfilene som f|lger med pep.
-
-
- Word Perfect til ASCII
- ----------------------
-
- Sp|rsm}l:
- Finnes det noe filter som konverterer fra Word Perfect til ASCII?
- Har sett p} pep, men det ser ikke ut til } hjelpe.
-
- Svar:
- Grunnen til at dette ikke er bygget inn i pep, er at Word Perfect
- fikser det selv. Funksjonen heter "store as DOS-text" og ligger
- p} CTRL-F5.
-
-
- Displaywrite til ASCII
- ----------------------
-
- Sp|rsm}l:
- Er det mulig } konvertere filer skrevet med DisplayWrite med PEP?
-
- Svar:
- Det finnes en konverteringstabell "ebc2ns7" som konverterer
- Displaywrite til 7-bits norsk ASCII. Det oppsettet av opsjoner
- jeg synes fungerer best er:
-
- pep -gebc2ns7 -b -s INNDATA.TXT > UTDATA.TXT
-
- (Hvor INNDATA.TXT og UTDATA.TXT byttes med navn p} dine filer).
-
- Resultatet kan du evt. peppe videre med kommandoer som:
-
- pep -i+ -o UTDATA.TXT
-
- for } lage 8-bits IBM-tegnset, etc.
-
- Jeg har d}rlig dokumentasjon av DisplayWrite-formatet (kun ett eksempel),
- og derfor kan f.eks. norsk [\] bli borte. Tabellen "ebc2ns7" b|r
- derfor forbedres. Brukere skal derfor v{re klar over at denne er en
- vanlig tekstfil som kan redigeres i en vanlig editor, og det er derfor
- enkelt for en bruker } selv forbedre denne etterhvert som han eller hun
- f}r mer erfaring med hvordan norske tegn representeres i DisplayWrite.
-
-
- MacIntosh til Digital multinasjonalt tegnsett
- ---------------------------------------------
-
- Sp|rsm}l:
- Er det mulig } bruke PEP til } konvertere filer mellom MacIntosh og
- Digitals multinasjonalt tegnsett?
-
- Svar:
- For } konvertere mellom Mac og Dec multinasjonalt tegnsett b|r du
- lage deg dine egne konverteringstabeller ("dec2mac" og "mac2dec")
- og spesifisere disse med -g opsjonen. Dessuten b|r du bruke -u-opsjonen
- for } f} korrekt linjeterminator: -ur n}r du konverterer til MacIntosh
- og -un n}r du konverterer til Dec-format.
-
- Dersom du lager "dec2mac" og "mac2dec" konverteringstabeller, vil jeg
- gjerne ha en kopi av en for } legge med framtidige distribusjoner av
- pep.
-
-
- Nye Konverteringstabeller
- -------------------------
-
- Sp|rsm}l:
- Hvordan f}r jeg tak i konverteringstabeller for nye format?
-
- Svar:
- Peps konverteringstabeller er vanlige ASCII tekstfiler, og du kan b}de
- endre p} eksisterende og lage nye med en vanlig editor. Du b|r
- imidlertid bruke en editor som ikke legger styrekoder inn i teksten,
- som f.eks.: EDLIN, MicroEMACS eller BRAGE.
-
-
- Sp|rsm}l:
- N}r man lager sine egne konverteringstabeller, hva gj|r man med tegn
- i det ene settet som ikke har motsvarighet i det andre (eksempelvis
- Trademark-tegnet p} Mac). Setter du inn blank eller bare oppgir du
- tegnet uten motsvarighet.
-
- Svar:
- Du m} alltid oppgi et tegn. Dette kan f.eks. v{re blank (32), eller
- punktum (46). Noen bruker ogs} et "sjeldent" tegn som "@" (64) for
- } s|ke etter det i en editor etterp}, slik at de f.eks. erstatte det
- med strengen "<Tm>" dersom "trademark" mangler i tegnsettet. Denne
- teknikken kan delvis kompensere for at Pep desverre ikke klarer }
- erstatte et tegn med en streng av tegn.
-
-
- Hvilke kontrolltegn finnes i filen
- ----------------------------------
-
- Sp|rsm}l:
- Jeg har en fil (foo.bar) som jeg fors|ker } f} inn i et arkivsystem.
- Desverre inneholder den en del "rare" tegn. Jeg har fors|kt b}de
- kommandoene:
-
- pep -o foo.bar
-
- og
-
- pep -o -b foo.bar
-
- men i det f|rste tilfelle inneholder fortsatt resultatet "grums";
- og i det andre tilfellet mangler det tegn. Hvilke pep-opsjoner er
- de riktige? Jeg har lest manualen, men vet jo ikke hva som egentlig
- ligger i filen. Du har tidligere sagt at -x opsjonen kan brukes
- til } se hva filen inneholder. Kan du forklare det litt n{rmere?
-
- Svar:
- Fors|k f|lgende:
-
- 1) Ekspander "rare" tegn til heksdesimal. Kommandoen er:
-
- pep -b -x foo.org > foo.ut
-
- 2) Ta filen "foo.ut" inn i en vanlig editor (det m} v{re en ASCII
- editor som "emacs" eller "edt", ikke et tekstbehandlingssystem).
- Let gjennom filen etter heksadesimale tall i hakeparanteser.
- (Disse ser feks. slik ut: "<a9h>", "<81h>", o.l. og den
- enkleste m}ten} finne dem p} er } bruke editoren til }
- s|ke etter strengen "h>".) Lag en liste over disse, og
- fors|k } avgj|re ut fra sammenhengen hvilket tegn de er
- ment } v{re. La oss f.eks. si at du oppdager at "<a9h>"
- sannsynligvis er et spesialtegn for lang bindestrek.
-
- 3) Bruk editorfunksjonen for gjennomg}ende s|king og erstatning
- til } bytte ut "<a9h>" med "--" (den beste lange bindestrek
- vi kan f} til med et begrenset tegnsett). Gj|r deretter
- tilsvarende med de andre "rare" tegnene som du fant
- betydningen av.
-
- 4) S|k til slutt p} nytt etter "h>" og rett opp evt. gjenv{rende
- koder for h}nd, eller slett dem.
-
-
- Konvertering av database
- ------------------------
-
- Sp|rsm}l:
- Jeg fors|ker } konvertere tegnsettet i en databasefil fra IBM-PC
- tegnsett til ISO 8859/1 ved hjelp av pep. Dette er en fil som
- tydligvis inneholder en del tegn PEP ikke klarer } oversette riktig.
- De norske tegnene blir riktig konvertert, men alt med ASCII verdi
- under 32 forsvinner. Resultatet er at databasen krasjer.
- Har du noen ideer?
-
- Svar:
- Beklager, du fors|ker } gj|re noe som pep ikke kan. Pep er et
- program som fors|ker } lage normale tekstfiler av det meste.
- Det egner seg d}rlig til oppgaver der *utfilen* m} inneholde
- ikke-tekstlig informasjon, som indekser i en database eller
- maskininstruksjoner i et program.
-
- Problemet er at pep ikke er i stand til } skille mellom tegn som
- er en del av dataene (og alts} skal konverteres), og byter med
- tilsvarende ASCII-verdier som inng}r i indekser og pekere (og
- som ikke skal r|res). Fordi pep ikke vet noe om hvilke bytes
- som er data, og hvilke som er deler av indekser, blir alt
- konvertert, og databasen blir |delagt.
-
- De fleste databaser har imidlertid en funksjon som tillater deg
- } skrive hele innholdet av databasen ut p} en tekstfil. Dette
- kan enten v{re en fil med fast recordlengde, eller det kan v{re
- en fil der et eller annet tegn (vanligvis komma) brukes som
- record-separator. I s} fall kan du gj|re f|lgende:
-
- 1) Skriv innholdet av databasen ut p} en tekstfil.
- 2) Bruk pep til } konvertere tegnsettet i denne tekstfilen.
- 3) Les den konverterte tekstfilen inn i databasen igjen.
-
-
- Skjermbilder til dokumentasjon
- ------------------------------
-
- Brev:
- Har nettopp lastet ned siste versjon av Pep, og kan rapportere f|lgende:
- Den kompilerer greit p} Apollos kompilator (ver. 5.3). Noen advarsler,
- men funker bra uten noen endringer.
-
- Den har n} l|st et problem for oss. V}r tekniske forfatter trenger kopi
- av skjermbilder for manualene v}re. Vi gjorde f|lgende:
-
- Startet vt100-emulator p} Apollo. Startet telnet p} f|lgende m}te:
-
- telnet | tee dump.pep
-
- Telnettet til Nord-maskinen, og kj|rte applikasjonen i vt100-modus.
- Etter pepping med
-
- pep -e1 < dump.pep > dump.txt
-
- fikk vi en ASCII-fil med bilder av skjermbilder, som bare trenger
- litt bearbeiding f|r vi kan legge filene inn i tekstbehandlings-
- systemet.
-
- Dette er vi meget forn|yd med, neste gang vi sees p} passende
- sted, vanker det nok en pils eller to.
-
- Svar:
- Finnes det flere forn|de brukere tro?
-
-
- \delagt FAT
- -----------
-
- Sp|rsm}l:
- Jeg har en diskett som ikke lenger lar seg lese p} vanlig m}te.
- Jeg vet for lite om DOS filsystem til at jeg kan redde den ved }
- redigere FAT, eller ved } bruke lavniv}verkt|y som Mace, Norton
- eller PC-tools. Finnes noe h}p for de tekstfilene som befant seg
- p} disketten.
-
- Svar:
- Ja. Men metoden er langt fra perfekt:
-
- * Den kan bare brukes til } redde filer som hovedsakelig best}r
- av vanlig ASCII tekst. ARCede filer og programmer kan ikke
- reddes.
-
- * Filene kommer til } trenge en god del redigering. Du kan
- risikere at rekkef|lgen kastes om, og all formaterings-
- informasjon g}r tapt. V{r forberedt p} } bruke en god del
- tid p} } rydde opp i resultatet.
-
- N}r s} mye er sagt, la oss se p} metoden:
-
- I tillegg til pep trenger du et shareware program som heter
- "teledisk".
-
- TELEDISK koster $25 og kan bestilles fra:
- SYDEX, 153 North Murphy Ave., Sunnyvale, CA 94086.
-
- I Oslo ligger det ogs} kopier som kan lastes opp for evaluering.
- Filen heter TELEDISK.ARC og ligger blant annet p}:
- Oslo Online Services (02) 28 54 17
- Infonet (02) 33 36 72
-
- For } redde tekstfilene g}r du fram p} f|lgende m}te:
-
- 1) Ved hjelp av "teledisk" tar du en verbatim kopi av hele den
- skadde disketten til en vanlig fil p} harddisken. Du starter
- teledisk uten opsjoner. Inne i teledisk b|r du velge f|lgende
- fra menyen:
- - Check diskette for data: both sides
- - Read which sectors: all
- - Data compression method: normal
- Du kan selv velge navn p} filen. La oss si at kaller den for
- "vrakgods". Filen med dataene fra disken vil da bli hetende
- "vrakgods.td0".
-
- 2) Vask ut alt annet enn ASCII-tekst fra denne filen pep. Det
- kan du for eksempel gj|re med kommandoen:
- pep -b -s6 vrakgods.td0 > vrakgods.txt
- Men her kan det l|nne seg } ekperimentere med forskjellige
- styrkegrader p} filterne.
-
- Resultatet ("vrakgods.txt") vil som sagt trenge redigering, men alt
- er vel bedre enn } taste inn alt p} nytt?
-
-
- Norske tegn
- -----------
-
- Sp|rsm}l:
- Hvordan er norske tegn representert i forskjellige 8-bits tegnsett?
-
- Svar:
- Heksadesimalt:
- +-----------+-----------+-----------+-----------+-----------+-----------+
- ! ! ISO 646 ! ISO8859/1 ! IBM-PC ! Apple ! H-P !
- ! Bokstav ! NS 4551 ! X3.134.2 ! CP 850 ! MacIntosh ! Roman 8 !
- ! ! NORSK I ! DEC m/n ! ! ! !
- +-----------+-----------+-----------+-----------+-----------+-----------+
- ! AE ([) ! 5b ! c6 ! 92 ! ae ! d3 !
- ! OE (\) ! 5c ! d8 ! 9d ! af ! d2 !
- ! AA (]) ! 5d ! c5 ! 8f ! 81 ! d0 !
- ! ae ({) ! 7b ! e6 ! 91 ! be ! d7 !
- ! oe (|) ! 7c ! f8 ! 9b ! bf ! d6 !
- ! aa (}) ! 7d ! e5 ! 86 ! 8c ! d4 !
- +-----------+-----------+-----------+-----------+-----------+-----------+
-
- Desimalt:
- +-----------+-----------+-----------+-----------+-----------+-----------+
- ! ! ISO 646 ! ISO8859/1 ! IBM-PC ! Apple ! H-P !
- ! Bokstav ! NS 4551 ! X3.134.2 ! CP 850 ! MacIntosh ! Roman 8 !
- ! ! NORSK I ! DEC m/n ! ! ! !
- +-----------+-----------+-----------+-----------+-----------+-----------+
- ! AE ([) ! 91 ! 198 ! 146 ! 174 ! 211 !
- ! OE (\) ! 92 ! 216 ! 157 ! 175 ! 210 !
- ! AA (]) ! 93 ! 197 ! 143 ! 129 ! 208 !
- ! ae ({) ! 123 ! 230 ! 145 ! 190 ! 215 !
- ! oe (|) ! 124 ! 248 ! 155 ! 191 ! 214 !
- ! aa (}) ! 125 ! 229 ! 134 ! 140 ! 212 !
- +-----------+-----------+-----------+-----------+-----------+-----------+
-
-
- Forslag til filtersettinger
- ---------------------------
-
- Nedenfor f|lger det en del filtersettinger som har vist seg } rimelig godt.
- Dette er kun forslag. Du b|r ofte eksperimentere for } komme fram til
- de riktige settingene for ditt problem.
-
- DisplayWrite: pep -gebc2ns7 -b -s inndata.dw4 > utdata.txt
-
- PowerPoint: pep -m- -b inndata.pp > utdata.txt
- Foilene vil ligge i motsatt rekkef|lge i tekst-filen.
- ..EOF
-