home
***
CD-ROM
|
disk
|
FTP
|
other
***
search
/
Power-Programmierung
/
CD2.mdf
/
tools
/
pep
/
hjelp.txt
< prev
next >
Wrap
Text File
|
1989-12-28
|
16KB
|
430 lines
HJELP.TXT
=========
<< This help file exists in Norwegian only. >>
<< Denne hjelpefilen finnes bare p} norsk. >>
Denne filen inneholder sp|rsm}l og svar omkring bruken av pep.
I all hovedsak er den basert p} min email-korrespondanse med
brukere av programmet. Den inneholder bl.a. en del tips om
mer eksotiske anvendelsesomr}der for pep.
Innhold
-------
Grovvask
Ekstra linjeskift
VMS Record format
Word Perfect til ASCII
Displaywrite til ASCII
MacIntosh til Digital multinasjonalt tegnsett
Nye konverteringstabeller
Hvilke kontrolltegn finnes i filen
Konvertering av database
Skjermbilder til dokumentasjon
\delagt FAT
Norske tegn
Forslag til filtersettinger
=======================================================================
Grovvask
--------
Sp|rsm}l:
Jeg har en s|lete fil med med navn "foo.bar". Den er full av
sorte blokker og greske tegn osv.
Holder det da } bruke kommandoen:
pep -o -b foo.bar
eller m} jeg ogs} kj|re
pep -o -d- foo.bar
Svar:
I slike tilfelle er det best } fors|ke seg fram.
Ta en kopi av den s|lete filen og fors|k pep med forskjellige
innstillinger p} opsjonene. Her er noen eksempler p}
hva som vil skje:
pep -o -b foo.bar
*Fjern* alt grums kjapt og brutalt. Dette er "hvit tornado"
instillingen. Dersom den ikke fjerner data som det er viktig
for deg } bevare er den sannsynligvis den beste l|sningen.
pep -o -b -x foo.bar
Ved } legge til "-x" oppn}r du at de tegnene som i eksemplet
over ble fjernet i steden blir ekspandert til tekst p} formen
"<??h>". Denne varianten anbefales dersom du ikke er sikker
p} hva slags tegn filen inneholder, og hvor viktige de er for
sammenhengen. Etter at du har ekspandert "grumset" kan du
studere de ekspanderte tegnene og eventuellt bytte dem ut med
meningsfyllte tegn vha. en vanlig editor.
pep -o -d- foo.bar
Denne kommandoen er for } konvertere [\] fra DEC-representasjon
til 7-bits ASCII. Du bruker den dersom filen er skrevet med
DEC-tegnsett, ellers ikke.
Ekstra linjeskift
-----------------
Sp|rsm}l:
Jeg fikk en liten overraskelse da jeg kj|rte pep p} en av mine
SINTRAN-filer. Jeg fikk flere linjer enn jeg if|lge DDPP-loggen
skulle hatt. Ved n{rmere unders|kelser viste det seg at pep hadde
satt inn linjeskift p} de stedene der det forekom ASCII 127 desimalt!
Verdien 127 burde selvf|lgelig ikke ha v{rt i dataene. Som bruker
lurer jeg likevel hvorfor jeg fikk ny linje. Er det vanlig i
bransjen } tolke verdien 127 slik, eller er dette en bug i pep?
Svar:
Det er ingen bug -- det er en feature!
Det er riktignok ikke vanlig } tolke ASCII 127 (DEL) som linjeskift,
men fordi det finnes s} mange rare linje-separatorer ute i verden
(QNX bruker f.eks. CTRL-T) lar jeg pep tolke "ukjente" kontroll-tegn
som linjeskift. Det har f|lgende fordeler:
* Dersom det virkelig er ment som en ukurant linjeseparator blir
folk stort sett forn|yde.
* Dersom det ikke er ment slik er i all fall en slik ekstra linjeskift
tydelig nok til at brukere legger fort merke til det, og kan g}
inn og fikse tingene manuellt i en editor.
* Dersom man vasker tekst ut av en virkelig bin{r fil (f.eks. et
eksekverbart program) gj|r det seg godt med hver ekstraherte streng
p} en linje for seg.
VMS Record format
-----------------
Sp|rsm}l
Etter } ha vasket en fil med pep vil en del VMS program ikke lenger
vite av den. F|r vaskingen sa dir/full at filen hadde:
Record format: Variable length, maximum 72 bytes
Den filen pep har laget har imidlertid:
Record format: Stream_LF
Svar:
Du kan f} tilbake "variable length" record format med VMS-programmet
CONVERT. Dette er mer inng}ende behandlet i filen "pepvms.txt", som
er en av de dokumentasjonsfilene som f|lger med pep.
Word Perfect til ASCII
----------------------
Sp|rsm}l:
Finnes det noe filter som konverterer fra Word Perfect til ASCII?
Har sett p} pep, men det ser ikke ut til } hjelpe.
Svar:
Grunnen til at dette ikke er bygget inn i pep, er at Word Perfect
fikser det selv. Funksjonen heter "store as DOS-text" og ligger
p} CTRL-F5.
Displaywrite til ASCII
----------------------
Sp|rsm}l:
Er det mulig } konvertere filer skrevet med DisplayWrite med PEP?
Svar:
Det finnes en konverteringstabell "ebc2ns7" som konverterer
Displaywrite til 7-bits norsk ASCII. Det oppsettet av opsjoner
jeg synes fungerer best er:
pep -gebc2ns7 -b -s INNDATA.TXT > UTDATA.TXT
(Hvor INNDATA.TXT og UTDATA.TXT byttes med navn p} dine filer).
Resultatet kan du evt. peppe videre med kommandoer som:
pep -i+ -o UTDATA.TXT
for } lage 8-bits IBM-tegnset, etc.
Jeg har d}rlig dokumentasjon av DisplayWrite-formatet (kun ett eksempel),
og derfor kan f.eks. norsk [\] bli borte. Tabellen "ebc2ns7" b|r
derfor forbedres. Brukere skal derfor v{re klar over at denne er en
vanlig tekstfil som kan redigeres i en vanlig editor, og det er derfor
enkelt for en bruker } selv forbedre denne etterhvert som han eller hun
f}r mer erfaring med hvordan norske tegn representeres i DisplayWrite.
MacIntosh til Digital multinasjonalt tegnsett
---------------------------------------------
Sp|rsm}l:
Er det mulig } bruke PEP til } konvertere filer mellom MacIntosh og
Digitals multinasjonalt tegnsett?
Svar:
For } konvertere mellom Mac og Dec multinasjonalt tegnsett b|r du
lage deg dine egne konverteringstabeller ("dec2mac" og "mac2dec")
og spesifisere disse med -g opsjonen. Dessuten b|r du bruke -u-opsjonen
for } f} korrekt linjeterminator: -ur n}r du konverterer til MacIntosh
og -un n}r du konverterer til Dec-format.
Dersom du lager "dec2mac" og "mac2dec" konverteringstabeller, vil jeg
gjerne ha en kopi av en for } legge med framtidige distribusjoner av
pep.
Nye Konverteringstabeller
-------------------------
Sp|rsm}l:
Hvordan f}r jeg tak i konverteringstabeller for nye format?
Svar:
Peps konverteringstabeller er vanlige ASCII tekstfiler, og du kan b}de
endre p} eksisterende og lage nye med en vanlig editor. Du b|r
imidlertid bruke en editor som ikke legger styrekoder inn i teksten,
som f.eks.: EDLIN, MicroEMACS eller BRAGE.
Sp|rsm}l:
N}r man lager sine egne konverteringstabeller, hva gj|r man med tegn
i det ene settet som ikke har motsvarighet i det andre (eksempelvis
Trademark-tegnet p} Mac). Setter du inn blank eller bare oppgir du
tegnet uten motsvarighet.
Svar:
Du m} alltid oppgi et tegn. Dette kan f.eks. v{re blank (32), eller
punktum (46). Noen bruker ogs} et "sjeldent" tegn som "@" (64) for
} s|ke etter det i en editor etterp}, slik at de f.eks. erstatte det
med strengen "<Tm>" dersom "trademark" mangler i tegnsettet. Denne
teknikken kan delvis kompensere for at Pep desverre ikke klarer }
erstatte et tegn med en streng av tegn.
Hvilke kontrolltegn finnes i filen
----------------------------------
Sp|rsm}l:
Jeg har en fil (foo.bar) som jeg fors|ker } f} inn i et arkivsystem.
Desverre inneholder den en del "rare" tegn. Jeg har fors|kt b}de
kommandoene:
pep -o foo.bar
og
pep -o -b foo.bar
men i det f|rste tilfelle inneholder fortsatt resultatet "grums";
og i det andre tilfellet mangler det tegn. Hvilke pep-opsjoner er
de riktige? Jeg har lest manualen, men vet jo ikke hva som egentlig
ligger i filen. Du har tidligere sagt at -x opsjonen kan brukes
til } se hva filen inneholder. Kan du forklare det litt n{rmere?
Svar:
Fors|k f|lgende:
1) Ekspander "rare" tegn til heksdesimal. Kommandoen er:
pep -b -x foo.org > foo.ut
2) Ta filen "foo.ut" inn i en vanlig editor (det m} v{re en ASCII
editor som "emacs" eller "edt", ikke et tekstbehandlingssystem).
Let gjennom filen etter heksadesimale tall i hakeparanteser.
(Disse ser feks. slik ut: "<a9h>", "<81h>", o.l. og den
enkleste m}ten} finne dem p} er } bruke editoren til }
s|ke etter strengen "h>".) Lag en liste over disse, og
fors|k } avgj|re ut fra sammenhengen hvilket tegn de er
ment } v{re. La oss f.eks. si at du oppdager at "<a9h>"
sannsynligvis er et spesialtegn for lang bindestrek.
3) Bruk editorfunksjonen for gjennomg}ende s|king og erstatning
til } bytte ut "<a9h>" med "--" (den beste lange bindestrek
vi kan f} til med et begrenset tegnsett). Gj|r deretter
tilsvarende med de andre "rare" tegnene som du fant
betydningen av.
4) S|k til slutt p} nytt etter "h>" og rett opp evt. gjenv{rende
koder for h}nd, eller slett dem.
Konvertering av database
------------------------
Sp|rsm}l:
Jeg fors|ker } konvertere tegnsettet i en databasefil fra IBM-PC
tegnsett til ISO 8859/1 ved hjelp av pep. Dette er en fil som
tydligvis inneholder en del tegn PEP ikke klarer } oversette riktig.
De norske tegnene blir riktig konvertert, men alt med ASCII verdi
under 32 forsvinner. Resultatet er at databasen krasjer.
Har du noen ideer?
Svar:
Beklager, du fors|ker } gj|re noe som pep ikke kan. Pep er et
program som fors|ker } lage normale tekstfiler av det meste.
Det egner seg d}rlig til oppgaver der *utfilen* m} inneholde
ikke-tekstlig informasjon, som indekser i en database eller
maskininstruksjoner i et program.
Problemet er at pep ikke er i stand til } skille mellom tegn som
er en del av dataene (og alts} skal konverteres), og byter med
tilsvarende ASCII-verdier som inng}r i indekser og pekere (og
som ikke skal r|res). Fordi pep ikke vet noe om hvilke bytes
som er data, og hvilke som er deler av indekser, blir alt
konvertert, og databasen blir |delagt.
De fleste databaser har imidlertid en funksjon som tillater deg
} skrive hele innholdet av databasen ut p} en tekstfil. Dette
kan enten v{re en fil med fast recordlengde, eller det kan v{re
en fil der et eller annet tegn (vanligvis komma) brukes som
record-separator. I s} fall kan du gj|re f|lgende:
1) Skriv innholdet av databasen ut p} en tekstfil.
2) Bruk pep til } konvertere tegnsettet i denne tekstfilen.
3) Les den konverterte tekstfilen inn i databasen igjen.
Skjermbilder til dokumentasjon
------------------------------
Brev:
Har nettopp lastet ned siste versjon av Pep, og kan rapportere f|lgende:
Den kompilerer greit p} Apollos kompilator (ver. 5.3). Noen advarsler,
men funker bra uten noen endringer.
Den har n} l|st et problem for oss. V}r tekniske forfatter trenger kopi
av skjermbilder for manualene v}re. Vi gjorde f|lgende:
Startet vt100-emulator p} Apollo. Startet telnet p} f|lgende m}te:
telnet | tee dump.pep
Telnettet til Nord-maskinen, og kj|rte applikasjonen i vt100-modus.
Etter pepping med
pep -e1 < dump.pep > dump.txt
fikk vi en ASCII-fil med bilder av skjermbilder, som bare trenger
litt bearbeiding f|r vi kan legge filene inn i tekstbehandlings-
systemet.
Dette er vi meget forn|yd med, neste gang vi sees p} passende
sted, vanker det nok en pils eller to.
Svar:
Finnes det flere forn|de brukere tro?
\delagt FAT
-----------
Sp|rsm}l:
Jeg har en diskett som ikke lenger lar seg lese p} vanlig m}te.
Jeg vet for lite om DOS filsystem til at jeg kan redde den ved }
redigere FAT, eller ved } bruke lavniv}verkt|y som Mace, Norton
eller PC-tools. Finnes noe h}p for de tekstfilene som befant seg
p} disketten.
Svar:
Ja. Men metoden er langt fra perfekt:
* Den kan bare brukes til } redde filer som hovedsakelig best}r
av vanlig ASCII tekst. ARCede filer og programmer kan ikke
reddes.
* Filene kommer til } trenge en god del redigering. Du kan
risikere at rekkef|lgen kastes om, og all formaterings-
informasjon g}r tapt. V{r forberedt p} } bruke en god del
tid p} } rydde opp i resultatet.
N}r s} mye er sagt, la oss se p} metoden:
I tillegg til pep trenger du et shareware program som heter
"teledisk".
TELEDISK koster $25 og kan bestilles fra:
SYDEX, 153 North Murphy Ave., Sunnyvale, CA 94086.
I Oslo ligger det ogs} kopier som kan lastes opp for evaluering.
Filen heter TELEDISK.ARC og ligger blant annet p}:
Oslo Online Services (02) 28 54 17
Infonet (02) 33 36 72
For } redde tekstfilene g}r du fram p} f|lgende m}te:
1) Ved hjelp av "teledisk" tar du en verbatim kopi av hele den
skadde disketten til en vanlig fil p} harddisken. Du starter
teledisk uten opsjoner. Inne i teledisk b|r du velge f|lgende
fra menyen:
- Check diskette for data: both sides
- Read which sectors: all
- Data compression method: normal
Du kan selv velge navn p} filen. La oss si at kaller den for
"vrakgods". Filen med dataene fra disken vil da bli hetende
"vrakgods.td0".
2) Vask ut alt annet enn ASCII-tekst fra denne filen pep. Det
kan du for eksempel gj|re med kommandoen:
pep -b -s6 vrakgods.td0 > vrakgods.txt
Men her kan det l|nne seg } ekperimentere med forskjellige
styrkegrader p} filterne.
Resultatet ("vrakgods.txt") vil som sagt trenge redigering, men alt
er vel bedre enn } taste inn alt p} nytt?
Norske tegn
-----------
Sp|rsm}l:
Hvordan er norske tegn representert i forskjellige 8-bits tegnsett?
Svar:
Heksadesimalt:
+-----------+-----------+-----------+-----------+-----------+-----------+
! ! ISO 646 ! ISO8859/1 ! IBM-PC ! Apple ! H-P !
! Bokstav ! NS 4551 ! X3.134.2 ! CP 850 ! MacIntosh ! Roman 8 !
! ! NORSK I ! DEC m/n ! ! ! !
+-----------+-----------+-----------+-----------+-----------+-----------+
! AE ([) ! 5b ! c6 ! 92 ! ae ! d3 !
! OE (\) ! 5c ! d8 ! 9d ! af ! d2 !
! AA (]) ! 5d ! c5 ! 8f ! 81 ! d0 !
! ae ({) ! 7b ! e6 ! 91 ! be ! d7 !
! oe (|) ! 7c ! f8 ! 9b ! bf ! d6 !
! aa (}) ! 7d ! e5 ! 86 ! 8c ! d4 !
+-----------+-----------+-----------+-----------+-----------+-----------+
Desimalt:
+-----------+-----------+-----------+-----------+-----------+-----------+
! ! ISO 646 ! ISO8859/1 ! IBM-PC ! Apple ! H-P !
! Bokstav ! NS 4551 ! X3.134.2 ! CP 850 ! MacIntosh ! Roman 8 !
! ! NORSK I ! DEC m/n ! ! ! !
+-----------+-----------+-----------+-----------+-----------+-----------+
! AE ([) ! 91 ! 198 ! 146 ! 174 ! 211 !
! OE (\) ! 92 ! 216 ! 157 ! 175 ! 210 !
! AA (]) ! 93 ! 197 ! 143 ! 129 ! 208 !
! ae ({) ! 123 ! 230 ! 145 ! 190 ! 215 !
! oe (|) ! 124 ! 248 ! 155 ! 191 ! 214 !
! aa (}) ! 125 ! 229 ! 134 ! 140 ! 212 !
+-----------+-----------+-----------+-----------+-----------+-----------+
Forslag til filtersettinger
---------------------------
Nedenfor f|lger det en del filtersettinger som har vist seg } rimelig godt.
Dette er kun forslag. Du b|r ofte eksperimentere for } komme fram til
de riktige settingene for ditt problem.
DisplayWrite: pep -gebc2ns7 -b -s inndata.dw4 > utdata.txt
PowerPoint: pep -m- -b inndata.pp > utdata.txt
Foilene vil ligge i motsatt rekkef|lge i tekst-filen.
..EOF