home *** CD-ROM | disk | FTP | other *** search
/ Power-Programmierung / CD2.mdf / tools / pep / hjelp.txt < prev    next >
Text File  |  1989-12-28  |  16KB  |  430 lines

  1. HJELP.TXT
  2. =========
  3.  
  4.      << This help file exists in Norwegian only. >>
  5.      << Denne hjelpefilen finnes  bare p} norsk. >>
  6.  
  7. Denne filen inneholder sp|rsm}l og svar omkring bruken av pep.
  8. I all hovedsak er den basert p} min email-korrespondanse med
  9. brukere av programmet.  Den inneholder bl.a. en del tips om
  10. mer eksotiske anvendelsesomr}der for pep.
  11.  
  12. Innhold
  13. -------
  14.  
  15. Grovvask
  16. Ekstra linjeskift
  17. VMS Record format
  18. Word Perfect til ASCII
  19. Displaywrite til ASCII
  20. MacIntosh til Digital multinasjonalt tegnsett
  21. Nye konverteringstabeller
  22. Hvilke kontrolltegn finnes i filen
  23. Konvertering av database
  24. Skjermbilder til dokumentasjon
  25. \delagt FAT
  26. Norske tegn
  27. Forslag til filtersettinger
  28.  
  29. =======================================================================
  30.  
  31.  
  32. Grovvask
  33. --------
  34.  
  35. Sp|rsm}l:
  36.    Jeg har en s|lete fil med med navn "foo.bar".  Den er full av
  37.    sorte blokker og greske tegn osv.
  38.  
  39.    Holder det da } bruke kommandoen:
  40.  
  41.     pep -o -b foo.bar
  42.  
  43.    eller m} jeg ogs} kj|re
  44.  
  45.     pep -o -d- foo.bar
  46.  
  47.  
  48. Svar:
  49.    I slike tilfelle er det best } fors|ke seg fram.
  50.    Ta en kopi av den s|lete filen og fors|k pep med forskjellige
  51.    innstillinger p} opsjonene.  Her er noen eksempler p}
  52.    hva som vil skje:
  53.  
  54.    pep -o -b foo.bar
  55.     *Fjern* alt grums kjapt og brutalt.  Dette er "hvit tornado"
  56.     instillingen.  Dersom den ikke fjerner data som det er viktig
  57.     for deg } bevare er den sannsynligvis den beste l|sningen.
  58.  
  59.    pep -o -b -x foo.bar
  60.     Ved } legge til "-x" oppn}r du at de tegnene som i eksemplet
  61.     over ble fjernet i steden blir ekspandert til tekst p} formen
  62.     "<??h>".  Denne varianten anbefales dersom du ikke er sikker
  63.     p} hva slags tegn filen inneholder, og hvor viktige de er for
  64.     sammenhengen.  Etter at du har ekspandert "grumset" kan du
  65.     studere de ekspanderte tegnene og eventuellt bytte dem ut med
  66.     meningsfyllte tegn vha. en vanlig editor.
  67.  
  68.    pep -o -d- foo.bar
  69.     Denne kommandoen er for } konvertere [\] fra DEC-representasjon
  70.     til 7-bits ASCII.  Du bruker den dersom filen er skrevet med
  71.     DEC-tegnsett, ellers ikke.
  72.  
  73.  
  74. Ekstra linjeskift
  75. -----------------
  76.  
  77. Sp|rsm}l:
  78.    Jeg fikk en liten overraskelse da jeg kj|rte pep p} en av mine
  79.    SINTRAN-filer. Jeg fikk flere linjer enn jeg if|lge DDPP-loggen
  80.    skulle hatt.  Ved n{rmere unders|kelser viste det seg at pep hadde
  81.    satt inn linjeskift p} de stedene der det forekom ASCII 127 desimalt!
  82.    Verdien 127 burde selvf|lgelig ikke ha v{rt i dataene. Som bruker
  83.    lurer jeg likevel hvorfor jeg fikk ny linje. Er det vanlig i
  84.    bransjen }  tolke verdien 127 slik, eller er dette en bug i pep?
  85.  
  86. Svar:
  87.    Det er ingen bug -- det er en feature!
  88.    Det er riktignok ikke vanlig } tolke ASCII 127 (DEL) som linjeskift,
  89.    men fordi det finnes s} mange rare linje-separatorer ute i verden
  90.    (QNX bruker f.eks. CTRL-T) lar jeg pep tolke "ukjente" kontroll-tegn
  91.    som linjeskift.  Det har f|lgende fordeler:
  92.    * Dersom det virkelig er ment som en ukurant linjeseparator blir
  93.      folk stort sett forn|yde.
  94.    * Dersom det ikke er ment slik er i all fall en slik ekstra linjeskift
  95.      tydelig nok til at brukere legger fort merke til det, og kan g}
  96.      inn og fikse tingene manuellt i en editor.
  97.    * Dersom man vasker tekst ut av en virkelig bin{r fil (f.eks. et
  98.      eksekverbart program) gj|r det seg godt med hver ekstraherte streng
  99.      p} en linje for seg.
  100.  
  101.  
  102. VMS Record format
  103. -----------------
  104.  
  105. Sp|rsm}l
  106.    Etter } ha vasket en fil med pep vil en del VMS program ikke lenger
  107.    vite av den.  F|r vaskingen sa dir/full at filen hadde:
  108.  
  109.     Record format: Variable length, maximum 72 bytes
  110.  
  111.    Den filen pep har laget har imidlertid:
  112.  
  113.     Record format: Stream_LF
  114.  
  115. Svar:
  116.    Du kan f} tilbake "variable length" record format med VMS-programmet
  117.    CONVERT.  Dette er mer inng}ende behandlet i filen "pepvms.txt", som
  118.    er en av de dokumentasjonsfilene som f|lger med pep.
  119.  
  120.  
  121. Word Perfect til ASCII
  122. ----------------------
  123.  
  124. Sp|rsm}l:
  125.    Finnes det noe filter som konverterer fra Word Perfect til ASCII?
  126.    Har sett p} pep, men det ser ikke ut til } hjelpe.
  127.  
  128. Svar:
  129.    Grunnen til at dette ikke er bygget inn i pep, er at Word Perfect
  130.    fikser det selv.  Funksjonen heter "store as DOS-text" og ligger
  131.    p} CTRL-F5.
  132.  
  133.  
  134. Displaywrite til ASCII
  135. ----------------------
  136.  
  137. Sp|rsm}l:
  138.    Er det mulig } konvertere filer skrevet med DisplayWrite med PEP?
  139.  
  140. Svar:
  141.    Det finnes en konverteringstabell "ebc2ns7" som konverterer
  142.    Displaywrite til 7-bits norsk ASCII.  Det oppsettet av opsjoner
  143.    jeg synes fungerer best er:
  144.  
  145.     pep -gebc2ns7 -b -s INNDATA.TXT > UTDATA.TXT
  146.  
  147.    (Hvor INNDATA.TXT og UTDATA.TXT byttes med navn p} dine filer).
  148.  
  149.    Resultatet kan du evt. peppe videre med kommandoer som:
  150.  
  151.     pep -i+ -o UTDATA.TXT
  152.  
  153.    for } lage 8-bits IBM-tegnset, etc.
  154.  
  155.    Jeg har d}rlig dokumentasjon av DisplayWrite-formatet (kun ett eksempel),
  156.    og derfor kan f.eks. norsk [\] bli borte.  Tabellen "ebc2ns7" b|r
  157.    derfor forbedres.  Brukere skal derfor v{re klar over at denne er en
  158.    vanlig tekstfil som kan redigeres i en vanlig editor, og det er derfor
  159.    enkelt for en bruker } selv forbedre denne etterhvert som han eller hun
  160.    f}r mer erfaring med hvordan norske tegn representeres i DisplayWrite.
  161.  
  162.  
  163. MacIntosh til Digital multinasjonalt tegnsett
  164. ---------------------------------------------
  165.  
  166. Sp|rsm}l:
  167.    Er det mulig } bruke PEP til } konvertere filer mellom MacIntosh og
  168.    Digitals multinasjonalt tegnsett?
  169.  
  170. Svar:
  171.    For } konvertere mellom Mac og Dec multinasjonalt tegnsett b|r du
  172.    lage deg dine egne konverteringstabeller ("dec2mac" og "mac2dec")
  173.    og spesifisere disse med -g opsjonen.  Dessuten b|r du bruke -u-opsjonen
  174.    for } f} korrekt linjeterminator: -ur n}r du konverterer til MacIntosh
  175.    og -un n}r du konverterer til Dec-format.
  176.  
  177.   Dersom du lager "dec2mac" og "mac2dec" konverteringstabeller, vil jeg
  178.   gjerne ha en kopi av en for } legge med framtidige distribusjoner av
  179.   pep.
  180.  
  181.  
  182. Nye Konverteringstabeller
  183. -------------------------
  184.  
  185. Sp|rsm}l:
  186.    Hvordan f}r jeg tak i konverteringstabeller for nye format?
  187.  
  188. Svar:
  189.    Peps konverteringstabeller er vanlige ASCII tekstfiler, og du kan b}de
  190.    endre p} eksisterende og lage nye med en vanlig editor.  Du b|r
  191.    imidlertid bruke en editor som ikke legger styrekoder inn i teksten,
  192.    som f.eks.: EDLIN, MicroEMACS eller BRAGE.
  193.  
  194.  
  195. Sp|rsm}l:
  196.    N}r man lager sine egne konverteringstabeller, hva gj|r man med tegn
  197.    i det ene settet som ikke har motsvarighet i det andre (eksempelvis
  198.    Trademark-tegnet p} Mac).  Setter du inn blank eller bare oppgir du
  199.    tegnet uten motsvarighet.
  200.  
  201. Svar:
  202.    Du m} alltid oppgi et tegn.  Dette kan f.eks. v{re blank (32), eller
  203.    punktum (46).  Noen bruker ogs} et "sjeldent" tegn som "@" (64) for
  204.    } s|ke etter det i en editor etterp}, slik at de f.eks. erstatte det
  205.    med strengen "<Tm>" dersom "trademark" mangler i tegnsettet.  Denne
  206.    teknikken kan delvis kompensere for at Pep desverre ikke klarer }
  207.    erstatte et tegn med en streng av tegn.
  208.  
  209.  
  210. Hvilke kontrolltegn finnes i filen
  211. ----------------------------------
  212.  
  213. Sp|rsm}l:
  214.    Jeg har en fil (foo.bar) som jeg fors|ker } f} inn i et arkivsystem.
  215.    Desverre inneholder den en del "rare" tegn.  Jeg har fors|kt b}de
  216.    kommandoene:
  217.  
  218.     pep -o foo.bar
  219.  
  220.    og
  221.  
  222.     pep -o -b foo.bar
  223.  
  224.    men i det f|rste tilfelle inneholder fortsatt resultatet "grums";
  225.    og i det andre tilfellet mangler det tegn.  Hvilke pep-opsjoner er
  226.    de riktige?  Jeg har lest manualen, men vet jo ikke hva som egentlig
  227.    ligger i filen.  Du har tidligere sagt at -x opsjonen kan brukes
  228.    til } se hva filen inneholder.  Kan du forklare det litt n{rmere?
  229.  
  230. Svar:
  231.    Fors|k f|lgende:
  232.  
  233.    1) Ekspander "rare" tegn til heksdesimal.  Kommandoen er:
  234.  
  235.     pep -b -x foo.org > foo.ut
  236.  
  237.    2) Ta filen "foo.ut" inn i en vanlig editor (det m} v{re en ASCII
  238.       editor som "emacs" eller "edt", ikke et tekstbehandlingssystem).
  239.       Let gjennom filen etter heksadesimale tall i hakeparanteser.
  240.       (Disse ser feks. slik ut: "<a9h>", "<81h>", o.l. og den
  241.       enkleste m}ten} finne dem p} er } bruke editoren til }
  242.       s|ke etter strengen "h>".)  Lag en liste over disse, og
  243.       fors|k } avgj|re ut fra sammenhengen hvilket tegn de er
  244.       ment } v{re.  La oss f.eks. si at du oppdager at "<a9h>"
  245.       sannsynligvis er et spesialtegn for lang bindestrek.
  246.  
  247.    3) Bruk editorfunksjonen for gjennomg}ende s|king og erstatning
  248.       til } bytte ut "<a9h>" med "--" (den beste lange bindestrek
  249.       vi kan f} til med et begrenset tegnsett).  Gj|r deretter
  250.       tilsvarende med de andre "rare" tegnene som du fant
  251.       betydningen av.
  252.  
  253.    4) S|k til slutt p} nytt etter "h>" og rett opp evt. gjenv{rende
  254.       koder for h}nd, eller slett dem.
  255.  
  256.  
  257. Konvertering av database
  258. ------------------------
  259.  
  260. Sp|rsm}l:
  261.    Jeg fors|ker } konvertere tegnsettet i en databasefil fra IBM-PC
  262.    tegnsett til ISO 8859/1 ved hjelp av pep.  Dette er en fil som
  263.    tydligvis inneholder en del tegn PEP ikke klarer } oversette riktig.
  264.    De norske tegnene blir riktig konvertert, men alt med ASCII verdi
  265.    under 32 forsvinner.  Resultatet er at databasen krasjer.
  266.    Har du noen ideer?
  267.  
  268. Svar:
  269.    Beklager, du fors|ker } gj|re noe som pep ikke kan.  Pep er et
  270.    program som fors|ker } lage normale tekstfiler av det meste.
  271.    Det egner seg d}rlig til oppgaver der *utfilen* m} inneholde
  272.    ikke-tekstlig informasjon, som indekser i en database eller
  273.    maskininstruksjoner i et program.
  274.  
  275.    Problemet er at pep ikke er i stand til } skille mellom tegn som
  276.    er en del av dataene (og alts} skal konverteres), og byter med
  277.    tilsvarende ASCII-verdier som inng}r i indekser og pekere (og
  278.    som ikke skal r|res).  Fordi pep ikke vet noe om hvilke bytes
  279.    som er data, og hvilke som er deler av indekser, blir alt
  280.    konvertert, og databasen blir |delagt.
  281.  
  282.    De fleste databaser har imidlertid en funksjon som tillater deg
  283.    } skrive hele innholdet av databasen ut p} en tekstfil.  Dette
  284.    kan enten v{re en fil med fast recordlengde, eller det kan v{re
  285.    en fil der et eller annet tegn (vanligvis komma) brukes som
  286.    record-separator.  I s} fall kan du gj|re f|lgende:
  287.  
  288.     1) Skriv innholdet av databasen ut p} en tekstfil.
  289.     2) Bruk pep til } konvertere tegnsettet i denne tekstfilen.
  290.     3) Les den konverterte tekstfilen inn i databasen igjen.
  291.  
  292.  
  293. Skjermbilder til dokumentasjon
  294. ------------------------------
  295.  
  296. Brev:
  297.    Har nettopp lastet ned siste versjon av Pep, og kan rapportere f|lgende:
  298.    Den kompilerer greit p} Apollos kompilator (ver. 5.3).  Noen advarsler,
  299.    men funker bra uten noen endringer.
  300.  
  301.    Den har n} l|st et problem for oss. V}r tekniske forfatter trenger kopi
  302.    av skjermbilder for manualene v}re.  Vi gjorde f|lgende:
  303.  
  304.    Startet vt100-emulator p} Apollo. Startet telnet p} f|lgende m}te:
  305.  
  306.     telnet | tee dump.pep
  307.  
  308.    Telnettet til Nord-maskinen, og kj|rte applikasjonen i vt100-modus.
  309.    Etter pepping med
  310.  
  311.     pep -e1 < dump.pep > dump.txt
  312.  
  313.    fikk vi en ASCII-fil med bilder av skjermbilder, som bare trenger
  314.    litt bearbeiding f|r vi kan legge filene inn i tekstbehandlings-
  315.    systemet.
  316.  
  317.    Dette er vi meget forn|yd med, neste gang vi sees p} passende
  318.    sted, vanker det nok en pils eller to.
  319.  
  320. Svar:
  321.    Finnes det flere forn|de brukere tro?
  322.  
  323.  
  324. \delagt FAT
  325. -----------
  326.  
  327. Sp|rsm}l:
  328.    Jeg har en diskett som ikke lenger lar seg lese p} vanlig m}te.
  329.    Jeg vet for lite om DOS filsystem til at jeg kan redde den ved }
  330.    redigere FAT, eller ved } bruke lavniv}verkt|y som Mace, Norton
  331.    eller PC-tools.  Finnes noe h}p for de tekstfilene som befant seg
  332.    p} disketten.
  333.  
  334. Svar:
  335.    Ja.  Men metoden er langt fra perfekt:
  336.  
  337.    * Den kan bare brukes til } redde filer som hovedsakelig best}r
  338.      av vanlig ASCII tekst.  ARCede filer og programmer kan ikke
  339.      reddes.
  340.  
  341.    * Filene kommer til } trenge en god del redigering.  Du kan
  342.      risikere at rekkef|lgen kastes om, og all formaterings-
  343.      informasjon g}r tapt.  V{r forberedt p} } bruke en god del
  344.      tid p} } rydde opp i resultatet.
  345.  
  346.    N}r s} mye er sagt, la oss se p} metoden:
  347.  
  348.    I tillegg til pep trenger du et shareware program som heter
  349.    "teledisk".
  350.  
  351.    TELEDISK koster $25 og kan bestilles fra:
  352.     SYDEX, 153 North Murphy Ave., Sunnyvale, CA  94086.
  353.  
  354.    I Oslo ligger det ogs} kopier som kan lastes opp for evaluering.
  355.    Filen heter TELEDISK.ARC og ligger blant annet p}:
  356.     Oslo Online Services (02) 28 54 17
  357.     Infonet              (02) 33 36 72
  358.  
  359.    For } redde tekstfilene g}r du fram p} f|lgende m}te:
  360.  
  361.    1) Ved hjelp av "teledisk" tar du en verbatim kopi av hele den
  362.       skadde disketten til en vanlig fil p} harddisken.  Du starter
  363.       teledisk uten opsjoner.  Inne i teledisk b|r du velge f|lgende
  364.       fra menyen:
  365.     - Check diskette for data: both sides
  366.     - Read which sectors:       all
  367.     - Data compression method: normal
  368.       Du kan selv velge navn p} filen.  La oss si at kaller den for
  369.       "vrakgods".  Filen med dataene fra disken vil da bli hetende
  370.       "vrakgods.td0".
  371.  
  372.    2) Vask ut alt annet enn ASCII-tekst fra denne filen pep.  Det
  373.       kan du for eksempel gj|re med kommandoen:
  374.     pep -b -s6 vrakgods.td0 > vrakgods.txt
  375.       Men her kan det l|nne seg } ekperimentere med forskjellige
  376.       styrkegrader p} filterne.
  377.  
  378.    Resultatet ("vrakgods.txt") vil som sagt trenge redigering, men alt
  379.    er vel bedre enn } taste inn alt p} nytt?
  380.  
  381.  
  382. Norske tegn
  383. -----------
  384.  
  385. Sp|rsm}l:
  386.   Hvordan er norske tegn representert i forskjellige 8-bits tegnsett?
  387.  
  388. Svar:
  389.    Heksadesimalt:
  390.    +-----------+-----------+-----------+-----------+-----------+-----------+
  391.    !           !  ISO 646  ! ISO8859/1 !  IBM-PC   !   Apple   !    H-P    !
  392.    !  Bokstav  !  NS 4551  !  X3.134.2 !  CP 850   ! MacIntosh !  Roman 8  !
  393.    !           !  NORSK I  !  DEC m/n  !           !           !           !
  394.    +-----------+-----------+-----------+-----------+-----------+-----------+
  395.    !  AE  ([)  !     5b    !     c6    !     92    !     ae    !     d3    !
  396.    !  OE  (\)  !     5c    !     d8    !     9d    !     af    !     d2    !
  397.    !  AA  (])  !     5d    !     c5    !     8f    !     81    !     d0    !
  398.    !  ae  ({)  !     7b    !     e6    !     91    !     be    !     d7    !
  399.    !  oe  (|)  !     7c    !     f8    !     9b    !     bf    !     d6    !
  400.    !  aa  (})  !     7d    !     e5    !     86    !     8c    !     d4    !
  401.    +-----------+-----------+-----------+-----------+-----------+-----------+
  402.  
  403.    Desimalt:
  404.    +-----------+-----------+-----------+-----------+-----------+-----------+
  405.    !           !  ISO 646  ! ISO8859/1 !  IBM-PC   !   Apple   !    H-P    !
  406.    !  Bokstav  !  NS 4551  !  X3.134.2 !  CP 850   ! MacIntosh !  Roman 8  !
  407.    !           !  NORSK I  !  DEC m/n  !           !           !           !
  408.    +-----------+-----------+-----------+-----------+-----------+-----------+
  409.    !  AE  ([)  !     91    !    198    !    146    !    174    !    211    !
  410.    !  OE  (\)  !     92    !    216    !    157    !    175    !    210    !
  411.    !  AA  (])  !     93    !    197    !    143    !    129    !    208    !
  412.    !  ae  ({)  !    123    !    230    !    145    !    190    !    215    !
  413.    !  oe  (|)  !    124    !    248    !    155    !    191    !    214    !
  414.    !  aa  (})  !    125    !    229    !    134    !    140    !    212    !
  415.    +-----------+-----------+-----------+-----------+-----------+-----------+
  416.  
  417.  
  418. Forslag til filtersettinger
  419. ---------------------------
  420.  
  421. Nedenfor f|lger det en del filtersettinger som har vist seg } rimelig godt.
  422. Dette er kun forslag.  Du b|r ofte eksperimentere for } komme fram til
  423. de riktige settingene for ditt problem.
  424.  
  425. DisplayWrite:    pep -gebc2ns7 -b -s inndata.dw4 > utdata.txt
  426.  
  427. PowerPoint:    pep -m- -b inndata.pp > utdata.txt
  428.         Foilene vil ligge i motsatt rekkef|lge i tekst-filen.
  429. ..EOF
  430.