home *** CD-ROM | disk | FTP | other *** search
open in:
MacOS 8.1
|
Win98
|
DOS
browse contents |
view JSON data
|
view as text
This file was processed as: SHell self-extracting ARchive
(archive/shar).
Confidence | Program | Detection | Match Type | Support
|
---|
100%
| dexvert
| SHell self-extracting ARchive (archive/shar)
| magic
| Supported |
100%
| dexvert
| Mailbox/MIME Entity (archive/mbox)
| magic
| Supported |
100%
| dexvert
| Internet Message Format (text/imf)
| magic
| Supported |
1%
| dexvert
| Text File (text/txt)
| fallback
| Supported |
100%
| file
| Mailbox text, 1st line "From jbuck@epimass.UUCP Fri Mar 6 21:00:36 1987"
| default
| |
99%
| file
| C source text
| default
| |
98%
| file
| C source, ASCII text
| default
| |
100%
| TrID
| E-Mail message (Var. 2)
| default
| |
100%
| checkBytes
| Printable ASCII
| default
| |
100%
| perlTextCheck
| Likely Text (Perl)
| default
| |
100%
| siegfried
| fmt/329 Shell Archive Format
| default
| |
100%
| gt2
| HTML (Hyper Text Markup Language) Datei
| default
| |
100%
| detectItEasy
| Format: plain text[LF]
| default (weak)
| |
100%
| xdgMime
| application/mbox
| default
|
|
hex view+--------+-------------------------+-------------------------+--------+--------+
|00000000| 46 72 6f 6d 20 6a 62 75 | 63 6b 40 65 70 69 6d 61 |From jbu|ck@epima|
|00000010| 73 73 2e 55 55 43 50 20 | 46 72 69 20 4d 61 72 20 |ss.UUCP |Fri Mar |
|00000020| 20 36 20 32 31 3a 30 30 | 3a 33 36 20 31 39 38 37 | 6 21:00|:36 1987|
|00000030| 0a 50 61 74 68 3a 20 62 | 65 6e 6f 21 73 65 69 73 |.Path: b|eno!seis|
|00000040| 6d 6f 21 65 70 69 77 72 | 6c 21 65 70 69 6d 61 73 |mo!epiwr|l!epimas|
|00000050| 73 21 6a 62 75 63 6b 0a | 46 72 6f 6d 3a 20 6a 62 |s!jbuck.|From: jb|
|00000060| 75 63 6b 40 65 70 69 6d | 61 73 73 2e 55 55 43 50 |uck@epim|ass.UUCP|
|00000070| 20 28 4a 6f 65 20 42 75 | 63 6b 29 0a 4e 65 77 73 | (Joe Bu|ck).News|
|00000080| 67 72 6f 75 70 73 3a 20 | 6e 65 74 2e 73 6f 75 72 |groups: |net.sour|
|00000090| 63 65 73 0a 53 75 62 6a | 65 63 74 3a 20 52 65 76 |ces.Subj|ect: Rev|
|000000a0| 69 73 65 64 20 61 6e 64 | 20 69 6d 70 72 6f 76 65 |ised and| improve|
|000000b0| 64 20 6d 61 72 6b 6f 76 | 33 2c 20 61 20 55 73 65 |d markov|3, a Use|
|000000c0| 6e 65 74 20 61 72 74 69 | 63 6c 65 20 67 65 6e 65 |net arti|cle gene|
|000000d0| 72 61 74 6f 72 0a 4d 65 | 73 73 61 67 65 2d 49 44 |rator.Me|ssage-ID|
|000000e0| 3a 20 3c 39 35 34 40 65 | 70 69 6d 61 73 73 2e 55 |: <954@e|pimass.U|
|000000f0| 55 43 50 3e 0a 44 61 74 | 65 3a 20 37 20 4d 61 72 |UCP>.Dat|e: 7 Mar|
|00000100| 20 38 37 20 30 32 3a 30 | 30 3a 33 36 20 47 4d 54 | 87 02:0|0:36 GMT|
|00000110| 0a 4f 72 67 61 6e 69 7a | 61 74 69 6f 6e 3a 20 45 |.Organiz|ation: E|
|00000120| 6e 74 72 6f 70 69 63 20 | 50 72 6f 63 65 73 73 69 |ntropic |Processi|
|00000130| 6e 67 2c 20 49 6e 63 2e | 2c 20 43 75 70 65 72 74 |ng, Inc.|, Cupert|
|00000140| 69 6e 6f 2c 20 43 41 0a | 4c 69 6e 65 73 3a 20 37 |ino, CA.|Lines: 7|
|00000150| 35 38 0a 0a 23 21 20 2f | 62 69 6e 2f 73 68 0a 23 |58..#! /|bin/sh.#|
|00000160| 20 54 68 69 73 20 69 73 | 20 61 20 73 68 65 6c 6c | This is| a shell|
|00000170| 20 61 72 63 68 69 76 65 | 2c 20 6d 65 61 6e 69 6e | archive|, meanin|
|00000180| 67 3a 0a 23 20 31 2e 20 | 52 65 6d 6f 76 65 20 65 |g:.# 1. |Remove e|
|00000190| 76 65 72 79 74 68 69 6e | 67 20 61 62 6f 76 65 20 |verythin|g above |
|000001a0| 74 68 65 20 23 21 20 2f | 62 69 6e 2f 73 68 20 6c |the #! /|bin/sh l|
|000001b0| 69 6e 65 2e 0a 23 20 32 | 2e 20 53 61 76 65 20 74 |ine..# 2|. Save t|
|000001c0| 68 65 20 72 65 73 75 6c | 74 69 6e 67 20 74 65 78 |he resul|ting tex|
|000001d0| 74 20 69 6e 20 61 20 66 | 69 6c 65 2e 0a 23 20 33 |t in a f|ile..# 3|
|000001e0| 2e 20 45 78 65 63 75 74 | 65 20 74 68 65 20 66 69 |. Execut|e the fi|
|000001f0| 6c 65 20 77 69 74 68 20 | 2f 62 69 6e 2f 73 68 20 |le with |/bin/sh |
|00000200| 28 6e 6f 74 20 63 73 68 | 29 20 74 6f 20 63 72 65 |(not csh|) to cre|
|00000210| 61 74 65 20 74 68 65 20 | 66 69 6c 65 73 3a 0a 23 |ate the |files:.#|
|00000220| 09 52 45 41 44 4d 45 0a | 23 09 6d 61 72 6b 6f 76 |.README.|#.markov|
|00000230| 33 2e 6c 0a 23 09 6d 61 | 72 6b 6f 76 33 2e 36 0a |3.l.#.ma|rkov3.6.|
|00000240| 23 09 4d 61 6b 65 66 69 | 6c 65 0a 23 09 67 65 74 |#.Makefi|le.#.get|
|00000250| 6f 70 74 2e 63 0a 23 09 | 50 41 54 43 48 4c 45 56 |opt.c.#.|PATCHLEV|
|00000260| 45 4c 0a 23 20 54 68 69 | 73 20 61 72 63 68 69 76 |EL.# Thi|s archiv|
|00000270| 65 20 63 72 65 61 74 65 | 64 3a 20 46 72 69 20 4d |e create|d: Fri M|
|00000280| 61 72 20 20 36 20 31 37 | 3a 35 37 3a 32 38 20 31 |ar 6 17|:57:28 1|
|00000290| 39 38 37 0a 65 78 70 6f | 72 74 20 50 41 54 48 3b |987.expo|rt PATH;|
|000002a0| 20 50 41 54 48 3d 2f 62 | 69 6e 3a 24 50 41 54 48 | PATH=/b|in:$PATH|
|000002b0| 0a 69 66 20 74 65 73 74 | 20 2d 66 20 27 52 45 41 |.if test| -f 'REA|
|000002c0| 44 4d 45 27 0a 74 68 65 | 6e 0a 09 65 63 68 6f 20 |DME'.the|n..echo |
|000002d0| 73 68 61 72 3a 20 77 69 | 6c 6c 20 6e 6f 74 20 6f |shar: wi|ll not o|
|000002e0| 76 65 72 2d 77 72 69 74 | 65 20 65 78 69 73 74 69 |ver-writ|e existi|
|000002f0| 6e 67 20 66 69 6c 65 20 | 22 27 52 45 41 44 4d 45 |ng file |"'README|
|00000300| 27 22 0a 65 6c 73 65 0a | 63 61 74 20 3c 3c 20 5c |'".else.|cat << \|
|00000310| 53 48 41 52 5f 45 4f 46 | 20 3e 20 27 52 45 41 44 |SHAR_EOF| > 'READ|
|00000320| 4d 45 27 0a 54 68 69 73 | 20 69 73 20 61 20 63 6c |ME'.This| is a cl|
|00000330| 65 61 6e 65 64 2d 75 70 | 20 72 65 70 6f 73 74 69 |eaned-up| reposti|
|00000340| 6e 67 20 6f 66 20 74 68 | 65 20 6d 61 72 6b 6f 76 |ng of th|e markov|
|00000350| 33 20 70 72 6f 67 72 61 | 6d 2e 20 20 54 68 65 20 |3 progra|m. The |
|00000360| 66 6f 6c 6c 6f 77 69 6e | 67 0a 63 68 61 6e 67 65 |followin|g.change|
|00000370| 73 20 68 61 76 65 20 62 | 65 65 6e 20 6d 61 64 65 |s have b|een made|
|00000380| 3a 0a 0a 54 68 65 20 6e | 75 6c 6c 20 70 6f 69 6e |:..The n|ull poin|
|00000390| 74 65 72 20 64 65 72 65 | 66 65 72 65 6e 63 69 6e |ter dere|ferencin|
|000003a0| 67 20 62 75 67 73 20 68 | 61 76 65 20 62 65 65 6e |g bugs h|ave been|
|000003b0| 20 66 69 78 65 64 20 28 | 49 20 68 6f 70 65 29 2e | fixed (|I hope).|
|000003c0| 0a 0a 54 68 65 20 63 6f | 64 65 20 74 68 61 74 20 |..The co|de that |
|000003d0| 75 73 65 73 20 22 72 61 | 6e 64 22 20 73 68 6f 75 |uses "ra|nd" shou|
|000003e0| 6c 64 20 6e 6f 77 20 62 | 65 20 70 6f 72 74 61 62 |ld now b|e portab|
|000003f0| 6c 65 20 28 74 68 65 20 | 70 61 74 63 68 65 73 20 |le (the |patches |
|00000400| 70 6f 73 74 65 64 0a 74 | 6f 20 74 68 65 20 6e 65 |posted.t|o the ne|
|00000410| 74 20 74 6f 20 66 69 78 | 20 74 68 69 73 20 70 72 |t to fix| this pr|
|00000420| 6f 62 6c 65 6d 20 77 65 | 72 65 20 77 72 6f 6e 67 |oblem we|re wrong|
|00000430| 2c 20 74 68 65 79 20 62 | 72 65 61 6b 20 74 68 65 |, they b|reak the|
|00000440| 20 63 6f 64 65 20 6f 6e | 0a 73 6f 6d 65 20 6d 61 | code on|.some ma|
|00000450| 63 68 69 6e 65 73 20 69 | 6e 20 6f 72 64 65 72 20 |chines i|n order |
|00000460| 74 6f 20 66 69 78 20 69 | 74 20 6f 6e 20 6f 74 68 |to fix i|t on oth|
|00000470| 65 72 73 2e 20 20 49 20 | 73 74 6f 6c 65 20 73 6f |ers. I |stole so|
|00000480| 6d 65 20 63 6f 64 65 20 | 66 72 6f 6d 0a 22 68 61 |me code |from."ha|
|00000490| 63 6b 22 20 74 6f 20 64 | 6f 20 74 68 69 6e 67 73 |ck" to d|o things|
|000004a0| 20 72 69 67 68 74 2e 20 | 20 49 66 20 68 61 63 6b | right. | If hack|
|000004b0| 20 77 6f 72 6b 73 20 66 | 6f 72 20 79 6f 75 2c 20 | works f|or you, |
|000004c0| 74 68 69 73 20 73 68 6f | 75 6c 64 29 2e 0a 0a 6d |this sho|uld)...m|
|000004d0| 61 72 6b 6f 76 33 20 6e | 6f 77 20 75 6e 64 65 72 |arkov3 n|ow under|
|000004e0| 73 74 61 6e 64 73 20 22 | 6e 6f 74 65 73 22 20 63 |stands "|notes" c|
|000004f0| 72 75 66 74 20 28 74 68 | 61 6e 6b 73 20 74 6f 20 |ruft (th|anks to |
|00000500| 52 69 63 68 20 53 61 6c | 7a 29 2e 0a 0a 42 65 63 |Rich Sal|z)...Bec|
|00000510| 61 75 73 65 20 6f 66 20 | 74 68 65 20 35 30 25 20 |ause of |the 50% |
|00000520| 72 75 6c 65 20 69 6e 20 | 6e 65 77 73 20 32 2e 31 |rule in |news 2.1|
|00000530| 31 2c 20 70 65 6f 70 6c | 65 20 6f 66 74 65 6e 20 |1, peopl|e often |
|00000540| 75 73 65 20 73 6f 6d 65 | 20 6f 74 68 65 72 0a 63 |use some| other.c|
|00000550| 68 61 72 61 63 74 65 72 | 20 74 68 61 6e 20 22 3e |haracter| than ">|
|00000560| 22 20 66 6f 72 20 69 6e | 63 6c 75 73 69 6f 6e 73 |" for in|clusions|
|00000570| 2e 20 20 6d 61 72 6b 6f | 76 33 20 61 73 73 75 6d |. marko|v3 assum|
|00000580| 65 73 20 74 68 61 74 20 | 6c 69 6e 65 73 0a 62 65 |es that |lines.be|
|00000590| 67 69 6e 6e 69 6e 67 20 | 77 69 74 68 20 61 6e 79 |ginning |with any|
|000005a0| 20 6f 66 20 0a 0a 09 3e | 20 3c 20 29 20 7c 20 23 | of ...>| < ) | #|
|000005b0| 20 7d 20 5d 0a 0a 61 72 | 65 20 69 6e 63 6c 75 73 | } ]..ar|e inclus|
|000005c0| 69 6f 6e 73 20 28 77 69 | 74 68 6f 75 74 20 74 68 |ions (wi|thout th|
|000005d0| 69 73 20 72 75 6c 65 2c | 20 66 75 6e 6e 79 2d 6c |is rule,| funny-l|
|000005e0| 6f 6f 6b 69 6e 67 20 6f | 75 74 70 75 74 20 72 65 |ooking o|utput re|
|000005f0| 73 75 6c 74 73 20 69 66 | 0a 61 6e 79 6f 6e 65 20 |sults if|.anyone |
|00000600| 75 73 65 73 20 6e 6f 6e | 2d 73 74 61 6e 64 61 72 |uses non|-standar|
|00000610| 64 20 22 71 75 6f 74 69 | 6e 67 22 29 2e 0a 0a 54 |d "quoti|ng")...T|
|00000620| 68 65 20 72 61 6e 64 6f | 6d 20 6e 75 6d 62 65 72 |he rando|m number|
|00000630| 20 67 65 6e 65 72 61 74 | 6f 72 20 69 73 20 69 6e | generat|or is in|
|00000640| 69 74 69 61 6c 69 7a 65 | 64 20 75 73 69 6e 67 20 |itialize|d using |
|00000650| 74 68 65 20 74 69 6d 65 | 2c 20 69 66 20 6e 65 69 |the time|, if nei|
|00000660| 74 68 65 72 0a 74 68 65 | 20 2d 73 20 66 6c 61 67 |ther.the| -s flag|
|00000670| 20 6e 6f 72 20 74 68 65 | 20 6e 65 77 20 2d 78 20 | nor the| new -x |
|00000680| 66 6c 61 67 20 69 73 20 | 67 69 76 65 6e 2e 0a 0a |flag is |given...|
|00000690| 54 68 69 73 20 77 69 6c | 6c 20 62 65 20 74 68 65 |This wil|l be the|
|000006a0| 20 6c 61 73 74 20 63 6f | 6d 70 6c 65 74 65 20 70 | last co|mplete p|
|000006b0| 6f 73 74 69 6e 67 3b 20 | 61 20 22 70 61 74 63 68 |osting; |a "patch|
|000006c0| 6c 65 76 65 6c 22 20 66 | 69 6c 65 20 69 73 20 69 |level" f|ile is i|
|000006d0| 6e 63 6c 75 64 65 64 0a | 61 6e 64 20 49 20 77 69 |ncluded.|and I wi|
|000006e0| 6c 6c 20 73 65 6e 64 20 | 6f 75 74 20 70 61 74 63 |ll send |out patc|
|000006f0| 68 65 73 20 69 66 20 74 | 68 65 72 65 20 61 72 65 |hes if t|here are|
|00000700| 20 66 75 72 74 68 65 72 | 20 62 75 67 73 20 6f 72 | further| bugs or|
|00000710| 20 69 6d 70 72 6f 76 65 | 6d 65 6e 74 73 2e 0a 0a | improve|ments...|
|00000720| 48 65 72 65 27 73 20 74 | 68 65 20 6f 72 69 67 69 |Here's t|he origi|
|00000730| 6e 61 6c 20 52 45 41 44 | 4d 45 2e 0a 2d 2d 2d 2d |nal READ|ME..----|
|00000740| 2d 2d 2d 2d 2d 2d 2d 2d | 2d 2d 2d 2d 2d 2d 2d 2d |--------|--------|
|00000750| 2d 2d 2d 2d 2d 2d 2d 2d | 2d 2d 2d 2d 2d 2d 2d 2d |--------|--------|
|00000760| 2d 2d 2d 2d 2d 2d 2d 2d | 2d 2d 2d 2d 2d 2d 2d 2d |--------|--------|
|00000770| 2d 2d 2d 2d 2d 2d 2d 2d | 2d 2d 2d 2d 2d 2d 2d 2d |--------|--------|
|00000780| 2d 2d 2d 2d 2d 2d 2d 0a | 49 20 63 72 65 61 74 65 |-------.|I create|
|00000790| 64 20 61 20 62 69 74 20 | 6f 66 20 61 20 73 74 69 |d a bit |of a sti|
|000007a0| 72 20 77 69 74 68 20 74 | 68 69 73 20 70 72 6f 67 |r with t|his prog|
|000007b0| 72 61 6d 20 69 6e 20 44 | 65 63 65 6d 62 65 72 20 |ram in D|ecember |
|000007c0| 31 39 38 36 20 77 68 65 | 6e 20 49 0a 75 73 65 64 |1986 whe|n I.used|
|000007d0| 20 61 6e 20 65 61 72 6c | 69 65 72 20 76 65 72 73 | an earl|ier vers|
|000007e0| 69 6f 6e 20 6f 66 20 69 | 74 20 74 6f 20 73 69 6d |ion of i|t to sim|
|000007f0| 75 6c 61 74 65 20 61 20 | 63 65 72 74 61 69 6e 20 |ulate a |certain |
|00000800| 77 65 6c 6c 2d 6b 6e 6f | 77 6e 20 6e 65 74 0a 70 |well-kno|wn net.p|
|00000810| 65 72 73 6f 6e 61 6c 69 | 74 79 20 28 48 69 20 4c |ersonali|ty (Hi L|
|00000820| 61 75 72 61 21 29 2e 20 | 20 49 74 20 64 69 67 65 |aura!). | It dige|
|00000830| 73 74 73 20 55 73 65 6e | 65 74 20 61 72 74 69 63 |sts Usen|et artic|
|00000840| 6c 65 73 20 61 6e 64 20 | 73 70 69 74 73 20 6f 75 |les and |spits ou|
|00000850| 74 0a 6f 74 68 65 72 20 | 61 72 74 69 63 6c 65 73 |t.other |articles|
|00000860| 20 77 69 74 68 20 73 69 | 6d 69 6c 61 72 20 63 68 | with si|milar ch|
|00000870| 61 72 61 63 74 65 72 69 | 73 74 69 63 73 2e 20 20 |aracteri|stics. |
|00000880| 59 6f 75 20 6e 65 65 64 | 20 6c 65 78 20 74 6f 20 |You need| lex to |
|00000890| 72 75 6e 20 69 74 2c 0a | 62 75 74 20 6f 74 68 65 |run it,.|but othe|
|000008a0| 72 77 69 73 65 20 69 74 | 20 73 68 6f 75 6c 64 20 |rwise it| should |
|000008b0| 72 75 6e 20 6f 6e 20 61 | 6e 79 20 55 6e 69 78 20 |run on a|ny Unix |
|000008c0| 49 20 6b 6e 6f 77 20 6f | 66 2e 20 20 0a 0a 49 20 |I know o|f. ..I |
|000008d0| 68 61 64 20 73 65 76 65 | 72 61 6c 20 72 65 71 75 |had seve|ral requ|
|000008e0| 65 73 74 73 20 66 6f 72 | 20 74 68 65 20 70 72 6f |ests for| the pro|
|000008f0| 67 72 61 6d 20 62 75 74 | 20 64 69 64 6e 27 74 20 |gram but| didn't |
|00000900| 63 6f 6e 73 69 64 65 72 | 20 69 74 0a 22 72 65 61 |consider| it."rea|
|00000910| 64 79 22 2e 20 20 49 74 | 27 73 20 61 73 20 72 65 |dy". It|'s as re|
|00000920| 61 64 79 20 61 73 20 69 | 74 20 77 69 6c 6c 20 65 |ady as i|t will e|
|00000930| 76 65 72 20 62 65 20 6e | 6f 77 2e 0a 0a 54 68 65 |ver be n|ow...The|
|00000940| 20 70 72 6f 67 72 61 6d | 20 75 73 65 73 20 67 65 | program| uses ge|
|00000950| 74 6f 70 74 28 33 29 2e | 20 20 54 68 65 72 65 20 |topt(3).| There |
|00000960| 61 72 65 20 73 65 76 65 | 72 61 6c 20 70 75 62 6c |are seve|ral publ|
|00000970| 69 63 2d 64 6f 6d 61 69 | 6e 20 76 65 72 73 69 6f |ic-domai|n versio|
|00000980| 6e 73 0a 61 76 61 69 6c | 61 62 6c 65 20 66 6f 72 |ns.avail|able for|
|00000990| 20 42 65 72 6b 65 6c 65 | 79 20 73 79 73 74 65 6d | Berkele|y system|
|000009a0| 73 20 66 72 6f 6d 20 74 | 68 65 20 6d 6f 64 2e 73 |s from t|he mod.s|
|000009b0| 6f 75 72 63 65 73 20 61 | 72 63 68 69 76 65 73 2e |ources a|rchives.|
|000009c0| 20 20 53 69 6e 63 65 0a | 69 74 27 73 20 73 6d 61 | Since.|it's sma|
|000009d0| 6c 6c 2c 20 49 27 76 65 | 20 69 6e 63 6c 75 64 65 |ll, I've| include|
|000009e0| 64 20 48 65 6e 72 79 20 | 53 70 65 6e 63 65 72 27 |d Henry |Spencer'|
|000009f0| 73 20 76 65 72 73 69 6f | 6e 2c 20 62 75 74 20 79 |s versio|n, but y|
|00000a00| 6f 75 27 6c 6c 20 68 61 | 76 65 0a 74 6f 20 63 68 |ou'll ha|ve.to ch|
|00000a10| 61 6e 67 65 20 74 68 65 | 20 4d 61 6b 65 66 69 6c |ange the| Makefil|
|00000a20| 65 20 74 6f 20 75 73 65 | 20 69 74 2e 0a 0a 46 6f |e to use| it...Fo|
|00000a30| 72 20 62 65 73 74 20 72 | 65 73 75 6c 74 73 2c 20 |r best r|esults, |
|00000a40| 66 65 65 64 20 69 74 20 | 61 74 20 6c 65 61 73 74 |feed it |at least|
|00000a50| 20 74 65 6e 20 61 72 74 | 69 63 6c 65 73 20 62 79 | ten art|icles by|
|00000a60| 20 74 68 65 20 73 61 6d | 65 20 70 65 72 73 6f 6e | the sam|e person|
|00000a70| 0a 6f 72 20 6f 6e 20 74 | 68 65 20 73 61 6d 65 20 |.or on t|he same |
|00000a80| 73 75 62 6a 65 63 74 2e | 20 20 49 66 20 74 68 65 |subject.| If the|
|00000a90| 72 65 20 61 72 65 20 66 | 65 77 65 72 20 61 72 74 |re are f|ewer art|
|00000aa0| 69 63 6c 65 73 20 74 68 | 65 20 6f 75 74 70 75 74 |icles th|e output|
|00000ab0| 0a 72 65 73 65 6d 62 6c | 65 73 20 74 68 65 20 6f |.resembl|es the o|
|00000ac0| 72 69 67 69 6e 61 6c 20 | 74 6f 6f 20 6d 75 63 68 |riginal |too much|
|00000ad0| 3b 20 69 66 20 74 68 65 | 72 65 20 69 73 20 74 6f |; if the|re is to|
|00000ae0| 6f 20 6d 75 63 68 20 76 | 61 72 69 65 74 79 20 69 |o much v|ariety i|
|00000af0| 6e 0a 74 68 65 20 61 72 | 74 69 63 6c 65 73 20 74 |n.the ar|ticles t|
|00000b00| 68 65 20 6f 75 74 70 75 | 74 20 69 73 20 6d 6f 72 |he outpu|t is mor|
|00000b10| 65 20 69 6e 63 6f 68 65 | 72 65 6e 74 20 74 68 61 |e incohe|rent tha|
|00000b20| 6e 20 69 74 20 6f 74 68 | 65 72 77 69 73 65 20 69 |n it oth|erwise i|
|00000b30| 73 2e 0a 0a 54 68 65 20 | 70 72 6f 67 72 61 6d 20 |s...The |program |
|00000b40| 72 65 71 75 69 72 65 73 | 20 6c 6f 74 73 20 6f 66 |requires| lots of|
|00000b50| 20 6d 65 6d 6f 72 79 20 | 69 66 20 69 74 20 69 73 | memory |if it is|
|00000b60| 20 67 69 76 65 6e 20 6c | 6f 74 73 20 6f 66 20 69 | given l|ots of i|
|00000b70| 6e 70 75 74 3b 0a 74 68 | 65 20 73 6d 61 6c 6c 2d |nput;.th|e small-|
|00000b80| 6d 6f 64 65 6c 20 70 65 | 6f 70 6c 65 20 77 69 6c |model pe|ople wil|
|00000b90| 6c 20 68 61 76 65 20 70 | 72 6f 62 6c 65 6d 73 2e |l have p|roblems.|
|00000ba0| 0a 0a 50 6c 65 61 73 65 | 20 64 6f 6e 27 74 20 70 |..Please| don't p|
|00000bb0| 6f 73 74 20 74 68 65 20 | 6f 75 74 70 75 74 20 74 |ost the |output t|
|00000bc0| 6f 20 74 68 65 20 6e 65 | 74 20 28 74 68 6f 75 67 |o the ne|t (thoug|
|00000bd0| 68 20 49 27 64 20 62 65 | 20 68 61 70 70 79 20 74 |h I'd be| happy t|
|00000be0| 6f 0a 73 65 65 20 73 6f | 6d 65 20 6f 66 20 74 68 |o.see so|me of th|
|00000bf0| 65 20 6d 6f 72 65 20 69 | 6e 74 65 72 65 73 74 69 |e more i|nteresti|
|00000c00| 6e 67 20 72 65 73 75 6c | 74 73 29 2e 0a 0a 53 65 |ng resul|ts)...Se|
|00000c10| 6e 64 20 63 6f 6d 6d 65 | 6e 74 73 2c 20 73 75 67 |nd comme|nts, sug|
|00000c20| 67 65 73 74 69 6f 6e 73 | 20 66 6f 72 20 69 6d 70 |gestions| for imp|
|00000c30| 72 6f 76 65 6d 65 6e 74 | 2c 20 66 61 6e 20 6d 61 |rovement|, fan ma|
|00000c40| 69 6c 2c 20 61 6e 64 20 | 66 6c 61 6d 65 73 0a 74 |il, and |flames.t|
|00000c50| 6f 20 6d 65 3a 20 7b 73 | 75 6e 2c 68 70 6c 61 62 |o me: {s|un,hplab|
|00000c60| 73 2c 61 6d 65 73 2c 69 | 68 6e 70 34 7d 21 6f 6c |s,ames,i|hnp4}!ol|
|00000c70| 69 76 65 62 21 65 70 69 | 6d 61 73 73 21 6a 62 75 |iveb!epi|mass!jbu|
|00000c80| 63 6b 2e 0a 53 48 41 52 | 5f 45 4f 46 0a 66 69 20 |ck..SHAR|_EOF.fi |
|00000c90| 23 20 65 6e 64 20 6f 66 | 20 6f 76 65 72 77 72 69 |# end of| overwri|
|00000ca0| 74 69 6e 67 20 63 68 65 | 63 6b 0a 69 66 20 74 65 |ting che|ck.if te|
|00000cb0| 73 74 20 2d 66 20 27 6d | 61 72 6b 6f 76 33 2e 6c |st -f 'm|arkov3.l|
|00000cc0| 27 0a 74 68 65 6e 0a 09 | 65 63 68 6f 20 73 68 61 |'.then..|echo sha|
|00000cd0| 72 3a 20 77 69 6c 6c 20 | 6e 6f 74 20 6f 76 65 72 |r: will |not over|
|00000ce0| 2d 77 72 69 74 65 20 65 | 78 69 73 74 69 6e 67 20 |-write e|xisting |
|00000cf0| 66 69 6c 65 20 22 27 6d | 61 72 6b 6f 76 33 2e 6c |file "'m|arkov3.l|
|00000d00| 27 22 0a 65 6c 73 65 0a | 63 61 74 20 3c 3c 20 5c |'".else.|cat << \|
|00000d10| 53 48 41 52 5f 45 4f 46 | 20 3e 20 27 6d 61 72 6b |SHAR_EOF| > 'mark|
|00000d20| 6f 76 33 2e 6c 27 0a 25 | 7b 0a 2f 2a 0a 20 2a 20 |ov3.l'.%|{./*. * |
|00000d30| 43 6f 70 79 72 69 67 68 | 74 20 28 63 29 20 31 39 |Copyrigh|t (c) 19|
|00000d40| 38 36 2c 20 31 39 38 37 | 20 62 79 20 4a 6f 65 20 |86, 1987| by Joe |
|00000d50| 42 75 63 6b 0a 20 2a 0a | 20 2a 20 50 65 72 6d 69 |Buck. *.| * Permi|
|00000d60| 73 73 69 6f 6e 20 69 73 | 20 67 72 61 6e 74 65 64 |ssion is| granted|
|00000d70| 20 74 6f 20 75 73 65 2c | 20 72 65 64 69 73 74 72 | to use,| redistr|
|00000d80| 69 62 75 74 65 2c 20 6f | 72 20 6d 6f 64 69 66 79 |ibute, o|r modify|
|00000d90| 20 74 68 69 73 20 70 72 | 6f 67 72 61 6d 2c 0a 20 | this pr|ogram,. |
|00000da0| 2a 20 61 73 20 6c 6f 6e | 67 20 61 73 20 79 6f 75 |* as lon|g as you|
|00000db0| 20 64 6f 6e 27 74 20 70 | 72 65 74 65 6e 64 20 79 | don't p|retend y|
|00000dc0| 6f 75 20 77 72 6f 74 65 | 20 69 74 2e 20 20 53 65 |ou wrote| it. Se|
|00000dd0| 6e 64 20 69 6d 70 72 6f | 76 65 6d 65 6e 74 73 20 |nd impro|vements |
|00000de0| 6f 72 0a 20 2a 20 62 75 | 67 20 72 65 70 6f 72 74 |or. * bu|g report|
|00000df0| 73 20 74 6f 20 7b 69 68 | 6e 70 34 2c 68 70 6c 61 |s to {ih|np4,hpla|
|00000e00| 62 73 2c 61 6d 65 73 2c | 73 75 6e 7d 21 6f 6c 69 |bs,ames,|sun}!oli|
|00000e10| 76 65 62 21 65 70 69 6d | 61 73 73 21 6a 62 75 63 |veb!epim|ass!jbuc|
|00000e20| 6b 2e 0a 20 2a 0a 20 2a | 20 54 68 65 20 70 72 6f |k.. *. *| The pro|
|00000e30| 67 72 61 6d 20 67 65 6e | 65 72 61 74 65 73 20 73 |gram gen|erates s|
|00000e40| 69 6d 75 6c 61 74 65 64 | 20 55 73 65 6e 65 74 20 |imulated| Usenet |
|00000e50| 61 72 74 69 63 6c 65 73 | 2c 20 67 69 76 65 6e 20 |articles|, given |
|00000e60| 55 73 65 6e 65 74 20 61 | 72 74 69 63 6c 65 73 0a |Usenet a|rticles.|
|00000e70| 20 2a 20 61 73 20 69 6e | 70 75 74 2e 0a 20 2a 0a | * as in|put.. *.|
|00000e80| 20 2a 20 54 68 69 73 20 | 70 72 6f 67 72 61 6d 20 | * This |program |
|00000e90| 63 6f 6e 73 74 72 75 63 | 74 73 20 61 20 74 61 62 |construc|ts a tab|
|00000ea0| 6c 65 20 6f 66 20 66 72 | 65 71 75 65 6e 63 69 65 |le of fr|equencie|
|00000eb0| 73 20 66 6f 72 20 61 20 | 74 6f 6b 65 6e 20 61 70 |s for a |token ap|
|00000ec0| 70 65 61 72 69 6e 67 2c | 0a 20 2a 20 67 69 76 65 |pearing,|. * give|
|00000ed0| 6e 20 74 68 65 20 74 77 | 6f 20 70 72 65 63 65 64 |n the tw|o preced|
|00000ee0| 69 6e 67 20 74 6f 6b 65 | 6e 73 2e 20 20 41 20 22 |ing toke|ns. A "|
|00000ef0| 74 6f 6b 65 6e 22 20 69 | 73 20 61 20 73 65 71 75 |token" i|s a sequ|
|00000f00| 65 6e 63 65 20 6f 66 20 | 6e 6f 6e 2d 62 6c 61 6e |ence of |non-blan|
|00000f10| 6b 0a 20 2a 20 63 68 61 | 72 61 63 74 65 72 73 2e |k. * cha|racters.|
|00000f20| 20 20 41 6e 20 65 6e 74 | 69 72 65 6c 79 20 62 6c | An ent|irely bl|
|00000f30| 61 6e 6b 20 6c 69 6e 65 | 20 69 73 20 61 6c 73 6f |ank line| is also|
|00000f40| 20 74 72 65 61 74 65 64 | 20 61 73 20 61 20 74 6f | treated| as a to|
|00000f50| 6b 65 6e 2c 20 61 73 20 | 69 73 0a 20 2a 20 74 68 |ken, as |is. * th|
|00000f60| 65 20 62 65 67 69 6e 6e | 69 6e 67 20 61 6e 64 20 |e beginn|ing and |
|00000f70| 65 6e 64 20 6f 66 20 61 | 6e 20 61 72 74 69 63 6c |end of a|n articl|
|00000f80| 65 2e 0a 20 2a 0a 20 2a | 20 54 68 65 20 70 72 6f |e.. *. *| The pro|
|00000f90| 67 72 61 6d 20 69 73 20 | 64 65 73 69 67 6e 65 64 |gram is |designed|
|00000fa0| 20 74 6f 20 70 72 6f 63 | 65 73 73 20 6e 65 77 73 | to proc|ess news|
|00000fb0| 20 61 72 74 69 63 6c 65 | 73 2c 20 72 65 6a 65 63 | article|s, rejec|
|00000fc0| 74 69 6e 67 20 74 65 78 | 74 20 66 72 6f 6d 0a 20 |ting tex|t from. |
|00000fd0| 2a 20 74 68 65 20 68 65 | 61 64 65 72 2c 20 73 69 |* the he|ader, si|
|00000fe0| 67 6e 61 74 75 72 65 2c | 20 61 6e 64 20 69 6e 63 |gnature,| and inc|
|00000ff0| 6c 75 64 65 64 20 74 65 | 78 74 2c 20 74 6f 67 65 |luded te|xt, toge|
|00001000| 74 68 65 72 20 77 69 74 | 68 20 63 72 75 66 74 20 |ther wit|h cruft |
|00001010| 69 6e 73 65 72 74 65 64 | 0a 20 2a 20 62 79 20 72 |inserted|. * by r|
|00001020| 6e 20 61 6e 64 20 6e 6f | 74 65 73 2e 20 20 41 20 |n and no|tes. A |
|00001030| 70 61 72 61 67 72 61 70 | 68 20 6f 66 20 69 6e 63 |paragrap|h of inc|
|00001040| 6c 75 64 65 64 20 74 65 | 78 74 20 69 73 20 74 72 |luded te|xt is tr|
|00001050| 65 61 74 65 64 20 6c 69 | 6b 65 20 61 20 74 6f 6b |eated li|ke a tok|
|00001060| 65 6e 2e 0a 20 2a 0a 20 | 2a 20 41 66 74 65 72 20 |en.. *. |* After |
|00001070| 74 68 65 20 74 61 62 6c | 65 20 69 73 20 62 75 69 |the tabl|e is bui|
|00001080| 6c 74 20 28 61 6e 64 20 | 69 74 20 63 61 6e 20 62 |lt (and |it can b|
|00001090| 65 20 62 69 67 29 2c 20 | 61 72 74 69 63 6c 65 73 |e big), |articles|
|000010a0| 20 61 72 65 20 67 65 6e | 65 72 61 74 65 64 0a 20 | are gen|erated. |
|000010b0| 2a 20 6f 6e 20 74 68 65 | 20 73 74 61 6e 64 61 72 |* on the| standar|
|000010c0| 64 20 6f 75 74 70 75 74 | 2e 0a 20 2a 2f 0a 23 69 |d output|.. */.#i|
|000010d0| 66 6e 64 65 66 20 6c 69 | 6e 74 0a 73 74 61 74 69 |fndef li|nt.stati|
|000010e0| 63 20 63 68 61 72 20 2a | 73 63 63 73 5f 69 64 20 |c char *|sccs_id |
|000010f0| 3d 20 22 40 28 23 29 6d | 61 72 6b 6f 76 33 2e 6c |= "@(#)m|arkov3.l|
|00001100| 09 31 2e 31 20 33 2f 36 | 2f 38 37 20 65 70 69 6d |.1.1 3/6|/87 epim|
|00001110| 61 73 73 21 6a 62 75 63 | 6b 22 3b 0a 23 65 6e 64 |ass!jbuc|k";.#end|
|00001120| 69 66 0a 23 69 6e 63 6c | 75 64 65 20 3c 73 79 73 |if.#incl|ude <sys|
|00001130| 2f 74 79 70 65 73 2e 68 | 3e 09 09 2f 2a 20 66 6f |/types.h|>../* fo|
|00001140| 72 20 74 69 6d 65 5f 74 | 20 2a 2f 0a 69 6e 74 20 |r time_t| */.int |
|00001150| 69 6e 5f 69 6e 63 6c 75 | 64 65 64 5f 74 65 78 74 |in_inclu|ded_text|
|00001160| 20 3d 20 30 3b 0a 25 7d | 0a 25 53 74 61 72 74 20 | = 0;.%}|.%Start |
|00001170| 48 44 52 20 42 4f 44 59 | 20 53 49 47 0a 25 25 0a |HDR BODY| SIG.%%.|
|00001180| 3c 48 44 52 3e 5e 5b 5e | 20 5c 74 5d 2b 3a 2e 2a |<HDR>^[^| \t]+:.*|
|00001190| 5c 6e 09 3b 09 2f 2a 20 | 48 65 61 64 65 72 20 6c |\n.;./* |Header l|
|000011a0| 69 6e 65 2c 20 65 2e 67 | 2e 20 22 46 72 6f 6d 3a |ine, e.g|. "From:|
|000011b0| 20 66 6f 6f 40 62 61 72 | 2e 55 55 43 50 22 20 2a | foo@bar|.UUCP" *|
|000011c0| 2f 0a 3c 48 44 52 3e 5e | 5b 20 5c 74 5d 2b 5b 5e |/.<HDR>^|[ \t]+[^|
|000011d0| 20 5c 74 5d 2e 2a 5c 6e | 09 3b 09 2f 2a 20 43 6f | \t].*\n|.;./* Co|
|000011e0| 6e 74 69 6e 75 61 74 69 | 6f 6e 20 6f 66 20 68 65 |ntinuati|on of he|
|000011f0| 61 64 65 72 20 6c 69 6e | 65 20 2a 2f 0a 3c 48 44 |ader lin|e */.<HD|
|00001200| 52 3e 5e 5b 20 5c 74 5d | 2a 24 09 09 42 45 47 49 |R>^[ \t]|*$..BEGI|
|00001210| 4e 20 42 4f 44 59 3b 0a | 3c 42 4f 44 59 3e 5e 22 |N BODY;.|<BODY>^"|
|00001220| 2d 2d 20 22 24 09 09 42 | 45 47 49 4e 20 53 49 47 |-- "$..B|EGIN SIG|
|00001230| 3b 0a 3c 42 4f 44 59 3e | 5e 5b 3e 3c 29 7c 23 7d |;.<BODY>|^[><)|#}|
|00001240| 5d 2e 2a 5c 6e 09 7b 20 | 2f 2a 20 35 30 25 20 72 |].*\n.{ |/* 50% r|
|00001250| 75 6c 65 20 67 65 74 73 | 20 70 65 6f 70 6c 65 20 |ule gets| people |
|00001260| 74 6f 20 63 68 61 6e 67 | 65 20 22 3e 22 0a 09 09 |to chang|e ">"...|
|00001270| 09 20 20 20 20 20 74 6f | 20 6f 74 68 65 72 20 63 |. to| other c|
|00001280| 68 61 72 61 63 74 65 72 | 73 3b 20 74 68 69 73 20 |haracter|s; this |
|00001290| 67 65 74 73 20 6d 6f 73 | 74 20 6f 66 20 74 68 65 |gets mos|t of the|
|000012a0| 6d 20 2a 2f 0a 09 09 09 | 20 20 69 66 20 28 21 69 |m */....| if (!i|
|000012b0| 6e 5f 69 6e 63 6c 75 64 | 65 64 5f 74 65 78 74 29 |n_includ|ed_text)|
|000012c0| 20 7b 0a 20 20 20 20 09 | 09 09 20 20 20 20 20 20 | {. .|.. |
|000012d0| 69 6e 5f 69 6e 63 6c 75 | 64 65 64 5f 74 65 78 74 |in_inclu|ded_text|
|000012e0| 20 3d 20 31 3b 0a 09 09 | 09 20 20 20 20 20 20 70 | = 1;...|. p|
|000012f0| 72 6f 63 65 73 73 5f 74 | 6f 6b 65 6e 20 28 22 5c |rocess_t|oken ("\|
|00001300| 6e 3e 20 2e 2e 2e 5c 6e | 5c 6e 22 29 3b 0a 09 09 |n> ...\n|\n");...|
|00001310| 09 20 20 7d 0a 09 09 09 | 7d 0a 3c 42 4f 44 59 3e |. }....|}.<BODY>|
|00001320| 22 5d 22 2e 2a 5c 6e 09 | 09 7b 20 2f 2a 20 73 68 |"]".*\n.|.{ /* sh|
|00001330| 6f 75 6c 64 20 68 61 76 | 65 20 62 65 65 6e 20 69 |ould hav|e been i|
|00001340| 6e 63 6c 75 64 65 64 20 | 69 6e 20 74 68 65 20 61 |ncluded |in the a|
|00001350| 62 6f 76 65 2e 20 20 4d | 79 0a 09 09 09 20 20 20 |bove. M|y.... |
|00001360| 20 20 6c 65 78 20 67 65 | 6e 65 72 61 74 65 73 20 | lex ge|nerates |
|00001370| 62 61 64 20 43 20 63 6f | 64 65 20 69 66 20 49 20 |bad C co|de if I |
|00001380| 73 61 79 20 5b 5b 3e 3c | 2e 2e 2e 5d 0a 09 09 09 |say [[><|...]....|
|00001390| 20 20 20 20 20 65 76 65 | 6e 20 74 68 6f 75 67 68 | eve|n though|
|000013a0| 20 65 64 28 31 29 20 73 | 61 79 73 20 74 68 61 74 | ed(1) s|ays that|
|000013b0| 27 73 20 61 20 76 61 6c | 69 64 20 72 65 67 75 6c |'s a val|id regul|
|000013c0| 61 72 0a 09 09 09 20 20 | 20 20 20 65 78 70 72 65 |ar.... | expre|
|000013d0| 73 73 69 6f 6e 2e 20 2a | 2f 0a 09 09 09 20 20 69 |ssion. *|/.... i|
|000013e0| 66 20 28 21 69 6e 5f 69 | 6e 63 6c 75 64 65 64 5f |f (!in_i|ncluded_|
|000013f0| 74 65 78 74 29 20 7b 0a | 09 09 09 20 20 20 20 20 |text) {.|... |
|00001400| 20 69 6e 5f 69 6e 63 6c | 75 64 65 64 5f 74 65 78 | in_incl|uded_tex|
|00001410| 74 20 3d 20 31 3b 0a 09 | 09 09 20 20 20 20 20 20 |t = 1;..|.. |
|00001420| 70 72 6f 63 65 73 73 5f | 74 6f 6b 65 6e 20 28 22 |process_|token ("|
|00001430| 5c 6e 3e 20 2e 2e 2e 5c | 6e 5c 6e 22 29 3b 0a 09 |\n> ...\|n\n");..|
|00001440| 09 09 20 20 7d 0a 09 09 | 09 7d 0a 3c 42 4f 44 59 |.. }...|.}.<BODY|
|00001450| 3e 5e 22 49 6e 20 61 72 | 74 69 63 6c 65 22 2e 2a |>^"In ar|ticle".*|
|00001460| 5c 6e 09 3b 09 2f 2a 20 | 52 65 6a 65 63 74 20 72 |\n.;./* |Reject r|
|00001470| 6e 20 63 72 75 64 20 2a | 2f 0a 3c 42 4f 44 59 3e |n crud *|/.<BODY>|
|00001480| 5e 22 2f 2a 20 57 72 69 | 74 74 65 6e 22 2e 2a 22 |^"/* Wri|tten".*"|
|00001490| 2a 2f 22 5c 6e 09 3b 09 | 09 2f 2a 20 41 6c 73 6f |*/"\n.;.|./* Also|
|000014a0| 20 4e 4f 54 45 53 20 63 | 72 75 64 20 2a 2f 0a 3c | NOTES c|rud */.<|
|000014b0| 42 4f 44 59 3e 5e 22 2f | 2a 20 45 6e 64 20 6f 66 |BODY>^"/|* End of|
|000014c0| 20 74 65 78 74 20 66 72 | 6f 6d 22 2e 2a 22 2a 2f | text fr|om".*"*/|
|000014d0| 22 5c 6e 09 3b 09 09 2f | 2a 20 4e 4f 54 45 53 20 |"\n.;../|* NOTES |
|000014e0| 2a 2f 0a 3c 42 4f 44 59 | 3e 5e 22 2f 2a 20 2d 2d |*/.<BODY|>^"/* --|
|000014f0| 2d 2d 2d 2d 2d 2d 2d 2d | 22 2e 2a 22 2d 2d 2d 2d |--------|".*"----|
|00001500| 2d 2d 2d 2d 2d 2d 2a 2f | 22 5c 6e 09 3b 09 09 2f |------*/|"\n.;../|
|00001510| 2a 20 4e 4f 54 45 53 20 | 2a 2f 0a 3c 42 4f 44 59 |* NOTES |*/.<BODY|
|00001520| 3e 5b 20 5c 74 5d 2b 09 | 09 3b 09 2f 2a 20 53 6b |>[ \t]+.|.;./* Sk|
|00001530| 69 70 20 77 68 69 74 65 | 20 73 70 61 63 65 20 2a |ip white| space *|
|00001540| 2f 0a 3c 42 4f 44 59 3e | 5c 6e 5b 20 5c 74 5c 6e |/.<BODY>|\n[ \t\n|
|00001550| 5d 2a 5c 6e 09 7b 20 70 | 72 6f 63 65 73 73 5f 74 |]*\n.{ p|rocess_t|
|00001560| 6f 6b 65 6e 20 28 22 5c | 6e 22 29 3b 20 2f 2a 20 |oken ("\|n"); /* |
|00001570| 50 61 72 61 67 72 61 70 | 68 20 62 72 65 61 6b 20 |Paragrap|h break |
|00001580| 2a 2f 7d 0a 3c 42 4f 44 | 59 3e 5b 5e 20 5c 74 5c |*/}.<BOD|Y>[^ \t\|
|00001590| 6e 5d 2b 09 09 7b 20 69 | 6e 5f 69 6e 63 6c 75 64 |n]+..{ i|n_includ|
|000015a0| 65 64 5f 74 65 78 74 20 | 3d 20 30 3b 20 70 72 6f |ed_text |= 0; pro|
|000015b0| 63 65 73 73 5f 74 6f 6b | 65 6e 20 28 79 79 74 65 |cess_tok|en (yyte|
|000015c0| 78 74 29 3b 20 7d 0a 3c | 48 44 52 3e 2e 09 09 09 |xt); }.<|HDR>....|
|000015d0| 3b 09 2f 2a 20 45 61 74 | 20 61 6e 79 74 68 69 6e |;./* Eat| anythin|
|000015e0| 67 20 74 68 61 74 20 65 | 73 63 61 70 65 64 20 2a |g that e|scaped *|
|000015f0| 2f 0a 3c 48 44 52 3e 5c | 6e 09 09 09 3b 0a 3c 42 |/.<HDR>\|n...;.<B|
|00001600| 4f 44 59 3e 5c 6e 09 09 | 3b 0a 3c 53 49 47 3e 2e |ODY>\n..|;.<SIG>.|
|00001610| 09 09 09 3b 0a 3c 53 49 | 47 3e 5c 6e 09 09 09 3b |...;.<SI|G>\n...;|
|00001620| 0a 25 25 0a 76 6f 69 64 | 20 70 65 72 72 6f 72 28 |.%%.void| perror(|
|00001630| 29 2c 20 65 78 69 74 28 | 29 3b 0a 63 68 61 72 20 |), exit(|);.char |
|00001640| 2a 73 74 72 63 70 79 28 | 29 2c 20 2a 6d 61 6c 6c |*strcpy(|), *mall|
|00001650| 6f 63 28 29 3b 0a 65 78 | 74 65 72 6e 20 69 6e 74 |oc();.ex|tern int|
|00001660| 20 6f 70 74 69 6e 64 3b | 0a 65 78 74 65 72 6e 20 | optind;|.extern |
|00001670| 63 68 61 72 20 2a 6f 70 | 74 61 72 67 3b 0a 0a 2f |char *op|targ;../|
|00001680| 2a 0a 20 2a 20 68 61 73 | 68 74 61 62 20 69 73 20 |*. * has|htab is |
|00001690| 61 20 68 61 73 68 20 74 | 61 62 6c 65 20 73 74 6f |a hash t|able sto|
|000016a0| 72 69 6e 67 20 61 6c 6c | 20 74 68 65 20 74 6f 6b |ring all| the tok|
|000016b0| 65 6e 73 20 77 65 20 65 | 6e 63 6f 75 6e 74 65 72 |ens we e|ncounter|
|000016c0| 2e 0a 20 2a 2f 0a 73 74 | 72 75 63 74 20 68 74 65 |.. */.st|ruct hte|
|000016d0| 6e 74 72 79 20 7b 0a 20 | 20 20 20 63 68 61 72 20 |ntry {. | char |
|000016e0| 2a 68 74 65 78 74 3b 0a | 20 20 20 20 73 74 72 75 |*htext;.| stru|
|000016f0| 63 74 20 68 74 65 6e 74 | 72 79 20 2a 68 6c 69 6e |ct htent|ry *hlin|
|00001700| 6b 3b 0a 7d 3b 0a 0a 23 | 64 65 66 69 6e 65 20 48 |k;.};..#|define H|
|00001710| 53 49 5a 45 20 33 35 35 | 37 09 09 2f 2a 20 53 68 |SIZE 355|7../* Sh|
|00001720| 6f 75 6c 64 20 62 65 20 | 70 72 69 6d 65 20 2a 2f |ould be |prime */|
|00001730| 0a 23 64 65 66 69 6e 65 | 20 46 70 72 69 6e 74 66 |.#define| Fprintf|
|00001740| 20 28 76 6f 69 64 29 66 | 70 72 69 6e 74 66 0a 23 | (void)f|printf.#|
|00001750| 64 65 66 69 6e 65 20 50 | 72 69 6e 74 66 20 28 76 |define P|rintf (v|
|00001760| 6f 69 64 29 70 72 69 6e | 74 66 0a 0a 73 74 72 75 |oid)prin|tf..stru|
|00001770| 63 74 20 68 74 65 6e 74 | 72 79 20 68 61 73 68 74 |ct htent|ry hasht|
|00001780| 61 62 5b 48 53 49 5a 45 | 5d 3b 0a 0a 2f 2a 0a 20 |ab[HSIZE|];../*. |
|00001790| 2a 20 6e 6f 64 65 20 61 | 6e 64 20 73 75 63 63 6e |* node a|nd succn|
|000017a0| 6f 64 65 20 61 72 65 20 | 70 6f 72 74 69 6f 6e 73 |ode are |portions|
|000017b0| 20 6f 66 20 74 68 65 20 | 62 69 67 20 73 74 72 75 | of the |big stru|
|000017c0| 63 74 75 72 65 20 77 65 | 27 72 65 20 67 6f 69 6e |cture we|'re goin|
|000017d0| 67 20 74 6f 20 62 75 69 | 6c 64 2e 0a 20 2a 20 6e |g to bui|ld.. * n|
|000017e0| 6f 64 65 20 72 65 70 72 | 65 73 65 6e 74 73 20 73 |ode repr|esents s|
|000017f0| 6f 6d 65 74 68 69 6e 67 | 20 6c 69 6b 65 20 28 22 |omething| like ("|
|00001800| 77 61 73 22 2c 20 22 61 | 22 29 20 69 6e 20 61 20 |was", "a|") in a |
|00001810| 62 69 6e 61 72 79 20 74 | 72 65 65 2e 0a 20 2a 20 |binary t|ree.. * |
|00001820| 61 20 6c 69 6e 6b 65 64 | 20 6c 69 73 74 20 6f 66 |a linked| list of|
|00001830| 20 73 75 63 63 6e 6f 64 | 65 73 20 63 6f 6e 74 61 | succnod|es conta|
|00001840| 69 6e 20 74 6f 6b 65 6e | 73 20 74 68 61 74 20 6d |in token|s that m|
|00001850| 61 79 20 66 6f 6c 6c 6f | 77 20 28 22 77 61 73 22 |ay follo|w ("was"|
|00001860| 2c 20 22 61 22 29 0a 20 | 2a 2f 0a 73 74 72 75 63 |, "a"). |*/.struc|
|00001870| 74 20 6e 6f 64 65 20 7b | 0a 20 20 20 20 63 68 61 |t node {|. cha|
|00001880| 72 20 2a 74 65 78 74 3b | 0a 20 20 20 20 63 68 61 |r *text;|. cha|
|00001890| 72 20 2a 74 65 78 74 32 | 3b 0a 20 20 20 20 69 6e |r *text2|;. in|
|000018a0| 74 20 6f 63 6f 75 6e 74 | 3b 0a 20 20 20 20 73 74 |t ocount|;. st|
|000018b0| 72 75 63 74 20 6e 6f 64 | 65 20 2a 6c 63 2c 20 2a |ruct nod|e *lc, *|
|000018c0| 72 63 3b 0a 20 20 20 20 | 73 74 72 75 63 74 20 73 |rc;. |struct s|
|000018d0| 75 63 63 6e 6f 64 65 20 | 2a 73 75 63 63 3b 0a 7d |uccnode |*succ;.}|
|000018e0| 3b 0a 0a 73 74 72 75 63 | 74 20 73 75 63 63 6e 6f |;..struc|t succno|
|000018f0| 64 65 20 7b 0a 20 20 20 | 20 73 74 72 75 63 74 20 |de {. | struct |
|00001900| 6e 6f 64 65 20 2a 73 63 | 6e 6f 64 3b 0a 20 20 20 |node *sc|nod;. |
|00001910| 20 69 6e 74 20 20 20 20 | 63 6f 75 6e 74 3b 0a 20 | int |count;. |
|00001920| 20 20 20 73 74 72 75 63 | 74 20 73 75 63 63 6e 6f | struc|t succno|
|00001930| 64 65 20 2a 6c 69 6e 6b | 3b 0a 7d 3b 0a 0a 0a 73 |de *link|;.};...s|
|00001940| 74 72 75 63 74 20 6e 6f | 64 65 20 2a 70 72 65 76 |truct no|de *prev|
|00001950| 5f 63 6f 64 65 20 3d 20 | 4e 55 4c 4c 3b 0a 63 68 |_code = |NULL;.ch|
|00001960| 61 72 20 2a 70 72 65 76 | 5f 74 6f 6b 65 6e 20 3d |ar *prev|_token =|
|00001970| 20 4e 55 4c 4c 2c 20 2a | 2a 41 72 67 76 3b 0a 69 | NULL, *|*Argv;.i|
|00001980| 6e 74 20 69 6e 69 74 5f | 73 74 61 74 65 20 3d 20 |nt init_|state = |
|00001990| 48 44 52 3b 0a 69 6e 74 | 20 76 65 72 62 6f 73 65 |HDR;.int| verbose|
|000019a0| 20 3d 20 30 3b 0a 73 74 | 72 75 63 74 20 6e 6f 64 | = 0;.st|ruct nod|
|000019b0| 65 20 2a 72 6f 6f 74 20 | 3d 20 4e 55 4c 4c 2c 20 |e *root |= NULL, |
|000019c0| 2a 74 6b 6e 70 74 72 3b | 0a 73 74 72 75 63 74 20 |*tknptr;|.struct |
|000019d0| 73 75 63 63 6e 6f 64 65 | 20 2a 73 74 61 72 74 20 |succnode| *start |
|000019e0| 3d 20 4e 55 4c 4c 3b 0a | 69 6e 74 20 6e 5f 70 61 |= NULL;.|int n_pa|
|000019f0| 69 72 73 20 3d 20 30 2c | 20 6e 5f 74 6f 6b 65 6e |irs = 0,| n_token|
|00001a00| 73 20 3d 20 30 2c 20 6e | 5f 66 69 6c 65 73 20 3d |s = 0, n|_files =|
|00001a10| 20 30 2c 20 6e 5f 74 6f | 74 61 6c 20 3d 20 30 3b | 0, n_to|tal = 0;|
|00001a20| 0a 0a 73 74 72 75 63 74 | 20 6e 6f 64 65 20 2a 69 |..struct| node *i|
|00001a30| 6e 73 65 72 74 5f 74 6f | 6b 65 6e 28 29 3b 0a 63 |nsert_to|ken();.c|
|00001a40| 68 61 72 20 2a 73 61 76 | 65 74 6f 6b 65 6e 28 29 |har *sav|etoken()|
|00001a50| 3b 0a 0a 70 72 6f 63 65 | 73 73 5f 74 6f 6b 65 6e |;..proce|ss_token|
|00001a60| 20 28 74 78 74 29 0a 63 | 68 61 72 20 2a 74 78 74 | (txt).c|har *txt|
|00001a70| 3b 0a 7b 0a 20 20 20 20 | 20 73 74 72 75 63 74 20 |;.{. | struct |
|00001a80| 6e 6f 64 65 20 2a 63 6f | 64 65 3b 0a 20 20 20 20 |node *co|de;. |
|00001a90| 20 63 68 61 72 20 2a 74 | 6f 6b 65 6e 20 3d 20 73 | char *t|oken = s|
|00001aa0| 61 76 65 74 6f 6b 65 6e | 20 28 74 78 74 29 3b 0a |avetoken| (txt);.|
|00001ab0| 2f 2a 20 57 65 20 68 61 | 76 65 20 61 20 6e 65 77 |/* We ha|ve a new|
|00001ac0| 20 74 6f 6b 65 6e 2e 20 | 20 53 61 79 20 74 68 65 | token. | Say the|
|00001ad0| 20 70 72 65 76 69 6f 75 | 73 20 74 77 6f 20 74 6f | previou|s two to|
|00001ae0| 6b 65 6e 73 20 77 65 72 | 65 20 22 6f 6e 65 22 20 |kens wer|e "one" |
|00001af0| 22 77 61 79 22 0a 20 2a | 20 61 6e 64 20 74 68 65 |"way". *| and the|
|00001b00| 20 63 75 72 72 65 6e 74 | 20 74 6f 6b 65 6e 20 69 | current| token i|
|00001b10| 73 20 22 74 6f 22 2e 20 | 20 54 68 65 6e 20 70 72 |s "to". | Then pr|
|00001b20| 65 76 5f 63 6f 64 65 20 | 70 6f 69 6e 74 73 20 74 |ev_code |points t|
|00001b30| 6f 20 61 20 6e 6f 64 65 | 0a 20 2a 20 66 6f 72 20 |o a node|. * for |
|00001b40| 28 22 6f 6e 65 22 2c 20 | 22 77 61 79 22 29 20 61 |("one", |"way") a|
|00001b50| 6e 64 20 74 6f 6b 65 6e | 20 69 73 20 22 74 6f 22 |nd token| is "to"|
|00001b60| 2e 20 20 54 68 69 73 20 | 66 75 6e 63 74 69 6f 6e |. This |function|
|00001b70| 20 61 64 64 73 20 28 22 | 77 61 79 22 2c 20 22 74 | adds ("|way", "t|
|00001b80| 6f 22 29 20 61 73 20 61 | 0a 20 2a 20 73 75 63 63 |o") as a|. * succ|
|00001b90| 65 73 73 6f 72 20 74 6f | 20 28 22 6f 6e 65 22 2c |essor to| ("one",|
|00001ba0| 22 77 61 79 22 29 20 61 | 6e 64 20 6d 61 6b 65 73 |"way") a|nd makes|
|00001bb0| 20 70 72 65 76 5f 63 6f | 64 65 20 70 6f 69 6e 74 | prev_co|de point|
|00001bc0| 20 74 6f 20 28 22 77 61 | 79 22 2c 22 74 6f 22 29 | to ("wa|y","to")|
|00001bd0| 2e 0a 20 2a 2f 0a 20 20 | 20 20 20 63 6f 64 65 20 |.. */. | code |
|00001be0| 3d 20 69 6e 73 65 72 74 | 5f 74 6f 6b 65 6e 20 28 |= insert|_token (|
|00001bf0| 70 72 65 76 5f 74 6f 6b | 65 6e 2c 20 74 6f 6b 65 |prev_tok|en, toke|
|00001c00| 6e 29 3b 0a 20 20 20 20 | 20 69 6e 73 65 72 74 5f |n);. | insert_|
|00001c10| 70 61 69 72 20 28 70 72 | 65 76 5f 63 6f 64 65 2c |pair (pr|ev_code,|
|00001c20| 20 63 6f 64 65 29 3b 0a | 20 20 20 20 20 70 72 65 | code);.| pre|
|00001c30| 76 5f 63 6f 64 65 20 3d | 20 63 6f 64 65 3b 0a 20 |v_code =| code;. |
|00001c40| 20 20 20 20 70 72 65 76 | 5f 74 6f 6b 65 6e 20 3d | prev|_token =|
|00001c50| 20 74 6f 6b 65 6e 3b 0a | 20 20 20 20 20 72 65 74 | token;.| ret|
|00001c60| 75 72 6e 3b 0a 7d 0a 0a | 2f 2a 0a 20 2a 20 68 65 |urn;.}..|/*. * he|
|00001c70| 72 65 20 69 74 20 69 73 | 2c 20 74 68 65 20 6d 61 |re it is|, the ma|
|00001c80| 69 6e 20 66 75 6e 63 74 | 69 6f 6e 2e 0a 20 2a 2f |in funct|ion.. */|
|00001c90| 0a 6d 61 69 6e 20 28 61 | 72 67 63 2c 20 61 72 67 |.main (a|rgc, arg|
|00001ca0| 76 29 0a 69 6e 74 20 61 | 72 67 63 3b 0a 63 68 61 |v).int a|rgc;.cha|
|00001cb0| 72 20 20 2a 2a 61 72 67 | 76 3b 0a 7b 0a 20 20 20 |r **arg|v;.{. |
|00001cc0| 20 69 6e 74 20 20 20 20 | 20 69 2c 20 63 2c 20 6e | int | i, c, n|
|00001cd0| 5f 61 72 74 69 63 6c 65 | 73 20 3d 20 31 30 2c 20 |_article|s = 10, |
|00001ce0| 73 66 6c 61 67 20 3d 20 | 30 3b 0a 20 20 20 20 63 |sflag = |0;. c|
|00001cf0| 68 61 72 20 2a 64 75 6d | 70 66 69 6c 65 20 3d 20 |har *dum|pfile = |
|00001d00| 4e 55 4c 4c 3b 0a 20 20 | 20 20 65 78 74 65 72 6e |NULL;. | extern|
|00001d10| 20 69 6e 74 20 20 6f 70 | 74 69 6e 64 3b 0a 20 20 | int op|tind;. |
|00001d20| 20 20 65 78 74 65 72 6e | 20 63 68 61 72 20 2a 6f | extern| char *o|
|00001d30| 70 74 61 72 67 3b 0a 0a | 20 20 20 20 77 68 69 6c |ptarg;..| whil|
|00001d40| 65 20 28 28 63 20 3d 20 | 67 65 74 6f 70 74 20 28 |e ((c = |getopt (|
|00001d50| 61 72 67 63 2c 20 61 72 | 67 76 2c 20 22 70 78 76 |argc, ar|gv, "pxv|
|00001d60| 6e 3a 64 3a 73 3a 22 29 | 29 20 21 3d 20 45 4f 46 |n:d:s:")|) != EOF|
|00001d70| 29 20 7b 0a 09 73 77 69 | 74 63 68 20 28 63 29 20 |) {..swi|tch (c) |
|00001d80| 7b 0a 09 20 20 20 20 63 | 61 73 65 20 27 76 27 3a |{.. c|ase 'v':|
|00001d90| 0a 09 09 76 65 72 62 6f | 73 65 20 3d 20 31 3b 0a |...verbo|se = 1;.|
|00001da0| 09 09 62 72 65 61 6b 3b | 0a 09 20 20 20 20 63 61 |..break;|.. ca|
|00001db0| 73 65 20 27 70 27 3a 09 | 09 2f 2a 20 49 6e 70 75 |se 'p':.|./* Inpu|
|00001dc0| 74 20 69 73 20 70 6c 61 | 69 6e 20 74 65 78 74 2c |t is pla|in text,|
|00001dd0| 20 6e 6f 74 20 55 73 65 | 6e 65 74 20 73 74 75 66 | not Use|net stuf|
|00001de0| 66 20 2a 2f 0a 09 09 69 | 6e 69 74 5f 73 74 61 74 |f */...i|nit_stat|
|00001df0| 65 20 3d 20 42 4f 44 59 | 3b 0a 09 09 62 72 65 61 |e = BODY|;...brea|
|00001e00| 6b 3b 0a 09 20 20 20 20 | 63 61 73 65 20 27 6e 27 |k;.. |case 'n'|
|00001e10| 3a 20 09 09 2f 2a 20 23 | 20 61 72 74 69 63 6c 65 |: ../* #| article|
|00001e20| 73 20 74 6f 20 67 65 6e | 65 72 61 74 65 20 2a 2f |s to gen|erate */|
|00001e30| 0a 09 09 6e 5f 61 72 74 | 69 63 6c 65 73 20 3d 20 |...n_art|icles = |
|00001e40| 61 74 6f 69 20 28 6f 70 | 74 61 72 67 29 3b 0a 09 |atoi (op|targ);..|
|00001e50| 09 62 72 65 61 6b 3b 0a | 09 20 20 20 20 63 61 73 |.break;.|. cas|
|00001e60| 65 20 27 64 27 3a 09 09 | 2f 2a 20 77 68 65 72 65 |e 'd':..|/* where|
|00001e70| 20 74 6f 20 64 75 6d 70 | 20 74 68 65 20 64 61 74 | to dump| the dat|
|00001e80| 61 20 73 74 72 75 63 74 | 75 72 65 20 2a 2f 0a 09 |a struct|ure */..|
|00001e90| 09 64 75 6d 70 66 69 6c | 65 20 3d 20 6f 70 74 61 |.dumpfil|e = opta|
|00001ea0| 72 67 3b 0a 09 09 62 72 | 65 61 6b 3b 0a 09 20 20 |rg;...br|eak;.. |
|00001eb0| 20 20 63 61 73 65 20 27 | 73 27 3a 09 09 2f 2a 20 | case '|s':../* |
|00001ec0| 53 65 74 20 74 68 65 20 | 73 65 65 64 20 66 6f 72 |Set the |seed for|
|00001ed0| 20 72 61 6e 64 3b 20 66 | 61 6c 6c 20 74 68 72 6f | rand; f|all thro|
|00001ee0| 75 67 68 20 2a 2f 0a 09 | 09 73 72 61 6e 64 20 28 |ugh */..|.srand (|
|00001ef0| 61 74 6f 69 20 28 6f 70 | 74 61 72 67 29 29 3b 0a |atoi (op|targ));.|
|00001f00| 09 20 20 20 20 63 61 73 | 65 20 27 78 27 3a 09 09 |. cas|e 'x':..|
|00001f10| 2f 2a 20 73 65 74 20 66 | 6c 61 67 20 74 6f 20 70 |/* set f|lag to p|
|00001f20| 72 65 76 65 6e 74 20 73 | 72 61 6e 64 20 2a 2f 0a |revent s|rand */.|
|00001f30| 09 09 73 66 6c 61 67 2b | 2b 3b 0a 09 09 62 72 65 |..sflag+|+;...bre|
|00001f40| 61 6b 3b 0a 09 20 20 20 | 20 64 65 66 61 75 6c 74 |ak;.. | default|
|00001f50| 3a 0a 09 09 46 70 72 69 | 6e 74 66 20 28 73 74 64 |:...Fpri|ntf (std|
|00001f60| 65 72 72 2c 0a 09 09 20 | 22 55 73 61 67 65 3a 20 |err,... |"Usage: |
|00001f70| 6d 61 72 6b 6f 76 33 20 | 5b 2d 70 76 78 5d 20 5b |markov3 |[-pvx] [|
|00001f80| 2d 73 20 73 65 65 64 5d | 20 5b 2d 6e 20 6e 5f 61 |-s seed]| [-n n_a|
|00001f90| 72 74 5d 20 5b 2d 64 20 | 64 75 6d 70 5d 20 66 69 |rt] [-d |dump] fi|
|00001fa0| 6c 65 73 5c 6e 22 29 3b | 0a 09 09 65 78 69 74 20 |les\n");|...exit |
|00001fb0| 28 31 29 3b 0a 09 7d 0a | 20 20 20 20 7d 0a 20 20 |(1);..}.| }. |
|00001fc0| 20 20 42 45 47 49 4e 20 | 69 6e 69 74 5f 73 74 61 | BEGIN |init_sta|
|00001fd0| 74 65 3b 09 09 2f 2a 20 | 69 6e 69 74 69 61 6c 20 |te;../* |initial |
|00001fe0| 73 74 61 74 65 20 6f 66 | 20 6c 65 78 69 63 61 6c |state of| lexical|
|00001ff0| 20 61 6e 61 6c 79 7a 65 | 72 20 2a 2f 0a 20 20 20 | analyze|r */. |
|00002000| 20 69 66 20 28 21 73 66 | 6c 61 67 29 09 09 09 2f | if (!sf|lag).../|
|00002010| 2a 20 73 65 74 20 72 61 | 6e 64 6f 6d 20 6e 75 6d |* set ra|ndom num|
|00002020| 62 65 72 20 67 65 6e 65 | 72 61 74 6f 72 20 2a 2f |ber gene|rator */|
|00002030| 0a 09 73 72 61 6e 64 20 | 28 28 69 6e 74 29 74 69 |..srand |((int)ti|
|00002040| 6d 65 20 28 28 74 69 6d | 65 5f 74 20 2a 29 30 29 |me ((tim|e_t *)0)|
|00002050| 29 3b 0a 2f 2a 20 4e 6f | 74 65 3a 20 69 66 20 6f |);./* No|te: if o|
|00002060| 70 74 69 6e 64 20 3d 3d | 20 61 72 67 63 2c 20 74 |ptind ==| argc, t|
|00002070| 68 65 72 65 20 61 72 65 | 20 6e 6f 20 66 69 6c 65 |here are| no file|
|00002080| 20 61 72 67 75 6d 65 6e | 74 73 2e 20 20 79 79 69 | argumen|ts. yyi|
|00002090| 6e 20 69 73 20 6c 65 66 | 74 0a 20 2a 20 69 6e 69 |n is lef|t. * ini|
|000020a0| 74 69 61 6c 69 7a 65 64 | 20 74 6f 20 73 74 64 69 |tialized| to stdi|
|000020b0| 6e 2e 0a 20 2a 2f 0a 20 | 20 20 20 69 66 20 28 6f |n.. */. | if (o|
|000020c0| 70 74 69 6e 64 20 3c 20 | 61 72 67 63 29 20 7b 0a |ptind < |argc) {.|
|000020d0| 2f 2a 20 79 79 69 6e 20 | 69 73 20 6c 65 78 20 69 |/* yyin |is lex i|
|000020e0| 6e 70 75 74 20 73 74 72 | 65 61 6d 2e 20 20 50 6f |nput str|eam. Po|
|000020f0| 69 6e 74 20 74 6f 20 66 | 69 72 73 74 20 66 69 6c |int to f|irst fil|
|00002100| 65 2e 20 2a 2f 0a 09 69 | 66 20 28 28 79 79 69 6e |e. */..i|f ((yyin|
|00002110| 20 3d 20 66 6f 70 65 6e | 20 28 61 72 67 76 5b 6f | = fopen| (argv[o|
|00002120| 70 74 69 6e 64 5d 2c 20 | 22 72 22 29 29 20 3d 3d |ptind], |"r")) ==|
|00002130| 20 4e 55 4c 4c 29 20 7b | 0a 09 20 20 20 20 70 65 | NULL) {|.. pe|
|00002140| 72 72 6f 72 20 28 61 72 | 67 76 5b 6f 70 74 69 6e |rror (ar|gv[optin|
|00002150| 64 5d 29 3b 0a 09 20 20 | 20 20 65 78 69 74 20 28 |d]);.. | exit (|
|00002160| 31 29 3b 0a 09 7d 0a 09 | 6f 70 74 69 6e 64 2b 2b |1);..}..|optind++|
|00002170| 3b 09 09 2f 2a 20 73 6b | 69 70 20 74 6f 20 6e 65 |;../* sk|ip to ne|
|00002180| 78 74 20 66 69 6c 65 20 | 2a 2f 0a 20 20 20 20 7d |xt file |*/. }|
|00002190| 0a 20 20 20 20 41 72 67 | 76 20 3d 20 61 72 67 76 |. Arg|v = argv|
|000021a0| 3b 09 09 2f 2a 20 6d 61 | 6b 65 20 69 74 20 67 6c |;../* ma|ke it gl|
|000021b0| 6f 62 61 6c 20 73 6f 20 | 79 79 77 72 61 70 20 63 |obal so |yywrap c|
|000021c0| 61 6e 20 61 63 63 65 73 | 73 20 69 74 20 2a 2f 0a |an acces|s it */.|
|000021d0| 20 20 20 20 6e 5f 66 69 | 6c 65 73 20 3d 20 31 3b | n_fi|les = 1;|
|000021e0| 0a 2f 2a 20 79 79 6c 65 | 78 20 70 75 74 73 20 61 |./* yyle|x puts a|
|000021f0| 6c 6c 20 74 68 65 20 69 | 6e 70 75 74 20 66 69 6c |ll the i|nput fil|
|00002200| 65 73 20 74 68 72 6f 75 | 67 68 20 74 68 65 20 6c |es throu|gh the l|
|00002210| 65 78 69 63 61 6c 20 61 | 6e 61 6c 79 7a 65 72 20 |exical a|nalyzer |
|00002220| 61 6e 64 20 62 75 69 6c | 64 73 0a 20 2a 20 74 68 |and buil|ds. * th|
|00002230| 65 20 64 61 74 61 62 61 | 73 65 2e 0a 20 2a 2f 0a |e databa|se.. */.|
|00002240| 20 20 20 20 28 76 6f 69 | 64 29 20 79 79 6c 65 78 | (voi|d) yylex|
|00002250| 20 28 29 3b 0a 20 20 20 | 20 69 66 20 28 64 75 6d | ();. | if (dum|
|00002260| 70 66 69 6c 65 29 0a 09 | 64 75 6d 70 5f 64 61 74 |pfile)..|dump_dat|
|00002270| 61 62 61 73 65 20 28 64 | 75 6d 70 66 69 6c 65 29 |abase (d|umpfile)|
|00002280| 3b 0a 20 20 20 20 69 66 | 20 28 76 65 72 62 6f 73 |;. if| (verbos|
|00002290| 65 29 0a 09 46 70 72 69 | 6e 74 66 20 28 73 74 64 |e)..Fpri|ntf (std|
|000022a0| 65 72 72 2c 0a 09 20 22 | 54 6f 74 61 6c 20 6f 66 |err,.. "|Total of|
|000022b0| 20 25 64 20 74 6f 6b 65 | 6e 73 20 28 25 64 20 64 | %d toke|ns (%d d|
|000022c0| 69 66 66 65 72 65 6e 74 | 29 2c 20 25 64 20 64 69 |ifferent|), %d di|
|000022d0| 66 66 65 72 65 6e 74 20 | 70 61 69 72 73 2c 20 25 |fferent |pairs, %|
|000022e0| 64 20 66 69 6c 65 73 5c | 6e 22 2c 0a 09 09 6e 5f |d files\|n",...n_|
|000022f0| 74 6f 74 61 6c 2c 20 6e | 5f 74 6f 6b 65 6e 73 2c |total, n|_tokens,|
|00002300| 20 6e 5f 70 61 69 72 73 | 2c 20 6e 5f 66 69 6c 65 | n_pairs|, n_file|
|00002310| 73 29 3b 0a 2f 2a 20 47 | 65 6e 65 72 61 74 65 20 |s);./* G|enerate |
|00002320| 74 68 65 20 61 72 74 69 | 63 6c 65 73 2c 20 73 65 |the arti|cles, se|
|00002330| 70 61 72 61 74 65 64 20 | 62 79 20 66 6f 72 6d 20 |parated |by form |
|00002340| 66 65 65 64 73 20 2a 2f | 0a 20 20 20 20 66 6f 72 |feeds */|. for|
|00002350| 20 28 69 20 3d 20 30 3b | 20 69 20 3c 20 6e 5f 61 | (i = 0;| i < n_a|
|00002360| 72 74 69 63 6c 65 73 3b | 20 69 2b 2b 29 20 7b 0a |rticles;| i++) {.|
|00002370| 09 69 66 20 28 69 20 3e | 20 30 29 20 6f 75 74 70 |.if (i >| 0) outp|
|00002380| 75 74 5f 77 6f 72 64 20 | 28 22 5c 6e 5c 66 5c 6e |ut_word |("\n\f\n|
|00002390| 22 29 3b 0a 09 67 65 6e | 65 72 61 74 65 5f 61 72 |");..gen|erate_ar|
|000023a0| 74 69 63 6c 65 20 28 29 | 3b 0a 20 20 20 20 7d 0a |ticle ()|;. }.|
|000023b0| 20 20 20 20 72 65 74 75 | 72 6e 20 30 3b 0a 7d 0a | retu|rn 0;.}.|
|000023c0| 0a 2f 2a 0a 20 2a 20 4c | 65 78 20 63 61 6c 6c 73 |./*. * L|ex calls|
|000023d0| 20 74 68 69 73 20 77 68 | 65 6e 20 45 4f 46 20 69 | this wh|en EOF i|
|000023e0| 73 20 72 65 61 63 68 65 | 64 2e 20 20 49 74 20 6f |s reache|d. It o|
|000023f0| 70 65 6e 73 20 74 68 65 | 20 6e 65 78 74 20 66 69 |pens the| next fi|
|00002400| 6c 65 20 69 66 20 74 68 | 65 72 65 0a 20 2a 20 69 |le if th|ere. * i|
|00002410| 73 20 6f 6e 65 2e 20 20 | 4c 65 78 20 69 6e 74 65 |s one. |Lex inte|
|00002420| 72 70 72 65 74 73 20 61 | 20 72 65 74 75 72 6e 20 |rprets a| return |
|00002430| 76 61 6c 75 65 20 6f 66 | 20 31 20 74 6f 20 6d 65 |value of| 1 to me|
|00002440| 61 6e 20 22 61 6c 6c 20 | 64 6f 6e 65 22 20 61 6e |an "all |done" an|
|00002450| 64 20 30 0a 20 2a 20 74 | 6f 20 6d 65 61 6e 20 22 |d 0. * t|o mean "|
|00002460| 6b 65 65 70 20 67 6f 69 | 6e 67 22 2e 0a 20 2a 2f |keep goi|ng".. */|
|00002470| 0a 79 79 77 72 61 70 20 | 28 29 20 7b 0a 20 20 20 |.yywrap |() {. |
|00002480| 20 28 76 6f 69 64 29 20 | 66 63 6c 6f 73 65 20 28 | (void) |fclose (|
|00002490| 79 79 69 6e 29 3b 0a 20 | 20 20 20 69 6e 73 65 72 |yyin);. | inser|
|000024a0| 74 5f 70 61 69 72 20 28 | 70 72 65 76 5f 63 6f 64 |t_pair (|prev_cod|
|000024b0| 65 2c 20 28 73 74 72 75 | 63 74 20 6e 6f 64 65 20 |e, (stru|ct node |
|000024c0| 2a 29 30 29 3b 0a 20 20 | 20 20 70 72 65 76 5f 63 |*)0);. | prev_c|
|000024d0| 6f 64 65 20 3d 20 4e 55 | 4c 4c 3b 0a 20 20 20 20 |ode = NU|LL;. |
|000024e0| 69 66 20 28 41 72 67 76 | 5b 6f 70 74 69 6e 64 5d |if (Argv|[optind]|
|000024f0| 20 3d 3d 20 4e 55 4c 4c | 29 20 72 65 74 75 72 6e | == NULL|) return|
|00002500| 20 31 3b 0a 20 20 20 20 | 65 6c 73 65 20 69 66 20 | 1;. |else if |
|00002510| 28 28 79 79 69 6e 20 3d | 20 66 6f 70 65 6e 20 28 |((yyin =| fopen (|
|00002520| 41 72 67 76 5b 6f 70 74 | 69 6e 64 5d 2c 20 22 72 |Argv[opt|ind], "r|
|00002530| 22 29 29 20 3d 3d 20 4e | 55 4c 4c 29 20 7b 0a 09 |")) == N|ULL) {..|
|00002540| 70 65 72 72 6f 72 20 28 | 41 72 67 76 5b 6f 70 74 |perror (|Argv[opt|
|00002550| 69 6e 64 5d 29 3b 0a 09 | 65 78 69 74 20 28 31 29 |ind]);..|exit (1)|
|00002560| 3b 0a 20 20 20 20 7d 0a | 20 20 20 20 6f 70 74 69 |;. }.| opti|
|00002570| 6e 64 2b 2b 3b 0a 20 20 | 20 20 69 6e 5f 69 6e 63 |nd++;. | in_inc|
|00002580| 6c 75 64 65 64 5f 74 65 | 78 74 20 3d 20 30 3b 0a |luded_te|xt = 0;.|
|00002590| 20 20 20 20 69 66 20 28 | 76 65 72 62 6f 73 65 20 | if (|verbose |
|000025a0| 26 26 20 6e 5f 66 69 6c | 65 73 20 25 20 31 30 20 |&& n_fil|es % 10 |
|000025b0| 3d 3d 20 30 29 0a 09 46 | 70 72 69 6e 74 66 20 28 |== 0)..F|printf (|
|000025c0| 73 74 64 65 72 72 2c 20 | 22 25 64 20 66 69 6c 65 |stderr, |"%d file|
|000025d0| 73 5c 6e 22 2c 20 6e 5f | 66 69 6c 65 73 29 3b 0a |s\n", n_|files);.|
|000025e0| 20 20 20 20 6e 5f 66 69 | 6c 65 73 2b 2b 3b 0a 20 | n_fi|les++;. |
|000025f0| 20 20 20 42 45 47 49 4e | 20 69 6e 69 74 5f 73 74 | BEGIN| init_st|
|00002600| 61 74 65 3b 0a 20 20 20 | 20 72 65 74 75 72 6e 20 |ate;. | return |
|00002610| 30 3b 0a 7d 0a 0a 2f 2a | 0a 20 2a 20 54 68 69 73 |0;.}../*|. * This|
|00002620| 20 66 75 6e 63 74 69 6f | 6e 20 73 61 76 65 73 20 | functio|n saves |
|00002630| 61 20 74 6f 6b 65 6e 20 | 69 6e 20 74 68 65 20 68 |a token |in the h|
|00002640| 61 73 68 20 74 61 62 6c | 65 20 28 69 66 20 69 74 |ash tabl|e (if it|
|00002650| 20 69 73 6e 27 74 20 74 | 68 65 72 65 0a 20 2a 20 | isn't t|here. * |
|00002660| 61 6c 72 65 61 64 79 29 | 20 61 6e 64 20 72 65 74 |already)| and ret|
|00002670| 75 72 6e 73 20 61 20 70 | 6f 69 6e 74 65 72 20 74 |urns a p|ointer t|
|00002680| 6f 20 74 68 65 20 73 74 | 6f 72 65 64 20 63 6f 70 |o the st|ored cop|
|00002690| 79 2e 0a 20 2a 2f 0a 63 | 68 61 72 20 2a 0a 73 61 |y.. */.c|har *.sa|
|000026a0| 76 65 74 6f 6b 65 6e 20 | 28 74 78 74 29 0a 63 68 |vetoken |(txt).ch|
|000026b0| 61 72 20 2a 74 78 74 3b | 0a 7b 0a 20 20 20 20 69 |ar *txt;|.{. i|
|000026c0| 6e 74 20 68 3b 0a 20 20 | 20 20 63 68 61 72 20 2a |nt h;. | char *|
|000026d0| 70 3b 0a 20 20 20 20 73 | 74 72 75 63 74 20 68 74 |p;. s|truct ht|
|000026e0| 65 6e 74 72 79 20 2a 68 | 70 3b 0a 0a 20 20 20 20 |entry *h|p;.. |
|000026f0| 6e 5f 74 6f 74 61 6c 2b | 2b 3b 0a 20 20 20 20 66 |n_total+|+;. f|
|00002700| 6f 72 20 28 70 20 3d 20 | 74 78 74 2c 20 68 20 3d |or (p = |txt, h =|
|00002710| 20 30 3b 20 2a 70 3b 20 | 68 20 2b 3d 20 2a 70 2b | 0; *p; |h += *p+|
|00002720| 2b 29 3b 0a 20 20 20 20 | 68 70 20 3d 20 68 61 73 |+);. |hp = has|
|00002730| 68 74 61 62 20 2b 20 28 | 68 20 25 20 48 53 49 5a |htab + (|h % HSIZ|
|00002740| 45 29 3b 0a 20 20 20 20 | 77 68 69 6c 65 20 28 68 |E);. |while (h|
|00002750| 70 2d 3e 68 6c 69 6e 6b | 29 20 7b 0a 09 69 66 20 |p->hlink|) {..if |
|00002760| 28 73 74 72 63 6d 70 20 | 28 68 70 2d 3e 68 74 65 |(strcmp |(hp->hte|
|00002770| 78 74 2c 20 74 78 74 29 | 20 3d 3d 20 30 29 20 7b |xt, txt)| == 0) {|
|00002780| 0a 09 20 20 20 20 72 65 | 74 75 72 6e 20 68 70 2d |.. re|turn hp-|
|00002790| 3e 68 74 65 78 74 3b 0a | 09 7d 0a 09 68 70 20 3d |>htext;.|.}..hp =|
|000027a0| 20 68 70 2d 3e 68 6c 69 | 6e 6b 3b 0a 20 20 20 20 | hp->hli|nk;. |
|000027b0| 7d 0a 2f 2a 20 4f 4b 2c | 20 69 74 27 73 20 61 20 |}./* OK,| it's a |
|000027c0| 6e 65 77 20 74 6f 6b 65 | 6e 2e 20 20 4d 61 6b 65 |new toke|n. Make|
|000027d0| 20 68 70 2d 3e 68 6c 69 | 6e 6b 20 70 6f 69 6e 74 | hp->hli|nk point|
|000027e0| 20 74 6f 20 61 20 6e 65 | 77 2c 0a 20 2a 20 6e 75 | to a ne|w,. * nu|
|000027f0| 6c 6c 20 62 6c 6f 63 6b | 20 61 6e 64 20 6d 61 6b |ll block| and mak|
|00002800| 65 20 68 70 2d 3e 68 74 | 65 78 74 20 70 6f 69 6e |e hp->ht|ext poin|
|00002810| 74 20 74 6f 20 74 68 65 | 20 74 65 78 74 2e 0a 20 |t to the| text.. |
|00002820| 2a 2f 0a 20 20 20 20 68 | 70 2d 3e 68 6c 69 6e 6b |*/. h|p->hlink|
|00002830| 20 3d 20 28 73 74 72 75 | 63 74 20 68 74 65 6e 74 | = (stru|ct htent|
|00002840| 72 79 20 2a 29 20 6d 61 | 6c 6c 6f 63 20 28 73 69 |ry *) ma|lloc (si|
|00002850| 7a 65 6f 66 20 2a 68 70 | 29 3b 0a 20 20 20 20 68 |zeof *hp|);. h|
|00002860| 70 2d 3e 68 74 65 78 74 | 20 3d 20 6d 61 6c 6c 6f |p->htext| = mallo|
|00002870| 63 20 28 28 75 6e 73 69 | 67 6e 65 64 29 28 73 74 |c ((unsi|gned)(st|
|00002880| 72 6c 65 6e 20 28 74 78 | 74 29 20 2b 20 31 29 29 |rlen (tx|t) + 1))|
|00002890| 3b 0a 20 20 20 20 28 76 | 6f 69 64 29 20 73 74 72 |;. (v|oid) str|
|000028a0| 63 70 79 20 28 68 70 2d | 3e 68 74 65 78 74 2c 20 |cpy (hp-|>htext, |
|000028b0| 74 78 74 29 3b 0a 20 20 | 20 20 68 70 2d 3e 68 6c |txt);. | hp->hl|
|000028c0| 69 6e 6b 2d 3e 68 6c 69 | 6e 6b 20 3d 20 4e 55 4c |ink->hli|nk = NUL|
|000028d0| 4c 3b 0a 20 20 20 20 68 | 70 2d 3e 68 6c 69 6e 6b |L;. h|p->hlink|
|000028e0| 2d 3e 68 74 65 78 74 20 | 3d 20 4e 55 4c 4c 3b 0a |->htext |= NULL;.|
|000028f0| 20 20 20 20 6e 5f 74 6f | 6b 65 6e 73 2b 2b 3b 0a | n_to|kens++;.|
|00002900| 20 20 20 20 72 65 74 75 | 72 6e 20 68 70 2d 3e 68 | retu|rn hp->h|
|00002910| 74 65 78 74 3b 0a 7d 0a | 0a 2f 2a 0a 20 2a 20 54 |text;.}.|./*. * T|
|00002920| 68 69 73 20 72 65 63 75 | 72 73 69 76 65 20 66 75 |his recu|rsive fu|
|00002930| 6e 63 74 69 6f 6e 20 69 | 6e 73 65 72 74 73 20 61 |nction i|nserts a|
|00002940| 20 74 6f 6b 65 6e 20 70 | 61 69 72 20 69 6e 74 6f | token p|air into|
|00002950| 20 74 68 65 20 74 72 65 | 65 2e 0a 20 2a 2f 0a 73 | the tre|e.. */.s|
|00002960| 74 72 75 63 74 20 6e 6f | 64 65 20 2a 0a 69 6e 73 |truct no|de *.ins|
|00002970| 65 72 74 5f 69 6e 5f 74 | 72 65 65 20 28 70 2c 20 |ert_in_t|ree (p, |
|00002980| 74 78 74 2c 20 74 78 74 | 32 29 0a 73 74 72 75 63 |txt, txt|2).struc|
|00002990| 74 20 6e 6f 64 65 20 2a | 70 3b 0a 63 68 61 72 20 |t node *|p;.char |
|000029a0| 2a 74 78 74 2c 20 2a 74 | 78 74 32 3b 0a 7b 0a 20 |*txt, *t|xt2;.{. |
|000029b0| 20 20 20 69 6e 74 20 63 | 6d 70 3b 0a 20 20 20 20 | int c|mp;. |
|000029c0| 69 66 20 28 70 20 3d 3d | 20 4e 55 4c 4c 29 20 7b |if (p ==| NULL) {|
|000029d0| 0a 2f 2a 20 43 72 65 61 | 74 65 20 61 20 6e 65 77 |./* Crea|te a new|
|000029e0| 20 6e 6f 64 65 2e 20 2a | 2f 0a 09 70 20 3d 20 28 | node. *|/..p = (|
|000029f0| 73 74 72 75 63 74 20 6e | 6f 64 65 20 2a 29 20 6d |struct n|ode *) m|
|00002a00| 61 6c 6c 6f 63 20 28 73 | 69 7a 65 6f 66 20 2a 70 |alloc (s|izeof *p|
|00002a10| 29 3b 0a 09 70 2d 3e 74 | 65 78 74 20 3d 20 74 78 |);..p->t|ext = tx|
|00002a20| 74 3b 0a 09 70 2d 3e 74 | 65 78 74 32 20 3d 20 74 |t;..p->t|ext2 = t|
|00002a30| 78 74 32 3b 0a 09 70 2d | 3e 6c 63 20 3d 20 70 2d |xt2;..p-|>lc = p-|
|00002a40| 3e 72 63 20 3d 20 4e 55 | 4c 4c 3b 0a 09 70 2d 3e |>rc = NU|LL;..p->|
|00002a50| 73 75 63 63 20 3d 20 4e | 55 4c 4c 3b 0a 09 70 2d |succ = N|ULL;..p-|
|00002a60| 3e 6f 63 6f 75 6e 74 20 | 3d 20 31 3b 0a 09 74 6b |>ocount |= 1;..tk|
|00002a70| 6e 70 74 72 20 3d 20 70 | 3b 0a 09 6e 5f 70 61 69 |nptr = p|;..n_pai|
|00002a80| 72 73 2b 2b 3b 0a 09 69 | 66 20 28 76 65 72 62 6f |rs++;..i|f (verbo|
|00002a90| 73 65 20 26 26 20 6e 5f | 70 61 69 72 73 20 25 20 |se && n_|pairs % |
|00002aa0| 31 30 30 30 20 3d 3d 20 | 30 29 0a 09 20 20 20 20 |1000 == |0).. |
|00002ab0| 46 70 72 69 6e 74 66 20 | 28 73 74 64 65 72 72 2c |Fprintf |(stderr,|
|00002ac0| 20 22 25 64 20 70 61 69 | 72 73 5c 6e 22 2c 20 6e | "%d pai|rs\n", n|
|00002ad0| 5f 70 61 69 72 73 29 3b | 0a 09 72 65 74 75 72 6e |_pairs);|..return|
|00002ae0| 20 70 3b 0a 20 20 20 20 | 7d 0a 20 20 20 20 63 6d | p;. |}. cm|
|00002af0| 70 20 3d 20 6d 79 5f 73 | 74 72 63 6d 70 20 28 70 |p = my_s|trcmp (p|
|00002b00| 2d 3e 74 65 78 74 2c 20 | 74 78 74 29 3b 0a 20 20 |->text, |txt);. |
|00002b10| 20 20 69 66 20 28 63 6d | 70 20 3d 3d 20 30 29 20 | if (cm|p == 0) |
|00002b20| 63 6d 70 20 3d 20 6d 79 | 5f 73 74 72 63 6d 70 20 |cmp = my|_strcmp |
|00002b30| 28 70 2d 3e 74 65 78 74 | 32 2c 20 74 78 74 32 29 |(p->text|2, txt2)|
|00002b40| 3b 0a 20 20 20 20 69 66 | 20 28 63 6d 70 20 3d 3d |;. if| (cmp ==|
|00002b50| 20 30 29 20 7b 0a 2f 2a | 20 49 74 27 73 20 61 20 | 0) {./*| It's a |
|00002b60| 6d 61 74 63 68 2e 20 20 | 49 6e 63 72 65 6d 65 6e |match. |Incremen|
|00002b70| 74 20 74 68 65 20 63 6f | 75 6e 74 2e 20 2a 2f 0a |t the co|unt. */.|
|00002b80| 20 20 20 20 20 20 20 20 | 74 6b 6e 70 74 72 20 3d | |tknptr =|
|00002b90| 20 70 3b 0a 09 70 2d 3e | 6f 63 6f 75 6e 74 20 2b | p;..p->|ocount +|
|00002ba0| 3d 20 31 3b 0a 20 20 20 | 20 7d 0a 2f 2a 20 4c 6f |= 1;. | }./* Lo|
|00002bb0| 6f 6b 20 69 6e 20 74 68 | 65 20 73 75 62 74 72 65 |ok in th|e subtre|
|00002bc0| 65 73 2e 20 2a 2f 0a 20 | 20 20 20 65 6c 73 65 20 |es. */. | else |
|00002bd0| 69 66 20 28 63 6d 70 20 | 3c 20 30 29 20 70 2d 3e |if (cmp |< 0) p->|
|00002be0| 6c 63 20 3d 20 69 6e 73 | 65 72 74 5f 69 6e 5f 74 |lc = ins|ert_in_t|
|00002bf0| 72 65 65 20 28 70 2d 3e | 6c 63 2c 20 74 78 74 2c |ree (p->|lc, txt,|
|00002c00| 20 74 78 74 32 29 3b 0a | 20 20 20 20 65 6c 73 65 | txt2);.| else|
|00002c10| 20 70 2d 3e 72 63 20 3d | 20 69 6e 73 65 72 74 5f | p->rc =| insert_|
|00002c20| 69 6e 5f 74 72 65 65 20 | 28 70 2d 3e 72 63 2c 20 |in_tree |(p->rc, |
|00002c30| 74 78 74 2c 20 74 78 74 | 32 29 3b 0a 20 20 20 20 |txt, txt|2);. |
|00002c40| 72 65 74 75 72 6e 20 70 | 3b 0a 7d 0a 0a 2f 2a 0a |return p|;.}../*.|
|00002c50| 20 2a 20 54 68 69 73 20 | 6a 75 73 74 20 63 61 6c | * This |just cal|
|00002c60| 6c 73 20 69 6e 73 65 72 | 74 5f 69 6e 5f 74 72 65 |ls inser|t_in_tre|
|00002c70| 65 20 73 74 61 72 74 69 | 6e 67 20 61 74 20 74 68 |e starti|ng at th|
|00002c80| 65 20 72 6f 6f 74 0a 20 | 2a 2f 0a 73 74 72 75 63 |e root. |*/.struc|
|00002c90| 74 20 6e 6f 64 65 20 2a | 0a 69 6e 73 65 72 74 5f |t node *|.insert_|
|00002ca0| 74 6f 6b 65 6e 20 28 74 | 78 74 2c 20 74 78 74 32 |token (t|xt, txt2|
|00002cb0| 29 0a 63 68 61 72 20 2a | 74 78 74 2c 2a 74 78 74 |).char *|txt,*txt|
|00002cc0| 32 3b 0a 7b 0a 20 20 20 | 20 72 6f 6f 74 20 3d 20 |2;.{. | root = |
|00002cd0| 69 6e 73 65 72 74 5f 69 | 6e 5f 74 72 65 65 20 28 |insert_i|n_tree (|
|00002ce0| 72 6f 6f 74 2c 20 74 78 | 74 2c 20 74 78 74 32 29 |root, tx|t, txt2)|
|00002cf0| 3b 0a 20 20 20 20 72 65 | 74 75 72 6e 20 74 6b 6e |;. re|turn tkn|
|00002d00| 70 74 72 3b 0a 7d 0a 0a | 2f 2a 0a 20 2a 20 54 68 |ptr;.}..|/*. * Th|
|00002d10| 69 73 20 66 75 6e 63 74 | 69 6f 6e 20 61 64 64 73 |is funct|ion adds|
|00002d20| 20 61 20 73 75 63 63 65 | 73 73 6f 72 2e 0a 20 2a | a succe|ssor.. *|
|00002d30| 2f 0a 73 74 72 75 63 74 | 20 73 75 63 63 6e 6f 64 |/.struct| succnod|
|00002d40| 65 20 2a 0a 69 6e 73 65 | 72 74 5f 69 6e 5f 73 75 |e *.inse|rt_in_su|
|00002d50| 63 63 5f 63 68 61 69 6e | 20 28 73 70 2c 20 6e 70 |cc_chain| (sp, np|
|00002d60| 29 0a 73 74 72 75 63 74 | 20 73 75 63 63 6e 6f 64 |).struct| succnod|
|00002d70| 65 20 2a 73 70 3b 0a 73 | 74 72 75 63 74 20 6e 6f |e *sp;.s|truct no|
|00002d80| 64 65 20 2a 6e 70 3b 0a | 7b 0a 20 20 20 20 69 66 |de *np;.|{. if|
|00002d90| 20 28 73 70 20 3d 3d 20 | 4e 55 4c 4c 29 20 7b 0a | (sp == |NULL) {.|
|00002da0| 09 73 70 20 3d 20 28 73 | 74 72 75 63 74 20 73 75 |.sp = (s|truct su|
|00002db0| 63 63 6e 6f 64 65 20 2a | 29 20 6d 61 6c 6c 6f 63 |ccnode *|) malloc|
|00002dc0| 20 28 73 69 7a 65 6f 66 | 20 2a 73 70 29 3b 0a 09 | (sizeof| *sp);..|
|00002dd0| 73 70 2d 3e 73 63 6e 6f | 64 20 3d 20 6e 70 3b 0a |sp->scno|d = np;.|
|00002de0| 09 73 70 2d 3e 63 6f 75 | 6e 74 20 3d 20 31 3b 0a |.sp->cou|nt = 1;.|
|00002df0| 09 73 70 2d 3e 6c 69 6e | 6b 20 3d 20 4e 55 4c 4c |.sp->lin|k = NULL|
|00002e00| 3b 0a 20 20 20 20 7d 0a | 20 20 20 20 65 6c 73 65 |;. }.| else|
|00002e10| 20 69 66 20 28 73 70 2d | 3e 73 63 6e 6f 64 20 3d | if (sp-|>scnod =|
|00002e20| 3d 20 6e 70 29 0a 09 73 | 70 2d 3e 63 6f 75 6e 74 |= np)..s|p->count|
|00002e30| 20 2b 3d 20 31 3b 0a 20 | 20 20 20 65 6c 73 65 20 | += 1;. | else |
|00002e40| 73 70 2d 3e 6c 69 6e 6b | 20 3d 20 69 6e 73 65 72 |sp->link| = inser|
|00002e50| 74 5f 69 6e 5f 73 75 63 | 63 5f 63 68 61 69 6e 20 |t_in_suc|c_chain |
|00002e60| 28 73 70 2d 3e 6c 69 6e | 6b 2c 20 6e 70 29 3b 0a |(sp->lin|k, np);.|
|00002e70| 20 20 20 20 72 65 74 75 | 72 6e 20 73 70 3b 0a 7d | retu|rn sp;.}|
|00002e80| 0a 0a 2f 2a 0a 20 2a 20 | 54 68 69 73 20 63 61 6c |../*. * |This cal|
|00002e90| 6c 73 20 69 6e 73 65 72 | 74 5f 69 6e 5f 73 75 63 |ls inser|t_in_suc|
|00002ea0| 63 5f 63 68 61 69 6e 20 | 73 74 61 72 74 69 6e 67 |c_chain |starting|
|00002eb0| 20 61 74 20 74 68 65 20 | 72 69 67 68 74 20 70 6c | at the |right pl|
|00002ec0| 61 63 65 2e 0a 20 2a 2f | 0a 69 6e 73 65 72 74 5f |ace.. */|.insert_|
|00002ed0| 70 61 69 72 20 28 70 31 | 2c 20 70 32 29 0a 73 74 |pair (p1|, p2).st|
|00002ee0| 72 75 63 74 20 6e 6f 64 | 65 20 2a 70 31 2c 20 2a |ruct nod|e *p1, *|
|00002ef0| 70 32 3b 0a 7b 0a 20 20 | 20 20 69 66 20 28 70 31 |p2;.{. | if (p1|
|00002f00| 29 20 70 31 2d 3e 73 75 | 63 63 20 3d 20 69 6e 73 |) p1->su|cc = ins|
|00002f10| 65 72 74 5f 69 6e 5f 73 | 75 63 63 5f 63 68 61 69 |ert_in_s|ucc_chai|
|00002f20| 6e 20 28 70 31 2d 3e 73 | 75 63 63 2c 20 70 32 29 |n (p1->s|ucc, p2)|
|00002f30| 3b 0a 20 20 20 20 65 6c | 73 65 20 73 74 61 72 74 |;. el|se start|
|00002f40| 20 3d 20 69 6e 73 65 72 | 74 5f 69 6e 5f 73 75 63 | = inser|t_in_suc|
|00002f50| 63 5f 63 68 61 69 6e 20 | 28 73 74 61 72 74 2c 20 |c_chain |(start, |
|00002f60| 70 32 29 3b 0a 7d 0a 0a | 2f 2a 0a 20 2a 20 54 68 |p2);.}..|/*. * Th|
|00002f70| 69 73 20 66 75 6e 63 74 | 69 6f 6e 20 64 75 6d 70 |is funct|ion dump|
|00002f80| 73 20 74 68 65 20 73 74 | 6f 72 65 64 20 64 61 74 |s the st|ored dat|
|00002f90| 61 20 73 74 72 75 63 74 | 75 72 65 20 6f 6e 74 6f |a struct|ure onto|
|00002fa0| 20 61 20 66 69 6c 65 2e | 0a 20 2a 20 4e 6f 77 20 | a file.|. * Now |
|00002fb0| 69 66 20 6f 6e 6c 79 20 | 49 20 68 61 64 20 61 20 |if only |I had a |
|00002fc0| 66 75 6e 63 74 69 6f 6e | 20 74 6f 20 72 65 61 64 |function| to read|
|00002fd0| 20 69 74 20 62 61 63 6b | 20 69 6e 2e 0a 20 2a 2f | it back| in.. */|
|00002fe0| 0a 63 68 61 72 20 2a 0a | 70 72 5f 74 6f 6b 65 6e |.char *.|pr_token|
|00002ff0| 20 28 74 78 74 29 0a 63 | 68 61 72 20 2a 74 78 74 | (txt).c|har *txt|
|00003000| 3b 0a 7b 0a 20 20 20 20 | 69 66 20 28 74 78 74 5b |;.{. |if (txt[|
|00003010| 30 5d 20 21 3d 20 27 5c | 6e 27 29 0a 09 72 65 74 |0] != '\|n')..ret|
|00003020| 75 72 6e 20 74 78 74 3b | 0a 20 20 20 20 72 65 74 |urn txt;|. ret|
|00003030| 75 72 6e 20 74 78 74 5b | 31 5d 20 3f 20 22 3c 49 |urn txt[|1] ? "<I|
|00003040| 4e 43 4c 3e 22 20 3a 20 | 22 3c 4c 46 3e 22 3b 0a |NCL>" : |"<LF>";.|
|00003050| 7d 0a 0a 74 72 65 65 64 | 75 6d 70 20 28 74 72 65 |}..treed|ump (tre|
|00003060| 65 2c 20 66 70 29 0a 73 | 74 72 75 63 74 20 6e 6f |e, fp).s|truct no|
|00003070| 64 65 20 2a 74 72 65 65 | 3b 0a 46 49 4c 45 20 2a |de *tree|;.FILE *|
|00003080| 66 70 3b 0a 7b 0a 20 20 | 20 20 69 66 20 28 74 72 |fp;.{. | if (tr|
|00003090| 65 65 29 20 7b 0a 09 74 | 72 65 65 64 75 6d 70 20 |ee) {..t|reedump |
|000030a0| 28 74 72 65 65 2d 3e 72 | 63 2c 20 66 70 29 3b 0a |(tree->r|c, fp);.|
|000030b0| 09 46 70 72 69 6e 74 66 | 20 28 66 70 2c 20 22 28 |.Fprintf| (fp, "(|
|000030c0| 20 25 73 20 25 73 20 29 | 20 25 64 22 2c 20 70 72 | %s %s )| %d", pr|
|000030d0| 5f 74 6f 6b 65 6e 20 28 | 74 72 65 65 2d 3e 74 65 |_token (|tree->te|
|000030e0| 78 74 29 2c 0a 09 09 09 | 70 72 5f 74 6f 6b 65 6e |xt),....|pr_token|
|000030f0| 20 28 74 72 65 65 2d 3e | 74 65 78 74 32 29 2c 20 | (tree->|text2), |
|00003100| 74 72 65 65 2d 3e 6f 63 | 6f 75 6e 74 29 3b 0a 09 |tree->oc|ount);..|
|00003110| 63 68 61 69 6e 64 75 6d | 70 20 28 74 72 65 65 2d |chaindum|p (tree-|
|00003120| 3e 73 75 63 63 2c 20 66 | 70 29 3b 0a 09 74 72 65 |>succ, f|p);..tre|
|00003130| 65 64 75 6d 70 20 28 74 | 72 65 65 2d 3e 6c 63 2c |edump (t|ree->lc,|
|00003140| 20 66 70 29 3b 0a 20 20 | 20 20 7d 0a 7d 0a 0a 2f | fp);. | }.}../|
|00003150| 2a 0a 20 2a 20 53 75 62 | 72 6f 75 74 69 6e 65 20 |*. * Sub|routine |
|00003160| 6f 66 20 74 72 65 65 64 | 75 6d 70 3b 20 69 74 20 |of treed|ump; it |
|00003170| 64 6f 65 73 20 6f 6e 65 | 20 72 6f 77 2e 0a 20 2a |does one| row.. *|
|00003180| 2f 0a 63 68 61 69 6e 64 | 75 6d 70 20 28 70 2c 20 |/.chaind|ump (p, |
|00003190| 66 70 29 0a 73 74 72 75 | 63 74 20 73 75 63 63 6e |fp).stru|ct succn|
|000031a0| 6f 64 65 20 2a 70 3b 0a | 46 49 4c 45 20 2a 66 70 |ode *p;.|FILE *fp|
|000031b0| 3b 0a 7b 0a 20 20 20 20 | 63 68 61 72 20 20 20 2a |;.{. |char *|
|000031c0| 74 65 78 74 3b 0a 20 20 | 20 20 77 68 69 6c 65 20 |text;. | while |
|000031d0| 28 70 29 20 7b 0a 09 69 | 66 20 28 70 2d 3e 73 63 |(p) {..i|f (p->sc|
|000031e0| 6e 6f 64 20 3d 3d 20 4e | 55 4c 4c 29 0a 09 20 20 |nod == N|ULL).. |
|000031f0| 20 20 74 65 78 74 20 3d | 20 22 3c 45 4f 46 3e 22 | text =| "<EOF>"|
|00003200| 3b 0a 09 65 6c 73 65 20 | 74 65 78 74 20 3d 20 70 |;..else |text = p|
|00003210| 72 5f 74 6f 6b 65 6e 20 | 28 70 2d 3e 73 63 6e 6f |r_token |(p->scno|
|00003220| 64 2d 3e 74 65 78 74 32 | 29 3b 0a 09 46 70 72 69 |d->text2|);..Fpri|
|00003230| 6e 74 66 20 28 66 70 2c | 20 22 20 25 73 20 25 64 |ntf (fp,| " %s %d|
|00003240| 22 2c 20 74 65 78 74 2c | 20 70 2d 3e 63 6f 75 6e |", text,| p->coun|
|00003250| 74 29 3b 0a 09 70 20 3d | 20 70 2d 3e 6c 69 6e 6b |t);..p =| p->link|
|00003260| 3b 0a 20 20 20 20 7d 0a | 20 20 20 20 70 75 74 63 |;. }.| putc|
|00003270| 20 28 27 5c 6e 27 2c 20 | 66 70 29 3b 0a 7d 0a 0a | ('\n', |fp);.}..|
|00003280| 2f 2a 0a 20 2a 20 54 68 | 69 73 20 72 6f 75 74 69 |/*. * Th|is routi|
|00003290| 6e 65 20 67 65 6e 65 72 | 61 74 65 73 20 74 68 65 |ne gener|ates the|
|000032a0| 20 64 75 6d 70 20 66 69 | 6c 65 20 28 2d 64 20 6f | dump fi|le (-d o|
|000032b0| 70 74 69 6f 6e 29 0a 20 | 2a 2f 0a 64 75 6d 70 5f |ption). |*/.dump_|
|000032c0| 64 61 74 61 62 61 73 65 | 20 28 66 69 6c 65 29 0a |database| (file).|
|000032d0| 63 68 61 72 20 2a 66 69 | 6c 65 3b 0a 7b 0a 20 20 |char *fi|le;.{. |
|000032e0| 20 20 46 49 4c 45 20 2a | 66 70 20 3d 20 66 6f 70 | FILE *|fp = fop|
|000032f0| 65 6e 20 28 66 69 6c 65 | 2c 20 22 77 22 29 3b 0a |en (file|, "w");.|
|00003300| 20 20 20 20 69 66 20 28 | 66 70 20 3d 3d 20 4e 55 | if (|fp == NU|
|00003310| 4c 4c 29 20 7b 0a 09 46 | 70 72 69 6e 74 66 20 28 |LL) {..F|printf (|
|00003320| 73 74 64 65 72 72 2c 20 | 22 6d 61 72 6b 6f 76 3a |stderr, |"markov:|
|00003330| 20 63 61 6e 27 74 20 6f | 70 65 6e 20 22 29 3b 0a | can't o|pen ");.|
|00003340| 09 70 65 72 72 6f 72 20 | 28 66 69 6c 65 29 3b 0a |.perror |(file);.|
|00003350| 09 65 78 69 74 20 28 31 | 29 3b 0a 20 20 20 20 7d |.exit (1|);. }|
|00003360| 0a 20 20 20 20 46 70 72 | 69 6e 74 66 20 28 66 70 |. Fpr|intf (fp|
|00003370| 2c 20 22 53 54 41 52 54 | 3a 22 29 3b 0a 20 20 20 |, "START|:");. |
|00003380| 20 63 68 61 69 6e 64 75 | 6d 70 20 28 73 74 61 72 | chaindu|mp (star|
|00003390| 74 2c 20 66 70 29 3b 0a | 20 20 20 20 74 72 65 65 |t, fp);.| tree|
|000033a0| 64 75 6d 70 20 28 72 6f | 6f 74 2c 20 66 70 29 3b |dump (ro|ot, fp);|
|000033b0| 0a 7d 0a 0a 2f 2a 20 72 | 6f 6c 6c 20 28 6e 29 20 |.}../* r|oll (n) |
|000033c0| 67 65 6e 65 72 61 74 65 | 73 20 61 20 75 6e 69 66 |generate|s a unif|
|000033d0| 6f 72 6d 6c 79 20 64 69 | 73 74 72 69 62 75 74 65 |ormly di|stribute|
|000033e0| 64 20 72 76 20 62 65 74 | 77 65 65 6e 20 30 20 61 |d rv bet|ween 0 a|
|000033f0| 6e 64 20 6e 2d 31 2e 0a | 20 2a 20 54 68 69 73 20 |nd n-1..| * This |
|00003400| 63 6f 64 65 20 69 73 20 | 73 74 6f 6c 65 6e 20 66 |code is |stolen f|
|00003410| 72 6f 6d 20 22 68 61 63 | 6b 22 20 61 6e 64 20 73 |rom "hac|k" and s|
|00003420| 68 6f 75 6c 64 20 62 65 | 20 70 6f 72 74 61 62 6c |hould be| portabl|
|00003430| 65 2e 20 20 49 66 20 79 | 6f 75 0a 20 2a 20 63 68 |e. If y|ou. * ch|
|00003440| 61 6e 67 65 20 74 68 69 | 73 2c 20 72 65 6d 65 6d |ange thi|s, remem|
|00003450| 62 65 72 20 74 68 61 74 | 20 64 69 66 66 65 72 65 |ber that| differe|
|00003460| 6e 74 20 73 79 73 74 65 | 6d 73 20 68 61 76 65 20 |nt syste|ms have |
|00003470| 72 61 6e 64 20 66 75 6e | 63 74 69 6f 6e 73 0a 20 |rand fun|ctions. |
|00003480| 2a 20 77 69 74 68 20 64 | 69 66 66 65 72 65 6e 74 |* with d|ifferent|
|00003490| 20 72 61 6e 67 65 73 2c | 20 61 6e 64 20 74 68 65 | ranges,| and the|
|000034a0| 20 62 6f 74 74 6f 6d 20 | 62 69 74 73 20 61 72 65 | bottom |bits are|
|000034b0| 20 6f 66 74 65 6e 20 6e | 6f 20 67 6f 6f 64 2e 0a | often n|o good..|
|000034c0| 20 2a 2f 0a 23 64 65 66 | 69 6e 65 20 72 6f 6c 6c | */.#def|ine roll|
|000034d0| 28 6e 29 20 28 28 72 61 | 6e 64 28 29 20 3e 3e 20 |(n) ((ra|nd() >> |
|000034e0| 33 29 20 25 20 6e 29 0a | 0a 2f 2a 0a 20 2a 20 54 |3) % n).|./*. * T|
|000034f0| 68 69 73 20 66 75 6e 63 | 74 69 6f 6e 20 67 65 6e |his func|tion gen|
|00003500| 65 72 61 74 65 73 20 61 | 6e 20 61 72 74 69 63 6c |erates a|n articl|
|00003510| 65 20 62 79 20 74 72 61 | 76 65 72 73 69 6e 67 20 |e by tra|versing |
|00003520| 74 68 65 0a 20 2a 20 73 | 74 72 75 63 74 75 72 65 |the. * s|tructure|
|00003530| 20 77 65 27 76 65 20 62 | 75 69 6c 74 2e 0a 20 2a | we've b|uilt.. *|
|00003540| 2f 0a 67 65 6e 65 72 61 | 74 65 5f 61 72 74 69 63 |/.genera|te_artic|
|00003550| 6c 65 20 28 29 20 7b 0a | 20 20 20 20 73 74 72 75 |le () {.| stru|
|00003560| 63 74 20 73 75 63 63 6e | 6f 64 65 20 2a 70 20 3d |ct succn|ode *p =|
|00003570| 20 73 74 61 72 74 3b 0a | 20 20 20 20 69 6e 74 20 | start;.| int |
|00003580| 6e 63 6f 75 6e 74 73 20 | 3d 20 6e 5f 66 69 6c 65 |ncounts |= n_file|
|00003590| 73 3b 0a 20 20 20 20 69 | 6e 74 20 6e 2c 20 61 63 |s;. i|nt n, ac|
|000035a0| 63 75 6d 3b 0a 20 20 20 | 20 63 68 61 72 20 2a 74 |cum;. | char *t|
|000035b0| 70 3b 0a 0a 20 20 20 20 | 77 68 69 6c 65 20 28 31 |p;.. |while (1|
|000035c0| 29 20 7b 0a 2f 2a 20 52 | 6f 6c 6c 20 74 68 65 20 |) {./* R|oll the |
|000035d0| 64 69 63 65 20 74 6f 20 | 66 69 6e 64 20 6f 75 74 |dice to |find out|
|000035e0| 20 74 68 65 20 6e 65 78 | 74 20 74 6f 6b 65 6e 2e | the nex|t token.|
|000035f0| 20 20 54 68 65 20 63 6f | 64 65 20 62 65 6c 6f 77 | The co|de below|
|00003600| 20 73 65 6c 65 63 74 73 | 20 74 68 65 0a 20 2a 20 | selects| the. * |
|00003610| 6e 65 78 74 20 74 6f 6b | 65 6e 2c 20 61 6e 64 20 |next tok|en, and |
|00003620| 74 68 65 20 6e 65 77 20 | 73 74 61 74 65 2c 20 77 |the new |state, w|
|00003630| 69 74 68 20 61 20 70 72 | 6f 62 61 62 69 6c 69 74 |ith a pr|obabilit|
|00003640| 79 20 63 6f 72 72 65 73 | 70 6f 6e 64 69 6e 67 20 |y corres|ponding |
|00003650| 74 6f 20 74 68 65 0a 20 | 2a 20 66 72 65 71 75 65 |to the. |* freque|
|00003660| 6e 63 79 20 69 6e 20 74 | 68 65 20 69 6e 70 75 74 |ncy in t|he input|
|00003670| 2e 0a 20 2a 2f 0a 09 6e | 20 3d 20 72 6f 6c 6c 20 |.. */..n| = roll |
|00003680| 28 6e 63 6f 75 6e 74 73 | 29 3b 0a 09 61 63 63 75 |(ncounts|);..accu|
|00003690| 6d 20 3d 20 70 2d 3e 63 | 6f 75 6e 74 3b 0a 09 77 |m = p->c|ount;..w|
|000036a0| 68 69 6c 65 20 28 61 63 | 63 75 6d 20 3c 3d 20 6e |hile (ac|cum <= n|
|000036b0| 20 26 26 20 70 2d 3e 6c | 69 6e 6b 29 20 7b 0a 09 | && p->l|ink) {..|
|000036c0| 20 20 20 20 70 20 3d 20 | 70 2d 3e 6c 69 6e 6b 3b | p = |p->link;|
|000036d0| 0a 09 20 20 20 20 61 63 | 63 75 6d 20 2b 3d 20 70 |.. ac|cum += p|
|000036e0| 2d 3e 63 6f 75 6e 74 3b | 0a 09 7d 0a 09 69 66 20 |->count;|..}..if |
|000036f0| 28 70 2d 3e 73 63 6e 6f | 64 20 3d 3d 20 4e 55 4c |(p->scno|d == NUL|
|00003700| 4c 29 0a 09 20 20 20 20 | 62 72 65 61 6b 3b 0a 09 |L).. |break;..|
|00003710| 74 70 20 3d 20 70 2d 3e | 73 63 6e 6f 64 2d 3e 74 |tp = p->|scnod->t|
|00003720| 65 78 74 32 3b 0a 2f 2a | 20 43 68 65 63 6b 20 66 |ext2;./*| Check f|
|00003730| 6f 72 20 22 65 6e 64 20 | 6f 66 20 73 74 6f 72 79 |or "end |of story|
|00003740| 22 20 2a 2f 0a 09 69 66 | 20 28 74 70 20 3d 3d 20 |" */..if| (tp == |
|00003750| 4e 55 4c 4c 29 0a 09 20 | 20 20 20 62 72 65 61 6b |NULL).. | break|
|00003760| 3b 0a 09 6f 75 74 70 75 | 74 5f 77 6f 72 64 20 28 |;..outpu|t_word (|
|00003770| 74 70 29 3b 0a 09 6e 63 | 6f 75 6e 74 73 20 3d 20 |tp);..nc|ounts = |
|00003780| 70 2d 3e 73 63 6e 6f 64 | 2d 3e 6f 63 6f 75 6e 74 |p->scnod|->ocount|
|00003790| 3b 0a 09 70 20 3d 20 70 | 2d 3e 73 63 6e 6f 64 2d |;..p = p|->scnod-|
|000037a0| 3e 73 75 63 63 3b 0a 20 | 20 20 20 7d 0a 20 20 20 |>succ;. | }. |
|000037b0| 20 6f 75 74 70 75 74 5f | 77 6f 72 64 20 28 22 5c | output_|word ("\|
|000037c0| 6e 22 29 3b 09 2f 2a 20 | 54 68 69 73 20 77 69 6c |n");./* |This wil|
|000037d0| 6c 20 66 6c 75 73 68 20 | 74 68 65 20 62 75 66 66 |l flush |the buff|
|000037e0| 65 72 20 61 73 20 77 65 | 6c 6c 2e 20 2a 2f 0a 20 |er as we|ll. */. |
|000037f0| 20 20 20 72 65 74 75 72 | 6e 3b 0a 7d 0a 0a 2f 2a | retur|n;.}../*|
|00003800| 0a 20 2a 20 54 68 69 73 | 20 76 65 72 73 69 6f 6e |. * This| version|
|00003810| 20 68 61 6e 64 6c 65 73 | 20 6e 75 6c 6c 20 73 74 | handles| null st|
|00003820| 72 69 6e 67 73 20 2a 0a | 20 2a 2f 0a 6d 79 5f 73 |rings *.| */.my_s|
|00003830| 74 72 63 6d 70 20 28 61 | 2c 20 62 29 0a 72 65 67 |trcmp (a|, b).reg|
|00003840| 69 73 74 65 72 20 63 68 | 61 72 20 2a 61 2c 20 2a |ister ch|ar *a, *|
|00003850| 62 3b 0a 7b 0a 20 20 20 | 20 69 66 20 28 61 20 3d |b;.{. | if (a =|
|00003860| 3d 20 4e 55 4c 4c 29 20 | 72 65 74 75 72 6e 20 62 |= NULL) |return b|
|00003870| 20 3f 20 2d 31 20 3a 20 | 30 3b 0a 20 20 20 20 69 | ? -1 : |0;. i|
|00003880| 66 20 28 62 20 3d 3d 20 | 4e 55 4c 4c 29 20 72 65 |f (b == |NULL) re|
|00003890| 74 75 72 6e 20 31 3b 0a | 20 20 20 20 72 65 74 75 |turn 1;.| retu|
|000038a0| 72 6e 20 73 74 72 63 6d | 70 20 28 61 2c 20 62 29 |rn strcm|p (a, b)|
|000038b0| 3b 0a 7d 0a 0a 23 64 65 | 66 69 6e 65 20 4c 45 4e |;.}..#de|fine LEN|
|000038c0| 20 37 35 0a 6f 75 74 70 | 75 74 5f 77 6f 72 64 20 | 75.outp|ut_word |
|000038d0| 28 77 6f 72 64 29 0a 63 | 68 61 72 20 2a 77 6f 72 |(word).c|har *wor|
|000038e0| 64 3b 0a 7b 0a 20 20 20 | 20 73 74 61 74 69 63 20 |d;.{. | static |
|000038f0| 63 68 61 72 20 6c 69 6e | 65 5b 4c 45 4e 2b 31 5d |char lin|e[LEN+1]|
|00003900| 3b 0a 20 20 20 20 73 74 | 61 74 69 63 20 69 6e 74 |;. st|atic int|
|00003910| 20 72 6f 6f 6d 20 3d 20 | 4c 45 4e 3b 0a 20 20 20 | room = |LEN;. |
|00003920| 20 69 6e 74 20 6c 3b 0a | 0a 20 20 20 20 69 66 20 | int l;.|. if |
|00003930| 28 77 6f 72 64 20 3d 3d | 20 4e 55 4c 4c 29 20 72 |(word ==| NULL) r|
|00003940| 65 74 75 72 6e 3b 0a 20 | 20 20 20 6c 20 3d 20 73 |eturn;. | l = s|
|00003950| 74 72 6c 65 6e 20 28 77 | 6f 72 64 29 3b 0a 2f 2a |trlen (w|ord);./*|
|00003960| 20 49 66 20 77 6f 72 64 | 20 77 6f 6e 27 74 20 66 | If word| won't f|
|00003970| 69 74 2c 20 6f 72 20 73 | 74 61 72 74 73 20 77 69 |it, or s|tarts wi|
|00003980| 74 68 20 5c 6e 2c 20 64 | 75 6d 70 20 74 68 65 20 |th \n, d|ump the |
|00003990| 63 75 72 72 65 6e 74 20 | 6c 69 6e 65 20 2a 2f 0a |current |line */.|
|000039a0| 20 20 20 20 69 66 20 28 | 28 6c 20 3e 3d 20 72 6f | if (|(l >= ro|
|000039b0| 6f 6d 20 7c 7c 20 77 6f | 72 64 5b 30 5d 20 3d 3d |om || wo|rd[0] ==|
|000039c0| 20 27 5c 6e 27 29 20 26 | 26 20 6c 69 6e 65 5b 30 | '\n') &|& line[0|
|000039d0| 5d 29 20 7b 0a 09 50 72 | 69 6e 74 66 20 28 22 25 |]) {..Pr|intf ("%|
|000039e0| 73 5c 6e 22 2c 20 6c 69 | 6e 65 29 3b 0a 09 6c 69 |s\n", li|ne);..li|
|000039f0| 6e 65 5b 30 5d 20 3d 20 | 30 3b 0a 09 72 6f 6f 6d |ne[0] = |0;..room|
|00003a00| 20 3d 20 4c 45 4e 3b 0a | 20 20 20 20 7d 0a 2f 2a | = LEN;.| }./*|
|00003a10| 20 49 66 20 77 6f 72 64 | 20 77 6f 6e 27 74 20 66 | If word| won't f|
|00003a20| 69 74 20 69 6e 20 74 68 | 65 20 62 75 66 66 65 72 |it in th|e buffer|
|00003a30| 20 6f 72 20 73 74 61 72 | 74 73 20 77 69 74 68 20 | or star|ts with |
|00003a40| 5c 6e 2c 20 70 72 69 6e | 74 20 69 74 20 6e 6f 77 |\n, prin|t it now|
|00003a50| 20 2a 2f 0a 20 20 20 20 | 69 66 20 28 6c 20 3e 3d | */. |if (l >=|
|00003a60| 20 4c 45 4e 29 0a 09 50 | 72 69 6e 74 66 20 28 22 | LEN)..P|rintf ("|
|00003a70| 25 73 5c 6e 22 2c 20 77 | 6f 72 64 29 3b 0a 20 20 |%s\n", w|ord);. |
|00003a80| 20 20 65 6c 73 65 20 69 | 66 20 28 77 6f 72 64 5b | else i|f (word[|
|00003a90| 30 5d 20 3d 3d 20 27 5c | 6e 27 29 0a 09 50 72 69 |0] == '\|n')..Pri|
|00003aa0| 6e 74 66 20 28 22 25 73 | 22 2c 20 77 6f 72 64 29 |ntf ("%s|", word)|
|00003ab0| 3b 0a 2f 2a 20 4f 74 68 | 65 72 77 69 73 65 20 66 |;./* Oth|erwise f|
|00003ac0| 69 6c 6c 20 69 74 20 69 | 6e 20 2a 2f 0a 20 20 20 |ill it i|n */. |
|00003ad0| 20 65 6c 73 65 20 7b 0a | 09 28 76 6f 69 64 29 73 | else {.|.(void)s|
|00003ae0| 74 72 63 61 74 20 28 6c | 69 6e 65 2c 20 77 6f 72 |trcat (l|ine, wor|
|00003af0| 64 29 3b 0a 09 28 76 6f | 69 64 29 73 74 72 63 61 |d);..(vo|id)strca|
|00003b00| 74 20 28 6c 69 6e 65 2c | 20 22 20 22 29 3b 0a 09 |t (line,| " ");..|
|00003b10| 72 6f 6f 6d 20 2d 3d 20 | 28 6c 20 2b 20 31 29 3b |room -= |(l + 1);|
|00003b20| 0a 20 20 20 20 7d 0a 20 | 20 20 20 72 65 74 75 72 |. }. | retur|
|00003b30| 6e 3b 0a 7d 0a 53 48 41 | 52 5f 45 4f 46 0a 66 69 |n;.}.SHA|R_EOF.fi|
|00003b40| 20 23 20 65 6e 64 20 6f | 66 20 6f 76 65 72 77 72 | # end o|f overwr|
|00003b50| 69 74 69 6e 67 20 63 68 | 65 63 6b 0a 69 66 20 74 |iting ch|eck.if t|
|00003b60| 65 73 74 20 2d 66 20 27 | 6d 61 72 6b 6f 76 33 2e |est -f '|markov3.|
|00003b70| 36 27 0a 74 68 65 6e 0a | 09 65 63 68 6f 20 73 68 |6'.then.|.echo sh|
|00003b80| 61 72 3a 20 77 69 6c 6c | 20 6e 6f 74 20 6f 76 65 |ar: will| not ove|
|00003b90| 72 2d 77 72 69 74 65 20 | 65 78 69 73 74 69 6e 67 |r-write |existing|
|00003ba0| 20 66 69 6c 65 20 22 27 | 6d 61 72 6b 6f 76 33 2e | file "'|markov3.|
|00003bb0| 36 27 22 0a 65 6c 73 65 | 0a 63 61 74 20 3c 3c 20 |6'".else|.cat << |
|00003bc0| 5c 53 48 41 52 5f 45 4f | 46 20 3e 20 27 6d 61 72 |\SHAR_EO|F > 'mar|
|00003bd0| 6b 6f 76 33 2e 36 27 0a | 2e 5c 22 20 6d 61 72 6b |kov3.6'.|.\" mark|
|00003be0| 6f 76 33 0a 2e 5c 22 20 | 40 28 23 29 6d 61 72 6b |ov3..\" |@(#)mark|
|00003bf0| 6f 76 33 2e 36 09 31 2e | 31 20 33 2f 36 2f 38 37 |ov3.6.1.|1 3/6/87|
|00003c00| 20 65 70 69 6d 61 73 73 | 21 6a 62 75 63 6b 0a 2e | epimass|!jbuck..|
|00003c10| 54 48 20 4d 41 52 4b 4f | 56 33 20 36 20 22 33 2f |TH MARKO|V3 6 "3/|
|00003c20| 36 2f 38 37 22 0a 2e 55 | 43 20 34 0a 2e 53 48 20 |6/87"..U|C 4..SH |
|00003c30| 4e 41 4d 45 0a 6d 61 72 | 6b 6f 76 33 20 5c 2d 20 |NAME.mar|kov3 \- |
|00003c40| 44 69 67 65 73 74 20 61 | 6e 64 20 73 70 69 74 20 |Digest a|nd spit |
|00003c50| 6f 75 74 20 71 75 61 73 | 69 2d 72 61 6e 64 6f 6d |out quas|i-random|
|00003c60| 20 55 73 65 6e 65 74 20 | 61 72 74 69 63 6c 65 73 | Usenet |articles|
|00003c70| 0a 2e 53 48 20 53 59 4e | 4f 50 53 49 53 0a 2e 42 |..SH SYN|OPSIS..B|
|00003c80| 20 6d 61 72 6b 6f 76 33 | 0a 5b 0a 2e 42 20 5c 2d | markov3|.[..B \-|
|00003c90| 70 76 0a 5d 20 5b 0a 2e | 42 20 5c 2d 6e 0a 2e 49 |pv.] [..|B \-n..I|
|00003ca0| 20 6e 5f 61 72 74 69 63 | 6c 65 73 0a 5d 20 5b 0a | n_artic|les.] [.|
|00003cb0| 2e 42 20 5c 2d 64 0a 2e | 49 20 64 75 6d 70 66 69 |.B \-d..|I dumpfi|
|00003cc0| 6c 65 0a 5d 20 5b 0a 2e | 42 20 5c 2d 73 0a 2e 49 |le.] [..|B \-s..I|
|00003cd0| 20 73 65 65 64 0a 5d 20 | 5b 0a 2e 42 20 5c 2d 78 | seed.] |[..B \-x|
|00003ce0| 0a 5d 0a 66 69 6c 65 73 | 0a 2e 53 48 20 44 45 53 |.].files|..SH DES|
|00003cf0| 43 52 49 50 54 49 4f 4e | 0a 2e 50 50 0a 2e 49 20 |CRIPTION|..PP..I |
|00003d00| 4d 61 72 6b 6f 76 33 0a | 64 69 67 65 73 74 73 20 |Markov3.|digests |
|00003d10| 55 73 65 6e 65 74 20 61 | 72 74 69 63 6c 65 73 20 |Usenet a|rticles |
|00003d20| 61 6e 64 20 62 75 69 6c | 64 73 20 61 6e 20 69 6e |and buil|ds an in|
|00003d30| 74 65 72 6e 61 6c 20 64 | 61 74 61 20 73 74 72 75 |ternal d|ata stru|
|00003d40| 63 74 75 72 65 20 74 68 | 61 74 0a 6d 6f 64 65 6c |cture th|at.model|
|00003d50| 73 20 74 68 65 20 61 72 | 74 69 63 6c 65 73 20 61 |s the ar|ticles a|
|00003d60| 73 20 69 66 20 74 68 65 | 79 20 63 61 6d 65 20 66 |s if the|y came f|
|00003d70| 72 6f 6d 20 61 20 72 61 | 6e 64 6f 6d 20 70 72 6f |rom a ra|ndom pro|
|00003d80| 63 65 73 73 2c 20 77 68 | 65 72 65 0a 65 61 63 68 |cess, wh|ere.each|
|00003d90| 20 77 6f 72 64 20 69 73 | 20 64 65 74 65 72 6d 69 | word is| determi|
|00003da0| 6e 65 64 20 62 79 20 74 | 68 65 20 70 72 65 76 69 |ned by t|he previ|
|00003db0| 6f 75 73 20 74 77 6f 2e | 20 20 49 74 20 74 68 65 |ous two.| It the|
|00003dc0| 6e 20 65 6d 69 74 73 20 | 61 20 73 65 72 69 65 73 |n emits |a series|
|00003dd0| 0a 6f 66 20 61 72 74 69 | 63 6c 65 73 20 6f 6e 20 |.of arti|cles on |
|00003de0| 74 68 65 20 73 74 61 6e | 64 61 72 64 20 6f 75 74 |the stan|dard out|
|00003df0| 70 75 74 20 74 68 61 74 | 20 68 61 76 65 20 74 68 |put that| have th|
|00003e00| 65 20 73 61 6d 65 20 64 | 69 73 74 72 69 62 75 74 |e same d|istribut|
|00003e10| 69 6f 6e 0a 6f 66 20 77 | 6f 72 64 73 2c 20 77 6f |ion.of w|ords, wo|
|00003e20| 72 64 20 70 61 69 72 73 | 2c 20 61 6e 64 20 77 6f |rd pairs|, and wo|
|00003e30| 72 64 20 74 72 69 70 6c | 65 74 73 20 61 73 20 64 |rd tripl|ets as d|
|00003e40| 6f 20 74 68 65 20 69 6e | 70 75 74 20 66 69 6c 65 |o the in|put file|
|00003e50| 73 2e 0a 54 68 65 20 6e | 61 6d 65 0a 2e 49 20 6d |s..The n|ame..I m|
|00003e60| 61 72 6b 6f 76 33 0a 63 | 6f 6d 65 73 20 66 72 6f |arkov3.c|omes fro|
|00003e70| 6d 20 74 68 65 20 66 61 | 63 74 20 74 68 61 74 20 |m the fa|ct that |
|00003e80| 74 68 69 73 20 73 74 72 | 75 63 74 75 72 65 20 69 |this str|ucture i|
|00003e90| 73 20 63 61 6c 6c 65 64 | 20 61 20 4d 61 72 6b 6f |s called| a Marko|
|00003ea0| 76 20 63 68 61 69 6e 2c | 0a 61 6e 64 20 74 68 61 |v chain,|.and tha|
|00003eb0| 74 20 74 68 65 20 73 74 | 61 74 69 73 74 69 63 73 |t the st|atistics|
|00003ec0| 20 66 6f 72 20 77 6f 72 | 64 20 74 72 69 70 6c 65 | for wor|d triple|
|00003ed0| 74 73 20 61 72 65 20 6d | 6f 64 65 6c 65 64 2e 0a |ts are m|odeled..|
|00003ee0| 48 65 72 65 2c 20 61 20 | 22 77 6f 72 64 22 20 69 |Here, a |"word" i|
|00003ef0| 73 20 61 20 73 65 71 75 | 65 6e 63 65 20 6f 66 20 |s a sequ|ence of |
|00003f00| 70 72 69 6e 74 61 62 6c | 65 20 63 68 61 72 61 63 |printabl|e charac|
|00003f10| 74 65 72 73 20 73 75 72 | 72 6f 75 6e 64 65 64 20 |ters sur|rounded |
|00003f20| 62 79 0a 77 68 69 74 65 | 73 70 61 63 65 2e 20 20 |by.white|space. |
|00003f30| 50 61 72 61 67 72 61 70 | 68 20 62 72 65 61 6b 73 |Paragrap|h breaks|
|00003f40| 20 28 62 6c 61 6e 6b 20 | 6c 69 6e 65 73 29 20 61 | (blank |lines) a|
|00003f50| 72 65 20 61 6c 73 6f 20 | 74 72 65 61 74 65 64 20 |re also |treated |
|00003f60| 61 73 20 61 0a 22 77 6f | 72 64 22 2e 20 20 50 61 |as a."wo|rd". Pa|
|00003f70| 72 61 67 72 61 70 68 73 | 20 6f 66 20 69 6e 63 6c |ragraphs| of incl|
|00003f80| 75 64 65 64 20 74 65 78 | 74 20 61 72 65 20 74 72 |uded tex|t are tr|
|00003f90| 65 61 74 65 64 20 61 73 | 20 73 69 6e 67 6c 65 20 |eated as| single |
|00003fa0| 22 77 6f 72 64 73 22 0a | 61 6e 64 20 70 72 69 6e |"words".|and prin|
|00003fb0| 74 65 64 20 61 73 20 22 | 3e 20 2e 2e 2e 22 2e 0a |ted as "|> ..."..|
|00003fc0| 2e 50 50 0a 42 79 20 64 | 65 66 61 75 6c 74 2c 20 |.PP.By d|efault, |
|00003fd0| 74 68 65 20 70 72 6f 67 | 72 61 6d 20 65 78 70 65 |the prog|ram expe|
|00003fe0| 63 74 73 20 74 6f 20 62 | 65 20 66 65 64 20 55 73 |cts to b|e fed Us|
|00003ff0| 65 6e 65 74 20 61 72 74 | 69 63 6c 65 73 3b 20 69 |enet art|icles; i|
|00004000| 74 20 73 74 72 69 70 73 | 0a 6f 66 66 20 68 65 61 |t strips|.off hea|
|00004010| 64 65 72 73 2c 20 69 6e | 63 6c 75 64 65 64 20 74 |ders, in|cluded t|
|00004020| 65 78 74 2c 20 61 6e 64 | 20 73 69 67 6e 61 74 75 |ext, and| signatu|
|00004030| 72 65 73 20 28 6f 72 20 | 61 74 20 6c 65 61 73 74 |res (or |at least|
|00004040| 20 69 74 20 74 72 69 65 | 73 29 2e 0a 54 68 65 0a | it trie|s)..The.|
|00004050| 2e 42 20 5c 2d 70 0a 28 | 70 6c 61 69 6e 29 20 6f |.B \-p.(|plain) o|
|00004060| 70 74 69 6f 6e 20 64 69 | 73 61 62 6c 65 73 20 74 |ption di|sables t|
|00004070| 68 65 20 68 65 61 64 65 | 72 2d 73 74 72 69 70 70 |he heade|r-stripp|
|00004080| 69 6e 67 20 66 65 61 74 | 75 72 65 20 28 6f 74 68 |ing feat|ure (oth|
|00004090| 65 72 77 69 73 65 0a 65 | 76 65 72 79 74 68 69 6e |erwise.e|verythin|
|000040a0| 67 20 69 73 20 73 6b 69 | 70 70 65 64 20 75 6e 74 |g is ski|pped unt|
|000040b0| 69 6c 20 61 20 62 6c 61 | 6e 6b 20 6c 69 6e 65 20 |il a bla|nk line |
|000040c0| 69 73 20 65 6e 63 6f 75 | 6e 74 65 72 65 64 29 2e |is encou|ntered).|
|000040d0| 0a 2e 50 50 0a 42 79 20 | 64 65 66 61 75 6c 74 2c |..PP.By |default,|
|000040e0| 20 31 30 20 61 72 74 69 | 63 6c 65 73 2c 20 73 65 | 10 arti|cles, se|
|000040f0| 70 61 72 61 74 65 64 20 | 62 79 20 66 6f 72 6d 20 |parated |by form |
|00004100| 66 65 65 64 73 2c 20 61 | 72 65 20 77 72 69 74 74 |feeds, a|re writt|
|00004110| 65 6e 20 6f 6e 20 74 68 | 65 0a 73 74 61 6e 64 61 |en on th|e.standa|
|00004120| 72 64 20 6f 75 74 70 75 | 74 2e 20 20 54 68 65 0a |rd outpu|t. The.|
|00004130| 2e 42 20 5c 2d 6e 0a 6f | 70 74 69 6f 6e 20 6c 65 |.B \-n.o|ption le|
|00004140| 74 73 20 79 6f 75 20 73 | 70 65 63 69 66 79 20 61 |ts you s|pecify a|
|00004150| 20 64 69 66 66 65 72 65 | 6e 74 20 6e 75 6d 62 65 | differe|nt numbe|
|00004160| 72 2e 0a 2e 50 50 0a 54 | 68 65 0a 2e 42 20 5c 2d |r...PP.T|he..B \-|
|00004170| 78 0a 6f 70 74 69 6f 6e | 20 64 6f 65 73 20 6e 6f |x.option| does no|
|00004180| 74 20 73 65 65 64 20 74 | 68 65 20 72 61 6e 64 6f |t seed t|he rando|
|00004190| 6d 20 6e 75 6d 62 65 72 | 20 67 65 6e 65 72 61 74 |m number| generat|
|000041a0| 6f 72 3b 20 74 68 69 73 | 20 69 73 20 75 73 65 66 |or; this| is usef|
|000041b0| 75 6c 0a 66 6f 72 20 73 | 69 6d 75 6c 61 74 69 6e |ul.for s|imulatin|
|000041c0| 67 20 70 65 6f 70 6c 65 | 20 77 68 6f 20 72 65 70 |g people| who rep|
|000041d0| 65 61 74 20 74 68 65 6d | 73 65 6c 76 65 73 2e 0a |eat them|selves..|
|000041e0| 2e 50 50 0a 54 68 65 0a | 2e 42 20 5c 2d 64 0a 28 |.PP.The.|.B \-d.(|
|000041f0| 64 75 6d 70 29 20 6f 70 | 74 69 6f 6e 20 64 75 6d |dump) op|tion dum|
|00004200| 70 73 20 61 20 72 65 70 | 72 65 73 65 6e 74 61 74 |ps a rep|resentat|
|00004210| 69 6f 6e 20 6f 66 20 74 | 68 65 20 69 6e 74 65 72 |ion of t|he inter|
|00004220| 6e 61 6c 20 64 61 74 61 | 20 73 74 72 75 63 74 75 |nal data| structu|
|00004230| 72 65 0a 62 75 69 6c 74 | 20 62 79 0a 2e 49 20 6d |re.built| by..I m|
|00004240| 61 72 6b 6f 76 33 0a 6f | 6e 20 74 68 65 20 6e 61 |arkov3.o|n the na|
|00004250| 6d 65 64 20 66 69 6c 65 | 2e 0a 2e 50 50 0a 46 69 |med file|...PP.Fi|
|00004260| 6e 61 6c 6c 79 2c 20 74 | 68 65 0a 2e 42 20 5c 2d |nally, t|he..B \-|
|00004270| 76 0a 28 76 65 72 62 6f | 73 65 29 0a 6f 70 74 69 |v.(verbo|se).opti|
|00004280| 6f 6e 20 70 72 69 6e 74 | 73 20 73 6f 6d 65 20 73 |on print|s some s|
|00004290| 74 61 74 69 73 74 69 63 | 73 20 6f 6e 20 74 68 65 |tatistic|s on the|
|000042a0| 20 73 74 61 6e 64 61 72 | 64 20 65 72 72 6f 72 2e | standar|d error.|
|000042b0| 0a 2e 53 48 20 22 43 41 | 56 45 41 54 53 22 0a 54 |..SH "CA|VEATS".T|
|000042c0| 68 69 73 20 70 72 6f 67 | 72 61 6d 20 61 6c 6c 6f |his prog|ram allo|
|000042d0| 63 61 74 65 73 20 6c 6f | 74 73 20 6f 66 20 6d 65 |cates lo|ts of me|
|000042e0| 6d 6f 72 79 20 69 66 20 | 67 69 76 65 6e 20 6c 61 |mory if |given la|
|000042f0| 72 67 65 20 61 6d 6f 75 | 6e 74 73 20 6f 66 20 69 |rge amou|nts of i|
|00004300| 6e 70 75 74 2e 0a 4f 6e | 20 76 69 72 74 75 61 6c |nput..On| virtual|
|00004310| 20 6d 65 6d 6f 72 79 20 | 73 79 73 74 65 6d 73 2c | memory |systems,|
|00004320| 20 74 68 65 20 70 61 67 | 69 6e 67 20 62 65 68 61 | the pag|ing beha|
|00004330| 76 69 6f 72 20 69 73 20 | 61 74 72 6f 63 69 6f 75 |vior is |atrociou|
|00004340| 73 20 62 65 63 61 75 73 | 65 0a 70 6f 69 6e 74 65 |s becaus|e.pointe|
|00004350| 72 73 20 74 65 6e 64 20 | 74 6f 20 70 6f 69 6e 74 |rs tend |to point|
|00004360| 20 65 76 65 72 79 20 77 | 68 69 63 68 20 77 61 79 | every w|hich way|
|00004370| 2c 20 61 6e 64 20 6d 61 | 6e 79 20 70 6f 69 6e 74 |, and ma|ny point|
|00004380| 65 72 73 20 61 72 65 20 | 64 65 72 65 66 65 72 65 |ers are |derefere|
|00004390| 6e 63 65 64 0a 66 6f 72 | 20 65 76 65 72 79 20 77 |nced.for| every w|
|000043a0| 6f 72 64 20 70 72 6f 63 | 65 73 73 65 64 2e 20 20 |ord proc|essed. |
|000043b0| 54 68 69 73 20 63 6f 75 | 6c 64 20 62 65 20 69 6d |This cou|ld be im|
|000043c0| 70 72 6f 76 65 64 2c 20 | 49 27 6d 20 73 75 72 65 |proved, |I'm sure|
|000043d0| 2e 0a 2e 50 50 0a 50 6f | 73 74 69 6e 67 20 61 72 |...PP.Po|sting ar|
|000043e0| 74 69 63 6c 65 73 20 67 | 65 6e 65 72 61 74 65 64 |ticles g|enerated|
|000043f0| 20 62 79 0a 2e 49 20 6d | 61 72 6b 6f 76 33 0a 74 | by..I m|arkov3.t|
|00004400| 6f 20 74 68 65 20 6e 65 | 74 20 6d 61 79 20 62 65 |o the ne|t may be|
|00004410| 20 68 61 7a 61 72 64 6f | 75 73 20 74 6f 20 79 6f | hazardo|us to yo|
|00004420| 75 72 20 68 65 61 6c 74 | 68 2e 0a 2e 50 50 0a 4e |ur healt|h...PP.N|
|00004430| 6f 74 20 61 73 20 73 6d | 61 72 74 20 61 73 20 4d |ot as sm|art as M|
|00004440| 61 72 6b 20 56 2e 20 53 | 68 61 6e 65 79 2e 0a 2e |ark V. S|haney...|
|00004450| 53 48 20 22 50 4f 52 54 | 41 42 49 4c 49 54 59 22 |SH "PORT|ABILITY"|
|00004460| 0a 41 6e 20 65 66 66 6f | 72 74 20 68 61 73 20 62 |.An effo|rt has b|
|00004470| 65 65 6e 20 6d 61 64 65 | 20 74 6f 20 6d 61 6b 65 |een made| to make|
|00004480| 20 74 68 69 73 20 70 72 | 6f 67 72 61 6d 20 61 73 | this pr|ogram as|
|00004490| 20 70 6f 72 74 61 62 6c | 65 20 61 73 20 70 6f 73 | portabl|e as pos|
|000044a0| 73 69 62 6c 65 3b 0a 61 | 6e 20 65 61 72 6c 69 65 |sible;.a|n earlie|
|000044b0| 72 20 76 65 72 73 69 6f | 6e 20 77 61 73 20 6d 75 |r versio|n was mu|
|000044c0| 63 68 20 6c 65 73 73 20 | 70 6f 72 74 61 62 6c 65 |ch less |portable|
|000044d0| 20 62 65 63 61 75 73 65 | 20 6f 66 20 70 72 6f 62 | because| of prob|
|000044e0| 6c 65 6d 73 20 77 69 74 | 68 0a 6e 75 6c 6c 20 70 |lems wit|h.null p|
|000044f0| 6f 69 6e 74 65 72 73 20 | 61 6e 64 20 72 61 6e 64 |ointers |and rand|
|00004500| 28 33 29 2e 20 20 50 6c | 65 61 73 65 20 6c 65 74 |(3). Pl|ease let|
|00004510| 20 6d 65 20 6b 6e 6f 77 | 20 69 66 20 79 6f 75 20 | me know| if you |
|00004520| 68 61 76 65 20 66 75 72 | 74 68 65 72 20 70 72 6f |have fur|ther pro|
|00004530| 62 6c 65 6d 73 2e 0a 2e | 50 50 0a 49 66 20 79 6f |blems...|PP.If yo|
|00004540| 75 20 64 6f 6e 27 74 20 | 68 61 76 65 20 6c 65 78 |u don't |have lex|
|00004550| 2c 20 79 6f 75 27 6c 6c | 20 6e 65 65 64 20 74 6f |, you'll| need to|
|00004560| 20 72 65 77 72 69 74 65 | 20 74 68 65 20 6c 65 78 | rewrite| the lex|
|00004570| 69 63 61 6c 20 61 6e 61 | 6c 79 7a 65 72 0a 62 75 |ical ana|lyzer.bu|
|00004580| 74 20 6d 6f 73 74 20 6f | 66 20 74 68 65 20 70 72 |t most o|f the pr|
|00004590| 6f 67 72 61 6d 20 69 73 | 20 69 6e 20 43 2e 0a 53 |ogram is| in C..S|
|000045a0| 48 41 52 5f 45 4f 46 0a | 66 69 20 23 20 65 6e 64 |HAR_EOF.|fi # end|
|000045b0| 20 6f 66 20 6f 76 65 72 | 77 72 69 74 69 6e 67 20 | of over|writing |
|000045c0| 63 68 65 63 6b 0a 69 66 | 20 74 65 73 74 20 2d 66 |check.if| test -f|
|000045d0| 20 27 4d 61 6b 65 66 69 | 6c 65 27 0a 74 68 65 6e | 'Makefi|le'.then|
|000045e0| 0a 09 65 63 68 6f 20 73 | 68 61 72 3a 20 77 69 6c |..echo s|har: wil|
|000045f0| 6c 20 6e 6f 74 20 6f 76 | 65 72 2d 77 72 69 74 65 |l not ov|er-write|
|00004600| 20 65 78 69 73 74 69 6e | 67 20 66 69 6c 65 20 22 | existin|g file "|
|00004610| 27 4d 61 6b 65 66 69 6c | 65 27 22 0a 65 6c 73 65 |'Makefil|e'".else|
|00004620| 0a 63 61 74 20 3c 3c 20 | 5c 53 48 41 52 5f 45 4f |.cat << |\SHAR_EO|
|00004630| 46 20 3e 20 27 4d 61 6b | 65 66 69 6c 65 27 0a 43 |F > 'Mak|efile'.C|
|00004640| 46 4c 41 47 53 3d 2d 4f | 0a 0a 47 4f 50 54 3d 0a |FLAGS=-O|..GOPT=.|
|00004650| 23 20 42 53 44 20 70 65 | 6f 70 6c 65 20 72 65 6d |# BSD pe|ople rem|
|00004660| 6f 76 65 20 74 68 65 20 | 66 6f 6c 6c 6f 77 69 6e |ove the |followin|
|00004670| 67 20 63 6f 6d 6d 65 6e | 74 0a 23 20 47 4f 50 54 |g commen|t.# GOPT|
|00004680| 3d 67 65 74 6f 70 74 2e | 6f 0a 6d 61 72 6b 6f 76 |=getopt.|o.markov|
|00004690| 33 3a 20 6d 61 72 6b 6f | 76 33 2e 6f 20 24 28 47 |3: marko|v3.o $(G|
|000046a0| 4f 50 54 29 0a 09 63 63 | 20 24 28 43 46 4c 41 47 |OPT)..cc| $(CFLAG|
|000046b0| 53 29 20 6d 61 72 6b 6f | 76 33 2e 6f 20 24 28 47 |S) marko|v3.o $(G|
|000046c0| 4f 50 54 29 20 2d 6f 20 | 6d 61 72 6b 6f 76 33 0a |OPT) -o |markov3.|
|000046d0| 0a 6d 61 72 6b 6f 76 33 | 2e 63 3a 09 6d 61 72 6b |.markov3|.c:.mark|
|000046e0| 6f 76 33 2e 6c 0a 09 09 | 6c 65 78 20 6d 61 72 6b |ov3.l...|lex mark|
|000046f0| 6f 76 33 2e 6c 0a 09 09 | 6d 76 20 6c 65 78 2e 79 |ov3.l...|mv lex.y|
|00004700| 79 2e 63 20 6d 61 72 6b | 6f 76 33 2e 63 0a 0a 73 |y.c mark|ov3.c..s|
|00004710| 68 61 72 3a 0a 09 09 73 | 68 61 72 20 52 45 41 44 |har:...s|har READ|
|00004720| 4d 45 20 6d 61 72 6b 6f | 76 33 2e 6c 20 6d 61 72 |ME marko|v3.l mar|
|00004730| 6b 6f 76 33 2e 36 20 4d | 61 6b 65 66 69 6c 65 20 |kov3.6 M|akefile |
|00004740| 67 65 74 6f 70 74 2e 63 | 20 50 41 54 43 48 4c 45 |getopt.c| PATCHLE|
|00004750| 56 45 4c 20 3e 20 73 68 | 61 72 0a 53 48 41 52 5f |VEL > sh|ar.SHAR_|
|00004760| 45 4f 46 0a 66 69 20 23 | 20 65 6e 64 20 6f 66 20 |EOF.fi #| end of |
|00004770| 6f 76 65 72 77 72 69 74 | 69 6e 67 20 63 68 65 63 |overwrit|ing chec|
|00004780| 6b 0a 69 66 20 74 65 73 | 74 20 2d 66 20 27 67 65 |k.if tes|t -f 'ge|
|00004790| 74 6f 70 74 2e 63 27 0a | 74 68 65 6e 0a 09 65 63 |topt.c'.|then..ec|
|000047a0| 68 6f 20 73 68 61 72 3a | 20 77 69 6c 6c 20 6e 6f |ho shar:| will no|
|000047b0| 74 20 6f 76 65 72 2d 77 | 72 69 74 65 20 65 78 69 |t over-w|rite exi|
|000047c0| 73 74 69 6e 67 20 66 69 | 6c 65 20 22 27 67 65 74 |sting fi|le "'get|
|000047d0| 6f 70 74 2e 63 27 22 0a | 65 6c 73 65 0a 63 61 74 |opt.c'".|else.cat|
|000047e0| 20 3c 3c 20 5c 53 48 41 | 52 5f 45 4f 46 20 3e 20 | << \SHA|R_EOF > |
|000047f0| 27 67 65 74 6f 70 74 2e | 63 27 0a 2f 2a 0a 20 2a |'getopt.|c'./*. *|
|00004800| 20 67 65 74 6f 70 74 20 | 2d 20 67 65 74 20 6f 70 | getopt |- get op|
|00004810| 74 69 6f 6e 20 6c 65 74 | 74 65 72 20 66 72 6f 6d |tion let|ter from|
|00004820| 20 61 72 67 76 0a 20 2a | 20 62 79 20 48 65 6e 72 | argv. *| by Henr|
|00004830| 79 20 53 70 65 6e 63 65 | 72 0a 20 2a 20 70 6f 73 |y Spence|r. * pos|
|00004840| 74 65 64 20 74 6f 20 55 | 73 65 6e 65 74 20 6e 65 |ted to U|senet ne|
|00004850| 74 2e 73 6f 75 72 63 65 | 73 20 6c 69 73 74 0a 20 |t.source|s list. |
|00004860| 2a 2f 0a 0a 23 69 6e 63 | 6c 75 64 65 20 3c 73 74 |*/..#inc|lude <st|
|00004870| 64 69 6f 2e 68 3e 0a 0a | 63 68 61 72 09 2a 6f 70 |dio.h>..|char.*op|
|00004880| 74 61 72 67 3b 09 2f 2a | 20 47 6c 6f 62 61 6c 20 |targ;./*| Global |
|00004890| 61 72 67 75 6d 65 6e 74 | 20 70 6f 69 6e 74 65 72 |argument| pointer|
|000048a0| 2e 20 2a 2f 0a 69 6e 74 | 09 6f 70 74 69 6e 64 20 |. */.int|.optind |
|000048b0| 3d 20 30 3b 09 2f 2a 20 | 47 6c 6f 62 61 6c 20 61 |= 0;./* |Global a|
|000048c0| 72 67 76 20 69 6e 64 65 | 78 2e 20 2a 2f 0a 0a 73 |rgv inde|x. */..s|
|000048d0| 74 61 74 69 63 20 63 68 | 61 72 09 2a 73 63 61 6e |tatic ch|ar.*scan|
|000048e0| 20 3d 20 4e 55 4c 4c 3b | 09 2f 2a 20 50 72 69 76 | = NULL;|./* Priv|
|000048f0| 61 74 65 20 73 63 61 6e | 20 70 6f 69 6e 74 65 72 |ate scan| pointer|
|00004900| 2e 20 2a 2f 0a 0a 65 78 | 74 65 72 6e 20 63 68 61 |. */..ex|tern cha|
|00004910| 72 09 2a 69 6e 64 65 78 | 28 29 3b 0a 0a 69 6e 74 |r.*index|();..int|
|00004920| 0a 67 65 74 6f 70 74 28 | 61 72 67 63 2c 20 61 72 |.getopt(|argc, ar|
|00004930| 67 76 2c 20 6f 70 74 73 | 74 72 69 6e 67 29 0a 69 |gv, opts|tring).i|
|00004940| 6e 74 20 61 72 67 63 3b | 0a 63 68 61 72 20 2a 61 |nt argc;|.char *a|
|00004950| 72 67 76 5b 5d 3b 0a 63 | 68 61 72 20 2a 6f 70 74 |rgv[];.c|har *opt|
|00004960| 73 74 72 69 6e 67 3b 0a | 7b 0a 09 72 65 67 69 73 |string;.|{..regis|
|00004970| 74 65 72 20 63 68 61 72 | 20 63 3b 0a 09 72 65 67 |ter char| c;..reg|
|00004980| 69 73 74 65 72 20 63 68 | 61 72 20 2a 70 6c 61 63 |ister ch|ar *plac|
|00004990| 65 3b 0a 0a 09 6f 70 74 | 61 72 67 20 3d 20 4e 55 |e;...opt|arg = NU|
|000049a0| 4c 4c 3b 0a 0a 09 69 66 | 20 28 73 63 61 6e 20 3d |LL;...if| (scan =|
|000049b0| 3d 20 4e 55 4c 4c 20 7c | 7c 20 2a 73 63 61 6e 20 |= NULL ||| *scan |
|000049c0| 3d 3d 20 27 5c 30 27 29 | 20 7b 0a 09 09 69 66 20 |== '\0')| {...if |
|000049d0| 28 6f 70 74 69 6e 64 20 | 3d 3d 20 30 29 0a 09 09 |(optind |== 0)...|
|000049e0| 09 6f 70 74 69 6e 64 2b | 2b 3b 0a 09 0a 09 09 69 |.optind+|+;.....i|
|000049f0| 66 20 28 6f 70 74 69 6e | 64 20 3e 3d 20 61 72 67 |f (optin|d >= arg|
|00004a00| 63 20 7c 7c 20 61 72 67 | 76 5b 6f 70 74 69 6e 64 |c || arg|v[optind|
|00004a10| 5d 5b 30 5d 20 21 3d 20 | 27 2d 27 20 7c 7c 20 61 |][0] != |'-' || a|
|00004a20| 72 67 76 5b 6f 70 74 69 | 6e 64 5d 5b 31 5d 20 3d |rgv[opti|nd][1] =|
|00004a30| 3d 20 27 5c 30 27 29 0a | 09 09 09 72 65 74 75 72 |= '\0').|...retur|
|00004a40| 6e 28 45 4f 46 29 3b 0a | 09 09 69 66 20 28 73 74 |n(EOF);.|..if (st|
|00004a50| 72 63 6d 70 28 61 72 67 | 76 5b 6f 70 74 69 6e 64 |rcmp(arg|v[optind|
|00004a60| 5d 2c 20 22 2d 2d 22 29 | 3d 3d 30 29 20 7b 0a 09 |], "--")|==0) {..|
|00004a70| 09 09 6f 70 74 69 6e 64 | 2b 2b 3b 0a 09 09 09 72 |..optind|++;....r|
|00004a80| 65 74 75 72 6e 28 45 4f | 46 29 3b 0a 09 09 7d 0a |eturn(EO|F);...}.|
|00004a90| 09 0a 09 09 73 63 61 6e | 20 3d 20 61 72 67 76 5b |....scan| = argv[|
|00004aa0| 6f 70 74 69 6e 64 5d 2b | 31 3b 0a 09 09 6f 70 74 |optind]+|1;...opt|
|00004ab0| 69 6e 64 2b 2b 3b 0a 09 | 7d 0a 0a 09 63 20 3d 20 |ind++;..|}...c = |
|00004ac0| 2a 73 63 61 6e 2b 2b 3b | 0a 09 70 6c 61 63 65 20 |*scan++;|..place |
|00004ad0| 3d 20 69 6e 64 65 78 28 | 6f 70 74 73 74 72 69 6e |= index(|optstrin|
|00004ae0| 67 2c 20 63 29 3b 0a 0a | 09 69 66 20 28 70 6c 61 |g, c);..|.if (pla|
|00004af0| 63 65 20 3d 3d 20 4e 55 | 4c 4c 20 7c 7c 20 63 20 |ce == NU|LL || c |
|00004b00| 3d 3d 20 27 3a 27 29 20 | 7b 0a 09 09 66 70 72 69 |== ':') |{...fpri|
|00004b10| 6e 74 66 28 73 74 64 65 | 72 72 2c 20 22 25 73 3a |ntf(stde|rr, "%s:|
|00004b20| 20 75 6e 6b 6e 6f 77 6e | 20 6f 70 74 69 6f 6e 20 | unknown| option |
|00004b30| 2d 25 63 5c 6e 22 2c 20 | 61 72 67 76 5b 30 5d 2c |-%c\n", |argv[0],|
|00004b40| 20 63 29 3b 0a 09 09 72 | 65 74 75 72 6e 28 27 3f | c);...r|eturn('?|
|00004b50| 27 29 3b 0a 09 7d 0a 0a | 09 70 6c 61 63 65 2b 2b |');..}..|.place++|
|00004b60| 3b 0a 09 69 66 20 28 2a | 70 6c 61 63 65 20 3d 3d |;..if (*|place ==|
|00004b70| 20 27 3a 27 29 20 7b 0a | 09 09 69 66 20 28 2a 73 | ':') {.|..if (*s|
|00004b80| 63 61 6e 20 21 3d 20 27 | 5c 30 27 29 20 7b 0a 09 |can != '|\0') {..|
|00004b90| 09 09 6f 70 74 61 72 67 | 20 3d 20 73 63 61 6e 3b |..optarg| = scan;|
|00004ba0| 0a 09 09 09 73 63 61 6e | 20 3d 20 4e 55 4c 4c 3b |....scan| = NULL;|
|00004bb0| 0a 09 09 7d 20 65 6c 73 | 65 20 7b 0a 09 09 09 6f |...} els|e {....o|
|00004bc0| 70 74 61 72 67 20 3d 20 | 61 72 67 76 5b 6f 70 74 |ptarg = |argv[opt|
|00004bd0| 69 6e 64 5d 3b 0a 09 09 | 09 6f 70 74 69 6e 64 2b |ind];...|.optind+|
|00004be0| 2b 3b 0a 09 09 7d 0a 09 | 7d 0a 0a 09 72 65 74 75 |+;...}..|}...retu|
|00004bf0| 72 6e 28 63 29 3b 0a 7d | 0a 53 48 41 52 5f 45 4f |rn(c);.}|.SHAR_EO|
|00004c00| 46 0a 66 69 20 23 20 65 | 6e 64 20 6f 66 20 6f 76 |F.fi # e|nd of ov|
|00004c10| 65 72 77 72 69 74 69 6e | 67 20 63 68 65 63 6b 0a |erwritin|g check.|
|00004c20| 69 66 20 74 65 73 74 20 | 2d 66 20 27 50 41 54 43 |if test |-f 'PATC|
|00004c30| 48 4c 45 56 45 4c 27 0a | 74 68 65 6e 0a 09 65 63 |HLEVEL'.|then..ec|
|00004c40| 68 6f 20 73 68 61 72 3a | 20 77 69 6c 6c 20 6e 6f |ho shar:| will no|
|00004c50| 74 20 6f 76 65 72 2d 77 | 72 69 74 65 20 65 78 69 |t over-w|rite exi|
|00004c60| 73 74 69 6e 67 20 66 69 | 6c 65 20 22 27 50 41 54 |sting fi|le "'PAT|
|00004c70| 43 48 4c 45 56 45 4c 27 | 22 0a 65 6c 73 65 0a 63 |CHLEVEL'|".else.c|
|00004c80| 61 74 20 3c 3c 20 5c 53 | 48 41 52 5f 45 4f 46 20 |at << \S|HAR_EOF |
|00004c90| 3e 20 27 50 41 54 43 48 | 4c 45 56 45 4c 27 0a 31 |> 'PATCH|LEVEL'.1|
|00004ca0| 0a 53 48 41 52 5f 45 4f | 46 0a 66 69 20 23 20 65 |.SHAR_EO|F.fi # e|
|00004cb0| 6e 64 20 6f 66 20 6f 76 | 65 72 77 72 69 74 69 6e |nd of ov|erwritin|
|00004cc0| 67 20 63 68 65 63 6b 0a | 23 09 45 6e 64 20 6f 66 |g check.|#.End of|
|00004cd0| 20 73 68 65 6c 6c 20 61 | 72 63 68 69 76 65 0a 65 | shell a|rchive.e|
|00004ce0| 78 69 74 20 30 0a 2d 2d | 20 0a 2d 20 4a 6f 65 20 |xit 0.--| .- Joe |
|00004cf0| 42 75 63 6b 20 09 7b 68 | 70 6c 61 62 73 2c 69 68 |Buck .{h|plabs,ih|
|00004d00| 6e 70 34 2c 73 75 6e 2c | 61 6d 65 73 7d 21 6f 6c |np4,sun,|ames}!ol|
|00004d10| 69 76 65 62 21 65 70 69 | 6d 61 73 73 21 6a 62 75 |iveb!epi|mass!jbu|
|00004d20| 63 6b 0a 09 09 73 65 69 | 73 6d 6f 21 65 70 69 77 |ck...sei|smo!epiw|
|00004d30| 72 6c 21 65 70 69 6d 61 | 73 73 21 6a 62 75 63 6b |rl!epima|ss!jbuck|
|00004d40| 20 20 7b 70 65 73 6e 74 | 61 2c 74 79 6d 69 78 2c | {pesnt|a,tymix,|
|00004d50| 61 70 70 6c 65 7d 21 65 | 70 69 6d 61 73 73 21 6a |apple}!e|pimass!j|
|00004d60| 62 75 63 6b 0a 20 20 45 | 6e 74 72 6f 70 69 63 20 |buck. E|ntropic |
|00004d70| 50 72 6f 63 65 73 73 69 | 6e 67 2c 20 49 6e 63 2e |Processi|ng, Inc.|
|00004d80| 2c 20 43 75 70 65 72 74 | 69 6e 6f 2c 20 43 61 6c |, Cupert|ino, Cal|
|00004d90| 69 66 6f 72 6e 69 61 0a | 0a 0a |ifornia.|.. |
+--------+-------------------------+-------------------------+--------+--------+