home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #26 / NN_1992_26.iso / spool / comp / compress / 3827 < prev    next >
Encoding:
Internet Message Format  |  1992-11-13  |  1.2 KB

  1. Path: sparky!uunet!dtix!darwin.sura.net!haven.umd.edu!decuac!ufp.enet.dec.com!bell
  2. From: bell@ufp.enet.dec.com
  3. Newsgroups: comp.compression
  4. Subject: How well do random files crunch?
  5. Message-ID: <1992Nov13.135437.19044@decuac.dec.com>
  6. Date: 13 Nov 92 13:54:37 GMT
  7. Sender: news@decuac.dec.com (USENET News System)
  8. Reply-To: bell@ufp.enet.dec.com ()
  9. Organization: Digital Equipment Corporation
  10. Lines: 22
  11. Nntp-Posting-Host: server.dco.dec.com
  12.  
  13.  
  14.  
  15. Ok, let's talk about random files.  Say I produce a file filled with
  16. random bytes, based on a fairly equal-distribution function.
  17.  
  18. So the probability for any given character to occur is 1/256, no matter
  19. the file length (because it's an even distribution).
  20.  
  21. Does anyone have any statistics, or guesses about the compression
  22. obtainable by some of the more popular schemes (like LZH or LZW)?
  23.  
  24. How about for a parabolic distribution?  I mean (since I'm not that good
  25. with statistics) that it's more likely to get a high or low number, that
  26. one close to 0.5.  Do you think that would make any difference?
  27.  
  28. I guess one could say I've come up with a random number generator that's
  29. not equally distributed (I like that), and I'd like some input on the
  30. theory behind compressing "random" files.
  31.  
  32. Mike
  33.  
  34. P.S. Thanks for any help.
  35.