home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #3 / NN_1993_3.iso / spool / bit / listserv / sasl / 5717 < prev    next >
Encoding:
Text File  |  1993-01-22  |  2.4 KB  |  55 lines

  1. Comments: Gated by NETNEWS@AUVM.AMERICAN.EDU
  2. Path: sparky!uunet!paladin.american.edu!auvm!LEICESTER.AC.UK!SDD
  3. Return-Path: <@OHSTVMA.ACS.OHIO-STATE.EDU:SAS-L@VTVM2.BITNET>
  4. Via: uk.ac.leicester; Fri, 22 Jan 1993 11:00:24 +0000
  5. X-Mailer: ELM [version 2.3 PL0 (LUT)]
  6. Message-ID: <8627.9301221055@irix.le.ac.uk>
  7. Newsgroups: bit.listserv.sas-l
  8. Date:         Fri, 22 Jan 1993 10:55:40 GMT
  9. Reply-To:     Simon Dunkley <sdd@LEICESTER.AC.UK>
  10. Sender:       "SAS(r) Discussion" <SAS-L@UGA.BITNET>
  11. From:         Simon Dunkley <sdd@LEICESTER.AC.UK>
  12. Subject:      Saving time with indices...
  13. Comments: To: "(SAS(r) Distribution list)" <sas-l@vtvm2.cc.vt.edu>
  14. Lines: 39
  15.  
  16. A colleague here, John Woods <wrj@le.ac.uk> sent me the following, which
  17. may interest some people:
  18.  
  19. Forwarded message:
  20.  
  21. >       I have a large dataset (76,000 obs, 8 vars = 5.6Mb) that I needed
  22. >       to do a many to one linkage from a small dataset (900 obs, 2 vars)
  23. >       When I came across the 'create index' thing (new) in 'proc datasets'
  24. >       I thought that this might be a more economical way of doing the
  25. >       linkage rather than using 'proc sort' on both files.
  26. >       I was expecting that 'proc sort' and 'create index' would take
  27. >       about the same cpu time and the 'merge' would take slightly longer.
  28. >       The saving being that I do not need the disk space to hold the sorted
  29. >       verions of the datasets. The index (a character string) takes only 75K.
  30. >       Because the one dataset is tiny compared with the other I decided to
  31. >       see what the timing differences were whith the various combinations
  32. >       of sorting and indexing.
  33. >
  34. >               order           order   merge
  35. >       Big     time    Tiny    time    time
  36. >       sort    12.6    sort    0.25    10.58
  37. >       sort    12.6    index   0.57    11.89
  38. >       index   22.6    sort    0.25    50.03
  39. >       index   22.6    index   0.57    50.7
  40. >
  41. >       I really didn't expect the difference to be five fold on the merge,
  42. >       or three times overall.
  43. >
  44. >               John.
  45.  
  46.     Simon
  47.  
  48.       00 0 O o o...
  49.      0    ___         _________________ _______________ _______________
  50.     ][_n_i|(  ooo___  | Simon Dunkley | |   sdd@le    | | sdd@le.ac.uk|
  51.    (  __  | | |     | | Department of | |University of| |     +44     |
  52.    _||__|_|_|_|_____|_|__Psychiatry___|_|__Leicester__|_|_533__523259_|
  53.     o  O--O    o o o    o-o       o-o      o   o   o       o   o   o
  54. -+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-
  55.