home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #3 / NN_1993_3.iso / spool / comp / os / vms / 22187 < prev    next >
Encoding:
Text File  |  1993-01-28  |  2.7 KB  |  55 lines

  1. Newsgroups: comp.os.vms
  2. Path: sparky!uunet!spool.mu.edu!howland.reston.ans.net!sol.ctr.columbia.edu!usenet.ucs.indiana.edu!fractal!mdchaney
  3. From: mdchaney@fractal.ucs.indiana.edu (M Darrin Chaney)
  4. Subject: Re: Tool to reorganize/transform ASCII files
  5. Message-ID: <C1Ktxs.JF7@usenet.ucs.indiana.edu>
  6. Sender: news@usenet.ucs.indiana.edu (USENET News System)
  7. Nntp-Posting-Host: fractal.ucs.indiana.edu
  8. Organization: Indiana University, Bloomington
  9. References: <1993Jan28.142833.7117@bmw.mayo.edu>
  10. Date: Thu, 28 Jan 1993 18:27:27 GMT
  11. Lines: 42
  12.  
  13. In article <1993Jan28.142833.7117@bmw.mayo.edu> fisk@mayo.edu writes:
  14. >We are looking for a tool that would allow us to take an ASCII input file, 
  15. >and reorganize/transform it to another format.
  16. >
  17. >The task at hand is taking ASCII data dumps from several different
  18. >medical centers that have similar but different formats and "normalizing" them
  19. >to one common data format that I can import into a database.  I would
  20. >essentially have to take apart the ASCII input records, reorganzie the data,
  21. >possibly do some transformations on the data (i.e., changing all the diagnosis
  22. >codes to a standard list), and write the data out to my common format.  I 
  23. >will then take this common format and import it into my database.
  24. >
  25. >The "perfect" tool would allow me to have a configuration file to drive the
  26. >entire process (since I have to do this for several different formats).
  27. >
  28. >Does anybody know if such a beast exsits?  Does this sound like something 
  29. >that awk/gawk would be capable of handling?
  30. >
  31. >Thanks for your help and suggestions!  Tom.
  32.  
  33. Well, I was going to suggest gawk, but you've heard about it already.  I'll
  34. suggest it anyway.
  35.  
  36. While I don't have the gawk source available, you can ftp to my machine
  37. (fractal.ucs.indiana.edu) and grab some sample awk programs there.  I also
  38. have a zipcode database, and the awk programs to fix it up.  You can also
  39. find the gawk manual in tex or ps format there.
  40.  
  41. >-------------------------------------------------------------------------------
  42. >Thomas B. Fisk          +----------------------------+  Internet: fisk@mayo.edu
  43. >Mayo Clinic             |   If you don't know where  |  Voice: (507) 255-4341
  44. >200 First Street SW     |  you're going you'll never |  FAX: (507) 255-5484
  45. >Mail Stop 2D-337 STM    |         get there.         |
  46. >Rochester, MN  55905    +----------------------------+
  47. >-------------------------------------------------------------------------------
  48.  
  49.     Darrin
  50. -- 
  51. M Darrin Chaney, Senior Database Programmer, University Computing Services, IU
  52. mdchaney@indiana.edu             1000 E 17th St.             Work: (812)855-5492
  53. mdchaney@iubacs.bitnet           Bloomington, IN 47408       Home: (812)333-6311
  54. "I want- I need- to live, to see it all..."
  55.