home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #30 / NN_1992_30.iso / spool / bit / listserv / sasl / 5424 < prev    next >
Encoding:
Text File  |  1992-12-18  |  3.4 KB  |  80 lines

  1. Comments: Gated by NETNEWS@AUVM.AMERICAN.EDU
  2. Path: sparky!uunet!paladin.american.edu!auvm!UNC.BITNET!UPHILG
  3. Message-ID: <SAS-L%92121718133832@VTVM2.CC.VT.EDU>
  4. Newsgroups: bit.listserv.sas-l
  5. Date:         Thu, 17 Dec 1992 18:15:00 EST
  6. Reply-To:     "Philip Gallagher,(919)966-1065" <UPHILG@UNC.BITNET>
  7. Sender:       "SAS(r) Discussion" <SAS-L@UGA.BITNET>
  8. From:         "Philip Gallagher,(919)966-1065" <UPHILG@UNC.BITNET>
  9. Subject:      Re: ID Numbers and confidentiality
  10. Comments: To: DENNIS G FISHER <AFDGF@ALASKA.BITNET>
  11. Lines: 67
  12.  
  13.     Dennis Fisher asked about concealing the identity of persons
  14.     in a dataset from a grad student who needs to work with the
  15.     data:
  16.  
  17.     Dennis,
  18.     I can think of several structural situations where this might not
  19.     work, but also many situations where it would.  How about this:
  20.  
  21.     DATA DISCREET(DROP=FIRSTNAM LASTNAM LABEL='File for student')
  22.          TELL_ALL(LABEL='File for Dennis, who knows all')
  23.          LINKFILE(KEEP=ID FIRSTNAM LASTNAM LABEL='Emergency file')
  24.          ;
  25.         INFILE ...;
  26.         INPUT month 1-2  day 3-4  year 5-6                              ;
  27.               firstnam $ 35-42  lastnam $ 43-54
  28.               ;
  29.         ID = _N_;
  30.         OUTPUT DISCREET TELL_ALL LINKFILE;
  31.     RUN;
  32.  
  33.     If there were many files you would have to go through the
  34.     nuisance process of creating the LINKFILE with the first dataset
  35.     and then merging it onto subsequent datasets by FIRSTNAM LASTNAM
  36.     to get the ID onto them, etc., but it is a feasible thing in lots
  37.     of situations;
  38.  
  39.     If it were a situation in which having obviously sequential
  40.     numbers would reveal the names to a true snoop, you could
  41.     sort the original dataset by some set of variables before
  42.     assigning values to ID.
  43.     If that were not enough, you could make the IDs look much
  44.     more mysterious by abandoning the _N_ technique and
  45.     substituting something a bit less obvious, like:
  46.  
  47.         RETAIN ID 0;
  48.         ID = ID + INT(10*RANUNI(1234567) );
  49.  
  50.     This also would be monotonically increasing and would undoubtedly
  51.     not fool the CIA or NASA or NSA or the British codebreakers, but
  52.     the average grad student with lots of work to do might not have
  53.     time to fuss with it.  Of course, if I really suspected that the
  54.     student would try to beat the system, I would ditch the student and
  55.     find someone else.  The best guarantee of confidentiality is
  56.     Integrity - without that you know there will always be someone
  57.     clever enough to break any code you devise.  Isn't there?
  58.  
  59.                                      Phil Gallagher
  60.  
  61.  
  62.  
  63.  
  64. > I have a situation with a grad student in which I have access to
  65. > a dataset that includes confidential names that she cannot have
  66. > access to.  I want to create a unique identifier so that
  67. > every time the same name shows up in the dataset, that person
  68. > gets the same identifier.  We do not have date of birth or
  69. > any other numbers that we could use.  The input statement looks something like
  70. > Input month 1-2  day 3-4  year 5-6  firstnam $ 35-42  lastnam $ 43-54 ;
  71. > We are using VMS and can use either 6.06 or 6.07.
  72. > If I could create a unique identifier, then I could just output
  73. > another raw dataset that has the unique identifier and the other
  74. > variables that she needs without the names, transfer that dataset
  75. > to her account, and everything would be fine.
  76. > Thanks in advance for your help.
  77. > Dennis Fisher
  78. > Center for Alcohol and Addiction Studies
  79. > University of Alaska Anchorage
  80.