home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #19 / NN_1992_19.iso / spool / comp / sys / next / sysadmin / 4914 < prev    next >
Encoding:
Text File  |  1992-08-29  |  5.7 KB  |  158 lines

  1. Newsgroups: comp.sys.next.sysadmin
  2. Path: sparky!uunet!newshost!root
  3. From: dglattin@trirex.com (Dennis Glatting)
  4. Subject: Re: crippled netinfo
  5. Message-ID: <1992Aug28.135743.20043@Trirex.COM>
  6. Sender: root@Trirex.COM (Operator)
  7. Organization: Trirex Systems Inc.
  8. References: <MeZffxu00WD510h3U9@andrew.cmu.edu>
  9. Date: Fri, 28 Aug 1992 13:57:43 GMT
  10. Lines: 146
  11.  
  12. In article <MeZffxu00WD510h3U9@andrew.cmu.edu> del+@CMU.EDU (Daniel Edward  
  13. Lovinger) writes:
  14. >     We have over 12k current users, and are using NetInfo to link
  15. > together a set of about 20 NeXTstations that are part of our larger
  16. > installation. After the last rebuild to insert the latest 4k account
  17. > adds, the server will not stay up for more than a few minutes - it
  18. > goes into a tight loop after which all data in /users in the / domain
  19. > is emptied.
  20. >     Chronology of the last two days ...:
  21. >     * 3pm Thu, after trying to wish the / domain back to life
  22. >         after the add, we rebuild the database from scratch.
  23. >         This appears to work, and /users is visible and
  24. >         lookups are working as the passwd file is loaded back
  25. >         in. People can log in, telnet, etc.
  26. >     * noon Friday the database had zeroed the /users from the
  27. >         previous day's rebuild. Start niload again on the
  28. >         passwd file, same circumstances during load. Back up
  29. >         the database after the niload finishes (seven hours
  30. >         later).
  31. >     * 1:30pm Sat, the database has zeroed out /users again. Kill
  32. >         netinfo, back in the database saveset, restart. Was
  33. >         able to nidump groups and look at passwd information.
  34. >         About two minutes later the netinfod for / goes into a
  35. >         tight loop and becomes unresponsive. Look at
  36. >         /usr/adm/messages and find nothing useful. Nothing
  37. >         else unusual. Repeat backup installation with same
  38. >         result. Begin waving dead chickens ...
  39. >     This is with the NeXT OS 2.0 netinfo suite. Before we tried
  40. > updating /usrers to 12k, we'd had little problems with the machine.
  41. > Does anyone have experience with NetInfo at this scale? I am
  42. > suspecting a magic number in the server that we must have crossed.
  43. >     I think my current options are limited to converting to YP on
  44. > the fly (something we have very little experience with). I have also
  45. > heard of third party NetInfo server implementations ... and
  46. > experience? Could a 3.0beta site comment on NetInfo changes? Would
  47. > that also be a realistic option? Can 2.0 machines contact a 3.0
  48. > server?
  49.  
  50. I administer some large computer NeXT sites.  I have seen NetInfo  
  51. wierdness before.
  52.  
  53. Do you know who your NetInfo clones are?  Until you have solved the  
  54. problem do this:
  55.  
  56. * Destroy all clones.
  57. * Go to *every* (except the master of course) NeXT in the network and look  
  58. in /etc/netinfo.  If there is anything there other than local.nidb, blow  
  59. it away.
  60. * Go to *every* machine (except the NetInfo master) and replace  
  61. /etc/hostconfig with the default from /usr/template/client/etc/hostconfig.   
  62. It would probably help if you edited /etc/hostconfig and set IPNETMASK to  
  63. -AUTOMATIC-.  That of course is dependent upon your network configuration.
  64.  
  65. Your NetInfo network performance will suffer with only one NetInfo server  
  66. but it is extremely important that you are working in a known environment.   
  67. In the past I have found clients set up clones, later destroyed the  
  68. clone's serves properties, but left the databases intact.  Even later,  
  69. when the NetInfo servers were down, machines were receiving out dated  
  70. NetInfo information from those exNetInfo servers.  I also saw those  
  71. machines providing NetInfo informtion thereby corrupting the master when  
  72. we were rebuilding the master NetInfo database.
  73.  
  74. I also suggest that you shut down all of the NeXT machines on your network  
  75. when you rebuild the master.
  76.  
  77. Here is a script I wrote that may help you.  It backs up the NetInfo  
  78. database.  I run it under cron every eight hours.  The script trims the  
  79. backup directory such that only a weeks worth of backups are retained.   
  80. (Sorry about using csh -- I was playing that day :).)
  81.  
  82.  
  83. --------- cut here ---------
  84. #! /bin/sh
  85. # This is a shell archive, meaning:
  86. # 1. Remove everything above the #! /bin/sh line.
  87. # 2. Save the resulting text in a file.
  88. # 3. Execute the file with /bin/sh (not csh) to create the files:
  89. #    niback
  90. # This archive created: Fri Aug 28 09:54:13 1992
  91. export PATH; PATH=/bin:$PATH
  92. if test -f 'niback'
  93. then
  94.     echo shar: will not over-write existing file "'niback'"
  95. else
  96. cat << \SHAR_EOF > 'niback'
  97. #!/bin/csh
  98.  
  99. # Dennis P. Glatting
  100. # Trirex Systems Inc.
  101. # 16-Jul-92
  102.  
  103. # (c) Copyright Trirex Systems Inc., 1992
  104.  
  105. # This is a modification to Amit's NetInfo backup script.
  106. # Rather than copy the databases verbatim, which uses a massive amount 
  107. # disk space, I am 'tar'ing and 'compress'ing the NetInfo data.
  108. # Also, I am doing the tar from the NetInfo directory level of /etc 
  109. # than descending the directory tree.  This makes restoration cleaner
  110. # but with a little more work.
  111.  
  112. set date = `date`
  113. set day = `echo $date | awk '{print $1}'`
  114. set target_file = "netinfo."`echo $date | awk '{print $2 $3 $4}'`".tar.Z"
  115.  
  116. set backup_dir = /etc/netinfo.old
  117. set source_dir = /etc/netinfo
  118.  
  119.  
  120. # If the backup directories does not exist then make it.
  121. if ( ! -d $backup_dir ) then
  122.     mkdir $backup_dir
  123.     chmod 700 $backup_dir
  124. endif
  125. if ( ! -d $backup_dir/$day ) then
  126.     mkdir $backup_dir/$day
  127.     chmod 700 $backup_dir/$day
  128. endif
  129.  
  130. # Maintain only a week's amount of data. 
  131. find $backup_dir -type f -mtime +7 -print | xargs rm -f
  132.  
  133. # Do the backup
  134. cd $backup_dir
  135. tar cf - $source_dir | compress >$day/$target_file
  136.  
  137.  
  138. exit 0
  139. SHAR_EOF
  140. chmod +x 'niback'
  141. fi # end of overwriting check
  142. #    End of shell archive
  143. exit 0
  144. --------- cut here ---------
  145.  
  146. --
  147. Dennis P. Glatting / Sr. Technical Manager / Trirex Systems Inc.
  148. 315 Post Road West / Westport, Connecticut 06880 / (203)221-4600
  149. dennis_glatting@trirex.com (NeXTmail Ok)
  150. Member League for Programming Freedom
  151.