home *** CD-ROM | disk | FTP | other *** search
/ Network Support Encyclopedia 96-1 / novell-nsepro-1996-1-cd2.iso / download / netware / tnds2.exe / TROUBTIP.TXT < prev    next >
Text File  |  1995-05-15  |  13KB  |  277 lines

  1.  
  2.  
  3. NetWare Directory Services
  4. Troubleshooting Tips
  5. May 5, 1995
  6.  
  7.  
  8.  
  9.  
  10.  
  11.  
  12.  
  13.  
  14. Disclaimer
  15.  
  16.            Novell, Inc. makes no representations or warranties with
  17.            respect to the contents or use of this manual, and
  18.            specifically disclaims any express or implied warranties
  19.            of merchantability or fitness for any particular
  20.            purpose.  Further, Novell, Inc. reserves the right to
  21.            revise this document and to make changes to its content,
  22.            at any time, without obligation to notify any person or 
  23.            entity of such revisions or changes.
  24.  
  25.            Novell, Inc.
  26.            122 East 1700 South
  27.            Provo, UT 84606
  28.  
  29.  
  30. Trademarks
  31.  
  32.            Novell and NetWare are registered trademarks of 
  33.            Novell, Inc.
  34. Troubleshooting Tips for NetWare Directory Services
  35.  
  36.  
  37. Introduction
  38.  
  39.      NetWare Directory Services (NDS) is a distributed database,
  40. and as such is loosely consistent.  Therefore, errors that come and
  41. go without intervention are normal and are no causes for alarm. 
  42. When an error occurs consistently for more than an hour, however,
  43. something is generally wrong and we recommend further
  44. investigation.
  45.      This document outlines general strategies for troubleshooting
  46. NDS problems.  The intent is to help System Administrators gather
  47. pertinent information and isolate their problem before placing a
  48. service call with Technical Support.  By following these
  49. guidelines, System Administrators can help Technical Support in
  50. resolving their issue quickly and perhaps even avoid placing a
  51. service call.
  52.  
  53.  
  54. Preventing Problems
  55.  
  56.      It is important to stay current with patches, read the release
  57. notes and readme files whenever upgrading or installing, and avoid
  58. experimenting on production trees.  If there is a warning notice on
  59. an operation in NWAdmin, Partition Manager, or DSRepair, rest
  60. assured that it is there for a good reason!  Many options available
  61. in DSRepair are for advanced troubleshooting purposes and should
  62. only be used in very specific situations.  Partition Manager should
  63. be used for ALL partition operations (i.e., deleting a replica from
  64. a server, changing a read/write replica to a master).  If a utility
  65. such as Partition Manager or NWAdmin returns an error during an
  66. operation, resolve the error instead of forcing the operation
  67. through DSRepair.  When in doubt, place a service call and take no
  68. action until advised to do so by a Technical Support Engineer.
  69.      The current NDS files can be found on the NSEPro, CompuServe,
  70. and the Internet.  The NetWare 4.x forum on NetWire is NOVLIB 14. 
  71. Current issues can be found in the above places and on the FaxBack
  72. service.  To obtain FaxBack documents, call 1-800-NetWare, press 2,
  73. then 2, and then follow the instructions or call FaxBack directly
  74. at (801)429-5350. 
  75.  
  76.  
  77. Identifying the Problem
  78.      
  79.      If you are experiencing a problem with your NDS, you are
  80. generally having trouble with one or more partitions, not with the
  81. entire tree.  The first step in identifying the problem
  82. is to determine the partition having trouble and then check the
  83. status of the servers holding replicas of that partition.  If there
  84. are multiple partitions with issues, take a top-down approach and 
  85. start at the top of the tree.  Resolve one partition's errors and 
  86. then move down to the next partition.
  87.      DSRepair and DSTrace are the best tools for finding NDS error
  88. conditions.  In a purely  4.1 tree, load DSRepair on a server
  89. holding a replica of the problem partition and perform Replica
  90. Synchronization from the Available Options menu.  This action will
  91. synchronize all replicas held on this server with all other
  92. replicas of the same partitions stored on other servers.  The log
  93. file will report the partition being synchronized, the server on
  94. which the synchronization was done, and the status of the
  95. synchronization according to that server.  The status column is
  96. especially helpful, providing error codes if the synchronization
  97. was unsuccessful.  The information shown on the screen in DSRepair
  98. after a Replica Synchronization is from a file in SYS:SYSTEM named
  99. DSREPAIR.LOG.  To manage the log file, go to the main menu in
  100. DSRepair, then to Advanced Options, then Log file and login
  101. configuration.  You can also view the file through a text editor
  102. and, if necessary, send it to Technical Support.  An example is
  103. shown below:
  104.  
  105. /****************************************************************
  106. ************/
  107. Netware 4.1 Directory Services Repair 4.25 , DS 4.77
  108. Log file for server "Saturn.novell" in tree "Galaxy"
  109. Start:  Thursday, May 4, 1995  10:32:00 pm Local Time
  110.  
  111. Synchronizing Replica: [Root]
  112. Performed on server: Mars.Novell
  113.  
  114. Servers that contain a replica  Replica Type    Status    
  115.  
  116. -----------------------------------------+-----------------+-----
  117. -----------
  118. Mars.Novell                     Subordinate     Host
  119. Saturn.Novell                   Master          OK
  120. Earth.Servers.Novell            Read Write      OK
  121. Mercury.Novell                  Read Write      -625
  122.  
  123.      In the above example, the [Root] partition is being
  124. synchronized and the replica being read is the one stored on the
  125. Mars server.  According to the Mars server, synchronization was
  126. successful with both Saturn and Earth, but failed with a -625 error
  127. on the Mercury server.  It is normal to see -683
  128. (INVALID_API_VERSION) errors during replica synchronization in a
  129. mixed (4.0x and 4.1) tree.
  130.      In mixed environments (4.1 and 4.0x servers in the same tree)
  131. and 4.0x trees, using DSTrace to identify the problem may be
  132. necessary.  DSTrace is a debugging screen on the server console. 
  133. To enable the screen, type SET DSTRACE=ON.  To force an immediate
  134. synchronization, type SET DSTRACE=*H.  Next, toggle to the
  135. Directory Services screen.  The synchronization of the replicas
  136. stored on that server will be shown on the screen.  An example is
  137. shown below:
  138.  
  139. Line
  140. 00   2FA9A1A3:152:FB018000 (95/05/04 21:55:15)
  141. 01   SYNC: Start sync of partition <[Root]> state:[0] type:[0]
  142. 02   SYNC: Start outbound sync with (2) [6B00023C]<Mars.Novell>
  143. 03    SYNC: sending updates to server <CN=Mars>
  144. 04   2FA9A1A3:355:FB018000  SYNC: update to server <CN=Mars>
  145.      successfully completed
  146. 05   2FA9A1A3:370:FB018000  SYNC: Start outbound sync with (3)
  147.      [010001A3]<Earth.Servers.Novell> 
  148. 06     SYNC: sending updates to server <CN=Earth>
  149. 07   2FA9A1A4:529:FB018000  SYNC: update to server <CN=Earth>
  150.      successfully completed
  151. 08   2FA9A1A4:542:FB018000  SYNC: Start outbound sync with (1)
  152.      [01000134]<Mercury.novell>
  153. 09   2FA9A1A4:549:FB018000 (21:55:16) SYNC: failed to communicate
  154.      with server <CN=Mercury> ERROR: 10  -625
  155. 11   SYNC: End sync of partition <[Root]> All processed = NO.
  156.  
  157.      Line 01 shows the partition being synched ([Root]), the state
  158. of the replica (0, which means "on"), and the replica type
  159. (0=Master, 1=Read/Write, 2=Read Only, 3=Subordinate Reference). 
  160. Line 02 shows the first outbound synch for the partition to server
  161. Mars.  Line 04 indicates that the synch with server Mars was
  162. successful.  Lines 06 and 07 shows outbound synch to server Earth
  163. completing successfully.  Line 08 shows the start of an outbound
  164. synch to server Mercury, and lines 09 and 10 show that synch
  165. failing with a -625 error.  The end result on line 11 is that the
  166. partition was unable to complete synchronization with all replicas. 
  167. The goal here is to see "All processed=YES" for every partition. 
  168.      To log the DSTrace information to a file, do the following at
  169. the console prompt:
  170.  
  171.      SET DSTRACE=ON     (Turns on the Directory Services screen)
  172.      SET TTF=ON         (Turns on Trace To File)
  173.      SET DSTRACE=*R     (Resets the Trace log file to zero bytes)
  174.      SET DSTRACE=*H     (Forces an immediate synchronization)
  175.      
  176.      Then toggle to the DS screen and wait for the cycle to
  177.      complete.
  178.      
  179.      SET TTF=OFF        (Turns off the Trace To File, closing the
  180.      log file)
  181.  
  182. This will send the DSTrace screen output to a file in SYS:SYSTEM
  183. named DSTRACE.DBG. This file can be viewed through a text editor
  184. and, if necessary, sent to Technical Support.
  185.  
  186.  
  187. Other Information to Gather
  188.  
  189.      Time Synchronization and DS Version: Time synchronization
  190. problems can prevent partition operations from completing
  191. successfully.  To check time synchronization for the entire tree in
  192. a 4.1 environment, load DSRepair on a 4.1 server holding a replica
  193. of the [Root] partition and choose Time Synchronization from the
  194. main menu.  This will send time synchronization information to a
  195. file (SYS:SYSTEM\DSREPAIR.LOG) which will list the server name, the
  196. timesync type, the DS version, and the timesync status.  A sample
  197. is shown below:
  198.  
  199. /****************************************************************
  200. ************/
  201. Netware 4.1 Directory Services Repair 4.25 , DS 4.77
  202. Log file for server "Saturn.Novell" in tree "Galaxy"
  203. Time synchronization and server status information
  204. Start:  Friday, May 5, 1995   9:51:40 am Local Time
  205.  
  206.                 DS.NLM    Replica  Time       Time is   Time
  207. Server name     Version   Depth    Source     in sync   +/-
  208. ---------------------------+-------+----------+-----------+-----
  209. ---+-------
  210. Mars.Novell     4.77       0       Secondary   No        +1
  211. Saturn.Novell   4.77       0       Secondary   Yes        0
  212. Earth.Servers.Novell
  213.                 4.77       0       Secondary   Yes        0
  214. Mercury.Novell  3.10       0       Single      Yes        0
  215.  
  216. *** END ***
  217.  
  218.      In a 4.0x tree, the time synchronization status can be found
  219. by typing TIME at the server console for each server.  Time
  220. synchronization should be active and time should be synchronized to
  221. the network.  Type MODULES at the server console to find the DS.NLM
  222. version for each server,  look for the DS.NLM, and note the number
  223. found in parentheses on the line immediately after the name DS.NLM
  224. (i.e., NetWare Directory Services (310) means that the version of
  225. DS is 310).  
  226.      Server Status: The status for each server in a replica list
  227. should be UP.  Directory Services was designed to be able to
  228. function normally when a server in the tree is down for short
  229. periods; however, if a server is not going to be up and available
  230. for synchronization for an extended period (more than a few days,
  231. depending on how busy the tree is) the "down" server  should be
  232. removed from the tree by loading INSTALL on that server and
  233. removing Directory Services from it.   If the network is having
  234. communication problems, Directory Services may have trouble
  235. synchronizing.  Therefore, checking the status of servers in the
  236. tree can pinpoint possible LAN issues which can adversely affect
  237. NDS.  To check the status of servers in  a 4.1 environment, load
  238. DSRepair on one server, choose Advanced Options, then select
  239. Servers Known to this Database.  All the servers found in that
  240. particular server's database will be displayed along with their
  241. status and ID number (according to the server you are viewing). 
  242. Any information gathered this way will be from the perspective of
  243. the server on which you ran the DSRepair.  To get a complete
  244. picture of the state of a partition, you should run this option on
  245. most, if not all, servers in the partition's replica list.  Any 4.x
  246. server showing as "DOWN" or "UNKNOWN" is a problem and should be
  247. noted in the Partition Troubleshooting Guide (PARTGUID.xxx).  
  248.      To check the status of servers in a 4.0x environment, you need
  249. an enhanced version of the 4.0x DSRepair.  This DSRepair can be
  250. found in 4X241.EXE on NetWire in NOVLIB 14.  Load this DSRepair on
  251. a 4.0x server as follows: LOAD DSREPAIR -UR.  This will load the
  252. DSRepair in unattended mode and gather the replica ring information
  253. and send it to DSREPAIR.LOG in SYS:SYSTEM.  Running this option
  254. will NOT lock the database, so users should not be affected.  You
  255. can then print or view this text file and send it Technical Support
  256. if necessary.  The replica ring information will be according to
  257. the server on which you ran the DSRepair, so to get a good idea of
  258. the state of a partition, you should run this DSRepair option on
  259. several, if not all, servers in the partition's replica list and
  260. then compare the output.  
  261.  
  262.  
  263. Summary
  264.      
  265.      With the information gathered through the above steps, one can
  266. fill out the  Partition Troubleshooting Guide (found in
  267. PARTGUID.xxx) to summarize partition errors and NDS troubleshooting
  268. status.  With that information in hand, System Administrators will
  269. be well equipped to solve NDS problems or, if necessary, help
  270. Technical Support to quickly resolve their issues.
  271.      The Partition Troubleshooting Guide document (PARTGUID.xxx)
  272. has a chart to help outline a partition's replica list, answer
  273. relevant NDS questions, and spot problem areas.  Included in that
  274. document is a sample chart with the information gathered in the
  275. examples listed above.  This chart is  a tool to help you to
  276. organize your troubleshooting efforts.
  277.