home *** CD-ROM | disk | FTP | other *** search
/ ftp.seagate.com / 2014.07.ftp.seagate.com.tar / ftp.seagate.com / pub / palindrome / technote / tn9401.asc < prev    next >
Text File  |  1995-02-07  |  27KB  |  669 lines

  1. Version 1.3  February 6, 1995
  2.  
  3. PURPOSE OF THIS TECH NOTE
  4.  
  5. To diagnose causes of NLM hangs and take appropriate action to resolve 
  6. the problem.
  7.  
  8.                     CONTENTS
  9.  
  10. 1.   OVERVIEW
  11.  
  12. 2.   FILES TO DOWNLOAD
  13.  
  14. 3.   WHAT TO DO FIRST
  15.  
  16. 4.   FREEING A HUNG NLM PROCESS
  17.  
  18. 5.   SERVERS WITH MORE THAN 16 MB OF RAM
  19.  
  20. 6.   SERVER TUNING
  21. 6.1  LOW AVAILABLE SERVER CACHE           
  22. 6.2  IMPROPER SERVER TUNING          
  23. 6.3  OLD NETWARE MODULES
  24. 6.4  OLD TSA's (SMS-based product only)
  25. 6.5  OLD LAN DRIVERS
  26.  
  27. 7.   HARDWARE ISSUES
  28. 7.1  ADAPTEC 274X SCSI CARDS
  29.  
  30. 8.   TYING IT ALL TOGETHER
  31.  
  32. 9.   WHAT TO DO IF PROBLEMS PERSIST
  33.  
  34.  
  35. 1.  Overview
  36.  
  37. Troubleshooting backup or restore hangs can be a time-consuming process.  
  38. When a backup or restore process hangs, it is usually caused by some 
  39. type of environmental problem and/or hardware conflict.  The exact cause 
  40. or combination of causes is often difficult to pinpoint.
  41.  
  42. Please take time to read this entire Tech Note.  Your particular hang 
  43. problem may be caused by a combination of the reasons described below.
  44.  
  45. NOTE:   The syntax and documentation references in this Tech Note are 
  46.         based on Network Archivist NLM version 3.1. Your syntax and 
  47.         the area of the documentation you may need to reference may 
  48.         vary depending on the Network Archivist version you are using. 
  49.  
  50.  
  51. 2.  FILES TO DOWNLOAD
  52.  
  53. This Tech Note refers to several files which are located on Palindrome's
  54. BBS and NETWIRE. You may want to download some of the following files 
  55. before proceeding with this Tech Note.
  56.  
  57.  
  58. FILE NAME       DESCRIPTION            AVAILABLE ON      DATE      PASSWORD 
  59. -----------------------------------------------------------------------------
  60. APRVMED.ASC    List of Palindrome-     Palindrome BBS       N/A         none
  61.                 approved media                                        
  62. -----------------------------------------------------------------------------
  63. LIBUP4.EXE     CLIB.NLM                Palindrome BBS                   none  
  64.                 version 3.12H for NetWare 3.11 and 3.12                       
  65.                 version 4.01e for NetWare 4.01 and 4.02                 
  66. -----------------------------------------------------------------------------
  67. CDL31.ASC      PNA/PBD 3.1             Palindrome BBS       N/A         none   
  68.                Supported Device                                          
  69.                List                                                      
  70. -----------------------------------------------------------------------------
  71. CDL30.ASC      PNA 3.0 Supported       Palindrome BBS       N/A         none   
  72.                Device List                                               
  73. ----------------------------------------------------------------------------
  74. CDL20G.ASC     TNA 2.0G / PBD 2.1      Palindrome BBS       N/A         none   
  75.                Supported Device                                          
  76.                List                                                      
  77. -----------------------------------------------------------------------------
  78. CDL20F.ASC     TNA 2.0F Supported      Palindrome BBS       N/A         none   
  79.                Device List                                               
  80. -----------------------------------------------------------------------------
  81. LANDR3.EXE     Updates to              NETWIRE              N/A         N/A    
  82.                Novell-certified                                          
  83.                *.LAN drivers                                            
  84. -----------------------------------------------------------------------------
  85. PALDIAG.ZIP    Backup device           Palindrome BBS       N/A         none   
  86.            diagnostic program                                        
  87. -----------------------------------------------------------------------------
  88. STRTL3.EXE     Updates to              NETWIRE              N/A         N/A    
  89.            NetWare NLMs                                              
  90. ----------------------------------------------------------------------------
  91. DRVR.ASC       Tested PNA/PBD          Palindrome BBS       N/A    
  92.            SCSI driver                                               
  93.                configurations                                            
  94. -----------------------------------------------------------------------------
  95. PALSDUMP.ZIP   Server Information      Palindrome BBS       N/A         N/A    
  96.                gathering tool
  97. -----------------------------------------------------------------------------
  98. SPXS4X.EXE     Updated spxs module     Palindrome BBS                     none
  99.            for NetWare 4.0x 
  100.            servers
  101. -----------------------------------------------------------------------------
  102.  
  103.  
  104. 3.  WHAT TO DO FIRST
  105.  
  106. If a backup or restore process hangs, perform the steps described below.
  107.  
  108. 1)  Always check the PNA_LOG file for any related error messages.  For help
  109.     with PNA error messages, with our 3.0 release or later, you can select the
  110.     Help - On Error menu, and get more information on a given error code.      
  111.     Often other pertinent error messages are also contained in the server's
  112.     volume error log, and system error log.  For instance, if our process hang 
  113.     was caused by a drive deactivation, this event will be recorded in the
  114.     system error log.  Also, PNA's backup activity of the server's Bindery
  115.     will also be recorded in the system error log.  
  116.  
  117. 2)  If the backup or restore process hangs, VERIFY the File History
  118.     Databases (AV*.PAC) for each protected volume using the 
  119.     Restore/Verify History Database(s) menu option. If you are using 
  120.     PNA version 3.0, use the Tools/Verify History Database(s) menu option; 
  121.     if you are using TNA version 2.x, use the TNARECOV menu option.
  122.  
  123. 3)  Write down (or print screen through RCONSOLE) a description of the 
  124.     backup/restore activity screen. What is the media state? Where on the 
  125.     volume is the backup or restore process?  What is the state of the 
  126.     LEDs on the front of the backup device?
  127.     
  128. 4)  Include the TIMESTAMP (/TS) switch during the next backup or restore
  129.     operation. The TIMESTAMP switch will create a detailed log file
  130.     (TMPSTAMP.LOG) which is written to your PNA installation directory.  
  131.     The TMPSTAMP.LOG file indicates exactly where the backup or restore 
  132.     process was at the time of the hang.  This is often important, especially
  133.     if the hang re-occurs.  In that case, a pattern can be established of 
  134.     exactly what process causes the hang each time, and that can significantly
  135.     narrow down the possible cause.
  136.  
  137.  
  138.     Additionally, you can edit the "Command to Execute" field (located
  139.     on the Network Archivist Configure/System Parameters screen) to include
  140.     the TIMESTAMP switch in your unattended backup command.
  141.     
  142.     BACKUP
  143.     ------
  144.     To invoke a TIMESTAMP during a backup operation, issue the following 
  145.     command:
  146.  
  147.        PNABACK  /A  /Q  /TS
  148.  
  149.     NOTE:   Use the LOAD statement if you are issuing PNABACK 
  150.             from the server console.
  151.  
  152.     RESTORE
  153.     -------
  154.     To invoke a TIMESTAMP during a restore operation, simply add the 
  155.     /TS switch to the end of the command line. For example:
  156.     
  157.        PNAREST /RO  FS1/APPS:  \*.*  /TS
  158.     
  159. 5)  If, during a backup, you suspect a particular volume is causing the 
  160.     problem, deactivate the volume on the Protected Resource List. 
  161.     (If you are using a 3.0 or previous version of PNA, remove the 
  162.     volume from the Protected Volume List.) If the backup completes, 
  163.     the hang may be caused by an environmental problem on the volume.
  164.  
  165.     NOTE:   DO NOT remove the volume from the Protected Resource List if
  166.             you are using PNA version 3.1. With version 3.1, removing
  167.             the volume also causes the volume's File History Database
  168.             to be deleted. However, making the resource INACTIVE simply
  169.             causes PNA to ignore the volume during the backup, and leaves
  170.             its File History Database intact.
  171.  
  172. 6)  To determine whether a backup hang is database-related, perform a 
  173.     Full Export. Since an export operation does not use the PNA databases
  174.     the way a managed backup operation does, a successful completion 
  175.     may indicate a database problem.
  176.  
  177.  
  178.  
  179. 4.  FREEING A HUNG NLM PROCESS
  180.  
  181. IMPORTANT!! 
  182.  
  183. NEVER try to unload an NLM that is hung or turn off the backup device 
  184. as a means of freeing up a hung process. Attempting to unload a hung 
  185. process or turning off the backup device may result in the entire server 
  186. locking or abending.
  187.  
  188. Always wait until a convenient time, then down the server properly using
  189. the DOWN command.
  190.  
  191.  
  192.  
  193. 5.  SERVERS WITH MORE THAN 16 MB OF RAM
  194.  
  195. A server with more than 16 MB of RAM and a lower end SCSI card such as 
  196. an Adaptec 1540 or 1640, or a Bustech 540, can cause NLMs to hang. 
  197. Within NetWare, any ISA SCSI card placed in an EISA-bus PC cannot
  198. address memory above 16 MB. 
  199.  
  200. As a workaround to this problem, Palindrome developed an additional 
  201. SCSI interface driver called PALSDRV.NLM, which was introduced in PNA 3.x. 
  202. PALSDRV.NLM is described below.
  203.  
  204. 1)  ARE YOU USING TNA 2.x or PBD 2.x?
  205.  
  206.     If so, upgrade your SCSI card to one that can address memory above 
  207.     16 MB. If you have an EISA machine, upgrade to a Palindrome-supported 
  208.     EISA SCSI controller. Optionally, you can upgrade your TNA or PBD
  209.     installation to PNA 3.1 or PBD 3.1, both which include Palindrome's
  210.     SCSI interface driver PALSDRV.NLM. Contact your Palindrome reseller
  211.     for upgrade information.
  212.  
  213. 2)  ARE YOU USING PNA 3.x or PBD 3.1?
  214.  
  215.     If so, add a "SET RESERVED BUFFERS BELOW 16 MEG = 200" statement
  216.     to the installation server's STARTUP.NCF file. 
  217.  
  218.     Also be sure to load the PALSDRV.NLM driver with the "ABOVE16MEG" switch.
  219.     You can add this statement to the installation server's AUTOEXEC.NCF 
  220.     file.
  221.  
  222.     "SET RESERVED BUFFERS" Statement
  223.     --------------------------------
  224.     Example of statement to be added to the PNA installation server's
  225.     STARTUP.NCF file:
  226.  
  227.          SET RESERVED BUFFERS BELOW 16 MEG = 200
  228.  
  229.     NOTE:   In order for this SET command to take effect, 
  230.          you must reboot the server.
  231.    
  232.     PALSDRV.NLM Driver
  233.     ------------------
  234.     Example of statements to be added to the PNA installation server's
  235.     AUTOEXEC.NCF file:
  236.  
  237.          LOAD AHA1540 PORT=330 ABOVE16=Y
  238.          LOAD PALSDRV ABOVE16MEG
  239.  
  240.     NOTE:   If PALSDRV is currently loaded in server memory 
  241.             (run MODULES to determine if it is loaded), unload 
  242.             it and reload it with the ABOVE16MEG switch.  However, 
  243.             do NOT unload PALSDRV if a backup or restore process 
  244.             is running.
  245.  
  246.     For more information, refer to the Network Archivist 3.1 Installation 
  247.     and Support Guide or the Network Archivist 3.0 Reference Guide.
  248.     
  249.  
  250.  
  251. 6.  SERVER TUNING
  252.  
  253.  
  254. 6.1  Available server cache is too low.
  255.  
  256. Check the AVAILABLE CACHE BUFFERS on the PNA installation server. To do 
  257. this, load MONITOR at the server console, choose RESOURCE UTILIZATION, 
  258. and check the percentage of AVAILABLE CACHE BUFFERS.
  259.  
  260. NOTE: 
  261. On a Netware 4.x server, load MONITOR, choose RESOURCE UTILIZATION, and 
  262. check the CACHE BUFFER percentage. 
  263.  
  264. If the percentage is at 50% or below, consider adding more memory to your
  265. server. This is because when a backup or restore process loads, it will take
  266. up an additional 1.5 MB to 2 MB. This coupled with normal network activity
  267. may take available cache percentage into the critical zone of 30% or lower.
  268.  
  269.  
  270. 6.2  Improper server tuning for Netware 3.1x and 4.0x servers.
  271.  
  272. Refer to page A-4 of the PNA 3.1 NLM Installation and Support
  273. Guide for more information on the procedures described below.
  274.  
  275. NOTE:   When using the settings suggested below, ensure your 
  276.         available cache buffers do not fall below 30% at any
  277.         time, including DURING a backup.  To check this, switch
  278.         screens to Monitor from a running backup process.  The
  279.         backup module will be using some additional memory during
  280.         the backup, and a server with 30% cache buffers when a
  281.         backup is NOT running, can easily fall below the 30% range
  282.         when a backup runs.  This is especially true with servers
  283.         with 16 or less megabytes of RAM.   
  284.         The settings suggested below can be placed in the 
  285.         AUTOEXEC.NCF file unless otherwise noted.
  286.  
  287.  
  288.     PACKET RECEIVE BUFFERS
  289.     ----------------------    
  290.     Palindrome recommends setting the "Minimum Packet Receive Buffers" to 
  291.     at least 100. A good rule of thumb is 1 packet receive buffer per 
  292.     licensed connection and 25 packet receive buffers for each NIC in the 
  293.     server.  
  294.  
  295.     For example, if your server is a 250-user license and your server has 
  296.     2 NICs, then your "Minimum Packet Receive Buffers" setting should be 300.
  297.  
  298.     To set the minimum packet receive buffers, use a command similar to the 
  299.     following at the server console:
  300.  
  301.      SET MINIMUM PACKET RECEIVE BUFFERS = 100
  302.      SET MAXIMUM PACKET RECEIVE BUFFERS = 500
  303.  
  304.     NOTE:   The "set minimum packet receive buffers" statement can be 
  305.             placed in the STARTUP.NCF file (but not in the AUTOEXEC.NCF file).
  306.  
  307.  
  308.     SPXCONFG  FOR 3.1x Servers !  (See next step for 4.0x servers)
  309.     --------
  310.     SPXCONFG is used to set certain parameters of SPX. Palindrome recommends 
  311.     using the following timeout values on your installation server if SPX is 
  312.     used:
  313.     Abort=5000, Verify=100, Wait=3000, Retry=255, Quiet=1.  
  314.  
  315.     To configure these settings, use a command similar to the following at the
  316.     server console:
  317.  
  318.       LOAD SPXCONFG A=5000 V=100 W=3000 R=255 Q=1
  319.     ( WARNING !  Loading this statement on a 4.x server will cause problems )
  320.  
  321. SPXCONFG  FOR 4.0x Servers !
  322.     --------
  323.  
  324.           Load "servman" on the 4.0x server.
  325.           Select IPX/SPX Configuration.
  326.           Select SPX Parameters.
  327.           Set the parameters as follows:
  328.                SPX watchdog abort timeout      5000
  329.                SPX watchdog verify timeout     100
  330.                SPX ack wait timeout            3000
  331.                SPX default retry count         255
  332.                Maximum concurrent SPX sessions 1000
  333.  
  334.  
  335.     DIRECTORY CACHE BUFFERS
  336.     
  337.     If any protected servers have directories containing a large number of
  338.     files, be sure to allocate enough directory cache buffers.
  339.  
  340.     Perform the following to calculate the number of cache buffers a server
  341.     should have:
  342.  
  343.     1)  Multiply the number of files (or potential number of files) in the 
  344.         largest directory by the number of name spaces on the volume.
  345.  
  346.      EXAMPLE:    The largest directory has 5000 files and there
  347.               are two name spaces loaded (AFP and DOS). Multiply
  348.               5000 x 2 = 10,000.
  349.  
  350.     2)  Multiply the number from Step 1 by the size of the directory 
  351.         entry, 128 bytes.
  352.  
  353.      EXAMPLE:    128 x 10000 = 1,280,000
  354.  
  355.     3)  Divide the number from Step 2 by the size of the cache buffer
  356.         (default size is 4K)
  357.  
  358.      EXAMPLE:    1,280,000/4096 = 320
  359.  
  360.     4)  Using the number from Step 3 as a minimum baseline, enter the 
  361.         following command at the server console:
  362.  
  363.        SET MINIMUM DIRECTORY CACHE BUFFERS=320
  364.  
  365.      Remember, the Maximum Directory Cache Buffers must be set 
  366.      to a value greater than the Minimum.
  367.      
  368.  
  369.     SHORT TERM MEMORY ALLOCATION on Netware 3.11 servers
  370.     
  371.     On servers with a large amount of communication activity (many users), 
  372.     the default 2MB of Allocated Short Term Memory is often not enough.
  373.     Depending on the number of users connected, the Allocated Short 
  374.     Term Memory should generally be somewhere between 4MB and 6MB and 
  375.     be increased as needed. Use a command similar to the following at 
  376.     the server console:
  377.  
  378.        SET MAXIMUM ALLOC SHORT TERM MEMORY = 4000000
  379.  
  380.  
  381. 6.3  OLD NETWARE MODULES
  382.  
  383. Be sure you are using current versions of the following modules on all
  384. protected servers: CLIB, STREAMS, TLI, IPXS, SPXS. Update any modules
  385. on protected servers that are not the current version.
  386.  
  387. Applying updates will depend on the NetWare version you are currently 
  388. running. Check on NETWIRE for information on the current NetWare updates.  
  389. Currently, STRTL3.EXE is available on NETWIRE and contains updates to 
  390. important Netware NLMs.  STRTL3.EXE is also available on Palindrome's BBS.
  391.  
  392. Use MODULES to compare the date of the modules loaded on your PNA
  393. installation server and all protected servers with the dates of the 
  394. modules listed below. If you find an older version on your server(s), 
  395. replace it with the current version.
  396.  
  397. NetWare 3.1x (includes Netware 3.12)
  398.  
  399.     STREAMS.NLM          7-20-93
  400.     SPXS.NLM             5-17-94
  401.     TLI.NLM              9-14-93
  402.     IPXS.NLM             8-10-93
  403.     
  404.  
  405. NetWare 4.0x
  406.  
  407.      STREAMS.NLM         9-14-93
  408.      SPXS.NLM            8-30-94  *
  409.      TLI.NLM             9-14-93
  410.      IPXS.NLM            8-23-93
  411.      SPXDDFIX.NLM        3-10-94
  412.  
  413.      *  This updated SPXS module can be uploaded via Palindrome's BBS or
  414.         NetWire under filename SPXS4X.EXE.
  415.       
  416.      ** Soon, NetWare 4.01 and 4.02 will no longer be supported by Novell.
  417.         Palindrome strongly recommends updating to NetWare 4.1 as soon
  418.         as possible.  Make sure to be running at least NetWare 4.02.
  419.  
  420. NetWare 4.1
  421.       
  422.       The NLMs found in the shipping-version of NetWare 4.1 are current as
  423.       of the date of this tech note.
  424.  
  425. CURRENT CLIB VERSIONS
  426.  
  427. Be sure you are using a current version of CLIB. Compare the date of the 
  428. CLIB loaded on your server(s) with the dates listed below according 
  429. to the version of NetWare you are using. If you are not using the current 
  430. CLIB version, update your PNA installation server and remote servers
  431. accordingly.  
  432.    
  433. SERVER RUNNING              USE CLIB.NLM VERSION        DATE            
  434.                                                                        
  435.  NetWare 3.12 or:                3.12H *                10-27-94        
  436.   - NetWare 3.11                                               
  437.      
  438.  NetWare 4.0x                    4.01E *                5-25-94
  439.  
  440.  NetWare 4.1                     4.10                   11-03-94       
  441.  
  442.  
  443. * CLIB.NLM version 3.12H and 4.01E are available on the Palindrome BBS as        
  444.   LIBUP4.EXE (no password).
  445.  
  446.  
  447. 6.4  OLD TSAs (SMS-BASED PNA & PBD ONLY)
  448.  
  449. Use MODULES to compare the TSA listing below with the TSAs currently loaded 
  450. on your PNA installation server and remote servers.
  451.  
  452. If you are using an older TSA than those listed below, unload it and 
  453. replace it with the corresponding TSA located on Palindrome's TSA diskette. 
  454. Also be sure to use the correct TSA name. (For example, do not load TSA_400; 
  455. the newer version of the same TSA is TSA400.)  If you are using TSA's NEWER
  456. than those listed below, that's ok.  Do NOT change TSA's if your TSA's are
  457. newer than those listed below.
  458.  
  459.  
  460.      NetWare 3.11 server
  461.  
  462.        SMDR31X.NLM    10-28-93
  463.        TSA311.NLM     11-5-93
  464.        WS_MAN.NLM     10-12-93
  465.        TSA_DOS.NLM    11-8-93
  466.  
  467.      NetWare 3.12 server
  468.  
  469.        SMDR31X.NLM    10-28-93
  470.        TSA312.NLM     11-5-93
  471.        WS_MAN.NLM     10-12-93
  472.        TSA_DOS.NLM    11-8-93
  473.  
  474.      NetWare 4.0x server 
  475.  
  476.        SMDR.NLM       10-28-93
  477.        TSA400.NLM     11-5-93
  478.        TSANDS.NLM     10-26-93
  479.        WS_MAN.NLM     10-12-93
  480.        TSA_DOS.NLM    11-8-93
  481.       
  482.      NetWare 4.1 server
  483.  
  484.        SMDR.NLM       10-20-94
  485.        TSA410.NLM     10-21-94
  486.        TSANDS.NLM     10-21-94
  487.        WSMAN.NLM      10-21-94
  488.        TSADOS.NLM     10-21-94
  489.  
  490.    Novell develops the core operating system TSAs, and generally releases new
  491.    versions every 6 months.  The most current release availble is on the
  492.    Palindrome's BBS in a file called TSA0694.ZIP.  
  493.  
  494.    IMPORTANT NOTE:
  495.  
  496.    There are issues raised by upgrading TSAs that go beyond the scope of
  497.    this tech note, so please see Palindrome Tech Note TN094-003.ASC if you
  498.    intend to upgrade any TSAs.  If you do upgrade TSA's, the Protected
  499.    Resource List will need to be reconfigured.  This process is explained
  500.    in TN94-003.ASC.
  501.  
  502.  
  503.    The TSAs available for NW 4.1 ship with NW 4.1.  Any later releases will
  504.    be made available on the Palindrome BBS and NETWIRE.
  505.  
  506.  
  507. 6.5  OLD LAN DRIVERS
  508.  
  509. Be sure you are using the most current LAN driver version available for
  510. your specific network card and NetWare version. If you need to verify 
  511. the current version of your LAN driver, contact the vendor from whom
  512. you purchased the driver.
  513.  
  514. Novell provides updates to the latest Novell-certified server
  515. drivers for NExxx.* boards, TOKEN, TRXNET, and PCN2L.  These
  516. updates are located on NETWIRE under filename LANDR3.EXE.
  517.  
  518. LANDR3.EXE also contains updates to the 4.0x and 3.1x media
  519. support module (MSM and MSM31X) and the Ethernet topology
  520. support module (ETHERTSM). 
  521.  
  522. Netware 4.1 ships with updated LAN drivers.
  523.  
  524. If applicable, compare the dates of the NLMs listed below to those 
  525. currently installed on your protected servers. Update to the version(s)
  526. listed below if your driver is older.
  527.  
  528.      NE2000.LAN     10-8-93
  529.      NE3200.LAN     10-8-93
  530.  
  531.      MSM.NLM        10-4-93
  532.      MSM31X.NLM     10-4-93
  533.  
  534.      ETHERTSM.NLM   9-28-93
  535.  
  536.  
  537.  
  538. 7.  HARDWARE ISSUES
  539.  
  540. 1)  Be sure your SCSI controller, backup device, and the backup device's 
  541.     firmware are supported. The Palindrome BBS contains the following 
  542.     supported device listings:
  543.     
  544.     CDL31.ASC for PNA & PBD 3.1
  545.  
  546.     CDL30.ASC for PNA 3.0
  547.  
  548.     CDL20G.ASC for TNA 2.0G & PBD 2.1
  549.  
  550.     CDL20F.ASC for TNA 2.0F
  551.  
  552.     To view information about the SCSI host adapter and the model and 
  553.     firmware version of your backup device, use PALDIAG.NLM to scan the 
  554.     SCSI bus. (PALDIAG.NLM can also be used to run diagnostics on the
  555.     backup device.) PALDIAG.NLM is included with Palindrome's 3.x products
  556.     and is also available on Palindrome's BBS under filename
  557.     PALDIAG.ZIP (no password needed).
  558.  
  559.     To scan the SCSI bus and determine your backup device's model and 
  560.     firmware version, copy PALDIAG.NLM to your SYS:SYSTEM directory,
  561.     and from the server console type:
  562.  
  563.      LOAD PALDIAG /S
  564.  
  565. 2)  Verify that the SCSI BUS is properly terminated.
  566.  
  567. 3)  Download the file TSTDRVR.ASC from Palindrome's BBS and compare your  
  568.     current SCSI driver with the list of Palindrome-tested SCSI drivers.
  569.  
  570. 4)  Be sure the drive is clean and the media being used is a recommended 
  571.     DATA GRADE brand. Download APRVMED.ASC from Palindrome's BBS for 
  572.     a listing of approved media.
  573.  
  574. 5)  To test the backup device, use PALDIAG with the "/D" switch to run 
  575.     diagnostics on the device.
  576.  
  577.     To perform the diagnostics, at the server console type:
  578.  
  579.     LOAD PALDIAG /D
  580.     
  581.     PALDIAG /D performs a short read/write test that will provide 
  582.     percentages of retries during the read and write phase of the testing.
  583.  
  584.     When you run PALDIAG /D, be sure the drive is clean and perform the 
  585.     test on at least 2 different tapes.  Print screen the results in case 
  586.     you need help from Palindrome Technical Support.
  587.  
  588.     Refer to the PNA Reference Guide (Chapter 3, "Media Maintenance") 
  589.     for acceptable percentage thresholds for your particular backup device.
  590.  
  591. 6)  If you suspect the media is bad, verify the media using the 
  592.     Media/Verify menu option. For pre-3.x versions of PNA, use the 
  593.     Utility/Verify Tape menu option.
  594.  
  595. 7)  Check for possible interrupt, I/O, and DMA conflicts with
  596.     other adapters in the server.
  597.  
  598. 8)  Consider swapping the hardware components. Begin with the backup 
  599.     device, followed by the cable, and then the host adapter.
  600.  
  601.  
  602. 7.1  ADAPTEC 274X SCSI CONTROLLERS
  603.  
  604. ADAPTEC 274X ADAPTERS:
  605.  
  606. Many hang situations are seen in cases where an Adaptec 274x card is in use,
  607. often as the backup device controller, and sometimes as the NetWare Volume's
  608. device controller.  It is critical that you make sure you have the proper
  609. driver for this popular SCSI card.  Typically, the drivers dated 5-31-94 or
  610. later have resolved the vast majority of problems.  This applies for any SCSI
  611. controller running the AIC7770 chipset, including embedded SCSI controllers
  612. integrated into the motherboards of the Intel Deskside server, and the HP
  613. NetServer.  With earlier revisions of the AIC7770 chip, having too many
  614. devices on the same SCSI bus can precipitate hangs and device deactivations
  615. during high-throughput situations, such as a backup.  You can tell the chip's
  616. revision by looking at the 3rd line of print on the chip marked Adaptec.  The
  617. first line of print says "Adaptec", the second says "AIC7770" (sometimes with
  618. a "p" after it), and the third row is a row of letters and numbers.  If that
  619. row begins with a "C", you have an early rev. chip.  If the row begins with
  620. "H" or later, then updating the driver should resolve the problem. 
  621.  
  622.  
  623. 8.  TYING IT ALL TOGETHER
  624.  
  625. Once you have gathered all of the above information, it is important to
  626. establish a pattern, and a point of failure.  There are a number of important
  627. questions that need to be asked that can lead to the solution:
  628.  
  629. When did the problem first begin to occur?
  630. Was there something that changed immediately prior to the first occurrence?
  631. When does the hang occur?
  632. What operation is the software performing when it happens?
  633. Does it happen on the same operation each time?
  634. The same volume?
  635. The same place on a particular volume?
  636. Does it occur when we begin writing to the backup media?
  637. What hardware components are being used, and which are being used the heaviest
  638. at the time of the hang?
  639. If you change one of the variables, (ie. hardware component or configuration,
  640. or software component or setting) does the behavior change?
  641.  
  642.  
  643. 9.  WHAT TO DO IF PROBLEMS PERSIST
  644.  
  645.  
  646. If the suggestions described in this Tech Note do not resolve the 
  647. hang problem you are experiencing, contact Palindrome Technical Support.
  648.  
  649. Please have the following items ready to fax to Palindrome Tech Support:
  650.  
  651.        1. PALSDUMP output  
  652.           (refer to readme contained within PALSDUMP.ZIP for 
  653.           instructions.  PALSDUMP.ZIP can be downloaded from
  654.           Palindrome's BBS)
  655.       
  656.        2. Server Configuration sheet (completed)  
  657.           (SERVCFG.ZIP on Palindrome's BBS)
  658.           
  659.        Note:  There is no need to fill out redundant information in
  660.        the server config sheet that has already been provided in the
  661.        PALSDUMP output.  Be sure to fill out hardware information.
  662.  
  663.        3. Printout of the TMPSTAMP LOG
  664.  
  665.        4. Printout of PALDIAG /S output
  666.  
  667.        5. Printout of PALDIAG /D output
  668.  
  669.