home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #26 / NN_1992_26.iso / spool / comp / os / vms / 17837 < prev    next >
Encoding:
Internet Message Format  |  1992-11-12  |  5.2 KB

  1. Path: sparky!uunet!cs.utexas.edu!zaphod.mps.ohio-state.edu!pacific.mps.ohio-state.edu!linac!att!ucbvax!lrw.com!leichter
  2. From: leichter@lrw.com (Jerry Leichter)
  3. Newsgroups: comp.os.vms
  4. Subject: re: VAX 4000/200 ethernet problems
  5. Message-ID: <9211121236.AA02598@uu3.psi.com>
  6. Date: 12 Nov 92 11:23:57 GMT
  7. Sender: daemon@ucbvax.BERKELEY.EDU
  8. Distribution: world
  9. Organization: The Internet
  10. Lines: 111
  11.  
  12.  
  13.     We had a MicroVAX II.  We upgraded it to VMS 5.4-2.  Then we purchased
  14.     an upgrade kit to convert it to a VAX 4000/200.  The upgrade kit
  15.     included a new CPU board, memory board, an DSSI disk, and various
  16.     cables and patch panels.
  17.  
  18.     Anyhow, the VAX 4000/200 CPU board has an onboard ethernet port, EZA0.
  19.     I've been trying to get this port working, but haven't been getting
  20.     anywhere.  The old DEQNA board still works, but is rumored to be much
  21.     slower than the EZA0 channel.
  22.  
  23. Not only that, but VMS 5.4-2 doesn't support it, at least for LAVC
  24. connections.
  25.  
  26.     After I took the ethernet cable off the DEQNA (AUI cable) and attached
  27.     it to the EZA0 port, I would get lots of decnet errors on the console
  28.     like "Circuit up", "Circuit Down", "Adjacency up"  There were numbers
  29.     that came with these errors, and I could look them up in the DECNET
  30.     manual if necessary.  When I would "set host" out of this machine to
  31.     other machines, the link would be VERY VERY slow, and often freeze up
  32.     for several seconds, as the "circuit up", "circuit down", and
  33.     "adjacency  up" errors flasshed by.
  34.  
  35. Hint on diagnosing network problems:  All of these are "high level" error
  36. conditions.  About all they tell you is that something is wrong at the
  37. physical circuit level.  Slow and delayed response in SET HOST means that the
  38. lower layers are losing or damaging a lot of packets; DECnet is recovering by
  39. retransmitting, but that takes time.
  40.  
  41. The actual details, at this level, are almost never of any help in diagnosing
  42. the problem.
  43.  
  44.     I got a new CPU board from DEC, and also replaced all the cables and
  45.     the patch panel.  After that, then I couldn't "set host" at all,
  46.     because the destination would always be unavailable.  I don't know how
  47.     the second board differed from the first, except that the problem got
  48.     worse.  I also no longer get any "circuit up", "circuit down", and
  49.     "adjacency up" errors.
  50.  
  51.     When I executed a "mcr ncp sho known circuits"  it would give me
  52.     circuit            state
  53.     isa-0            on - synchronizing
  54.  
  55. Again, this is still a fairly high level indication of a problem.
  56.  
  57.     When I execute a "mcr ncp sho active lines counters" I would get:
  58.  
  59. Ah, now we are getting to the APPROPRIATE level.
  60.     ...
  61.     83 send failures, including:
  62.         excessive collisions
  63.         carrier check failed
  64.         remote failure to defer
  65.     1 collision detect check failure
  66.  
  67. These are the important numbers.  In fact, they pretty much pinpoint the
  68. problem.
  69.  
  70.     0 user boffer unavailable
  71.         ^
  72.  
  73. Really!  Just what ARE you doing with that system?  :-)
  74.  
  75.     Anyhow I called Colorado Springs.  Colorado Springs sent software
  76.     patch CSCPAT_0252019 which is a new ezdriver.exe.  I've installed the
  77.     patch, but the problem is still occuring.  After the patch, here is a
  78.     sample of "mcr ncp sho active lines counters"
  79.  
  80. A bad driver can, of course, make a piece of hardware appear to fail in any
  81. arbitrary way; but somehow I doubt that's your problem.
  82.  
  83.     91 send failures, including:
  84.         carrier check failed
  85.  
  86. Again, this is the important counter.  In a properly configured system, the
  87. only acceptable number for send failures, under normal conditions (i.e.,
  88. when you aren't playing with the hardware) is zero.  (On two systems I have
  89. here, in a total of 213065 blocks sent, the total count is indeed zero.)
  90.  
  91.     Also, "mcr ncp sho known circuits" now states that isa-0's state is
  92.     on, and not "on -synchronizing".
  93.  
  94.     This is where I am right now.  Has anyone ever heard of this problem?
  95.     I actually swapped out the 4000/200 CPU once more since then, but that
  96.     didn't fix the problem either.  Each time I install a new board, I run
  97.     sys$manager:netconfig to setup the parameters.  I've also swapped out
  98.     the AUI cable and the tranceiver to the backbone.
  99.  
  100. I'll bet your swapped the transceiver for an identical one.  I'll further
  101. guess that you have an old transceiver, most likely a DEC H4000.
  102.  
  103. I'd say the odds are 99% or better that you have a hardware configuration
  104. problem of some sort.  My bet is on the following:  The DEQNA was built at a
  105. time when the original Ethernet standards were in effect, while your new
  106. interface complies with the IEEE specs.  The two are almost, but not quite,
  107. the same.  You need different transceivers (or at least different transceiver
  108. configurations) for devices built to the different specs.  The H4000 was
  109. eventually replaced by the H4005, identical except that it complied with IEEE
  110. rather than Ethernet specs.  I'm sure the H4005 is long obsolete; I don't know
  111. what its modern replacement would be.
  112.  
  113. The effect of using the wrong kind of transceiver would be to cause the timing
  114. of some of the self-check features to be wrong.  This will show up as carrier
  115. check failures, spurious collisions, spurious remote failures to defer, and
  116. so on.
  117.  
  118. Some transceivers allow you to select either Ethernet or IEEE operating mode.
  119. If yours is one of those, try changing the setting.  If not, you'll need a
  120. new transceiver.
  121.                             -- Jerry
  122.  
  123.