home *** CD-ROM | disk | FTP | other *** search
/ Telecom / 1996-04-telecom-walnutcreek.iso / reports / st.louis.phone.outage < prev    next >
Internet Message Format  |  1991-06-10  |  21KB

  1. Date:     Sun, 9 Jun 91 23:11:28 CDT
  2. From:     TELECOM Moderator <telecom@eecs.nwu.edu>
  3. [To]:     telecom@eecs
  4. Subject:  SPECIAL REPORT: St. Louis Phone Outage
  5. BCC:         
  6. Message-ID:  <9106092311.ab30100@delta.eecs.nwu.edu>
  7.  
  8.  
  9.  
  10. [Moderator's Note: Here is a special report sent to the Digest by Brad
  11. Hicks which discusses the major service outage in St. Louis last week.
  12. It was too large for a regular issue of the Digest. PAT]
  13.  
  14.   Date: 09 Jun 91 15:57:19 EDT
  15.   From: "76012,300 Brad Hicks" <76012.300@compuserve.com>
  16.   Subject: SWBT Drops 2,800 Data Lines
  17.  
  18.  
  19. {St. Louis Post-Dispatch} , 6/4/91, pp. 1A, 7A: 
  20.  
  21. COMPUTER FAILURE SHUTS DOWN AUTOMATIC TELLERS ACROSS AREA 
  22.  
  23. by Jim Gallagher Of the Post-Dispatch Staff
  24.  
  25. Scores of automatic teller machines across St. Louis have been shut
  26. down for four days because of a computer failure at Southwestern Bell.
  27. The glitch also slowed the transfer of billions of dollars on
  28. Friday through the Federal Reserve Bank of St. Louis and afected dozens
  29. of other businesses that send information by computer.  A Southwestern
  30. Bell spokesman said Monday that crews were working aroundthe clock to
  31. put 2,800 data transmission lines back in service.
  32.  
  33. The failure hit Friday morning.  It immediately froze 55 automatic
  34. teller machines belonging to 18 St. Louis credit unions with 135,000
  35. customers.
  36.  
  37. An additional 26 automatic tellers owned by Mercantile Bank and
  38. several owned by United Postal Savings Association also went blank.
  39. Tellers in some branches lost their links to the main computers at the
  40. credit unions, Mercantile and United Postal.  The branches remained
  41. open using backup systems, although the glitch is slowing business,
  42. officials say.  "It's been a major pain," said Bill Humpfer, president
  43. of St. Louis Teachers Credit Union, where automatic tellers are used
  44. 50,000 times a month.
  45.  
  46. Southwestern Bell said the problem was in a "high capacity digital
  47. cross-connection system" in the 2600 block of Olive Street.  The
  48. machine shuttles computer calls between stations.  Phone company
  49. officials don't know what caused the problem but sabotage is not
  50. suspected, said Bell spokesman David Martin.  Engineers got the
  51. computer working again on Saturday and began the slow process of
  52. reprogramming it.  By Monday night, Bell had restored 1,500 lines --
  53. mostly high-speed lines used by businesses -- but the automatic
  54. tellers remained down.
  55.  
  56. The Federal Reserve Bank of St.  Louis -- which wires $15 billion a
  57. day between banks around the country -- switched to a backup system
  58. Friday to keep the money moving.  "We got all our work done, but it
  59. delayed things," said a Fed spokesman. The Fed was still using the
  60. backup system Monday afternoon.  Besides financial institutions, the
  61. system serves scores of businesses that send information by computer.
  62.  
  63. AT&T leases about 280 of the Bell lines for its own long-distance
  64. customers.  Most were back in service Monday, an AT&T spokesman said.
  65.  
  66. The problem hit on a very busy day for banks.  It was a "double
  67. payday" -- a Friday on the last day of the month.  Many customers who
  68. could not used automatic tellers lined up in front of human tellers
  69. instead.  Lines were longer than normal, although officials said the
  70. extra crowd caused few problems.  But credit union officials said the
  71. breakdown was costing them money. Customers who can't use their own
  72. credit union's automatic tellers may use acompetitor's instead.  When
  73. that happens, the credit union pays a fee to the competitor.
  74.  
  75.  "We're starting to talk megabucks," Humpfer said.  Credit unions
  76. affected are part of a single automatic teller machine processing
  77. system.  The credit unions include Anheuser-Busch, Aerospace,
  78. Educational Emerson, Gateway Telco, Telephone, First Community,
  79. WestCommunity, RAC, First American, Sunset, St.  Louis Federal Center,
  80. St. Andrew,Arsenal, Wetterau, Victory, South Community and Electro.
  81.  
  82.                          ----------
  83.  
  84. {St. Louis Post-Dispatch}, 6/5/91, pp. 1C, 3C: 
  85.  
  86. CRASH! SW Bell Computer Expected Back on Line This Morning 
  87.  
  88. by Jim Gallagher Of the Post-Dispatch Staff 
  89.  
  90. The computer breakdown that paralyzed dozens of automatic teller
  91. machines and apparently frustrated crowds of horse-racing fans should
  92. be fixed by this morning, Southwestern Bell Telephone Co. says.  The
  93. phone company was methodically reactivating 2,800 high-speed lines
  94. that carry electronic data around St. Louis and beyond.  "We're
  95. finishing it up," phone company spokesman David Martin said
  96. Tuesday afternoon.
  97.  
  98. Crews hoped to have the work done by Tuesday evening, he said.  ATMs
  99. were slowly coming back on line through the day.  Mercantile Bank said
  100. nearly all its machines were working.  On Monday, 26 of the bank's
  101. ATMs were down.  But 55 ATMs operated by 18 credit unions were still
  102. down early Tuesday evening.
  103.  
  104. Relief couldn't come too soon for Brian Zander, general manager of
  105. Fairmount Park.  The park lost $500,000 in weekend wagers when its
  106. data phone lines went dead, stalling the computerized bet-taking
  107. system.  "It is a major, major problem," Zander said.  About 1,000
  108. would-be race goers were turned away at the track gates Saturday when
  109. the glitch slowed betting to a crawl.  The track decided to send half
  110. its customers home, rather than create huge lines at the betting
  111. windows.  The turned-away patrons weren't in a kindly state of mind,
  112. Zander said. "People don't understand it's the phone lines.  They
  113. blame it on us."  Zander said AT&T officials had told him the problem
  114. was at Southwestern Bell, which rents data phone lines to the
  115. long-distance company.  AT&T and Southwestern Bell spokesman said the
  116. couldn't immediately confirm that Fairmount's problem stemmed from the
  117. computer crash.
  118.  
  119.  "It's entirely possible," the AT&T spokesman said.  The problem
  120. struck Friday morning, when a Southwestern Bell computer in downtown
  121. St. Louis suddenly broke down, cutting off 2,800 data lines.  Martin
  122. said Southwestern Bell still doesn't know why the system failed.
  123. Workers are trying so hard to fix it that they haven't had time to
  124. look for the cause, he said.  Besides frustrating bettors and ATM
  125. users, the failure also cut computer links between main computers and
  126. some branches at Mercantile, many credit unions and United Postal
  127. Savings Association.  The branches remained open, but business was
  128. slowed.
  129.  
  130. At St. Louis Teacher's Credit Union, for instance, workers have to
  131. bring records in from the branches each day and punch them into the
  132. main computer by hand.  The lines are used by a variety of businesses
  133. to link their computers to others around the nation.  Fairmount Park
  134. wasn't using the computer betting system Tuesday, and Zander said he
  135. didn't know if it was working yet.  The computer system requiring
  136. phone lines is used only for bets on races run at other tracks.
  137.  Fairmount has its own computer system for its races.  The computer
  138. failure forced Fairmount to hook its computers to regular phone lines.
  139. But data lines move information 20 times faster, he said.
  140.  
  141.                           ------------
  142.  
  143. {St. Louis Post-Dispatch}, 6/4/91, pp. 1C, 3C: 
  144.  
  145. COMPUTER FAILURE SHUTS DOWN AUTOMATIC TELLERS ACROSS AREA 
  146.  
  147. by Jim Gallagher Of the Post-Dispatch Staff
  148.  
  149. A king-sized computer snafu that silenced 2,800 data phonelines has
  150. beenfixed "for the most part," a Southwestern Bell spokesman said
  151. Wednesday.  All but eight of the 55 credit union automatic teller
  152. machines were working Wednesday, after being shut down since Friday.
  153. The computerized betting system at Fairmount Park race track is
  154. working again.  But United Postal Savings Association says its data
  155. lines are still down -- and its executives are getting angry.  "It's
  156. been a nightmare," said Michael Gorman, executive vice president at
  157. St.  Louis' second-largest savings and loan.  The high-speed lines
  158. connect the S&L's main computer to terminals at half of United
  159. Postal's branches.
  160.  
  161. Gorman said Southwestern Bell can't tell him when the problem will
  162. befixed.  "They give us stories and every couple of hours it's
  163. different. I can't believe them any more," he said.  Dave Martin,
  164. spokesman for Southwestern Bell, said only a few lines were still out
  165. Wednesday evening.  "When you do a major repair job like this, there
  166. are going to be glitches,"he said.  "We are taxing the patience of the
  167. few remaining customers with problems."
  168.  
  169. At its height, the five-day breakdown affected scores of businesses
  170. andfroze more than 80 automatic tellers at 18 credit unions,
  171. Mercantile Bank and United Postal.  A Fairmount Park spokeswoman said
  172. the track lost "tens of thousands of dollars" in profit when betting
  173. slowed to a crawl Friday and Saturday. About 1,000 race fans had to be
  174. turned away at the gate.  Bankers complained of lost automatic teller
  175. fees and large costs for worker overtime caused when people had to do
  176. the work of computers.  But the companies stand little chance of
  177. recovering their losses from Southwestern Bell.
  178.  
  179. Under the law, victims normally can't collect damages for a failure in
  180. phone or electric services, said Rob Hack, assistant general counsel
  181. for the Missouri Public Service Commission.  To collect, they would
  182. have to prove that the utility deliberately cut service or was
  183. willfully negligent.  The law was designed to protect utilities from
  184. massive losses after breakdowns and power failures, Hack said.
  185. Perhaps the most the victims can hope for is not to be charged for
  186. phone services for the period the lines weredown.
  187.  
  188. The breakdown hit Friday morning in a computer switching machine in
  189. downtown St. Louis, and Southwestern Bell engineers have been
  190. struggling since to get it fixed.  They were joined by engineers from
  191. American Telephone & Telegraph Corp.,which sold the equipment that
  192. failed.  Officials at United Postal were struggling, too.  It took
  193. them until Wednesday to switch their computers to normal phone lines.
  194.  
  195. Branches remained open and customers weren't affected, Gorman said.
  196. But many employees were placed on overtime to work around the glitch.
  197. United Postal hasn't yet counted the cost, he said.  At Fairmount Park,
  198. officials said their losses go beyond lost betting profits.  Many of
  199. their customers left the track angry, said spokeswoman Mary Ozanic.
  200. "The hardest thing to measure is what the ill will will cost us," she
  201. said. 
  202.                      --------------
  203.   
  204. Three-quarter page advertisement in the 6/9/91 {St. Louis Post-Dispatch}, 
  205. p.  13D:
  206.  
  207. AN OPEN LETTER TO OUR BUSINESS CUSTOMERS:
  208.  
  209. At Southwestern Bell Telephone, we've built a high standard of
  210. customer service and we take pride in that. Unfortunately, we recently
  211. experienced a rare failure in a computer system that transmits data.
  212.  
  213. As a result, about 750 St. Louis-area business customers lost access
  214. to important day-to-day services. For those of you whose service was
  215. impaired, that failure translates to a disruption in your operations
  216. and, at best, an inconvenience to your customers. We apologize for
  217. letting you down in this instance. Though the problem lingered longer
  218. than any of us would have liked, we made every effort to see that it
  219. was fixed as quickly as possible.  Our technicians worked around the
  220. clock, logging more than 2,500 hours, to correct the problem.  We
  221. enlisted the help of experts from across the country.
  222.  
  223. Still, I know that even though we pulled out all stops to restore
  224. service, you would rather it not have happened at all.  So would we.
  225. Now that service has been restored, our focus has shifted to further
  226. upgrading the system's reliability.  While some of the solutions may
  227. take time to complete, we will persist until the service we provide
  228. meets your high standards and ours. In the next few days, we will
  229. individually contact customers whose service was interrupted.  We want
  230. to share with you our plans for improving the system,and we want to
  231. hear your comments on how we can continually improve our service to
  232. you. We are committed to earning your confidence once again.
  233.  
  234. Sincerely, 
  235.  
  236. (s) Randy Barroy President-Missouri
  237. Division Southwestern Bell Telephone 
  238.  
  239.                              --------------
  240.  
  241.  
  242. {St. Louis Post-Dispatch}, 6/4/91, pp. 1E, 8E: 
  243.  
  244. VITAL LINES Phone Net Vulnerable, Crash Shows 
  245.  
  246. by Jim Gallagher Of the Post-Dispatch Staff
  247.  
  248. Brian Zander, manager of Fairmount Park, faced a lot of unhappy
  249. customers in the past week.  But one fuming customer took the cake.
  250. "He was pretty red-faced," Zander recalled.  The man said he had
  251. waited a year for his favorite horse to race at Arlington Park
  252. racetrack near Chicago.  But when he came to Fairmount to place an
  253. intertrack bet, he was turned away at the gate.
  254.  
  255. The high-speed data phone lines linking Arlington to Fairmount had
  256. gone down -- part of a Southwestern Bell Telephone Co. computer
  257. failure that rattled companies around the region last week.  Fairmount
  258. turned away 1,000 racing fans last weekend when phone problems slowed
  259. its computerized betting operation to a crawl.  The man was livid
  260. because his horse won, Zander said.  "He said he was going to bet
  261. $500.  He was not a happy camper," Zander said.
  262.  
  263. The six-day failure, which ended Thursday, affected 2,800 data lines.
  264. At its height, it shut down more than 80 automatic teller machines,
  265. cut off bank branches from their main computers and slowed the
  266. transfer of billions of dollars through the Federal Reserve System.
  267. It also illustrated the region's growing reliance on phone lines to
  268. keep business running.  The installation of high technology over the
  269. past decade has left the nation's phone system with an odd
  270. contradiction.  Experts say the new technology is making the system
  271. more efficient andusually more reliable.  But by squeezing more phone
  272. lines into fewer computers and cables, the system may have also become
  273. more vulnerable.  A routine foul-up or accidents that would have
  274. silenced a few thousand lines a decade ago now can affect millions.
  275.  
  276.  
  277. Take these examples:   
  278.  
  279. Jan. 4., 1991.  An AT&T construction crew in New Jersey mistakenly
  280. cracks asingle fiber-optic cable.  The cable is the width of a
  281. person's thumb.  The crack halts 60 percent of AT&T's long-distance
  282. calls to New York City. Aviation control centers are paralyzed,
  283. causing gridlock in the skies throughout the Northeast.
  284.  
  285. Jan. 23, 1990.  More than 42,000 people in north St. Louis county lose
  286. some or all of their phone service when a fire under a bridge burns a
  287. mainfiber-optic cable and other phone lines.  Hospitals, police and
  288. fire departments can't get calls.  Some customers wait three days for
  289. service to be restored.
  290.  
  291. Jan. 15, 1990.  AT&T's national switching system suffers a collapse,
  292. and half of its long-distance calls go uncompleted.  The company takes
  293. nine hours to restore full service.  AT&T blames a bug in its software.
  294.  
  295. May 8, 1988.  Mother's Day is soured for thousands as a fire breaks
  296. out in an unmanned switching center in Hinsdale, Ill., near Chicago.
  297. The blaze knocks out service for 35,000 customers for up to a month.
  298.  
  299. Communications experts say spectacular advances in computer systems
  300. andfiber optics are improving service in general.  In Missouri, for
  301. instance, telephone trouble reports fell 18 percent during the past
  302. six years, according to Southwestern Bell.  But some wonder whether
  303. technology has left the system too vulnerable toproblems at critical
  304. choke points, where simple accidents can mushroom intocommunications
  305. disasters.  In the 1970s, the biggest telephone cable could carry
  306. 50,000 calls.  Now fiber-optic cables carry 300,000 to 500,000.
  307.  
  308. That means that a backhoe operator these days can knock out 10 times
  309. as many telephones in a flick of a lever.  "Technology has
  310. concentrated things to the point where, when you do have a major
  311. failure, you can have a much more widespread and devastating failure,"
  312. said Don Mitchell, division manager of planning and engineering at
  313. Southwestern Bell.  Phone calls are funnelled through computerized
  314. switching centers.  The number of such centers has dropped by about
  315. half since the mid-1980s, as technology allowed more phone connections
  316. to be squeezed into fewer computer boxes.
  317.  
  318. This means a crash at a single switching center affects many more
  319. people, experts say.  And with fewer centers, phone companies have a
  320. harder time routing calls around a failed switch.  The Hinsdale
  321. switching center wasn't even manned.  It was monitored by phone lines
  322. from Springfield, Ill.  As a result, the fire burned for 90 minutes
  323. before the Hinsdale Fire Department heard of it.  "It was designed
  324. never to fail, and as a result, they couldn't put the fire out," said
  325. David  Farrell, spokesman for the Illinois Commerce Commission.
  326.  
  327. The complexity of today's computers can compound the headaches.  Take
  328. the most recent failure in St. Louis.  The problem centered on complex
  329. software in a "digital access and cross-connect system" computer.
  330.  
  331. The $330,000 machine links thousands of customers' computers by
  332. high-speed telephone lines.  When the software failed May 31, Bell
  333. technicians replaced it with a standby copy on a floppy disk.  But the
  334. spare software was "contaminated" with errors, Mitchell said.  It
  335. destroyed the computer's main memory, forcing technicians to spend
  336. five days painstakingly reprogramming the machine.
  337.  
  338. "It was just a freaky thing," Mitchell said.  Bell has two such
  339. computers in St. Louis.  They are four years old and neither had
  340. failed before, Mitchell said, although a similar machine in Kansas
  341. City shut down in 1988.
  342.  
  343. The phone company plans to install a new computer with safety features
  344. to prevent a repeat of the snafu.  "We don't anticipate this happening
  345. again," he said.  Despite the spectacular collapses of recent years,
  346. the American phone system remains remarkably reliable, experts say.
  347. Modern telephone computers are designed to work with only two minutes
  348. of downtime a year.  That compares with hours for other mainframe
  349. computers.  "There is absolutely no comparison," said Jonathan Turner,
  350. a computer science professor at Washington University.
  351.  
  352. Designers pile backup systems upon backup systems to keep the machines
  353. clicking.  Telephone engineers compare the phone system to the highway
  354. system.  In both, there are points of vulnerability where a lot of
  355. routes intersect, Mitchell said.  "If the Poplar Street Bridge
  356. collapsed, you'd have a real mess," he said.  To bypass the choke
  357. points, Southwestern Bell is building interconnected loops of
  358. fiber-optic cable, so that one cable break can't silence whole towns.
  359.  
  360. Last year's North County outage couldn't happen today, Mitchell said.
  361. At the time, the area was served by a single line of main cables.  Now
  362. it'spart of a broader loop.  If part of the loop breaks, calls simply
  363. travel the other direction to reach their destination.  The loops are
  364. steadily expanding, although some outlying areas -- Eureka, for
  365. instance -- are still served by single cables.
  366.  
  367. AT&T, which carries nearly 70 percent of the nation's long distance
  368. calls,has four cables linking St. Louis with the world.  If one
  369. connection is cut,long-distance calls could be sent through the
  370. others, AT&T says.
  371.  
  372. That's what was supposed to happen in New York this January, but
  373. didn't.  Dale McHenry, AT&T divisional manager, said a system designed
  374. to prevent such a spectacular failure wasn't fully operational in
  375. January, although it will be by the end of the year.  "We will resond
  376. better and better to this type of incident," he said.
  377.  
  378. AT&T, meanwhile, says it is busy adding to its own system of loops and
  379. backup switches designed to head off major failures.  But efforts to
  380. make the system less vulnerable run smack into twoobstacles -- price
  381. and competition.  "We could design a fail-safe telephone system.  But
  382. who could afford it?" said Sam Goldman, head of utility operations for
  383. the Missouri Public Service Commission.  Many customers, meanwhile,
  384. buy long-distance and computer-line servicethe same way they buy nuts
  385. and bolts.  The company with the lowest price gets the business.
  386.  
  387. Washington University's Turner suspects that such price-consciousness
  388. may put phone companies in a bind.  To make the system less vulnerable
  389. means increasing the price -- and possibly losing the business.  "You
  390. try to protect things.  You get backups to backups to backups.  But at
  391. some point it's no longer cost-effective," Mitchell added.
  392.  
  393.                          -------------
  394.  
  395.  
  396. [Moderator's Note: My sincere thanks to Brad Hicks for typing all this
  397. in and submitting it o the Digest. Which direction would you go?
  398. Backups at any cost ... or if not, up to what point?  Are occassional
  399. outages like St. Louis this past week or Chicago in 1988 worth the
  400. difference in cost?   PAT]
  401.