home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #18 / NN_1992_18.iso / spool / comp / database / 6091 < prev    next >
Encoding:
Internet Message Format  |  1992-08-13  |  2.8 KB

  1. Path: sparky!uunet!cs.utexas.edu!swrinde!sdd.hp.com!caen!destroyer!gumby!yale!mintaka.lcs.mit.edu!spdcc!dirtydog.ima.isc.com!keps.kodak.com!cronkite!atar!umak
  2. From: umak@atar.epps.kodak.com (Uma Krishnan)
  3. Newsgroups: comp.databases
  4. Subject: Re: Distributed vs. Centralized Database
  5. Message-ID: <1992Aug13.140813.8941@APS.Atex.Kodak.COM>
  6. Date: 13 Aug 92 14:08:13 GMT
  7. References: <1992Aug12.190713.26205@linus.mitre.org>
  8. Sender: news@APS.Atex.Kodak.COM
  9. Reply-To: umak@atar.Atex.Kodak.COM
  10. Organization: Atex Publishing Systems, Inc.
  11. Lines: 42
  12.  
  13. In article <1992Aug12.190713.26205@linus.mitre.org>, kalagher@mwunix.mitre.org (Dick Kalagher) writes:
  14. |> 
  15. |> Organization: The MITRE Corporation
  16. |> 
  17. |> I have a question related to response time of a centralized vs. a 
  18. |> distributed database.  Suppose I have a database made up of one record 
  19. |> type that is fairly simple, consisting of 20 or so data elements.  Suppose 
  20. |> there are X records, where X is a large number, lets say 10*6.  Suppose
  21. |> I am concerned about the response time.  If I had all records stored in 
  22. |> one database on a single computer, would the response time be better than having the database distributed among 10-20 computers on a wide area network.  Assume that network traffic is not a problem and that I am using a modern relational database such as |> Oracle 
  23. |> 7.  I may also have thousands of users accessing the database.
  24. |> 
  25. |> Any help, either theoretical or operational would be appreciated.
  26. |> 
  27. |> Dick Kalagher
  28. |> 
  29. |> 
  30.  
  31. In this model, you have not specified the access behavior, ie. whether it will
  32. be primarily used as a read-only database etc. 
  33.  
  34. The other factor is that even though it has a homogeneous data structure, the data itself
  35. may not be homogeneous. An example of this, is lets say you have a library
  36. system, and users belong to different univ. departments. The chance of
  37. a comp. sc student interested in fine arts may be dim -  Hence you can
  38. parition the data horizonatally. An index can be maintained with the book
  39. category (fine arts, comp. sc) and the corresponding table.
  40.  
  41. In the distributed alternative, you say 10-20 computers on a WAN. Does that
  42. imply that the users get to the centralized database over a a WAN? This is not
  43. clearly stated in the model. If users are spread across geographically, then
  44. a distributed solution would make sense in a read situation. In this scenerio,
  45. data will be replicated in the different sites. However, a write is going
  46. to be awfully expensive, since it will have to update all the site databases.
  47. If the data is horizontally partitioned then by keeping the data close
  48. to the access point should yield better results.
  49.  
  50. Another factor is response time itself. Not all users may need the same
  51. thruput. I do not know if the users themselves can be categorized based
  52. on response time.
  53.  
  54. Uma Krishnan
  55.