home *** CD-ROM | disk | FTP | other *** search
/ ftp.pasteur.org/FAQ/ / ftp-pasteur-org-FAQ.zip / FAQ / Star-Trek / relativity_FTL / part3 < prev    next >
Encoding:
Internet Message Format  |  2004-05-15  |  120.3 KB

  1. Path: senator-bedfellow.mit.edu!bloom-beacon.mit.edu!newsfeed.stanford.edu!logbridge.uoregon.edu!news-feed01.roc.ny.frontiernet.net!nntp.frontiernet.net!peer02.cox.net!cox.net!p02!lakeread01.POSTED!not-for-mail
  2. From: Jason W. Hinson <jason@physicsguy.com>
  3. Newsgroups: rec.arts.startrek.tech,rec.answers,news.answers
  4. Subject: Relativity and FTL Travel--PART III (optional reading)
  5. User-Agent: Newspost/2.1.1 (http://newspost.unixcab.org/)
  6. Followup-To: rec.arts.startrek.tech
  7. Organization: physicsguy.com
  8. Summary: A Bit About General Relativity
  9. Approved: news-answers-request@MIT.EDU
  10. Lines: 2290
  11. Message-ID: <Nw1pc.148089$f_5.107743@lakeread01>
  12. Date: Fri, 14 May 2004 10:51:25 GMT
  13. NNTP-Posting-Host: 68.227.220.12
  14. X-Complaints-To: abuse@cox.net
  15. X-Trace: lakeread01 1084531885 68.227.220.12 (Fri, 14 May 2004 06:51:25 EDT)
  16. NNTP-Posting-Date: Fri, 14 May 2004 06:51:25 EDT
  17. Xref: senator-bedfellow.mit.edu rec.arts.startrek.tech:171411 rec.answers:87008 news.answers:271274
  18.  
  19. Archive-name: star-trek/relativity_FTL/part3
  20. Posting-Frequency: bimonthly for r.a.s.tech, monthly for news.answers
  21.  
  22. =============================================================================
  23.                           Relativity and FTL Travel
  24.                                  
  25.                by Jason W. Hinson (hinson@physics.purdue.edu)
  26. -----------------------------------------------------------------------------
  27.                                  
  28.                   Part III: A Bit About General Relativity
  29.                                  
  30. =============================================================================
  31. Edition: 5.1
  32. Last Modified: April 8, 2003
  33. URL: http://www.physicsguy.com/ftl/
  34. FTP (text version): ftp://ftp.cc.umanitoba.ca/startrek/relativity/
  35.  
  36.  
  37.  
  38.      This is Part III of the "Relativity and FTL Travel" FAQ. It is an
  39. "optional reading" part of the FAQ in that the FTL discussion in Part IV
  40. does not assume that the reader has read the information discussed below. If
  41. your only interest in this FAQ is the consideration of FTL travel with
  42. relativity in mind, then you may only want to read Part I: Special
  43. Relativity and Part IV: Faster Than Light Travel--Concepts and Their
  44. "Problems".
  45.      In this part, we take a look at general relativity. The discussion is
  46. rather lengthy, but I hope you will find it straight forward and easy to
  47. follow. The subject of GR is still new to this FAQ, and your comments on the
  48. usefulness, ease of reading, etc. for this part of the FAQ would be
  49. appreciated.
  50.      For more information about this FAQ (including copyright information
  51. and a table of contents for all parts of the FAQ), see the Introduction to
  52. the FAQ portion which should be distributed with this document.
  53.  
  54.  
  55. Contents of Part III:
  56. Chapter 5: Introduction to General Relativity
  57.      5.1 Reasoning for its Existence
  58.      5.2 The "New Inertial Frame"
  59.      5.3 The Global Break-Down of Special Relativity
  60.      5.4 Manifolds, Geodesics, Curvature, and Local Flatness
  61.      5.5 The Invariant Interval
  62.      5.6 A Bit About Tensors
  63.      5.7 The Metric Tensor and the Stress-Energy Tensor
  64.      5.8 Applying these Concepts to Gravity
  65.           5.8.1 The Basic Idea
  66.           5.8.2 Some Notes on the Physics and the Math
  67.           5.8.3 First Example: Back to SR
  68.           5.8.4 Second Example: Stars and Black Holes
  69.      5.9 Experimental Support for GR
  70.  
  71.  
  72.  
  73.  
  74.  
  75. Chapter 5: Introduction to General Relativity
  76.  
  77.      Thus far, we have confined our talks to the realm of what is known as
  78. Special Relativity (or SR). In this section I will introduce a few of the
  79. main concepts in General Relativity (or GR). The difference between the two
  80. is basically that GR deals with how relativity applies to gravitation. As it
  81. turns out, our concept of how gravity works must be changed because of
  82. relativity, and GR explains the new concept of gravity. It is called
  83. "General" relativity because if you look at General Relativity in the case
  84. where there is little or no gravity, you get Special Relativity (SR is a
  85. special case of GR).
  86.      Now, GR is a heavily mathematical theory, and while I will try to
  87. simply give the reader some understanding of the physical notions
  88. underlining the theory, some mathematics will inevitably come into play. I
  89. will, however, try to give simple, straight-forward explanations of where
  90. the math comes from and how it helps explain the theory. I will start by
  91. discussing why we might even think that gravity and relativity are related
  92. in the first place. This will lead us to change our concepts of space and
  93. time in the presence of gravity. To discuss this new concept of space-time,
  94. we will need to introduce the idea of mathematical constructs known as
  95. Tensors. The two tensors we will talk about in specific are called the
  96. Metric Tensor and the Stress-Energy Tensor. Once we have discussed these
  97. concepts, we will look at how it all comes together to produce the basic
  98. ideas behind the theory of general relativity. We will also consider a
  99. couple of examples to illustrate the use of the theory. Finally, we will
  100. mention some of the experimental evidence which supports general relativity.
  101.  
  102.  
  103.  
  104. 5.1 Reasoning for its Existence
  105.  
  106.      To start off our discussion, I want to indicate why one would reason
  107. that gravity and relativity are connected. While I could start with a
  108. somewhat unrealistic thought experiment to explain the first point I want to
  109. make, perhaps it will be better if I just tell you about actual experimental
  110. evidence to support the point. We thus start by considering an experiment in
  111. which a light beam is emitted from Earth and rises in the atmosphere to some
  112. point where the light is detected. When one performs this experiment, one
  113. finds that the energy of the light decreases as it rises.
  114.      So, what does this have to do with our view of relativity and gravity?
  115. Well, let's reason through the situation: First, we note that the energy of
  116. light is related to its frequency. (If you think of light as a wave with
  117. crests and troughs, and if you could make note of the crests and troughs as
  118. they passed you, then you could calculate the frequency of the wave as 1/dt,
  119. where dt is the time between the point when one crest passes you and the
  120. point when the next crest passes you.) So, if the energy of the light
  121. decreases (and thus its frequency decreases), then dt (the time between
  122. crests) must increase. Let's then consider a frame of reference sitting
  123. stationary on the Earth. We will look at a space-time diagram in this frame
  124. which shows the paths that two crests would take as the light travels away
  125. from the Earth.
  126.      In Diagram 5-1 I have drawn indications of the paths the two crests
  127. might take. The diagram shows distance above the Earth as distance in the
  128. positive x direction, so as time goes on, the two crests rise (move in the
  129. positive x direction) and eventually meet a detector. Now, we don't know
  130. what the gravity of the Earth might do to the light. We thus want to
  131. generalize our diagram by allowing for the possibility that the paths of the
  132. crests might be influenced in some unknown way by gravity. So, I have drawn
  133. a haphazard path for the two crests marked with question marks. The actual
  134. paths don't matter for our argument, but what does matter is this: whatever
  135. gravity does to the light, it must act the same way on both crests.
  136. Therefore, the two haphazard paths are drawn the same way.
  137.  
  138.                                  Diagram 5-1
  139.  
  140.                   t                        #  = detector's path
  141.                   |                  #
  142.                   |                  ?
  143.                   |               ?  #
  144.                   |      second ?    # dt-final
  145.                   |   crest ?        ?
  146.                   |      ?        ?  #
  147.                   |   ?         ?    #
  148.                   | ?       ?        #
  149.                   ?      ? first     #
  150.        dt-initial |   ? crest        #
  151.                   | ?                #
  152.       ------------?------------------#------> x (distance above surface)
  153.                   |                  #
  154.                   |                  #
  155.                         dt-initial = dt-final
  156.  
  157.  
  158.      As we see in the diagram, because gravity acts the same way on both
  159. crests, the time between them when they leave the surface (dt-initial) is
  160. the same as the time between them when they are detected (dt-final). Thus,
  161. our diagram does not predict that the energy of the light should change, but
  162. experimental evidence shows it does. According to special relativity, this
  163. frame of reference we have drawn is an inertial frame (that is, if we ignore
  164. the Earth's motion, this frame of reference is stationary--it's just inside
  165. a gravitational field). Thus our diagram (drawn for an inertial frame of
  166. reference) should explain the geometry of the situation, but does not. That
  167. indicates that SR must be changed in light of gravity. However, we have yet
  168. to show that SR must be completely thrown out.
  169.      What if there were another way to define an inertial frame such that
  170. its geometry would explain the above situation and other situations which
  171. occur in the presence of a gravitational field? That is what we will
  172. consider next.
  173.  
  174.  
  175.  
  176. 5.2 The "New Inertial Frame"
  177.  
  178.      Before starting this section, I want to mention something to the
  179. reader: in the end, when gravity is concerned, we will not be able to find a
  180. single inertial frame of reference which will correctly explain the geometry
  181. of all situations. This will be the actual death-blow to special relativity.
  182. In this section, it will start to look as if the situation is hopeful, and
  183. that by defining a proper inertial frame, SR will be saved. However, in the
  184. next section, we will see where this all falls apart, and I want the reader
  185. to realize this from the beginning.
  186.      Now, in the previous section we showed that a space-time diagram drawn
  187. for an inertial frame of reference doesn't explain the way things really are
  188. for a frame of reference sitting stationary on the Earth's surface. If such
  189. a frame cannot be called an inertial frame because of some effect of
  190. gravity, then perhaps there is another way to define an inertial frame of
  191. reference in the presence of gravity.
  192.      First, let's consider the properties of a frame which we know to be an
  193. inertial frame without gravity. Consider a space ship sitting far from any
  194. source of gravity. Here we will assume that the ship isn't
  195. accelerating--it's just sitting there in the middle of space. Diagram 5-2
  196. shows such a space ship at different times. Also shown is an observer and a
  197. ball, both of which start out stationary in this frame of reference. Both
  198. the observer and the ball are weightless along with the ship, and as time
  199. goes on neither move with-respect-to the sides of the ship. This is
  200. obviously what we would consider to be an ideal inertial frame of reference.
  201.  
  202.                                  Diagram 5-2
  203.  
  204.               --------------------- time -------------------->
  205.                 1             2             3             4
  206.              +------+      +------+      +------+      +------+
  207.              |      |      |      |      |      |      |      |
  208.              |    O |      |    O |      |    O |      |    O |
  209.              |      |      |      |      |      |      |      |
  210.              | O    |      | O    |      | O    |      | O    |
  211.              |/|\   |      |/|\   |      |/|\   |      |/|\   |
  212.              | |    |      | |    |      | |    |      | |    |
  213.              |/ \   |      |/ \   |      |/ \   |      |/ \   |
  214.              |      |      |      |      |      |      |      |
  215.              |      |      |      |      |      |      |      |
  216.              |      |      |      |      |      |      |      |
  217.              |      |      |      |      |      |      |      |
  218.              +------+      +------+      +------+      +------+
  219.                            Ship Floating in Space
  220.  
  221.  
  222.      Next, consider the same ship, but let it be sitting stationary on the
  223. Earth. Diagram 5-3 shows such a ship at different times, and again there is
  224. an observer and a ball shown as well. Obviously, the observer and the ball
  225. in this case cannot remain stationary with respect to the ship--rather they
  226. must fall in the Earth's gravity and accelerate towards the Earth's surface.
  227. Note that because of the way gravity works, the observer and the ball and
  228. anything else in the ship will accelerate downward at the same rate
  229. regardless of their mass (as long as they are at relatively the same height
  230. above the Earth's surface, and neglecting air resistance). This
  231. distinguishes gravity from all other forces in nature. With the other three
  232. forces (electromagnetism, the strong nuclear force, and the weak nuclear
  233. force) the motion of an object in the presence of the force depends on the
  234. composition of the object. For example, electromagnetism doesn't act on
  235. neutral particles, but does act on charged ones. However, when we consider
  236. gravity, the path taken by an object which is released with a given velocity
  237. in a gravitational field does not depend on the composition of the
  238. object--not even its mass. So, both the ball and the observer in Diagram 5-3
  239. accelerate at the same, constant rate towards the bottom of the ship. In
  240. step 3 on that diagram, the observer hits the bottom of the ship, and in
  241. step 4 the ball reaches the bottom as well. Obviously this situation isn't
  242. like the inertial frame of reference we described above, and the observer in
  243. these two situations could easily tell the difference between the two cases.
  244.  
  245.                                  Diagram 5-3
  246.  
  247.               --------------------- time -------------------->
  248.                 1             2             3             4
  249.              +------+      +------+      +------+      +------+
  250.              |      |   |  |      |      |      |      |      |
  251.              |    O | G |  |      |      |      |      |      |
  252.              |      | r |  |    O |      |      |      |      |
  253.              | O    | a |  |      |      |      |      |      |
  254.              |/|\   | v |  | O    |      |      |      |      |
  255.              | |    | i |  |/|\   |      |    O |      |      |
  256.              |/ \   | t |  | |    |      |      |      |      |
  257.              |      | y |  |/ \   |      | O    |      | O    |
  258.              |      |  \|/ |      |      |/|\   |      |/|\   |
  259.              |      |      |      |      | |    |      | |    |
  260.              |      |      |      |      |/ \   |      |/ \ O |
  261.              +------+      +------+      +------+      +------+
  262.             ==========    ==========    ==========    ==========
  263.              Earth's       Earth's       Earth's       Earth's
  264.              Surface       Surface       Surface       Surface
  265.                        Ship Sitting on the Earth's Surface
  266.  
  267.  
  268.      Further, consider the same ship again, this time letting it accelerate
  269. at a constant rate in the middle of space. Diagram 5-4 shows such a ship at
  270. different times (again with an observer and a ball). Note that in the
  271. diagram, the observer and the ball start out at a constant speed (in steps
  272. 1, 2, and 3, both move one interval up during each step of time). However,
  273. the acceleration of the ship causes it to move further between steps 2 and 3
  274. than it did between steps 1 and 2, and so on. Therefore, at step 3 the
  275. bottom of the ship meets with the observer, and the observer begins to be
  276. pushed by the ship, accelerating along with the it from then on. This would
  277. cause the observer to feel the force of the ship against him, "holding" him
  278. against the floor. In the final step, the ball meets with the bottom of the
  279. ship, and it too accelerates from then on because the ship is pushing
  280. against it. This case thus looks very much like the case just above where
  281. the ship was sitting on the Earth's surface--in both cases objects in the
  282. ship will seem to accelerate at the same, constant rate towards the bottom
  283. of the ship (regardless of their mass) and once there they will feel a force
  284. against them as they sit on the floor of the ship. The observer in each of
  285. these cases would find it hard to tell which of the two situations he was
  286. really in.
  287.  
  288.                                  Diagram 5-4
  289.  
  290.               --------------------- time -------------------->
  291.                                                           4
  292.                                                        +------+
  293.                                                        |      |
  294.                                                        |      |
  295.                                                        |      |
  296.                                             3          |      |
  297.                                                        |      |
  298.                                          +------+      |      |
  299.                 1             2          |      |      |      |
  300.                                          |      |      | O    |
  301.               accel                      |      |      |/|\   |
  302.                 ^          +------+      |      |      | |    |
  303.                 |          |      |      |      |      |/ \ O |
  304.              +------+      |      |      |    O |      +------+
  305.              |      |      |    O |      |      |       \/  \/
  306.              |    O |      |      |      | O    |
  307.              |      |      | O    |      |/|\   |
  308.              | O    |      |/|\   |      | |    |
  309.              |/|\   |      | |    |      |/ \   |
  310.              | |    |      |/ \   |      +------+
  311.              |/ \   |      |      |       \/  \/
  312.              |      |      |      |
  313.              |      |      |      |
  314.              |      |      +------+
  315.              |      |       \/  \/
  316.              +------+
  317.               \/  \/
  318.                          Ship Accelerating in Space
  319.  
  320.  
  321.      Given all three examples above, it seems obvious that a frame sitting
  322. stationary on the Earth is much more like an accelerating frame than it is
  323. like an inertial frame. Seeing that, it now seems perfectly reasonable for
  324. us to find that an experiment performed on the surface of the Earth can't be
  325. explained by a diagram drawn for an inertial frame.
  326.      But, can we now find a frame of reference in the presence of gravity
  327. which DOES look like an inertial frame? Well, look back to Diagram 5-4
  328. (where the ship is accelerating in space) and notice the state of the ball
  329. and the observer during the first part of that illustration. Even though the
  330. ship in that case is not an inertial frame because it is accelerating, the
  331. observer and the ball don't begin to accelerate until the bottom of the ship
  332. reaches them and begins to push them. Thus, until that point, the ball and
  333. the observer are not accelerating. They are shown moving at a constant
  334. velocity. Thus, until the bottom of the ship reaches them, the observer and
  335. the ball are inertial observers. AH, but as we have pointed out, this
  336. situation is supposed to be analogous to the one in Diagram 5-3 (where the
  337. ship is sitting stationary on the Earth). If so, then we could argue that
  338. the observer and the ball in the first part of Diagram 5-3 (which are in
  339. free-fall in the Earth's gravitational field) are what we would now call our
  340. inertial observers in the presence of gravity.
  341.      So, let's look at one last illustration in which the whole ship is in
  342. free-fall as well as the observer and the ball. Diagram 5-5, shows such a
  343. situation. Notice that the observer, the ball, and the ship all accelerate
  344. at the same rate towards the earth. They each move the same distance during
  345. each step shown. Now, look at just the ship and everything in it at each
  346. step shown. The observer, the ball, and the sides of the ship are not moving
  347. with respect to one another because they are all falling at the same rate.
  348. At each step, the ball and the observer are at the same position inside the
  349. ship. Therefore, until the ship in Diagram 5-5 reaches the surface of the
  350. Earth, the observer wouldn't notice any difference between this situation
  351. and the one in Diagram 5-2 (where the ship is floating in space).
  352.  
  353.                                  Diagram 5-5
  354.  
  355.               --------------------- time -------------------->
  356.                 1
  357.              +------+         2
  358.              |      |      +------+
  359.              |    O | G |  |      |
  360.              |      | r |  |    O |         3
  361.              | O    | a |  |      |      +------+
  362.              |/|\   | v |  | O    |      |      |
  363.              | |    | i |  |/|\   |      |    O |
  364.              |/ \   | t |  | |    |      |      |
  365.              |      | y |  |/ \   |      | O    |         4
  366.              |      |  \|/ |      |      |/|\   |      +------+
  367.              |      |      |      |      | |    |      |      |
  368.              |      |      |      |      |/ \   |      |    O |
  369.              +------+      |      |      |      |      |      |
  370.                            +------+      |      |      | O    |
  371.                                          |      |      |/|\   |
  372.                                          |      |      | |    |
  373.                                          +------+      |/ \   |
  374.                                                        |      |
  375.                                                        |      |
  376.                                                        |      |
  377.                                                        |      |
  378.                                                        +------+
  379.             ==========    ==========    ==========    ==========
  380.              Earth's       Earth's       Earth's       Earth's
  381.              Surface       Surface       Surface       Surface
  382.                      Ship Falling in Earth's Gravitation
  383.  
  384.  
  385.      It certainly seems, then, that a frame which is freely falling in the
  386. presence of gravity is actually an inertial frame of reference. As one final
  387. test, let's go back to the experiment mentioned earlier in which light rises
  388. in the presence of Earth's gravity. As it turns out (though I won't go into
  389. the proof) if the light is detected while it is still relatively close to
  390. the Earth, and we consider the experiment in a frame of reference which is
  391. freely falling near the Earth's surface, then in that frame, the light does
  392. not loose energy. Thus, in the freely falling frame of reference, Diagram
  393. 5-1 (which depicts an inertial frame of reference) can correctly depict the
  394. geometry of the situation.
  395.      And so, things are looking deceptively hopeful. In every case we have
  396. studied, it seems as if we can continue to use special relativity as-is,
  397. even in the presence of gravity, if we simply define "inertial frame" to
  398. mean a frame which is in free fall. Then the space-time diagrams we have
  399. drawn throughout our discussions would work just fine in the presence of
  400. gravity, as long as we understand that they are drawn in free falling
  401. frames. However, as I warned earlier, there is a problem here which we
  402. haven't solved.
  403.  
  404.  
  405.  
  406. 5.3 The Global Break-Down of Special Relativity
  407.  
  408.      Now that we have tried to argue that we can continue using special
  409. relativity even when gravity is involved (by appropriately defining a new
  410. inertial frame), we are now in a position to explain where the argument
  411. breaks down.
  412.      Consider Diagram 5-6. There we see a ship which is much wider than the
  413. ships we have shown thus far. It is in free fall towards the surface of the
  414. Earth, and there are two observers shown, one at either side of the ship.
  415. Now, according to our argument, both observers are said to be in inertial
  416. frames of reference because they are both in free-fall. However, as they
  417. each fall towards the center of the Earth, because they are at great
  418. distances from one another, they accelerate in different directions as
  419. shown. If one observer looks at the other, he will see that other observer
  420. accelerating towards him. But if they are both supposed to be inertial
  421. observers, then how can they also each be accelerating in the frame of the
  422. other?
  423.  
  424.                                  Diagram 5-6
  425.  
  426.       +--------------------------------------------------------------+
  427.       |                                                              |
  428.       |    O                                                    O    |
  429.       |     \                                                  /     |
  430.       | O    \|                                              |/    O |
  431.       |/|\  ""`Acceleration                     Acceleration '""  /|\|
  432.       | |      toward center                    toward center      | |
  433.       |/ \ \     of Earth                         of Earth      / / \|
  434.       |     \|                                                |/     |
  435.       |    ""`                                                '""    |
  436.       +--------------------------------------------------------------+
  437.                          _______==========_______
  438.               ___==="""""                        """""===___
  439.                             The Earth's Surface
  440.                   Long Ship Falling in Earth's Gravitation
  441.  
  442.  
  443.      Also, consider Diagram 5-7 in which there is a ship which is much
  444. taller than the ships we have been considering. Here, two observers are
  445. again shown, one at the bottom of the ship and one at the top. Because the
  446. one near the bottom is much closer to the surface of the Earth, he is
  447. accelerating at a greater rate than the other observer. Again, these two
  448. observers are both supposed to be inertial observers, yet each is
  449. accelerating in the other observer's frame. Further, as the observer on the
  450. top continues to accelerate downward, he will eventually be where the
  451. observer at the bottom is now. Thus, as time passes, he will fall into a
  452. stronger gravitational field, and he will be in a "different" inertial frame
  453. than he his now.
  454.  
  455.                                  Diagram 5-7
  456.  
  457.                                    +------+
  458.                                    |    O |
  459.                                    |      |
  460.                                    | O    |
  461.                                    |/|\   |
  462.                                 |  | |    |
  463.                         smaller\|/ |/ \   |
  464.                          accel     |      | G |
  465.                                    |      | r |
  466.                                    |      | a |
  467.                                    |      | v |
  468.                                    |      | i |
  469.                                    |      | t |
  470.                                    |      | y |
  471.                                    |      |  \|/
  472.                                    |    O |
  473.                                    |      |
  474.                                 |  | O    |
  475.                                 |  |/|\   |
  476.                         larger  |  | |    |
  477.                          accel \|/ |/ \   |
  478.                                    |      |
  479.                                    +------+
  480.                                   ==========
  481.                                     Earth's
  482.                                     Surface
  483.                    Tall Ship Falling in Earth's Gravitation
  484.  
  485.  
  486.      What does all this say? Well, we have shown that for small distances
  487. and over small amounts of time, a free falling frame has all the properties
  488. we want in an inertial frame when gravity is present. However, in each of
  489. the last two cases above, we have observers who are all free-falling and
  490. thus (by our new definition of an inertial frame in the presence of gravity)
  491. are all supposed to be in inertial frames. Yet, if we draw a space-time
  492. diagram for one of the observers, and extend it so that the other observer
  493. can be drawn on the diagram, that other observer will be accelerating on the
  494. space-time diagram. Therefore, a space-time diagram which well describes an
  495. inertial frame for all of space-time in special relativity can only well
  496. describe an inertial frame of reference over a small distance in space and
  497. time when a general gravitational field is involved.
  498.      This is analogous to the situation in which a flat map can well
  499. describe a small, local piece of the curved surface of the Earth (such as a
  500. city). However, globally, as you extend the map, it no longer describes the
  501. curved surface of the Earth.
  502.      We therefore find that when gravity is involved, we can still define an
  503. inertial frame of reference LOCALLY (meaning local in both space and time),
  504. but globally, there is no way to define a single, rigid frame of reference
  505. which describes an inertial frame of reference everywhere in space-time.
  506. Therefore, globally we cannot use special relativity to describe space-time
  507. in the presence of a general gravitational field. We must therefore re-think
  508. relativity in the presence of gravity.
  509.      What we will find is that gravity is actually caused by a curvature of
  510. space-time, and like the map trying in vain to describe the curved surface
  511. of the Earth, special relativity cannot describe the curved space-time
  512. caused by gravity. It is general relativity which describes curved
  513. space-time, and for us to fully appreciate it, we will need to discuss some
  514. basic ideas used to describe such a geometry.
  515.  
  516.  
  517.  
  518. 5.4 Manifolds, Geodesics, Curvature, and Local Flatness
  519.  
  520.      Before we discuss space-time in the presence of gravity, we need to
  521. understand some basic geometric concepts which we will use. We will develop
  522. these concepts by considering normal, spatial geometry which can be fully
  523. grasped using common sense. Applying these concepts to space-time becomes
  524. less intuitive (in part because we still aren't that used to thinking of
  525. time as just another dimension); therefore, developing them using normal
  526. spatial geometry will be beneficial.
  527.      First, we introduce the term "manifold". Basically, for our purposes,
  528. you can think of a manifold as a fancy term for a space. The space around us
  529. that you are used to thinking of can be called a three dimensional manifold.
  530. The surface of a sheet of paper is a two dimensional manifold, as is the
  531. surface of a cylinder or the surface of a sphere. Much of our focus on
  532. manifolds will involve discussing their geometry. Understanding the geometry
  533. of a manifold means understanding the relationships between various points
  534. on the manifold and understanding various curves on the manifold as well as
  535. knowing how to measure distances on the manifold. Thus, we want to define a
  536. few specific notions which will help us understand and explain the geometry
  537. of a manifold.
  538.      So, next we look at a particular type of path on a manifold called a
  539. geodesic. A geodesic is essentially the path which takes the shortest
  540. distance between two points on the manifold. On a piece of paper (a flat
  541. manifold) the shortest distance between two points is found by following the
  542. path of a straight line. However, for a sphere, the shortest distance
  543. between two points would be traveled by following a curve known as a great
  544. circle. If you imagine cutting a sphere directly in half and then putting it
  545. back together, then the cut mark on the surface of the sphere would be a
  546. great circle. If you move along the surface of a sphere between two points,
  547. then the shortest path you could take would lie on a great circle. Thus, a
  548. great circle on a sphere is basically equivalent to a line on a flat
  549. manifold--they are both geodesics on their respective manifolds. Similarly,
  550. on any other manifold there would be a path to follow between two points
  551. such that you would travel the shortest distance. Such a path is a geodesic
  552. on that manifold.
  553.      Next, we introduce the concept of the curvature of a manifold. There
  554. are two different types of curvature: intrinsic and extrinsic. To
  555. demonstrate the difference between the two, let's first consider a surface
  556. which has only extrinsic curvature. Imagine taking a flat sheet of paper and
  557. rolling it as if you were making a cylinder; however, don't let the two ends
  558. touch to complete the cylinder. Now, while this two dimensional surface will
  559. now look curved in our three dimensional perspective, the geometry of the
  560. surface is still the same as the geometry of the flat sheet of paper from
  561. which it was made. If you were a two dimensional creature confined to live
  562. on this two dimensional surface, there would be no test you could perform to
  563. prove you weren't on a flat sheet of paper rather than this cylinder-like
  564. surface. Now if you did complete the cylinder, then a two dimensional
  565. creature could tell that the global topology of the situation has changed
  566. (for example, on a complete cylinder, he could follow a particular path
  567. which would bring him around back to where he started). However, this
  568. doesn't change the fact that throughout the cylinder, the internal geometry
  569. is just like the geometry of a flat sheet of paper from which it was made.
  570.      So, for a two-dimensional cylinder, its curvature is only "visible"
  571. when viewed from a higher dimensional space (our three-dimensional space).
  572. We only say it is curved because a line on the 2-D cylinder can bend away
  573. from a straight line in three dimensions. However, The cylinder has no
  574. intrinsic curvature to its geometry, so its curvature is extrinsic.
  575.      Contrast this with the surface of a sphere. You cannot bend a flat
  576. sheet of paper around a sphere without crumpling or cutting the paper. The
  577. geometry on the surface of a sphere will then be different from the geometry
  578. of a flat sheet of paper. To distinctly show this, let's consider a couple
  579. of two dimensional creatures who are confined to the surface of a sphere.
  580. Say that they stand facing the same direction at a given, small distance
  581. apart from one another on the two dimensional surface, and then they begin
  582. walking in the same direction parallel to one another. As they continue to
  583. walk beside one another, each will continue in what seems to him to be a
  584. straight line. If they do this--if each of them believes that he is
  585. following a straight line from one step to the next--then each will follow
  586. the path of a geodesic on the sphere. As we said earlier, this means that
  587. they will each follow a great circle. But if they each follow a great circle
  588. on the surface of a sphere, then they will each eventually notice that their
  589. friend walking next to them is moving closer and closer, and eventually they
  590. will meet. Now, they started out moving on parallel paths, and they each
  591. believed that they were walking in a straight line, but their paths
  592. eventually came together. This would not be the case if they performed this
  593. experiment on a flat sheet of paper (or on a cylinder). Thus, creatures who
  594. are confined to live on the two dimensional surface of a sphere could tell
  595. that the geometry of their space was different from the geometry of a flat
  596. piece of paper (even though they couldn't "see" the curvature because they
  597. are trapped in only two dimensions). That intrinsic difference is due to the
  598. intrinsic curvature of the sphere's surface.
  599.      This, then, is what we want to note about curvature: There are two
  600. types of curvature, extrinsic and intrinsic. Extrinsic curvature is only
  601. detectable from dimensions higher than the dimension of the manifold being
  602. considered. Intrinsic curvature can be detected and understood even by
  603. creatures who are confined to live within the dimensions of the manifold.
  604. Thus, just because a manifold may looked "curved" in a higher dimension,
  605. that doesn't mean that its intrinsic geometry is different from that of a
  606. flat manifold (i.e. its geometry can still be flat--like the cylinder).
  607. Thus, the test of whether a manifold is intrinsically curved does not have
  608. anything to do with higher dimensions, but with experiments that could be
  609. performed by beings confined on that manifold. (For example, if two parallel
  610. lines do not remain parallel when extended on the manifold, then the
  611. manifold possesses curvature). This is important to us in our discussion of
  612. space-time in the presence of gravity. It means that the curvature of the
  613. four dimensional manifold of space-time in which we live can be understood
  614. without having to worry about or even speculate on the existence of any
  615. other dimensions.
  616.      As a final note in this introduction to manifolds, I want to mention a
  617. bit about local flatness. Note that even though a manifold can be curved, on
  618. a small enough portion of that manifold, it will be fairly flat. For
  619. example, we can represent a city on our curved Earth by using a flat map.
  620. The map will be a very good representation of the city because it is a very
  621. small piece of the curved manifold. Earlier I mentioned that over a small
  622. enough piece of space-time in the presence of gravity, you can define a
  623. frame of reference which is still very similar to an inertial reference
  624. frame in special relativity. This gives an indication as to why the geometry
  625. of space-time in special relativity is that of a flat manifold, while with
  626. general relativity, space-time is said to be curved in the presence of
  627. gravity. Still, the space-time of any observer being acted on only by
  628. gravity is LOCALLY flat.
  629.      Later we will see how the concepts discussed here will help us in
  630. explaining gravity and relativity. Next, however, we want to discuss another
  631. property of manifolds which itself will tell us everything we want to know
  632. about the geometry of a particular manifold. We will call this property the
  633. invariant interval.
  634.  
  635.  
  636.  
  637. 5.5 The Invariant Interval
  638.  
  639.      Here we will basically be discussing distances on manifolds, and what
  640. we can learn about a manifold based on how we calculate distances on that
  641. manifold. We start by discussing the length of a random path on a manifold.
  642.      Consider a random path on a flat sheet of paper. We can use an x-y
  643. coordinate system to specify any point on the paper and any point on the
  644. path. With this coordinate system in place, how can we use it to measure the
  645. length of that random path? One way is to break up the path into tiny parts,
  646. each of which can be approximated with a straight line segment. Then, if we
  647. know how to measure the length of a straight line, we can measure the length
  648. of each line segment and add them up to find the approximate length of the
  649. path. Now, since the random path doesn't have to be very straight, the line
  650. segments we use might not be very good at approximating the path at some
  651. point. However, if we break up the path into smaller pieces, then the
  652. smaller line segments should do a better job of approximating the curve and
  653. giving us the correct length for the path. The smaller we make the line
  654. segments, the better our approximation of the path's length will be. The
  655. ultimate result of this idea is to figure out what the calculated length
  656. would be if we made the line segments infinitesimally small. That would give
  657. us the actual length of the curve.
  658.      So, the next question is this: How do we calculate the length of a very
  659. small (infinitesimal) line segment using our x-y coordinate system? Well,
  660. each segment is made up of a component in the x direction (dx) and a
  661. component in the y direction (dy) as shown in Diagram 5-8. These components
  662. represent infinitesimal distances. The length of the infinitesimal line
  663. segment (let's call the length ds) is then given by the following (using the
  664. Pythagorean theorem):
  665.  
  666.   (Eq 5:1)
  667.    ds^2 = dx^2 + dy^2
  668.  
  669. (Note that this is the length of a straight line--a geodesic on this
  670. manifold--between an initial and a final position which are separated by a
  671. distance dx in the x direction and dy in the y direction.)
  672.  
  673.                                  Diagram 5-8
  674.  
  675.                                  y
  676.                                  |       /.
  677.                                  |      / .
  678.                                  |   ds/  .
  679.                                  |    /   .dy
  680.                                  |   /    .
  681.                                  |  /......
  682.                                  |     dx
  683.                              ----+------------->x
  684.                                  |
  685.  
  686.  
  687.      This distance between two very-nearby points is what I call the
  688. invariant interval. Why? Well, first I need to note that there are other
  689. types of coordinate systems one could use to locate every point on a flat
  690. surface, and that the equation for ds in terms of small changes in each
  691. coordinate will depend on the coordinate system you use. However, though the
  692. form of the equation will change, the actual distance between two points on
  693. the manifold is a physical reality which won't change. The actual interval
  694. is independent of the coordinate system you place on the manifold.
  695.      Now, Below, I will specifically use ds as defined here (in a flat, x-y
  696. coordinate system) to make a comparison with an invariant interval defined
  697. using a particular coordinate system on a curved manifold. However, all the
  698. arguments I will make can also be made using any other coordinate system on
  699. a flat manifold and any other coordinate system on a curved manifold. I
  700. simply use two specific ones as solid examples.
  701.      So, to demonstrate how the equation for ds will tell us everything we
  702. want to know about a manifold, we next need to consider a curved manifold.
  703. We will use our old friend the sphere. Let's start by defining a coordinate
  704. system on the sphere. Picture a sphere with a great circle drawn on it.
  705. Let's call that great circle the equator. Next, consider a point on the
  706. equator, and call that point our origin. We want to define two independent
  707. coordinates which will allow us to locate any point on the sphere starting
  708. from the origin (note: by "independent coordinates" I mean that you can
  709. always change your position in one coordinate independent of any change in
  710. the other). So, consider some other point on the sphere (call the point
  711. "P"), and let's explain how to get to that point using two coordinates. We
  712. start by moving either towards the "east" or "west" from our origin in the
  713. general direction of "P" (you can define "east" and "west" however you
  714. wish). We move along the equator until P is directly north or south of us,
  715. and we call the distance we move "L" (L is positive if we move east). Next,
  716. we need to move north or south on the sphere to reach P. The distance we
  717. move north or south to reach P will be called "H" (H is positive if we move
  718. north). That gives us our coordinate system. Every point on the sphere can
  719. now be represented by an L-H coordinate pair. The "grid" on the surface of
  720. the sphere which represents this coordinate system would be made of latitude
  721. and longitude lines such as those on a globe.
  722.      Next, we need to figure out what infinitesimal distance (ds) would be
  723. associated with moving a small distance in L (dL) and a small distance in H
  724. (dH). For the sake of time, I'll just give the answer here. (Note, R is the
  725. radius of the sphere we are considering):
  726.  
  727.   (Eq 5:2)
  728.    ds^2 = dH^2 + [cos(H/R)]^2*dL^2
  729.  
  730. Remember what this represents. If you start at some point (L,H) on the
  731. sphere, and you change your L coordinate by a small amount (dL) and your H
  732. coordinate by a small amount (dH) then the shortest distance along the
  733. sphere between your first position and your final position would be ds. Note
  734. that this distance depends on your H position (because of the "cos(H/R)"
  735. part of the equation). This is an interesting point because as soon as you
  736. start moving from one position to the next, the equation for ds becomes
  737. slightly different. We basically think of this difference as negligible as
  738. long as dL is very small, but, in fact, the equation is only correct when dL
  739. is truly "infinitesimal". Such concepts are generally covered in calculus,
  740. and for our purposes, we will just claim that the equation is practically
  741. true as long as dL is very small.
  742.      So now we come to an important statement to be made in this section:
  743. THE FORM OF THE INVARIANT INTERVAL FULLY DEFINES THE INTRINSIC GEOMETRY OF A
  744. MANIFOLD. For example, what if we tried to find another coordinate system on
  745. the sphere using two independent coordinates (a and b) such that the
  746. invariant interval on the sphere would be given by the following:
  747.  
  748.   (Eq 5:3)
  749.    ds^2 = da^2 + db^2?
  750.  
  751. Well, because that invariant interval looks just like the formula for ds on
  752. a flat sheet of paper (ds^2 = dx^2 + dy^2), then it should be impossible for
  753. Equation 5:3 to be the invariant interval on the sphere (no matter how we
  754. define "a" and "b"). If I drew a grid on a flat sheet of paper and labeled
  755. the axes "a" and "b", then Equation 5:3 would appropriately describe the
  756. relationship between every single point on that flat manifold given the "a"
  757. and "b" coordinate system. Thus, if I define "a" and "b" to be independent
  758. coordinates on a sphere, and I claimed that Equation 5:3 described the
  759. invariant interval on the sphere given those coordinates, then I'd be saying
  760. that Equation 5:3 describes the relationship between every single point on
  761. the sphere given the "a" and "b" coordinate system. But that's saying that
  762. by appropriately defining "a" and "b", I can make the relationship between
  763. all points on the sphere be just like the relationship between every point
  764. on a flat sheet of paper. We know that physically, this simply can't be
  765. done, because there are intrinsic ways to tell the difference between the
  766. geometry of a sphere and the geometry of a flat sheet of paper.
  767.      You might be looking back at Equation 5:2 and thinking, "but what if I
  768. just define a new coordinate, L' such that dL'^2 = cos^2(H/R) dL^2? Then I
  769. get ds^2 = dH^2 + dL'^2, which looks like the invariant interval for a flat
  770. sheet of paper." Ah, but look at your definition for dL' and notice that it
  771. involves your other coordinate, H. You see that H and L' are NOT independent
  772. coordinates. To be valid in our discussion here, the coordinates you use on
  773. a manifold must be independent.
  774.      So, Considering this example of a sphere and a flat sheet of paper,
  775. let's make some general points: First, consider some manifold, M1. On M1, we
  776. have some (valid) coordinate system, S1. Next we consider two very-nearby
  777. points on M1 (call the points P and Q). If we know the distance between P
  778. and Q along each of the coordinates (like dx and dy, for example), then we
  779. can find some function for ds (the shortest distance on M1 between the
  780. very-nearby points) using the coordinates in S1. Now, consider a second
  781. manifold, M2. If a (valid) coordinate system, S2, can be defined on that
  782. manifold such that ds has the same functional form in S2 as it did using the
  783. S1 coordinate system on M1, then the geometry of the two manifolds must be
  784. identical.
  785.      This indicates that the geometry of a manifold is completely determined
  786. if one knows the form of the invariant interval using a particular
  787. coordinate system on that manifold. In fact, starting with the form of the
  788. invariant interval in some coordinate system on a manifold, we can determine
  789. the curvature of the manifold, the path of a geodesic on the manifold, and
  790. everything we need to know about the manifold's geometry.
  791.      Now, the mathematics used to describe these properties involves
  792. geometric constructs known as tensors. In fact, the invariant interval on a
  793. manifold is directly related to a tensor known as the metric tensor on the
  794. manifold, and we will discuss this a bit later. First, I want to give a very
  795. brief introduction to tensors in general.
  796.  
  797.  
  798.  
  799. 5.6 A Bit About Tensors
  800.  
  801.      In this section I will introduce just a few basic ideas which will give
  802. the reader a feeling for what tensors are. This is simply meant to provide a
  803. minimum amount of information to those who do not know about tensors.
  804.      Basically, a tensor is a geometrical entity which is identified by its
  805. various components. To give a solid example, I note that a vector is a type
  806. of tensor. In an x-y coordinate system, a vector has one component which
  807. points in the x direction (its x component) and another component which
  808. points in the y direction (its y component). If you consider a vector
  809. defined in three dimensional space, then it will also have a z component as
  810. well. Similarly a tensor in general is defined in a particular space which
  811. has some number of dimensions. The number of dimensions of the space is also
  812. called the number of dimensions of the tensor. Note that vectors have a
  813. component for each individual (one) dimension, and they are called tensors
  814. of rank 1. For other tensors, you have to use two of the dimensions in order
  815. to specify one component of the tensor. In x-y space, such a tensor would
  816. have an xx component, an xy component, a yx component, and a yy component.
  817. In three-space, it would also have components for xz, zx, yz, zy, and zz.
  818. Since you have to specify two of the dimensions for each component of such a
  819. tensor, it is called a tensor of rank 2. Similarly, you can have third rank
  820. tensors (which have components for xxx, xxy, ...), fourth rank tensors, and
  821. so on.
  822.      So that you aren't confused, I want to explicitly note that the
  823. dimensionality of a tensor (the number of dimensions of the space in which
  824. the tensor is defined) is independent of the rank of the tensor (the amount
  825. of those dimensions that have to be used to specify each component of the
  826. tensor). In any dimensional space, we can have a tensor of rank 0 (just a
  827. number by itself, because it is not associated in any way with any of the
  828. dimensions), a tensor of rank 1 (like a vector--it has a component for every
  829. one dimension you can specify), a tensor of rank 2 (it has a component for
  830. every pair of dimensions you can specify), etc.
  831.      Now we look at a very important property of tensors. In fact, it is the
  832. property which really defines whether a set of components make up a tensor.
  833. This property involves the question of how the tensor's components change
  834. when you change the coordinate system you are using for the space in which
  835. the tensor is defined. So, let's consider an example in two dimensional
  836. space where you go from some coordinate system (call the coordinates x and
  837. y) to some other coordinate system (call these coordinates x' and y'). There
  838. will be some sort of relationship between the two systems. For example, say
  839. we start at some point in this space such that our coordinates are (x,y) and
  840. (x',y') (depending on which coordinate system you are using). Now, say we
  841. move an "infinitesimal distance" in x (using the first coordinate system).
  842. Call that distance dx. When we do so, we may have changed our x' position
  843. (using the second coordinate system) by some infinitesimal amount, dx'.
  844. Also, we may have changed our y' position by some amount dy'. We can use
  845. these concepts of infinitesimal changes to define some relationships between
  846. the two systems. We can answer the question "how does x' change when x
  847. changes at this point" by noting the ratio, dx'/dx. Similarly we can write
  848. dx/dx' to denote how much x changes with changes in x' at some point, and
  849. dy'/dx denotes how y' changes with changes in x.
  850.      Please understand that these are not simply ratios of definite numbers.
  851. For example, dx'/dx is not necessarily the inverse of dx/dx' because dx in
  852. one expression is NOT the same as dx in the other. The first expression uses
  853. dx in the following context: "If I hold y constant and change x by an amount
  854. dx, x' and y' might change by amounts dx' and dy'. Take the amount that x'
  855. changes (dx') and divide it by the amount I changed x (dx)." The second
  856. expression uses dx in the following context: "If I hold y' constant and
  857. change x' by an amount dx', x and y might change by amounts dx and dy. Take
  858. the amount that x changes (dx) and divide it by the amount I changed x'
  859. (dx')." You can see that the dx in the former context does not have to be
  860. the same amount as dx in the latter. So, when I write dx'/dx or dx/dx' or
  861. dy/dx' etc, you must understand that the form of these ratios (what's on top
  862. and what's on bottom) defines how they are produced, and they are not just
  863. ratios of definite numbers. (Those who know something of calculus will
  864. obviously recognize these terms as simple partial derivatives, but
  865. anyway....)
  866.      Now, all together there are four of these ratios which denote how the
  867. x' and y' coordinates change with changes in x and y:
  868.  
  869. dx'/dx, dx'/dy, dy'/dx, and dy'/dy.
  870.  
  871. Similarly, there are four more to denote how x and y change with changes in
  872. x' and y':
  873.  
  874. dx/dx', dx/dy', dy/dx', and dy/dy'.
  875.  
  876. In general the values of these ratios can depend on where you are on a
  877. manifold, so each ratio is generally a function of x and y (or x' and y', if
  878. you like).
  879.      Now, we have these ratios which help us relate one coordinate system to
  880. another. If we have a tensor defined in this space, then we must be able to
  881. use those ratios to find out how the tensor's components themselves change
  882. when we go from considering them in one coordinate system to considering
  883. them in the other. Let's consider a tensor of rank 1 (a vector) in a two
  884. dimensional space. Let the vector, call it V, have an x component (V_x) and
  885. a y component (V_y). Then, the rules for finding the x' and y' components of
  886. the vector at some point are the following:
  887.  
  888.   (Eq 5:4)
  889.     V_x' = dx'/dx V_x + dx'/dy V_y
  890.    and
  891.     V_y' = dy'/dx V_x + dy'/dy V_y.
  892.  
  893.      That is the way in which this type of first rank tensor must transform
  894. from one coordinate system to another. Note that we can write both equations
  895. in Equation 5:4 by using the following:
  896.  
  897.   (Eq 5:5)
  898.    V_a = SUM(b = x,y) [da'/db V_b]
  899.  
  900.      In that expression, "a" can be either x or y (so we actually have two
  901. equations--those in Equation 5:4). Also, the right side of the equation is a
  902. summation where the first term in the summation is found by letting b = x,
  903. and the second term is found by letting b = y. Further, we could make this
  904. expression more general by noting that it will be true for a space with
  905. higher dimensions when we let "a" be any one of those dimensions and let the
  906. sum with b extend over all the dimensions.
  907.      The fact that the physical components of a vector do actually transform
  908. this way is what makes the vector a tensor. However, we should note that not
  909. all types of vectors transform this way.
  910.      To show this is so, first we will consider a function which has a value
  911. at every point in x-y space. Call the function f(x,y). Such a function is a
  912. 0 rank tensor, because at any point in the space, it has some single,
  913. numerical value (it does not have components for x and y like a vector
  914. does--you can't ask "what's its value in the x direction", or "what's its
  915. value in the y direction", because it has only a single number at any
  916. point). Note that if we change to another coordinate system, the value of f
  917. at some physical point in the space will not change. Because it has no x or
  918. y component, it is invariant when you change coordinate systems, as are all
  919. 0 rank tensors. This is the way all 0 rank tensors must transform when you
  920. change coordinate systems--they must be invariant.
  921.      Now, back to the point that there are other types of vectors which do
  922. not transform as discussed earlier. Let's take the function we were just
  923. discussing, f(x,y), at some point and ask "how does it change with small
  924. changes in x?" If the function changes by an amount df when we move to
  925. another x location a distance dx away, then we can write the expression
  926. df/dx to tell how f changes with x. We can do the same in y and have the
  927. expression df/dy. Then we could define a vector (call it G) which has an x
  928. component (G_x) equal to df/dx at every point in x and y, while it has a y
  929. component (G_y) equal to df/dy at every point. Now, what if we do this same
  930. procedure in the x'-y' coordinate system. First, we need to convert f into a
  931. function f'. We do this such that if a point in our space has coordinates
  932. (x,y) in one coordinate system while the same physical point has coordiantes
  933. (x',y') in the other coordinate system, then we want f(x,y) = f'(x',y').
  934. That way f' is the proper representation of f in the primed coordinate
  935. system. Now we again find a vector, G, and we will end up with the x' and y'
  936. components of the G vector such that G_x' = df'/dx' and G_y' = df'/dy'.
  937.      We now want to figure out how to transform G from one frame to another.
  938. First, we will look at G_x' = df'/dx' which says that G_x' comes from
  939. knowing how f' changes with respect to x' (i.e. df'/dx'). To transform this
  940. component of G, we must know how to find df'/dx' using G_x and G_y. This
  941. means we will be using information about how f changes with respect to x and
  942. y (i.e., using df/dx and df/dy). We will also need to use information about
  943. how x and y change with respect to x'. Without taking the time to fully
  944. explain the calculus involved, perhaps the following equation will not be
  945. too surprising:
  946.  
  947.   (Eq 5:6)
  948.     df'   df'  dx     df'  dy
  949.     --  = -- * --  +  -- * --
  950.     dx'   dx   dx'    dy   dx'
  951.  
  952.      Conceptually (though mathematicians would cringe a bit at this
  953. explanation) one can imagine canceling out the dx in df'/dx * dx/dx' and
  954. canceling out the dy in df'/dy * dy/dx' to see that in both parts of that
  955. equation we are looking at information about df'/dx'. In the first case, we
  956. are looking at how f' changes with respect to x' by way of how x changes
  957. with respect to x', while in the second case we are looking at how f'
  958. changes with respect to x' by way of how y changes with respect to x'.
  959. Adding these two components together as we do in the above equation gives us
  960. a full picture of how f' changes with respect to x' given information about
  961. how f' changes with respect to x and y.
  962.      We further note that f' and f are actually the same physical function,
  963. we just use the prime to indicate which coordinate system we are primarily
  964. thinking of. Thus f and f' will both change in the same way with respect to
  965. changes in x and y (i.e. df'/dx = df/dx and df'/dy = df/dy. We therefore
  966. rewrite Equation 5:6 as
  967.  
  968.   (Eq 5:7)
  969.     df'   df   dx     df   dy
  970.     --  = -- * --  +  -- * --
  971.     dx'   dx   dx'    dy   dx'
  972.  
  973.                dx          dy
  974.         = G_x* --  +  G_y* --
  975.                dx'         dx'
  976.  
  977. Note that we have substituted G_x = df/dx and G_y = df/dy. The above
  978. equation provides the transformation of G_x' given the components of G in
  979. the (x,y) coordinate system. Similarly, we can also find the transformation
  980. of G_y'. In the end, simply because of the way this vector is defined, it
  981. transforms as follows:
  982.  
  983.   (Eq 5:8)
  984.     G_x' = dx/dx' G_x + dy/dx' G_y
  985.    and
  986.     G_y' = dx/dy' G_x + dy/dy' G_y
  987.  
  988. As before, we can rewrite these two equations as follows:
  989.  
  990.   (Eq 5:9)
  991.    G_a' = SUM(b = x, y) [db/da' G_b]
  992.  
  993. Note that we are using ratios like db/da' rather than da'/db (which we used
  994. earlier). That means that this is a different type of vector (because it
  995. transforms in a different way). The vector we discussed earlier (V) is
  996. called a contravariant vector, and the fact that it transforms as shown in
  997. Equation 5:5 is what defines it as that type of vector. The G vector is
  998. called a covariant vector, and it is defined as such because it transforms
  999. as shown in Equation 5:9. Usually, we express which type of vector we have
  1000. by the way we denote its components. For contravariant vectors, we denote
  1001. their components by putting their indexes (the x or the y) in superscripts:
  1002.  
  1003.     x      y
  1004.    V  and V   (or V^{x} and V^{y}),
  1005.  
  1006. While we denote the components of covariant vectors by putting their indices
  1007. in subscripts:
  1008.  
  1009.    G  and G   (or G_x and G_y)
  1010.     x      y
  1011.  
  1012.      With this notation, the two different transformations begin to take on
  1013. an easy to remember form. See if you can figure out how the "upper" indices
  1014. and the "lower" indices match up on both sides of the two transformation
  1015. equations when they are written as follows:
  1016.  
  1017.   (Eq 5:10)
  1018.     a'               da'  b
  1019.    V  = SUM(b = x,y) --  V
  1020.                      db
  1021.  
  1022. and
  1023.  
  1024.   (Eq 5:11)
  1025.                      db
  1026.    G  = SUM(b = x,y) --  G
  1027.     a'               da'  b
  1028.  
  1029.  
  1030. Notice that the superscript (or subscript) on one side remains "upper" (or
  1031. "lower") in the ratio on the other side. Also, note that the summation is
  1032. always over the index which is repeated on the right side, once in an
  1033. "upper" position and once in a "lower" position. This basic "formula" helps
  1034. to produce equations for all transformation in tensor analyses (note this in
  1035. the next part of this section).
  1036.      It is interesting to note that in the normal spatial coordinates we are
  1037. used to using (Cartesian coordinates), db/da' = da'/db, and there is no
  1038. distinction between covariant and contravariant vectors. However, in other
  1039. systems, the difference is there and must be considered.
  1040.      Further, we note that with higher rank tensors, they are also defined
  1041. by the way they transform from one coordinate system to another. For
  1042. example, consider a second rank tensor, U. It could be that both of its
  1043. indices are associated with the contravariant type of transformation (note:
  1044. the following actually denotes four equations because a'b' can be set to
  1045. x'x', x'y', y'x', or y'y'):
  1046.  
  1047.   (Eq 5:12)
  1048.      a'b'    da'  db' xx    da'  db' xy    da'  db' yx    da'  db' yy
  1049.    U      =  -- * -- U   +  -- * -- U   +  -- * -- U   +  -- * -- U
  1050.              dx   dx        dx   dy        dy   dx        dy   dy
  1051.  
  1052.                                                 [ da'  db' ce ]
  1053.           = SUM(c & e vary over all dimensions) [ -- * -- U   ]
  1054.                                                 [ dc   de     ]
  1055.  
  1056. Or they could both be associated with the covariant type of transformation:
  1057.  
  1058.   (Eq 5:13)
  1059.                     [ dc   de      ]
  1060.    U     = SUM(c,e) [ -- * --  U   ]
  1061.      a'b'           [ da'  db'  ce ]
  1062.  
  1063.  
  1064. Or it could be a mix of the two:
  1065.  
  1066.   (Eq 5:14)
  1067.     a'               [ da'  de   c  ]
  1068.    U      = SUM(c,e) [ -- * --  U   ]
  1069.       b'             [ dc   db'   e ]
  1070.  
  1071.      Finally, we will see in the next section that any contravariant tensor
  1072. also has a covariant form (and vice-versa), and we can transform from one
  1073. form to the other if we know the geometry of the manifold on which the
  1074. tensors are defined.
  1075.      And that about ends our introduction to tensors. To sum up, they are
  1076. geometric entities which have components denoted by some number of indices.
  1077. Each index can be any of the dimensions in which the tensor is defined, and
  1078. the number of indices needed to specify a component of a tensor is called
  1079. the tensor's rank. We are familiar with 0 and 1 rank tensors (numbers--or
  1080. "scalars"--and vectors). Finally, the way one transforms a tensor from one
  1081. coordinate system to another depends on the type of tensor, and it (in fact)
  1082. defines what it actually is to be a tensor. Each index of a tensor will
  1083. transform in either a contravariant way or a covariant way.
  1084.      These are the basic ideas behind tensors, and they allow us to define
  1085. some very powerful mathematics. If you are familiar with the usefulness of
  1086. vectors, then you have touched the surface of the usefulness of tensors in
  1087. general. In the following section, we will look at two particular tensors,
  1088. and we will see that they can be quite useful.
  1089.  
  1090.  
  1091.  
  1092. 5.7 The Metric Tensor and the Stress-Energy Tensor
  1093.  
  1094.      Now that we have had a glimpse at tensors, let's consider a couple that
  1095. will be important to us. The first is called the metric tensor. I mentioned
  1096. a couple of sections ago that this tensor is related to the invariant
  1097. interval for a certain coordinate system on a given manifold. So, let's go
  1098. back and look at a the two specific invariant intervals which we introduced.
  1099. First, in normal, x-y, Cartesian coordinates, we have Equation 5:1
  1100. duplicated here:
  1101.  
  1102.   (Eq 5:15--Copy of Eq 5:1)
  1103.    ds^2 = dx^2 + dy^2
  1104.  
  1105.      Second, on the surface of a sphere, using the L-H coordinate system
  1106. which we defined, we have Equation 5:2 duplicated here:
  1107.  
  1108.   (Eq 5:16--Copy of Eq 5:2)
  1109.    ds^2 = dH^2 + [cos(H/R)]^2*dL^2
  1110.  
  1111.      Now, let's make this more general by considering an arbitrary, two
  1112. dimensional manifold and an arbitrary coordinate system on that manifold.
  1113. Let's call the coordinates "a" and "b". Now, in general, the invariant
  1114. interval on this manifold is defined in terms of the square of that interval
  1115. ds^2. The equation for ds^2 involves the infinitesimal distances da and db
  1116. in second order combinations. By second order combinations, I mean, for
  1117. example, da^2 or da*db. Thus, in general, the invariant interval will have
  1118. the following form (note: the g components are generally formulas of "a" and
  1119. "b"):
  1120.  
  1121.   (Eq 5:17)
  1122.    ds^2 = g   *da^2 + g  *da*db + g  *db*da + g  *db^2
  1123.            aa          ab          ba          bb
  1124.  
  1125.      In that equation you see the four components of the metric tensor in
  1126. this two dimensional, a-b coordinate system. They are the "g's" in the
  1127. equation. For our x-y coordinate system, we have
  1128.  
  1129.   (Eq 5:18)
  1130.    g  = 1,     g  = 0,     g  = 0,     g  = 1
  1131.     xx          xy          yx          yy
  1132.  
  1133. For our L-H coordinate system, we have
  1134.  
  1135.   (Eq 5:19)
  1136.    g  = 1,     g  = 0,     g  = 0,     g  = [cos(H/R)]^2
  1137.     HH          HL          LH          LL
  1138.  
  1139.      So, we can construct the invariant interval if we know the metric
  1140. tensor for a coordinate system on a manifold. Now, remember that we said
  1141. that the form of the invariant interval for a particular coordinate system
  1142. tells us everything there is to know about the manifold for which those
  1143. coordinates are valid. So, now we see that all we need to know is the form
  1144. of the metric tensor. Once we know g, we know the geometry of the manifold.
  1145. Using tensor analysis, we can take the metric tensor and find an equation
  1146. for geodesics on the manifold. We can use it to find out all about the
  1147. curvature of the manifold. We can even use it to find the dot product (we
  1148. will discuss this a bit later) of two vectors in a particular coordinate
  1149. system.
  1150.      Another thing the metric allows us to do is something generally called
  1151. "raising" or "lowering" indices. Basically, if you consider a tensor with a
  1152. contravariant index (which transforms in a particular way as discussed
  1153. earlier), then there is another way to express the tensor as one which has a
  1154. covariant index (and vice versa). That is to say that the geometric entity
  1155. represented by the tensor with the contravariant index has another
  1156. representation which involves a covariant index. For example, consider the
  1157. tensor A^a, which has a contravariant index, a. There is a corresponding
  1158. covariant tensor, A_a, which can be found using the metric of the space (and
  1159. coordinate system) we are dealing with. Here is an example of how you find
  1160. it (finding A_x when you know A^x) for a coordinate system with some
  1161. arbitrary coordinates, x and y:
  1162.  
  1163.   (Eq 5:20)
  1164.               x          y
  1165.    A  =  g   A   +  g   A
  1166.     x     xx         xy
  1167.  
  1168. For a general space and coordinate system, you can write this rule as
  1169. follows (remember, "a" can be any one dimension in the space, so this
  1170. represents a number of equations):
  1171.  
  1172.   (Eq 5:21)
  1173.                                                 b
  1174.    A  =  SUM(b varies over all dimensions) g   A
  1175.     a                                       ab
  1176.  
  1177. Similarly, if you know the covariant form of A (A_a) you can find the
  1178. contravariant form by using the following:
  1179.  
  1180.   (Eq 5:22)
  1181.     a                                       ab
  1182.    A  =  SUM(b varies over all dimensions) g   A
  1183.                                                  b
  1184.  
  1185. But that equation involves the contravariant form of the metric g^ab. In the
  1186. invariant interval, the metric is expressed in its covariant form g_ab. It
  1187. is therefore important for the reader to remember as we discuss various
  1188. metrics below, that for all of them we have
  1189.  
  1190.   (Eq 5:23)
  1191.      ab    1
  1192.     g   = ---   if a = b
  1193.            g
  1194.             ab
  1195.    and
  1196.      ab
  1197.     g   =  0    if a doesn't = b
  1198.  
  1199.      Thus, using the metric tensor, one can "raise" or "lower" any index of
  1200. a tensor. Remember, what one is really doing is finding a form of that
  1201. tensor which transforms in a different way.
  1202.      With this example of how the metric can be used, we will end our
  1203. discussion of this tensor. To sum up, the metric tensor on a manifold is a
  1204. very important entity which not only tells us all about the manifold's
  1205. geometry, but which also provides a very powerful tool which allows us to
  1206. deal with that geometry mathematically.
  1207.  
  1208.      The second tensor we want to mention is the stress-energy tensor. I
  1209. don't want to get too deep into a discussion of the stress-energy tensor,
  1210. but the reader should know a couple of key points. With the stress-energy
  1211. tensor, we see our first example of a tensor explicitly defined in four
  1212. dimensional space-time (though later we will look at the metric tensor
  1213. defined in 4-d space-time). The stress-energy tensor (T) is also a tensor of
  1214. rank 2 (like the metric tensor), which gives it 16 components in 4
  1215. dimensions. Sometimes we express such a tensor in the form of a matrix as
  1216. follows:
  1217.  
  1218.   (Eq 5:24)
  1219.             +-                          -+
  1220.             |   tt     tx     ty     tz  |
  1221.             |  T      T      T      T    |
  1222.             |                            |
  1223.             |   xt     xx     xy     xz  |
  1224.     ab      |  T      T      T      T    |
  1225.    T   =    |                            |
  1226.             |   yt     yx     yy     yz  |
  1227.             |  T      T      T      T    |
  1228.             |                            |
  1229.             |   zt     zx     zy     zz  |
  1230.             |  T      T      T      T    |
  1231.             +-                          -+
  1232.  
  1233. There you can see the 16 different components. Now, each of these components
  1234. tell us something about the distribution and "flow" of energy and momentum
  1235. in a region. More precisely, T contains information about all the stresses
  1236. and pressures and momenta in a region. For example, The "tt" component of
  1237. the stress-energy tensor would be the density of the energy in the region
  1238. (the amount of energy--including mass energy--per unit volume).
  1239.      As to why the stress-energy tensor is important to us, that will be
  1240. discussed further in a bit. However, here we can note the following in order
  1241. to pull us back towards our discussion of relativity and gravity: In
  1242. Newtonian physics, gravity was caused by the density of mass in an area.
  1243. However, in SR we find that mass is just a form of energy, and so we might
  1244. think that the "tt" component of the stress-energy tensor would be the right
  1245. thing to look at when it comes to gravity. However, if we write a rule using
  1246. one component of a tensor, then because the value of that component will
  1247. depend on your coordinate system (or frame of reference in space-time) then
  1248. the rule will also be frame-dependent. In short gravity would not be an
  1249. invariant theory, and it would require a preferred frame if we based it only
  1250. on the "tt" component of T. However, if we use all the components of a
  1251. tensor to form our theory, then (as it turns out) the theory can be made
  1252. frame-independent. Einstein thus considered the possibility that the whole
  1253. stress-energy tensor would need to play a part as the source of gravity. Add
  1254. to this some insight on curved manifolds and you end up with general
  1255. relativity, as we will see.
  1256.  
  1257.  
  1258.  
  1259. 5.8 Applying these Concepts to Gravity
  1260.  
  1261.      Now that we have discussed manifolds and their properties along with
  1262. some of the basic concepts of tensors, let's see how all of this applies to
  1263. relativity and gravitation. First, I will go over the main ideas which lead
  1264. us from what we have discussed so far to a general relativistic theory.
  1265. After that, I want to mention a few notes on the physics and the mathematics
  1266. we will be using given the concepts we have gone over. Next, we will go back
  1267. and look again at special relativity while applying a bit of our new
  1268. knowledge. This will show that GR is indeed general, because when applied to
  1269. space-time without the presence of gravity it will explain a special
  1270. case--special relativity. Finally, we will look quickly at a specific
  1271. application of the GR concepts to a space-time in which there is a
  1272. gravitational field. This application will focus on a particular class of
  1273. stars and black holes.
  1274.  
  1275.  
  1276.  
  1277. 5.8.1 The Basic Idea
  1278.  
  1279.      Let's get started with the basic ideas which combine the concepts we
  1280. have discussed to produce GR. Here I will simply state the main ideas
  1281. without an explanation of their application. You will get some feel for
  1282. their application in our two examples to follow.
  1283.      So, here are the main claims of GR which involve the concepts we have
  1284. discussed. First, the space-time in which we live is a four dimensional
  1285. manifold. On that manifold there is a metric tensor (or just "a metric")
  1286. which describes the geometry of space-time. The metric can be used to find
  1287. geodesics on the space-time manifold, and when an object (only being acted
  1288. on by gravity) goes from one point in space-time to another point in
  1289. space-time (note: these are not just two points in space, but two
  1290. points--i.e. events--in space-time), it moves between the points by
  1291. following a space-time geodesic. Therefore, all the information necessary
  1292. for us to determine how such objects move through space-time is held within
  1293. the form of the metric. How, then, do we determine the metric? Well, the
  1294. metric of space-time in a region is itself determined (in a not-too-trivial
  1295. way) from the stress-energy tensor (T) which is affecting the region. This
  1296. then is the new theory of gravity which relativity has produced. The
  1297. stresses and pressures and momenta in a nearby region produces a
  1298. stress-energy tensor which, in turn, changes the metric of the nearby
  1299. space-time (making its geometry "curved"). This forces objects in the region
  1300. to follow specific paths (geodesics) through the "curved" space-time, and we
  1301. attribute this motion to gravitational effects.
  1302.      As a conceptual example, consider a football being thrown from the
  1303. surface of the earth. Because of the mass of the earth, the space-time the
  1304. football is traveling through is a curved manifold, and the football follows
  1305. a "straight line" geodesic in the four dimensional curved space-time. To us,
  1306. the football's path is curved through three-space, but if we could somehow
  1307. experience the time dimension as a spacial dimension (i.e. if we were four
  1308. dimensional beings) and if we followed the path of the football in the
  1309. four-space, we would seem to be following a straight line on our four
  1310. dimensional curved manifold. However, in reality, the fourth dimension of
  1311. time does not act like the other dimensions in our perception of the
  1312. space-time manifold. Thus we do not see the actual four dimensional path of
  1313. the football, we only see the path in three dimensions while the fourth
  1314. component of the path is revealed to us as a dynamic component of the ball's
  1315. motion through time. That's why we can't see that its path is a "straight
  1316. line" in curved space-time. The stright-line is revealed to us as curved
  1317. motion, and we attribute that motion to gravitational effects.
  1318.  
  1319.  
  1320.  
  1321. 5.8.2 Some Notes on the Physics and the Math
  1322.  
  1323.      Before we go on to our two examples, I wanted to mention a couple of
  1324. points about the mathematics which can be used to develop physics in a
  1325. particular space-time.
  1326.      First, note that for any space-time there is a four dimensional metric
  1327. involved. This metric can be used to find the invariant interval between two
  1328. space-time points. That interval (recall) can generally be expressed as
  1329.  
  1330.   (Eq 5:25)
  1331.    ds^2 = SUM(a & b vary over space and time dimensions) g  *da*db
  1332.                                                           ab
  1333.  
  1334.      Second, consider a vector in our four dimensional space. Such a vector
  1335. (usually called a four-vector) has four components, three relating to space
  1336. and one relating to time. Now, in general, the values for these components
  1337. will depend on the coordinate system/frame of reference in which you are
  1338. considering the vector. However, we can use the metric to act on two
  1339. four-vectors to produce an invariant number. In other words, if there are
  1340. two four-vectors in a space-time, then two different observers using two
  1341. different frames of reference will each find different x, y, z, and t
  1342. coordinates which represent those two vectors in their respective frames.
  1343. However, when they each act on those two vectors in a specific way using
  1344. their own coordinate systems and using their own representation of the
  1345. metric, they will each produce the same particular number. The action on the
  1346. two vectors is called the dot product of the vectors, and many of you may
  1347. have heard of and used it before (though perhaps you didn't realize you were
  1348. using the metric--if you have ever had to remember how to produce a dot
  1349. product in polar coordinates, then you have seen how the metric in that
  1350. coordinate system affects the way you produce the dot product).
  1351.      So, consider two four vectors, U and V. Remember that these are simply
  1352. tensors with either contravariant or covariant components. Now, we can
  1353. produce the dot product of U with V as follows.
  1354.  
  1355.   (Eq 5:26)
  1356.                              a  b
  1357.    U (dot) V = SUM(a,b) g  *U *V
  1358.                          ab
  1359.  
  1360.      This produces a frame invariant number (a scalar), and if U and V have
  1361. particular physical properties in space-time, then we can use the dot
  1362. product to produce frame invariant physical rules in a particular
  1363. space-time.
  1364.      For our third note in this section, let's discuss the time between two
  1365. events. It will be useful for us to find a frame-independent way of
  1366. expressing that time. To explore this a bit, consider an observer who is not
  1367. being acted on by any forces other than gravity. Because of gravity, he will
  1368. simply follow a geodesic through space-time--being at certain points in
  1369. space at particular times. Now, consider two events which each occur at the
  1370. position of our observer, but which occur at two different times on our
  1371. observer's clock. For such events, the time on the observer's clock which
  1372. ticks off between the two events is called the "proper time" (T, though it
  1373. is usually denoted using the Greek letter "tau") between those two events.
  1374. The time this observer reads on his clock does not depend on what any other
  1375. observer sees or does, and T is therefore a frame-invariant way of
  1376. specifying a time between two such events. Of course, the time as measured
  1377. in other frames will be different from T, but every frame will agree that
  1378. for the one, unique observer who naturally follows space-time curvature to
  1379. be at the position of both events, T is the proper time which he measures on
  1380. his clock.
  1381.      We should note that not all events can be connected by the natural
  1382. space-time path of an observer because no observer can travel faster than
  1383. light in that space-time. Any two events which can be connected by an
  1384. observer's natural space-time path are called "time-like separated", and T
  1385. can easily be defined for such events.
  1386.      Now, consider the invariant interval for some observer's space-time
  1387. path between two particular points. Remember that in general the invariant
  1388. interval is a function of your position in space-time. Thus, as soon as you
  1389. start moving down a path, the invariant interval begins to change. We
  1390. discussed this fact briefly in Section 5.5 and decided that we would deal
  1391. with it by breaking up the path into small bits and consider the invariant
  1392. interval at each bit. Therefore, rather than discuss the entire interval
  1393. between the two events, it is better to consider just one point along our
  1394. observer's path and look the infinitesimal (ds) at that point. That
  1395. infinitesimal in four dimensional space-time is generally made up of an
  1396. infinitesimal change in space and an infinitesimal change in time. However,
  1397. remember that for the observer and the two events we are considering, both
  1398. of the events occur right at the observer's position. So, for him there is
  1399. no spatial distance (dx' = 0, dy' = 0, and dz' = 0) between any two points
  1400. on the path. Therefore, the invariant interval at any point on his path as
  1401. calculated using his coordinates must be made up of only changes in his time
  1402. coordinate (dt'). Thus, the value of the invariant interval at some point on
  1403. the observer's path is given totally by the infinitesimal change in the
  1404. proper time (dT = dt', the infinitesimal change in time on our observer's
  1405. watch). We can therefore write the following (taking the spatial components
  1406. out of Equation 5:25):
  1407.  
  1408.   (Eq 5:27)
  1409.    ds^2 = g    *dT^2
  1410.            t't'
  1411.  
  1412. Notice that the component of the metric tensor in the above equation is
  1413. expressed in the coordinates of the observer we are considering (i.e. we are
  1414. specifically using t' and not t). This must be the case, because it is only
  1415. when we measure the infinitesimal invariant interval (ds) using his
  1416. coordinates that we can disregard any spatial component and write the
  1417. interval totally in terms of dT. However, since this observer is free
  1418. falling (only being acted on by gravity), then recall that his local
  1419. space-time is flat, regardless of the global geometry of the space-time he
  1420. is in. Thus, for small distances in space and time in his coordinate system
  1421. (i.e. for infinitesimals like dt') his space-time can be considered to be
  1422. that of special relativity (flat space-time). We will find out in the next
  1423. section what g_tt is for the flat space-time of SR, and when we plug this
  1424. into Equation 5:27 we will find that
  1425.  
  1426.   (Eq 5:28)
  1427.    dT^2 = -ds^2/c^2.
  1428.  
  1429. That equation is true for any space-time, because the space-time of the
  1430. observer is locally flat regardless of the global geometry of the space-time
  1431. we are considering.
  1432.      So, how will this help us with the physics? Well, specifically, this
  1433. gives us a way to define the momentum of an object in any space-time.
  1434. Consider a free-falling object of mass m. In some coordinate system, the
  1435. object's position in one coordinate (say "a") can be changing. Note that "a"
  1436. could be x in an x-y-z coordinate system, r in polar coordinates (which we
  1437. will discuss later), etc. Now, as the object changes spatial coordinates in
  1438. this system, it will follow a natural geodesic path through space-time. As
  1439. the object's position in "a" changes by some infinitesimal amount (da) its
  1440. own "clock" will tick off some small time (dT--note that this is a proper
  1441. time because it is measured on the clock of the object itself). In that
  1442. case, the "a" component of the momentum for that object in this coordinate
  1443. system will be expressed as
  1444.  
  1445.   (Eq 5:29)
  1446.     a
  1447.    p  = m*da/dT
  1448.  
  1449. Notice that if we consider the situation where "a" is the time coordinate
  1450. itself in our system, then we have a sort of "temporal momentum" who's
  1451. significance will be discussed in the next section. Thus, p^a actually has
  1452. four dimensions, and is, in fact, a four-vector. Combine this with our
  1453. discussion of four-vectors above, and we will find some useful physics, as
  1454. we will see in the following examples.
  1455.  
  1456.  
  1457.  
  1458. 5.8.3 First Example: Back to SR
  1459.  
  1460.      The most simple application of the ideas expressed in Section 5.8.2 is
  1461. one which we have already looked at (though without using the concepts
  1462. discussed in that section). It is the situation where there is no
  1463. gravitational field. That is exactly the situation we were considering when
  1464. we discussed special relativity. In special relativity, there is no
  1465. gravitational field. All the components of the stress-energy tensor are
  1466. identically zero.
  1467.      Now, we will figure out the metric of space-time in such a case by
  1468. examining what we already know about special relativity. So, let's go back
  1469. to our space-time diagrams. (By the way, our diagrams only considered one of
  1470. the spatial dimensions, but we will incorporate the other two in this
  1471. section.) Consider two observers who start out moving parallel to one
  1472. another on the diagram. This would mean that they start out with the same
  1473. velocity in any inertial frame. Well, in special relativity (with no
  1474. gravitational field) the two observers will continue to remain on parallel
  1475. paths on the space-time diagram. This is the property of a flat manifold, so
  1476. in SR, space-time is "flat".
  1477.      Before we go on, it will be helpful for us to redefine the time
  1478. variable in our space-time coordinates. Instead of "t", consider the
  1479. combination "c*t" (where c is the speed of light). For convenience, we will
  1480. simply define a new variable, w, where
  1481.  
  1482.   (Eq 5:30)
  1483.    w = c*t
  1484.  
  1485. Then we can use w in place of t in our coordinates. This is actually a
  1486. fairly natural substitution in a couple of ways: First, note that w has the
  1487. units of length, just like x, y, and z do. Second, using w on our space-time
  1488. diagrams makes them a little more general. Why? Well, remember how we
  1489. defined the units of length and time to be the light-second and the second?
  1490. We did this so that a light ray would make a line at a 45 degree angle on
  1491. our diagram. Well, with a w-x coordinate system, this will automatically be
  1492. the case, regardless of what units you use. To see this, note that the value
  1493. of t at a certain value of w is just the time it takes for light to travel
  1494. that length, w (because t = w/c). For example, the point x = 1 light-second
  1495. and t = 1 second corresponds to the point x = 1 light-second and w = 1
  1496. light-second. So, on both an x-t diagram and on an x-w diagram, a light beam
  1497. would make a 45 degree angle with the x axis by going through the point
  1498. (1,1). However, if we wanted to, we could now use a meter as our unit of
  1499. length. Then, when w = 1 meter, t would just be the time it takes for light
  1500. to travel 1 meter. So, the point x = 1 meter, w = 1 meter also lies on the
  1501. light path, and again, that light path would automatically make a 45 degree
  1502. angle with the x axis by going through the point (1,1). For consistency, we
  1503. will continue to use units of seconds and light-seconds, but we will now use
  1504. "w" in units of light-seconds to indicate time in our discussions and
  1505. diagram (remember, the length "w" just represents the time it takes light to
  1506. travel that length).
  1507.      Now, let's look at a change in coordinates on the flat space-time of
  1508. SR. In space-time, a change in coordinates can represent a change in an
  1509. observer's frame of reference. So, when we discussed two observers who were
  1510. moving with respect to one another, we were looking at two different
  1511. coordinate systems (x-t and x'-t', or now, x-w and x'-w') which both
  1512. correctly described space-time in SR. This leads us to consider the
  1513. invariant interval, because we know it must be the same for each of these
  1514. two coordinate systems. So, let's take a closer look at these coordinate
  1515. systems on our diagrams and see if we can't define the invariant interval
  1516. (which, remember, is just another way of writing the metric).
  1517.      We will specifically want to consider infinitesimal lengths like dx.
  1518. So, let's look at a small line segment which lies on a particular
  1519. geodesic--a geodesic we know a little about. That geodesic is the path which
  1520. light follows. Like anything else being acted on only by gravity, light must
  1521. follow a geodesic on the space-time manifold. So, for the particular case of
  1522. a light path, a small segment on that path would have an x component (dx)
  1523. and a t component (dt); however, we now want to begin thinking of w as the
  1524. unit which represents time, so we note that a small change in t (dt)
  1525. represents a change in w of dw = c*dt. Now, since the small distance light
  1526. travels (dx) divided by the time (dt) it took it to travel that distance is
  1527. defined as the speed of light, then we have the following:
  1528.  
  1529.   (Eq 5:31)
  1530.    dx
  1531.    -- = c  (where c is the speed of light)
  1532.    dt
  1533.  
  1534. which can be rewritten as
  1535.  
  1536.   (Eq 5:32)
  1537.    dx
  1538.    -- = 1
  1539.    dw
  1540.  
  1541. That means that dx = dw (for light). Now, since we always define the
  1542. invariant interval in terms of the infinitesimal lengths squared, we will
  1543. actually want to square both sides of that equation and then bring
  1544. everything to one side so as to get the following:
  1545.  
  1546.   (Eq 5:33)
  1547.    dx^2 - dw^2 = 0  (For light)
  1548.  
  1549. Now, because the speed of light is the same for all inertial observers, the
  1550. above equation must be true for all frames of reference. Thus, we might
  1551. consider the idea that the invariant interval for any small line segment
  1552. (not just for light) is given in SR by
  1553.  
  1554.   (Eq 5:34)
  1555.    ds^2 = dx^2 - dw^2,
  1556.  
  1557. and this turns out to be the case. The light path, then, is just the case
  1558. where ds^2 = 0.
  1559.      Now, let's note a few things about this interval. First, it is
  1560. independent of where you are in space-time. All that matters is the lengths
  1561. dx and dw, regardless of what actual x and w position you have. This means
  1562. that the distances (like dx) don't have to be infinitesimal, because the
  1563. equation remains true regardless of how far you extend dx and dw. Thus,
  1564. let's consider the case where one side of the line segment is at x = w = 0
  1565. (the origin). Then dx will be the x distance from the origin to the end of
  1566. the line segment (which in this case can be as far away as we like), and dw
  1567. will be the w distance to that point. In other words, for SR, dx and dw can
  1568. be replaced with x and w when we consider one side of the line segment to be
  1569. at the origin. Further, consider a point in space-time with coordinates
  1570. (x,w) in the o observer's coordinates and (x',w') in the o' observer's
  1571. coordinates. Since the value of the invariant interval is the same for any
  1572. frame of reference, the following must be true:
  1573.  
  1574.   (Eq 5:35)
  1575.    x^2 - w^2  =  x'^2 - w'^2
  1576.  
  1577.      Let's see that this is the case on our space-time diagrams. Diagram 5-9
  1578. shows a space-time diagram with two coordinate systems indicated, one for an
  1579. observer o, and a second for an observer (o') moving with velocity 0.6 c
  1580. with respect to o. (Note that now we use w = ct for the time axes.) There is
  1581. also a point marked "*" on the diagram. The x'-w' coordinates for that point
  1582. are clearly shown to be x'= 1 light-second and w'= 2 light-seconds (i.e. t'=
  1583. 2 second, remember?). The x-w coordinates are x = 2.75 light-seconds and w =
  1584. 3.25 light-seconds, and I tried to show this as best I could with an ASCII
  1585. diagram.
  1586.  
  1587.                                  Diagram 5-9
  1588.  
  1589.                        w                    w'
  1590.                        |                   /
  1591.                        |                  /
  1592.                        |                 /
  1593.                 w=3.25 |->              /         *
  1594.                        +               /      '  '
  1595.                        |              /   '     '
  1596.                        |         w'=2+'        '
  1597.                        |            /         '
  1598.                        |           /         '
  1599.                        +          /         '                    x'
  1600.                        |         /         '                   '
  1601.                        |        /         '                '
  1602.                        |       /         '             '
  1603.                        |      +         '         +'
  1604.                        |     /         '       '
  1605.                        +    /         '    '
  1606.                        |   /         + '
  1607.                        |  /        'x' = 1
  1608.                        | /     '
  1609.                        |/  '
  1610.          --+-----------o---------+----------+---------+--->x
  1611.                    '  /|                          ^
  1612.                '     / |                       x=2.75
  1613.  
  1614.  
  1615. We therefore find the following:
  1616.  
  1617.   (Eq 5:36)
  1618.    ds^2  =  x^2 - w^2  =  (2.75)^2 - (3.25)^2
  1619.          =  -3 light-seconds^2
  1620.    and
  1621.  
  1622.    ds'^2 =  x'^2 - w'^2  =  (1)^2 - (2)^2
  1623.          =  -3 light-seconds^2
  1624.  
  1625.      There are a couple notes to make about this outcome. First, of course,
  1626. we note that ds^2 = ds'^2, as it must be. In fact, it is the form of the
  1627. invariant interval and the fact that it must be invariant from one
  1628. coordinate system to another that causes the transformation from x-w to
  1629. x'-w' to look as it does. If the x' and w' axes didn't look the way they do
  1630. relative to the x and w axes in our diagrams, then the interval would not be
  1631. invariant. Note that if the "-" sign in the invariant interval were a "+"
  1632. sign, then the invariant interval would look just like the one for a normal,
  1633. space-only x-y coordinate system where ds^2 = dx^2 + dy^2. Then, the
  1634. coordinate transformation to x'-w' would be just like a rotation of
  1635. coordinates (see Diagram 5-10). The "-" sign in the SR interval causes one
  1636. of the axes to rotate in the opposite direction from the other when we do
  1637. our space-time coordinate transformation.
  1638.      Second, note that the interval squared is, in fact, negative. This is
  1639. not too distressing, because we know that _physical_ lengths on our diagram
  1640. do not represent the space-time "lengths" which the invariant interval gives
  1641. us. If they did, then the invariant interval for special relativity would be
  1642. just like the x-y form of the invariant interval (since the physical lengths
  1643. on our diagrams are just normal lengths on the flat paper/screen we draw
  1644. them on). Now, the actual length of an infinitesimal interval on a manifold
  1645. is usually defined to be the square root of the absolute value of ds^2.
  1646. Thus, we can still make sense of lengths, even when the invariant interval
  1647. squared is negative.
  1648.  
  1649.                                 Diagram 5-10
  1650.  
  1651.                     x'-y' is rotated from x-y, and the line segment
  1652.                          in the two diagrams are identical
  1653.               y                                       y'
  1654.               |                                      /
  1655.               |                                     /
  1656.               |               /                    /        /
  1657.               |             / .                   /       / '
  1658.               |        ds /   .                  /   ds /  '
  1659.               |         /     . dy              /     /   '
  1660.               |       /       .                /    /    'dy'
  1661.               |     /..........               /   /     '
  1662.               |          dx                  /    ' .  '
  1663.             --+------------------ x         +    dx'  '
  1664.               |                                 \
  1665.                                                     \
  1666.                                                         \
  1667.          Note: the length of the line segment             \
  1668.          doesn't change just because you rotated                x'
  1669.          the coordinate system, so
  1670.             dx^2 + dy^2 = dx'^2 + dy'^2
  1671.  
  1672.  
  1673.      The reader may have noted that thus far in our look back at special
  1674. relativity we have still only included two of the four dimensions of
  1675. space-time. The other two (y and z) could actually replace x in any of our
  1676. discussions, and so they play the same roll in the invariant interval as x
  1677. does. Therefore, the total four dimensional invariant interval for special
  1678. relativity is given by
  1679.  
  1680.   (Eq 5:37)
  1681.    ds^2 = dx^2 + dy^2 + dz^2 - dw^2
  1682.  
  1683.      Finally, let's talk about some physics in this space-time using the
  1684. concepts discussed in the previous section. First, consider the proper time
  1685. between two time-like separated events. Recall that we defined this time
  1686. such that:
  1687.  
  1688.   (Eq 5:38)
  1689.    ds^2 = g  (of SR)*dT^2
  1690.            tt
  1691.  
  1692. We now know that g_ww = -1 for SR from the above, so g_tt = -c^2 for SR.
  1693. This is how we got Equation 5:28, which is duplicated here:
  1694.  
  1695.   (Eq 5:39--Copy of Eq 5:28)
  1696.    dT^2 = -ds^2/c^2.
  1697.  
  1698. in the previous section. However, since we are now working with w for our
  1699. time coordinate, we should define dW = c*dT, and rewrite Equation 5:39 as
  1700.  
  1701.   (Eq 5:40)
  1702.    dW^2 = -ds^2
  1703.  
  1704. Now, let's consider the observer which followed the t' axes in Diagram 5-9
  1705. such that his velocity was 0.6 c. Consider the O observer's frame of
  1706. reference, and note that if it takes O' a certain time (dw) to travel a
  1707. certain distance (dx) in the O observer's coordinates, then it must be the
  1708. case that dx/dt = 0.6 c. So dx/dw = 0.6, or
  1709.  
  1710.   (Eq 5:41)
  1711.    dx = 0.6*dw
  1712.  
  1713. This, then, is true all along the w' axes (the line that O' follows through
  1714. the O observer's coordinate system). So, the invariant interval (considering
  1715. only two dimensions once again) at any point along the w' axes must be given
  1716. by the following (using Equation 5:37 with only x and w coordinates and
  1717. substituting Equation 5:41):
  1718.  
  1719.   (Eq 5:42)
  1720.    ds^2 =         dx^2 - dw^2
  1721.  
  1722.         = [0.6]^2*dw^2 - dw^2  = -[1 - 0.6^2]*dw^2
  1723.  
  1724. plugging this into Equation 5:40 we find that
  1725.  
  1726.   (Eq 5:43)
  1727.    dW^2 = [1 - 0.6^2] * dw^2
  1728.  
  1729. so,
  1730.  
  1731.   (Eq 5:44)
  1732.                1
  1733.    dw = --------------- * dW = gamma*dW
  1734.         SQRT[1 - 0.6^2]
  1735.  
  1736. Since dW just represents an infinitesimal time as measured on our "moving"
  1737. observer's clock, and dw an infinitesimal time measured on our clock,
  1738. Equation 5:44 is just the equation which shows time-dilation effects in SR,
  1739. and it was quickly derived using our new knowledge.
  1740.      For another physics consideration, look at the momentum four-vector. We
  1741. defined this earlier (Equation 5:29) and it is duplicated here:
  1742.  
  1743.   (Eq 5:45--Copy of Eq 5:29)
  1744.     a
  1745.    p  = m*da/dT
  1746.  
  1747. Again, we want to use dW = c*dT, and we thus find
  1748.  
  1749.   (Eq 5:46)
  1750.     a
  1751.    p  = m*c*da/dW
  1752.  
  1753. For us, we consider the situation where "a" is the x dimension. Then, p^x'
  1754. for the "moving" observer himself is zero (because all along the w' axes we
  1755. have dx' = 0 by definition, i.e. he is not moving relative to himself).
  1756. However, for the O observer (for whom the "moving" observer moves a distance
  1757. dx in a time dw) we find the following from Equation 5:46 by substituting x
  1758. for a(Note that from Equation 5:44 we can write dW = dw/gamma, and we are
  1759. substituting that here. We also use dw = c*dt and v = dx/dt in this
  1760. equation.):
  1761.  
  1762.   (Eq 5:47)
  1763.     x
  1764.    p  = m*c*dx/[dw/gamma]  =  gamma*m*c*dx/dw
  1765.  
  1766.       = gamma*m*dx/dt = gamma*m*v.
  1767.  
  1768. This is exactly the definition of the momentum we saw in our discussions of
  1769. special relativity.
  1770.      However, now we can also look at the time component of the momentum
  1771. four-vector and figure out what it represents. Again we use Equation 5:46,
  1772. but here we substitute w for x:
  1773.  
  1774.   (Eq 5:48)
  1775.     w
  1776.    p  = m*c*dw/[dw/gamma] = gamma*m*c
  1777.  
  1778. But this is just the energy we had defined in SR (E = gamma*m*c^2) divided
  1779. by c:
  1780.  
  1781.   (Eq 5:49)
  1782.     w
  1783.    p  = E/c.
  1784.  
  1785. And so, we now know all about the components of the momentum four-vector of
  1786. a particle: three are the spatial components of the momentum of the
  1787. particle, and the time component represents the energy of the particle
  1788. divided by c.
  1789.      As a final bit of physics, consider the dot product (as defined in
  1790. Equation 5:26) of the momentum four-vector with itself:
  1791.  
  1792.   (Eq 5:50)
  1793.                     w  w        x   x
  1794.    p (dot) p = g  *p *p +  g  *p * p
  1795.                 ww          xx
  1796.  
  1797.              = -[E/c]^2 + p^2
  1798.  
  1799. (Note that the total momentum of this observer is p^x, and so we write p^2
  1800. in the last line to mean the total momentum squared). Now, recall that the
  1801. dot product is invariant, so that if any observer measures the energy and
  1802. momentum of a particle and calculates the above equation in his frame of
  1803. reference, he must find the same number that any other observer would find
  1804. in any other frame of reference. This shouldn't come as too much of a
  1805. surprise if we look back for a moment. Back when we discussed energy and
  1806. momentum in special relativity, we found in Equation 1:7 that E^2 = m^2*c^4
  1807. + p^2*c^2. Thus, we find that the dot product in Equation 5:50 is simply
  1808. equal to -m^2*c^2. Since m and c are invariant (remember, m is the rest
  1809. mass), we could have already known that the formula in Equation 5:50 would
  1810. be invariant.
  1811.      We have therefore been able to find all the major physics equations we
  1812. saw in special relativity by simply apply some tensor analyses using the
  1813. metric of flat space-time.
  1814.      So, to sum up, we have found the following: For SR, where there is no
  1815. gravitational field, space-time has the properties of a flat manifold. The
  1816. invariant interval of a flat space-time manifold is given by the following:
  1817.  
  1818.   (Eq 5:51--Copy of Eq 5:37)
  1819.    ds^2 = dx^2 + dy^2 + dz^2 - dw^2
  1820.  
  1821. That interval tells us all about the nature of space-time in SR. The fact
  1822. that the contribution of the time component (dw) is negative where as the
  1823. spatial components have positive contributions is what gives the coordinate
  1824. transformation between different frames of reference its unique form. Thus,
  1825. it is the negative sign which essentially causes time dilation and length
  1826. contraction effects, and it is the fact that the speed of light is invariant
  1827. which causes that sign to be negative.
  1828.  
  1829.  
  1830.  
  1831. 5.8.4 Second Example: Stars and Black Holes
  1832.  
  1833.      In this second example, we will briefly look at the description GR
  1834. gives us for the gravitational field of certain stars. We will also take a
  1835. look at one of the most widely publicized consequences of GR--black holes.
  1836.      To make our discussion simpler, the types of stars we will be
  1837. considering will be spherically symmetric. What does that mean? Well,
  1838. consider an imaginary sphere with some radius. Place the center of that
  1839. sphere at the center of the star. If the star is spherically symmetric, then
  1840. the strength of the gravitational field everywhere on the surface of our
  1841. imaginary sphere will be exactly the same. For example, a star who's density
  1842. is spherically symmetric and which is not spinning would work.
  1843.      Now, it will be helpful for us to discuss the space around the star in
  1844. terms of spherical coordinates; therefore, I should make sure the reader
  1845. knows what these coordinates are. Rather than using x, y, and z coordinates
  1846. for the three dimensional space around the star, we will use r, a, and b
  1847. coordinates, which I will define here. In Diagram 5-11 I have tried to draw
  1848. (in three dimensions) an z-y-z coordinate system, and I have marked a point
  1849. in space, *. There is a line segment drawn from the origin (o) to that
  1850. point, and the lengths of the x, y, and z components of the line segment are
  1851. the values for the x, y, and z coordinates of the point, *. These components
  1852. have been indicated on the diagram using "dotted" lines. Now, note that
  1853. there is one other dotted line which is not labeled. If you imagine a light
  1854. shining down on our line segment, then the unlabeled dotted line would be
  1855. the shadow that light produced on the x-y plane. It is called the projection
  1856. of the line segment on the x-y plane, but let's just call it "the x-y
  1857. component" for convenience.
  1858.  
  1859.                                 Diagram 5-11
  1860.  
  1861.                                     z
  1862.                                     |
  1863.                                     |
  1864.                                     |      *
  1865.                                     |     /'
  1866.                                     |    / '
  1867.                                     |_a /  'z-comp
  1868.                                     | \/r  '
  1869.                                     | /    '
  1870.                                     |/     '
  1871.                                     o------'----- y
  1872.                                    / '.    '  '
  1873.                                   /__b/'.  ' ' x-comp
  1874.                                  /       '.''
  1875.                                 /'''''''''''
  1876.                                x   y-comp
  1877.  
  1878.  
  1879.      Now we can define the r-a-b coordinates for the point, *. First, the
  1880. distance from the origin to the point (the length of the line segment) is
  1881. the "r" coordinate as indicated on the diagram. Next, the angle between the
  1882. z axes and the line segment is our "a" coordinate (though it is usually
  1883. denoted by the Greek letter "theta"). It too is indicated on the diagram.
  1884. Finally, there is the angle between x and the x-y component of the line
  1885. segment. That angle is our "b" coordinate (though it is usually denoted by
  1886. the Greek letter "phi"), and it is indicated on the diagram as well. Thus,
  1887. with r-a-b coordinates as defined here, we can specify any point in three
  1888. dimensional space.
  1889.      As a final note about this coordinate system, we should look at the
  1890. metric of a flat 3-space using these coordinates. For an x-y-z system, the
  1891. metric is (of course) given by this invariant interval:
  1892.  
  1893.   (Eq 5:52)
  1894.    ds^2 = dx^2 + dy^2 + dz^2.
  1895.  
  1896. However, for our new coordinate system in the same flat 3-space, it is given
  1897. by the following:
  1898.  
  1899.   (Eq 5:53)
  1900.    ds^2 = dr^2 + r^2*da^2 + r^2*[sin(a)]^2*db^2.
  1901.  
  1902. For convenience, a new infinitesimal (call it du) is sometimes defined such
  1903. that:
  1904.  
  1905.   (Eq 5:54)
  1906.    du^2 = da^2 + [sin(a)]^2*db^2.
  1907.  
  1908. Then we can rewrite Equation 5:53 as
  1909.  
  1910.   (Eq 5:55)
  1911.    ds^2 = dr^2 + r^2*du^2.
  1912.  
  1913. We will therefore continue to use du throughout this discussion, but
  1914. remember it is just a convenient way to write the a and b components of the
  1915. invariant interval.
  1916.      Next, let's look at some properties of the star we will be considering.
  1917. Basically, we will say it has a total mass of m(star) and a radius R. The
  1918. center of the star will be centered at the origin, o. Finally, we will only
  1919. be considering the gravitational field outside of the star itself. In
  1920. general, physicists are interested in the gravitational field inside the
  1921. star as well, but we will not worry about it that much.
  1922.      We also want to define a new variable for mass using the Newtonian
  1923. gravitational constant G. In Newtonian gravitation, the force between two
  1924. objects of mass m1 and m2 which are a distance r apart is given by
  1925.  
  1926.   (Eq 5:56)
  1927.    F(Newtonian Gravity) = G * m1 * m2 / r^2
  1928.  
  1929. (where G = 6.672*10^-11 m^3/(s^2*kg) and we note that kg is the symbol for
  1930. kilogram). We will use G to define a new variable, M, such that
  1931.  
  1932.   (Eq 5:57)
  1933.    M = G*m(star)/c^2
  1934.  
  1935. Notice that M has the units of meters, and so M gives us a way of specifying
  1936. the mass of an object in units of meters (similar to the way w allows us to
  1937. specify time in units of meters). It is called the "geometrized" mass. So,
  1938. using M we can say that an object has a mass of 1 meter, and one can
  1939. decipher what mass we are talking about in terms of conventional units by
  1940. using Equation 5:57. As a note, a mass of M = 1 meter corresponds to
  1941. m(conventional) = 1.35E27 kg, the mass of the sun is M(sun) = 1477 meters
  1942. (1.989E30 kg), and the mass of the earth is M(earth) = 0.004435 meter
  1943. (5.973E24 kg).
  1944.      Now, with this information in mind, the next step is to figure out what
  1945. the metric of the space-time around the star would be because of the
  1946. stress-energy tensor of the star. Generally, one uses the fact that we are
  1947. considering spherically symmetric stars in order to make some assumptions
  1948. about the form of the metric. One then uses this general form to calculate
  1949. the general form the stress-energy tensor would have. Finally, one uses what
  1950. we know physically about the star compared to the form of the stress-energy
  1951. tensor, and one can decipher what equations must have made up the metric in
  1952. the first place. In the end, one finds a metric for the space-time around
  1953. this type of star, and for our purposes, we will simply state that end
  1954. result. Thus, the metric is as follows (expressed in terms of the invariant
  1955. interval):
  1956.  
  1957.   (Eq 5:58)
  1958.    ds^2 = -(1 - 2*M/r)*dw^2 + [1/(1 - 2M/r)]*dr^2  + r^2 du^2
  1959.  
  1960.         =        g    *dw^2 +          g  *dr^2    + g  *du^2
  1961.                   ww                    rr            uu
  1962.  
  1963. Note that we are using du as defined earlier, and we are using dw = c*dt as
  1964. our time component as discussed in the previous section. Also, we are using
  1965. M (as defined in Equation 5:57 ) to denote the mass of the star rather than
  1966. m(star). This metric is known as the Schwarzschild metric.
  1967.      The next step, then, is to show that we can get useful physics by
  1968. considering this metric. We will again (as we did with the Special
  1969. Relativity discussion earlier) be looking at a particle of mass m, and here
  1970. we will be interested in its motion in the space-time around the star.
  1971. Because of the spherical symmetry of the space-time, the motion of such a
  1972. particle will remain within a plane, and we can orient our coordinate system
  1973. so that the plane is one where the angle "a" = 90 degrees (and sin(a) = 1).
  1974. Since the particle doesn't move out of that plane, there is never a change
  1975. in the angle "a" (da = 0). Thus, for this particle, we can consider the
  1976. metric as follows (putting sin(a) = 1 and da = 0 into Equation 5:58):
  1977.  
  1978.   (Eq 5:59)
  1979.    ds^2(particle's path)
  1980.                   = -(1 - 2*M/r)*dw^2 + [1/(1 - 2*M/r)]*dr^2 + r^2*db^2
  1981.  
  1982.                   =        g    *dw^2 +          g    *dr^2  + g  *db^2
  1983.                             ww                    rr            bb
  1984.  
  1985.      In the interest of time (because we simply haven't been able to cover
  1986. everything we need to know about tensor analyses in this text), I will have
  1987. to simply state a couple of facts which we will use to produce the physics
  1988. we will look at. Namely, we notice that the form of the metric depends on
  1989. your particular position in r (because g_ww, g_rr, and g_bb are all
  1990. functions of r). However, none of the metric's components are functions of
  1991. w. Because of that, as it turns out, p_w (the covariant form of the time
  1992. component of the momentum four-vector) is constant throughout the motion of
  1993. the particle. The metric is also independent of the angle b. This, as it
  1994. turns out, implies that p_b is a constant. We can therefore define two
  1995. constants, E and L such that
  1996.  
  1997.   (Eq 5:60)
  1998.    p  = -E*m*c
  1999.     w
  2000.  
  2001. and
  2002.  
  2003.   (Eq 5:61)
  2004.    p  = L*m*c
  2005.     b
  2006.  
  2007. where m is the mass of the particle. These definitions will simplify the
  2008. equations we will produce below (and they are related to our usual concepts
  2009. of energy and angular momentum, so the fact that they are constant basically
  2010. say that energy and angular momentum are conserved as the particle moves).
  2011.      Now, so far we have only defined the contravariant form of the
  2012. momentum, p^a. However, when we discussed the metric tensor we learned how
  2013. to use it to "raise" and "lower" indices. So, we can write the following
  2014. from Equation 5:22:
  2015.  
  2016.   (Eq 5:62)
  2017.     w     ww       wr       wb       wa
  2018.    p  =  g  *p  + g  *p  + g  *p  + g  *p
  2019.               w        r        b        a
  2020.  
  2021. Note that we are considering the case where the angle "a" is a constant so
  2022. that p^a = 0 in Equation 5:62. Also recall that in Equation 5:23 we noted
  2023. how to go from contravariant to covariant forms of the metric. For the
  2024. metrics we are discussing we thus have (note that the metric components come
  2025. from Equation 5:59).
  2026.  
  2027.   (Eq 5:63)
  2028.     ww    1         -1
  2029.    g   = ---  =  ---------
  2030.          g       1 - 2*M/r
  2031.           ww
  2032.  
  2033.     rr    1
  2034.    g   = ---  =  1 - 2M/r
  2035.          g
  2036.           rr
  2037.  
  2038.     bb    1       1
  2039.    g   = ---  =  ---
  2040.          g       r^2
  2041.           bb
  2042.  
  2043.    all other covariant metric components = 0
  2044.  
  2045.  
  2046. Thus, only the p_w part remains in Equation 5:62 giving us the following
  2047. (note that I substitute using Equation 5:60):
  2048.  
  2049.   (Eq 5:64)
  2050.     w       -1                    1
  2051.    p  = ----------- * p   =  ----------- * E*m*c
  2052.         (1 - 2*M/r)    w     (1 - 2*M/r)
  2053.  
  2054. Similarly we can find the equation for p^b:
  2055.  
  2056.   (Eq 5:65)
  2057.     b    bb            1              1
  2058.    p =  g   *p    =   --- * p    =   --- * L*m*c
  2059.               b       r^2    b       r^2
  2060.  
  2061.      Now, recall that in the last section we found that p(dot)p was a
  2062. constant, -(m*c)^2. That remains true here, so we find the following:
  2063.  
  2064.   (Eq 5:66)
  2065.                     w  w        r  r        b  b
  2066.    p (dot) p = g  *p *p  + g  *p *p  + g  *p *p   = -(m*c)^2
  2067.                 ww          rr          bb
  2068.  
  2069. We can express each of the parts for that equation by substituting in the
  2070. metric components from Equation 5:59, using the above equations for p^w and
  2071. p^b, and writing p^r as m*c*dr/dW to get the following:
  2072.  
  2073.   (Eq 5:67)
  2074.         w  w                  [  (E*m*c)^2  ]
  2075.    g  *p *p  = -(1 - 2*M/r) * [-------------]
  2076.     ww                        [(1 - 2*M/r)^2]
  2077.  
  2078.                -E^2*(m*c)^2
  2079.              = ------------
  2080.                (1 - 2*M/r)
  2081.  
  2082.         r  r        1        [  dr] 2
  2083.    g  *p *p  = ----------- * [m*--]    (NOTE: dr/dW = c*dr/dT)
  2084.     rr         (1 - 2*M/r)   [  dW]
  2085.  
  2086.                (dr/dT)^2*(m*c)^2
  2087.              = -----------------
  2088.                   (1 - 2*M/r)
  2089.  
  2090.         b  b         (L*m*c)^2
  2091.    g  *p *p  = r^2 * ---------
  2092.     bb                  r^4
  2093.  
  2094.                L^2*(m*c)^2
  2095.              = -----------
  2096.                    r^2
  2097.  
  2098. Substitute this into Equation 5:66 and the (m*c)^2 portions will cancel out
  2099. on both sides giving this:
  2100.  
  2101.   (Eq 5:68)
  2102.             -E^2        (dr/dT)^2     L^2
  2103.    -1  = ----------- + ----------- + -----
  2104.          (1 - 2*M/r)   (1 - 2*M/r)    r^2
  2105.  
  2106. From this, we can find the following equation which describes the orbits the
  2107. particle can take. It is the equation of motion of the particle:
  2108.  
  2109.   (Eq 5:69)
  2110.    (dr/dT)^2 = E^2 - (1 - 2*M/r)*(1 + L^2/r^2)
  2111.  
  2112.      Now, it turns out that if one examine this equation for the case of a
  2113. circular orbit (where r is a constant and dr = 0) and for the case where the
  2114. mass is small or the orbit is large, we find things to be quite similar to
  2115. what Newtonian physics predicts. However, it is interesting to note that for
  2116. orbits for which r can change (elliptical orbits in Newtonian physics) GR
  2117. predicts something a bit different from Newtonian physics. Basically, in
  2118. Newtonian physics, the path of the particle in space is a true, closed
  2119. ellipse. However, with the above equation one finds that the "elliptical"
  2120. orbit in GR does not close in on itself. Instead, it's as if the ellipse
  2121. changes position as the particle's orbit goes on. We thus see a difference
  2122. in the predictions of the two theories, and we will mention this again in
  2123. the next section.
  2124.      With this quick look at the physics one can derive using the metric for
  2125. such a star, we now want to go on and look at a very special case where this
  2126. metric comes into play. Consider for a moment what would happen if the
  2127. star's radius were to somehow become smaller than 2*M. Such a thing can
  2128. theoretically happen for certain stars at the end of their life cycle,
  2129. (though we won't get into how in our discussion).
  2130.      So, consider the case where the radius of the star is smaller than 2*M.
  2131. We can then consider a point above the star for which r < 2*M. Now look back
  2132. at the metric of the star. If r < 2*M then g_tt becomes positive, while g_rr
  2133. becomes negative. That is to say that the time component of the invariant
  2134. interval will contribute to the interval in the same way that a space-like
  2135. coordinate did when r was greater than 2*M, and the radial component will
  2136. contribute in the same way as a time-like coordinate did when r was greater
  2137. than 2*M. Further, when r was greater than 2*M, we understood that all
  2138. particles followed a space-time path which took them "forward" in time.
  2139. Similarly, when g_rr becomes negative and d_tt becomes positive, (when r <
  2140. 2*M) we find that all particles must continue along a space-time path for
  2141. which r continually decreases. In other words, the point r = 0 becomes part
  2142. of the "future" of every particle/observer for which r is less than 2*M.
  2143. Thus, such a particle will be doomed to fall in toward the center of the
  2144. star. One can then imagine that the star itself would be doomed to fall in
  2145. upon itself completely, becoming nothingness at r = 0.
  2146.      This is known as a black hole (specifically, for the metric we are
  2147. considering, it is a spherically symmetric black hole), and the radius r=2*M
  2148. is called the Schwarzschild radius or the event horizon. Any observer with
  2149. an r coordinate less than 2*M must fall into the point r = 0. Note that at r
  2150. = 0 our metric becomes truly infinite, and as it turns out, that would be a
  2151. point where physical laws break down. Such a point is called a singularity.
  2152. We should also note that any signal (even a light signal) which the observer
  2153. tries to send outside of the event horizon must also fall into the
  2154. singularity (because all space-time geodesics for r < 2*M fall into the
  2155. singularity). Thus, there is no way to get any information from the
  2156. singularity to the "outside universe". There is no way for one to "see" the
  2157. singularity and its destruction of physical laws. In that sense, the
  2158. singularity's existence isn't a problem for our physical laws outside of the
  2159. event horizon.
  2160.      As a last consideration about black holes, one might ask what would
  2161. happen to an observer who starts where his r coordinate is greater than 2*M
  2162. and then falls toward the event horizon. I won't go through the math, but
  2163. one finds that in our coordinates, the observer will take an infinite amount
  2164. of time to reach r = 2*M. However, if we ask about how much time the
  2165. observer himself reads on his watch as he falls (the proper time) we find
  2166. that in his coordinates, the time it takes for him to reach the event
  2167. horizon is finite. To try and understand how this can be, we will start by
  2168. considering the equation for p^w (the time component of the momentum
  2169. four-vector) as defined in Equation 5:46:
  2170.  
  2171.   (Eq 5:70)
  2172.     w       dw
  2173.    p  = m*c*--
  2174.             dW
  2175.  
  2176. However, if we look back at Equation 5:64, we can combine it with Equation
  2177. 5:70 to find the following:
  2178.  
  2179.   (Eq 5:71)
  2180.    dw        E
  2181.    -- = -----------
  2182.    dW   (1 - 2*M/r)
  2183.  
  2184. Rewriting this, one finds that
  2185.  
  2186.   (Eq 5:72)
  2187.         (1 - 2*M/r)
  2188.    dW = ----------- * dw.
  2189.              E
  2190.  
  2191. So what does that tell us? Well, consider an observer at the coordinate
  2192. position r. If a small time ticks in our coordinate w = c*t, then the amount
  2193. of time which ticks on the observer's clock (dW = c*dT, where dT is the
  2194. proper time) depends on the r position of the observer. The smaller his r
  2195. position (as long as he is above the event horizon) the smaller dW will be
  2196. for a given dw. This is similar to time dilation in SR, but here it is
  2197. caused by the gravitational field and not by the relative motion of two
  2198. observers.
  2199.      Applying this to our discussion of the observer falling towards the
  2200. event horizon, we find the following: In our coordinates (w) the clock of
  2201. the infalling observer (who is constantly falling to smaller and smaller r
  2202. values) takes longer and longer to tick its next tick. For example, let's
  2203. say that for the observer's clock, it ticks 10 ticks before it reaches the
  2204. event horizon. As we mentioned earlier, the coordinate time (w) will have to
  2205. become infinitely large before the observer will reach the horizon. However,
  2206. as the observer gets closer and closer to the event horizon, his clock takes
  2207. longer and longer to tick its next tick. Essentially, in our coordinate
  2208. system, the observer's clock will never be able to tick the 10th tick.
  2209. Meanwhile, for the observer, time goes on as usual. For him, therefore, the
  2210. 10th tick will come, and he will enter the event horizon. However, once in
  2211. the horizon, he will not be able to send any signals out of the r = 2*M
  2212. event horizon (in our coordinates). Thus, no one with r greater than 2*M in
  2213. our coordinates will ever be able to see the infalling observer go into the
  2214. event horizon. This then explains how we can say that the infalling observer
  2215. never reaches the horizon according to our coordinate system.
  2216.      As it was in SR, there are different explanations for how certain
  2217. outcomes come to be. The explanation depends on what coordinate system you
  2218. use to explain the occurrences (which means that it depends on your frame of
  2219. reference). The important point is that the end result of the explanations
  2220. agree with the each other as far as any physical laws can be applied. In the
  2221. twin paradox of SR, when the two twins come back together and stand next to
  2222. one another at the end of the trip, each explanation must agree as to which
  2223. twin is actually, physically older. For the question of whether an infalling
  2224. observer reaches the event horizon, regardless of which coordinate system we
  2225. use, we must agree that the observer is never seen to enter the horizon by
  2226. any observer outside of the event horizon. The fact that the infalling
  2227. observer "sees" himself enter the horizon has no physical consequences to
  2228. the outside world.
  2229.  
  2230.      Thus, with spherically symmetric stars and black holes, we have found
  2231. the following: the metric of the surrounding space-time is given by the
  2232. following (using variables we have defined earlier):
  2233.  
  2234.   (Eq 5:73--Copy of Eq 5:58)
  2235.    ds^2 = -(1 - 2*M/r)*dw^2 + [1/(1 - 2M/r)]*dr^2  + r^2 du^2
  2236.  
  2237.         =        g    *dw^2 +          g  *dr^2    + g  *du^2
  2238.                   ww                    rr            uu
  2239.  
  2240. Symmetries in this metric can be used along with the metric itself to find
  2241. the equations of motion for a particle which moves within this space-time.
  2242. Finally, the space-time has interesting consequences for the measurement of
  2243. space and time for observers at different points in the curved space-time
  2244. surrounding such stars and black holes.
  2245.  
  2246.      That ends our look at some examples of the application of GR. The only
  2247. thing left in our discussion of this theory is to show some experimental
  2248. evidence for its existence, as we will do in the following section.
  2249.  
  2250.  
  2251.  
  2252. 5.9 Experimental Support for GR
  2253.  
  2254.      In this section we will take a look at a few experiments which agree
  2255. with the predictions of GR.
  2256.      For the first experiment, we use the effect mentioned in the previous
  2257. section whereby orbits which were supposed to be elliptical according to
  2258. Newtonian physics didn't actually close in on themselves according to GR
  2259. predictions. This effect can be seen as a rotation (or precession) of the
  2260. "long axis" of the elliptical orbit, whereas under Newtonian theory, this
  2261. axes doesn't move. Now, for the orbits of most planets, this effect is too
  2262. small to measure. However, for Mercury (which is closest to the sun and
  2263. would thus be the most affected) the effect is measurable. In fact,
  2264. measurements taken during the 1800s showed that Mercury's orbit precessed.
  2265. Now, much of this could be attributed to effects from the gravity of the
  2266. other planets, however, after all those effects were taken into account,
  2267. there was still a small amount of precession which wasn't accounted for. The
  2268. predictions of GR accounted for the left-over difference. It was Einstein
  2269. who first pointed this out, and this was the first evidence in favor of GR.
  2270.      For the second experiment we want to consider, note that light, just
  2271. like anything else being acted on only by gravity, must follow a geodesic in
  2272. space-time. One can use the metric introduced in the previous section to
  2273. figure out how light would travel when passing near an approximately
  2274. spherically symmetric star. What one finds is that the light would be bent
  2275. by the presence of the star's gravitational field. Now, one might try to
  2276. make an argument using special relativity by which light with an energy E
  2277. would be said to have a "relativistic mass" defined by "m" = E/c^2. One
  2278. could then figure out how much the light with this "mass" would bend in the
  2279. presence of a Newtonian-type gravitational field. This, one might hope,
  2280. could allow the explanation of how light could be bent without considering
  2281. GR. However, one finds that the amount of bending predicted by this
  2282. SR-Newtonian method is exactly half as much as the bending predicted by GR.
  2283. Thus, if we could actually measure the bending of the light, we could figure
  2284. out which of the two predictions was correct.
  2285.      Well, experiments to measure such bending can and have been performed
  2286. using the sun as the source of gravity and using light from particular
  2287. stars--light which passes near the sun on its way to us--as the light that
  2288. gets bent (it was Einstein who suggested this test, by the way). Normally,
  2289. of course, the sun would be too bright to see stars who's light passes near
  2290. the sun on its way to us. However, during a solar eclipse, the stars can be
  2291. seen. When one compares the positions of such stars which one sees during a
  2292. solar eclipse to the positions where the stars should actually be, one finds
  2293. that the difference can be attributed to the bending of the light as
  2294. predicted by GR, while the SR-Newtonian prediction was incorrect by a factor
  2295. of 2.
  2296.      The third experiment we will look at involves using highly sensitive
  2297. atomic clocks taken aboard jets. When one compares the reading on such
  2298. clocks to clocks which remained on the ground, one finds that the difference
  2299. (though quite small) can only be accounted for completely if one includes
  2300. calculations for SR effects and acceleration along with the GR effects of
  2301. having the jet fly at high altitudes where the gravitational field is not as
  2302. strong as it is on the surface of the earth.
  2303.      These are a few examples of experimental evidence that exists in favor
  2304. of GR. In many cases, more data and more precise measurements would be
  2305. needed to rule out all theories other than GR; however, all the evidence we
  2306. do have supports the theory.
  2307.  
  2308.  
  2309.