home *** CD-ROM | disk | FTP | other *** search
/ Total Baseball (1994 Edition) / Total_Baseball_1994_Edition_Creative_Multimedia_1994.iso / dp / 0019 / 00191.txt < prev    next >
Text File  |  1994-02-14  |  68KB  |  1,029 lines

  1. $Unique_ID{BAS00191}
  2. $Pretitle{}
  3. $Title{Sabermetrics}
  4. $Subtitle{}
  5. $Author{
  6. Thorn, John}
  7. $Subject{Sabermetrics statistical analysis sabermetrician sabermetricians
  8. statistic statistics stat stats numbers Number Linear Weights Runs Wins Run
  9. Productivity Average RPA RBIs RBI home run HR triple 3B double 2B single 1B
  10. walks walk/HBP BB HB stolen base SB caught stealing CS bat AB hits H outs
  11. OOB Formula SABR Fielding Pitching Earned Average ERA Park Factor Relativity
  12. Relief}
  13. $Log{}
  14.  
  15. Total Baseball:  Registers, Leaders, and Rosters
  16.  
  17.  
  18. Sabermetrics
  19.  
  20.  
  21.      Sabermetrics may be a new coinage for the statistical analysis of
  22. baseball but it is not a new phenomenon. Henry Chadwick, in the antebellum
  23. period, was as much a sabermetrician as Allan Roth or Bill James or Pete
  24. Palmer: he saw as clearly as they that because the object of the game is to
  25. win, runs are the best measure of player performance, just as they are of team
  26. performance at the end of a game.
  27.      After many decades in which this fundamental truth was lost (amid the
  28. general worship of false idols like batting average and pitcher won-lost
  29. percentage), today's sabermetricians have come around full circle to the game
  30. as it was originally understood. And what's remarkable about this is that in
  31. order to return to the primordial simplicity of the 1840s, '50s, and '60s,
  32. when runs and outs were all that went in to the box score, they have relied
  33. upon computer simulations and higher mathematics. In other words, with the
  34. new statistics, simplicity emerges from complexity; what baseball statistics
  35. have offered for the last hundred years or so has been, despite the appearance
  36. of simplicity, in fact extremely complex.
  37.      For the veteran fan as well as for Organized Baseball, new ideas, new
  38. statistics, and new discoveries that dispute long-held verities (Ty Cobb's hit
  39. total, Hoss Radbourn's number of victories in 1884, etc.) may represent a
  40. challenge to tradition and thus a threat to the very soul of baseball, its
  41. proud anachronism. Bernard Malamud wrote, "The whole history of baseball has
  42. the quality of mythology."  The editors of Total Baseball relish the game's
  43. myths, from Abner Doubleday to the sacrifice bunt, and believe that in setting
  44. the record straight or turning conventional wisdom on its head, they are
  45. adding to the fan's enjoyment of the rich texture of the game. If you are one
  46. of the skeptics--like Earl Weaver, who once said, "There's no such thing as a
  47. new statistic"--please permit us to make the case for sabermetrics.
  48.      If you skipped over the preceding Introduction, which is largely taken up
  49. with an overview of baseball's traditional measures, we would encourage you to
  50. go back and read it before proceeding with this discussion of sabermetrics.
  51. As with the Introduction, much of the material in this section is adapted from
  52. the editors' earlier The Hidden Game of Baseball.
  53.  
  54.  
  55. What's in a Number?
  56.  
  57.      On April 27, 1983, the Montreal Expos came to bat in the bottom of the
  58. eighth inning trailing the Houston Astros 4-2. First up to face pitcher Nolan
  59. Ryan was Tim Blackwell, a lifetime .228 hitter who had struck out in his first
  60. time at bat. At this routine juncture of this commonplace game, Ryan stared
  61. down at Blackwell, but his invisible--yet, for all that, more
  62. substantial--opponent was a man who had died the month before Ryan was born, a
  63. man about whom Ryan knew nothing, he confessed, except his statistical line.
  64. For at this moment of his glorious big-league career, Ryan had accumulated a
  65. total of 3,507 strikeouts, only one short of the mark Walter Johnson set over
  66. twenty-one seasons, from 1907 to 1927. Long thought invulnerable, Johnson's
  67. record was in imminent danger of falling, in 1983, not only to Ryan but also
  68. to Steve Carlton and Gaylord Perry.
  69.      Ryan fanned Blackwell and then froze the next batter, pinch-hitter Brad
  70. Mills, with a 1-and-2 curveball. The pinnacle was his. Johnson had been
  71. baseball's all-time strikeout leader since 1921, when he surpassed Cy Young.
  72. Ryan would hold that title for just a few weeks, then would be overtaken by
  73. Carlton, only to display an incredible finishing kick and top the 5,000 mark
  74. in 1990. But at the time that Ryan topped Johnson, baseball savants scurried
  75. to assess the meaning of 3,509 for both the deposed King of K and the new.
  76.      In the aftermath of Ryan's feat, some writers pointed out that he only
  77. needed sixteen full seasons, plus fractions of two others, in which to record
  78. 3,509 strikeouts while Johnson needed twenty-one, or that Johnson pitched over
  79. 2,500 more innings than Ryan. Coming into the 1983 season, Ryan had fanned
  80. 9.44 men per nine innings, while Johnson was way down the list at 5.33. And
  81. Ryan allowed fewer hits per nine innings than Johnson, or, for that matter,
  82. anyone in the history of the game. So, it would seem 3,509 was not just one
  83. batter better than Johnson, but rather was mere confirmation for the masses of
  84. a superiority that was clear to the cognoscenti years before.
  85.      However, other writers introduced mitigating factors on Johnson's behalf,
  86. much as Ruth found supporters as the home run king even after Aaron hit number
  87. 715. These champions of the old order cited Johnson's won-lost record of
  88. 417-279 and earned run average of 2.17 while scoffing at Ryan's mark, entering
  89. 1983, of 205-186 with an ERA of 3.11. This tack led to further argument in
  90. print, bringing in the quality of the teams each man pitched for and against,
  91. the resiliency of the ball, the attitudes of the batters in each era toward
  92. the strikeout, the advent of night ball, integration, expansion, the
  93. designated hitter, the overall talent pool, competition from other
  94. professional sports . . . and on down into the black hole of subjectivism.
  95.      Why were so many things dragged into that discussion?  Because the
  96. underlying question about 3,509 was: Does this total make Ryan better than
  97. Johnson, or even a better strikeout pitcher than Johnson?  At the least, does
  98. it make him a great pitcher?  In our drive to identify excellence on the
  99. baseball field (or off it), we inevitably look to the numbers as a means of
  100. encapsulating and comprehending experience. This quantifying habit is at the
  101. heart of baseball's hidden game, the one ceaselessly played by Ryan and
  102. Johnson and Ruth and Aaron--and, thanks to baseball's voluminous records, more
  103. than 13,000 other players--in a stadium bounded only by the imagination.
  104.      What's in a number?  The answer to "How Many?" and sometimes a great deal
  105. more. In this case, 3,509 men had come to the plate against Ryan and failed
  106. to put the ball in play, one more man than Johnson had returned to the dugout,
  107. cursing. So what's the big deal?  That Ryan was .0002849 faster, scarier,
  108. tougher--better--than Johnson?  An absolute number like 3,509, or 714 (the
  109. home-run record once thought invulnerable, too), or 4,191 (the erroneous hit
  110. total of Ty Cobb that Pete Rose finally surpassed) does not resound with
  111. meaning unless it is placed into some context that will give it life.
  112.      Baseball statistics are not the instruments of vivisection, taking the
  113. life out of the game in order to examine it; rather, statistics are themselves
  114. the vital part of baseball, the only tangible and imperishable remains of
  115. contests played yesterday or a hundred years ago. Baseball may be loved
  116. without statistics, but it cannot be understood without them. As the
  117. statistics reflect more accurately the reality of what happened on the field,
  118. greater understanding leads to a deeper love and appreciation of this great
  119. game--which is, essentially, the case for sabermetrics and the reason for
  120. Total Baseball.
  121.  
  122.  
  123. The Linear Weights System
  124.  
  125.      In 1982, Milwaukee's Robin Yount had the year of his life, batting .331
  126. with 29 homers, 114 RBIs and 129 runs scored; he led the American League in
  127. hits, doubles, total bases, and slugging percentage, while finishing just one
  128. point behind the league leader in batting average. First of the two times in
  129. his career, he was voted the Most Valuable Player in the American League,
  130. being named first on all but one of the twenty-eight ballots cast by the
  131. baseball writers.
  132.      Over in the other league, Mike Schmidt of the Phillies was having an off
  133. year, batting only .280 with 35 homers and 87 RBIs; the previous year, when he
  134. was awarded the MVP, in only 102 games played he had totaled 31 homers and 91
  135. RBIs. He did lead the league once again in 1982 in slugging percentage, and
  136. he did win the Gold Glove at third base for the seventh straight year, yet in
  137. the MVP balloting none of the ballots listed him higher than fourth; ten
  138. ballots were cast without listing him at all.
  139.      For Yount, 1982 was a crowning achievement; for Schmidt, a
  140. disappointment: That is the verdict reached by the baseball writers and
  141. conventional baseball statistics. Yet in terms of actual performance, as
  142. determined by the number of runs contributed, Schmidt's "off year" was
  143. scarcely different from Yount's. With the bat, Yount accounted for 50.3 runs
  144. beyond what an average batter might have contributed; Schmidt, 47.2. Through
  145. base stealing, Yount added 2.4; Schmidt none. With the glove, Yount was 4
  146. runs below league average at his position; Schmidt was 18.8 above average at
  147. his position. Total runs contributed: Yount 48.7, Schmidt 66.0. Total wins
  148. contributed beyond average by each: Yount 6.5, Schmidt 6.3. Both men had
  149. outstanding seasons, the best in their respective leagues, and both
  150. outstripped the second-best player by about the same margin.
  151.      Viewing player (and team) performance through this sort of prism
  152. frequently produces such illuminating results. Cecil Fielder had a wonderful
  153. year in 1990, with his 51 homers, 132 RBIs, and league-leading figures in
  154. slugging average and extra-base hits. But how did he convince any writer
  155. voting for MVP that he had a better year than Rickey Henderson?  In Total
  156. Baseball, you could look it up: Fielder contributed 4.4 extra wins to his
  157. team (wins that an average player would not), which was the fourth-best figure
  158. in the American League that year; Henderson was responsible for a whopping
  159. 7.7, not only the top mark in 1990 but also the third-best mark in the AL
  160. since Ted Williams' epic season in 1941!
  161.      This is the kind of analysis of player performance possible with a
  162. variety of sabermetric measures, not just the Linear Weights System. The
  163. common ingredient of most of the new, as yet unofficial statistics is their
  164. creators' recognition of the relationship between runs and wins.
  165.  
  166.  
  167. Runs and Wins
  168.  
  169.      George Lindsey, in an article in Operations Research in 1963, was the
  170. first to assign run values to the various offensive events which lead to runs:
  171. Runs = (.41)1B + (.82)2B + (1.06)3B + (1.42)HR. He based these values on
  172. recorded play-by-play data and basic probability theory. Unlike Earnshaw
  173. Cook, who in the following year assigned run values on the basis of the sum of
  174. the individual scoring probabilities--that is, the direct run potential of the
  175. hit or walk plus those of the baserunners set in motion--Lindsey recognized
  176. that a substantial part of the run value of any non-out is that it brings
  177. another man to the plate. This additional batter has a one-in-three chance of
  178. reaching base and thus bringing another man to the plate with the same chance,
  179. as do the batters to follow. The indirect run potential of these batters
  180. cannot be ignored.
  181.      Steve Mann's Run Productivity Average (RPA) assigned these values based
  182. on observation of some 12,000 plate appearances: RPA = (.51)1B + (.82)2B +
  183. (1.38)3B + (2.63)HR + (.25)BB + (.15)SB - (.25)CS, all divided by plate
  184. appearances, then plus .016. His values were denominated in terms of the
  185. number of runs and RBIs each event produced. Bill James, at about the same
  186. time, came up with a similar formula, since shunned, with values based on runs
  187. plus RBIs minus home runs. The drawbacks to the approaches of Mann and James
  188. were the drawbacks of the RBI, which gives the entire credit for producing a
  189. run to the man who plates it, and of the run scored, which gives credit only
  190. to the man who touches home, no matter how he came to do so. For example,
  191. with no outs, a man reaches first on an error; the next batter hits a double,
  192. placing runners on second and third; the following batter taps a roller to
  193. short and is thrown out at first, with the run scoring from third. The man
  194. who produced the out is given the credit for producing a run, while the man
  195. who started the sequence by reaching first on an error is likewise credited
  196. with a run. The man who hit the double, which was surely the key event in the
  197. sequence which produced the run, and the only one reflecting batting skill,
  198. receives no credit whatsoever. In this regard, any formula based on "Runs
  199. Produced" (whether R + RBI or R + RBI - HR) is philosophically inferior to
  200. the formula Lindsey proposed, despite his failure to account for walks,
  201. steals, and other events.
  202.      The run values in the Linear Weights formula for identifying batters'
  203. real contribution are derived from Pete Palmer's 1978 computer simulation of
  204. all major-league games played since 1901. All the data available concerning
  205. the frequencies of the various events was collected; following a test run,
  206. these were tabulated. Unmeasured quantities, such as the probability of a man
  207. going from first to third on a single vs. that of his advancing only one base,
  208. were assigned values based on play-by-play analysis of over 100 World Series
  209. contests. The goal was to get all the measured quantities very nearly equal
  210. to the league statistics; then the simulation would provide run values of each
  211. event in terms of net runs produced above average. Expressing the values in
  212. those terms would give a meaningful base line to individual performances,
  213. because if you are told that a player contributed 87 runs you don't know what
  214. that signifies unless you know the average level of run contribution in that
  215. year: 87 may sound like a lot, but if the norm was 80, then you know the
  216. player contributed only 7 runs beyond average.
  217.      The values obtained from the simulation are remarkably similar from one
  218. era to the next, confounding expectations that the home run would prove more
  219. valuable today than in the dead-ball era, or that the steal was once a primary
  220. offensive weapon. These values are expressed in beyond average runs.
  221.  
  222.  
  223. Run Values of Various Events, by Periods
  224.  
  225. Event                                  Period
  226. -----------------------------------------------------------------
  227.                    1901-20      1921-40      1941-60      1961-77
  228. -----------------------------------------------------------------
  229. home run             1.36         1.40         1.42         1.42
  230. triple               1.02         1.05         1.03         1.00
  231. double                .82          .83          .80          .77
  232. single                .46          .50          .47          .45
  233. walk/HBP              .32          .35          .35          .33
  234. stolen base           .20          .22          .19          .19
  235. caught stealing      -.33         -.39         -.36         -.32
  236. out [*]              -.24         -.30         -.27         -.25
  237. -----------------------------------------------------------------
  238.   *  An out is considered to be a hitless at bat and its value
  239. is set so that the sum of all events times their frequency is
  240. zero, thus establishing zero as the base line, or norm, for
  241. performance.
  242.  
  243.      In the years since this simulation was conducted, statistician Dave
  244. Smith ("Maury Wills and the Value of the Stolen Base," Baseball Research
  245. Journal, 1980) convinced Pete to adjust the values of the stolen base and
  246. caught stealing because of their situation-dependent, elective nature:
  247. Attempts are apt to occur more frequently in close games, where they would be
  248. worth more than if they were distributed randomly the way an event like a
  249. single or a home run would be. Pete revised the value for the steal upward to
  250. .30 runs, while for the caught stealing it becomes -.60 runs.
  251.      Just as these run values change marginally with changing conditions of
  252. play, they differ slightly up and down the batting order (a homer is not
  253. worth as much to the leadoff hitter as it is to the fifth-place batter; a walk
  254. is worth more for the man batting second than for the man batting eighth);
  255. however, these differences have been averaged out in the figures above. For
  256. evaluating runs contributed by any batter at any time, there is no better
  257. method than Batting Runs, the Linear Weights formula derived from the
  258. computer simulation which is the basis of the table above.
  259.  
  260.  
  261. The Formula
  262.  
  263. Runs = (.47)1B + (.78)2B + (1.09)3B + (1.40)HR + (.33)(BB + HB) + (.30)SB -
  264.        (.60)CS - (.25)(AB - H) - .50(OOB).
  265.  
  266.      The events not included in the formula that you might have thought to see
  267. are sacrifices, sacrifice hits, grounded into double plays, and reached on
  268. error. The last is not known for most years and in the official statistics is
  269. indistinguishable from outs on base (OOB). The sacrifice has essentially
  270. cancelling values, trading an out for an advanced base which, often as not,
  271. leaves the team in a situation with poorer run potential than it had before
  272. the sacrifice. The sacrifice fly has dubious run value because it is entirely
  273. dependent upon a situation not under the batter's control: While a single or
  274. a walk always has a potential run value, a long fly does not unless a man
  275. happens to be poised at third base (whether it is achieved by accident or
  276. design is open to question, as well, but that is beside the question--getting
  277. hit by a pitch is not a product of intent, either). Last, the grounded into
  278. double play is to a far greater extent a function of one's place in the
  279. batting order than it is of poor speed or failure in the clutch, and thus it
  280. does not find a home in a formula applicable to all batters. It is no
  281. accident that Henry Aaron, who ran well for most of his long career and wasn't
  282. too bad in the clutch, hit into more DP's than anyone else, nor that Roberto
  283. Clemente, Al Kaline, and Frank Robinson, who fit the same description, are
  284. also among the ten "worst" in this department. If Boston's Luis Rivera
  285. doesn't hit into many twin killings, it's not because of adept bat handling or
  286. blazing speed but because he bats ninth.
  287.      The Linear Weights formula for batters may be long, but it calls for only
  288. addition, subtraction, and multiplication and thus is as simple as the
  289. slugging average, whose incorrect weights (1, 2, 3, and 4) it revises and
  290. expands upon. Each event has a value and a frequency, just as in slugging
  291. average, yet as in no batting statistic you have ever seen, outs are treated
  292. as offensive events with a run value of their own (albeit a negative one), a
  293. truth so obvious it somehow escaped notice. Just as the run potential for a
  294. team in a given half inning is boosted by a man reaching base, it is
  295. diminished by a man being retired; not only has he failed to change the
  296. situation on the bases but he has deprived his team of the services of a man
  297. further down the order who might have come up in this half inning, either with
  298. men on base and/or with scores already in.
  299.      What Batting Runs does is to take every offensive event and treat it in
  300. terms of its impact upon the team--an average team, so that a man does not
  301. benefit in his individual record for having the good fortune to bat cleanup
  302. with the Giants or suffer for batting seventh with the Astros. The
  303. relationship of individual performance to team play is stated poorly or not at
  304. all in conventional baseball statistics. In Batting Runs it is crystal clear:
  305. the linear progression, the sum of the various offensive events, when weighted
  306. by their accurately predicted run values, will total the runs contributed by
  307. that batter or that team beyond the league average.
  308.      Recognizing some dedicated readers of Total Baseball will wish to keep
  309. track of batting performance by computing Batting Runs themselves over the
  310. course of a season, and that they may be frustrated by the difficulty of
  311. calculating the "At Bats-Hits" factor for the league, which is necessary to
  312. determine the negative value of an out, we advise that using a fixed value of
  313. -.25 for outs will tend to work quite well if you wish to include pitcher
  314. batting performance, and a fixed value of -.27 will serve if you wish to
  315. delete it. Actually, any fixed value will suffice in midseason; it's only
  316. when all the numbers are in and you care to compare this year's results with
  317. last year's (or with those of the 1927 Yankees) that more precision is
  318. desirable. At that point the value of the out may be calculated by the
  319. ambitious among you, but ideally, your newspaper or the sporting press will
  320. provide accurate Batting Runs figures. Who, after all, calculates ERA for
  321. himself?
  322.  
  323.  
  324. Batting Runs and Production
  325.  
  326.      For those to whom calculation is anathema, or at the least no pleasure,
  327. Batting Runs has a "shadow stat" that tracks its accuracy to a remarkable
  328. degree and is a breeze to calculate: Production, which consists simply of On
  329. Base Percentage Plus Slugging Average. While it is not expressed in runs and
  330. thus lacks the philosophical appeal of Batting Runs, the standard deviation of
  331. its most complete version is 20.4 runs compared to the 19.8 of Batting Runs.
  332. In other words, the correlation between Batting Runs and Production over the
  333. course of an average team season is 99.7 percent.
  334.      However, as an average or ratio, Production measures the rate of batting
  335. success (efficiency), while Batting Runs measures the amount of success. For
  336. example, a batter who goes 2-for-5 with a walk in one game, those 2 hits being
  337. doubles, will have an On Base Percentage of .500 and a Slugging Average of
  338. .800; his Production will be 1.3, or as stated for convenience in Total
  339. Baseball, 130. Another batter, who in 162 games gets 200 hits and 100 walks
  340. in 500 at bats, with 400 total bases, will have an identical OBP, SLG, and
  341. PRO. Which player has contributed more to his team?  Clearly, longevity, or
  342. amount of production, is no less important than rate of production.
  343.      To cite a specific instance in which Production and Batting Runs differ,
  344. take George Brett's remarkable 1980 season in which he batted .390, had 298
  345. total bases, 75 bases through walks or HBP, and 118 RBIs--all in only 117
  346. games played. In the table of all-time single-season leaders in production,
  347. the Kansas City third baseman ranks 44th when his PRO of 1.124 is normalized
  348. to the league average and adjusted for home-park effects. Yet in the table of
  349. park adjusted Batting Runs, Brett's season ranks out of the top 100 because
  350. he missed 45 games, in which his team derived no benefit from his high rate of
  351. performance. (Had Brett played 162 games and continued to perform at the same
  352. level, his Batting Runs would have been not 64.8 but 89.7, the 19th best mark
  353. in history.)
  354.      Because PRO is not expressed in runs, it is less versatile than Batting
  355. Runs. For just as runs are proportional to the events that form them, so are
  356. they proportional to wins and losses. This statement, a truism today, was a
  357. novelty in 1954 when Rickey and Roth first stated the correlation between run
  358. differentials and team standings. But they did not take the next step, to
  359. recognize that not only a team's standing but even its won-lost record could
  360. be predicted from the run totals.
  361.      "The initial published attempt on this subject," Pete wrote in the 1982
  362. issue of the SABR annual The National Pastime, "was Earnshaw Cook's Percentage
  363. Baseball, in 1964. Examining major-league results from 1950 through 1960 he
  364. found winning percentage equal to .484 times runs scored divided by runs
  365. allowed. . . . Arnold Soolman, in an unpublished paper which received some
  366. media attention, looked at results from 1901 through 1970 and came up with
  367. winning percentage equal to .102 times runs scored per game minus .103 times
  368. runs allowed per game plus .505. . . . Bill James, in the Baseball Abstract,
  369. developed winning percentage equal to runs scored raised to the power x,
  370. divided by the sum of runs scored and runs allowed each raised to the power x.
  371. Originally, x was equal to two but then better results were obtained when a
  372. value of 1.83 was used. . . .
  373.      "My work showed that as a rough rule of thumb, each additional ten runs
  374. scored (or ten less runs allowed) produced one extra win, essentially the same
  375. as the Soolman study. However, breaking the teams into groups showed that
  376. high-scoring teams needed more runs to produce a win. This runs-per-win
  377. factor I determined to be ten times the square root of the average number of
  378. runs scored per inning by both teams. Thus in normal play, when 4.5 runs per
  379. game are scored by each club, each team scores .5 runs per inning--totalling
  380. one run, the square root of which is one, times ten."
  381.      Note that when Palmer refers to the need for approximately ten additional
  382. runs scored (or ten fewer allowed) to provide a team with an additional win,
  383. he does not mean that it takes ten runs to win any given game. Obviously, in
  384. a specific case, a one-run margin is all that is required; but statistics are
  385. designed for the long haul, not the short.
  386.      What does this have to do with Batting Runs?  Remembering that Batting
  387. Runs are expressed not simply in runs but in beyond-average runs, the
  388. conversion from a batter's Linear Weights runs to his wins is a snap: simply
  389. divide Batting Runs by the number of runs it takes to gain an extra win in a
  390. given year. Taking the exploits of Babe Ruth in 1927, we see that through
  391. batting alone he contributed 100.7 runs, or 9.56 wins, since in the American
  392. League in 1927 it took 10.53 runs to produce an additional win. If every
  393. other player on the Yankees had performed at the league average, the New York
  394. record should have been 87-67; if each of the seven other batters had
  395. performed only half as well as Ruth and had added five extra wins (discounting
  396. reserves, pitchers, fielders, and stealers, whom we shall presume for this
  397. discussion to have been average), the Yankees would have gained another 35
  398. wins (7 X 5) to finish with a won-lost mark of 122-32.
  399.  
  400.  
  401. Stolen Base Runs
  402.  
  403.      The Linear Weights formula for batters contains a factor for base
  404. stealers, expressed in runs. How do you judge the effectiveness of a base
  405. stealer? Conventional baseball statistics will lead you to the conclusion that
  406. whoever has the most steals is the best thief; that is the sole criterion for
  407. The Sporting News annual "Golden Shoe Award" in each league. How often the
  408. man with the most steals may have been thrown out is of no concern.
  409.      An article in the 1981 Baseball Research Journal by Bob Davids offered
  410. something more sophisticated yet utterly simple: a stolen base percentage,
  411. which is simply stolen bases divided by attempts. The best stolen base
  412. average of all time, insofar as we know and based on a minimum of 30 attempts,
  413. is Max Carey's in 1922 when he stole 51 bases in 53 attempts. The most times
  414. caught stealing in the course of a season was Ty Cobb's 38 in 1915, until 1982
  415. when Rickey Henderson was nabbed 42 times. But the best method yet devised,
  416. and the one that is pleasingly simple, is to apply the Linear Weights method
  417. to get Stolen Base Runs. One multiplies the steals by their run value of .30
  418. and the failed attempts by -.60, and adds the two products. The
  419. implication for such men as Ty Cobb, Rickey Henderson, and Vince Coleman is
  420. clear: It takes a fabulous stealing performance to produce as much as one
  421. extra win for the team.
  422.      In 1915 Ty Cobb, when he established the modern stolen base record of 96,
  423. can be seen to have contributed to his team 28.8 runs, while his 38 foiled
  424. larcenies cost 22.8. Thus Cobb, for all his whirling-dervish activity,
  425. accounted for only 6 non-par runs--not even a single win. Whoa! You mean
  426. that not a single one of Cobb's steals produced a victory?  That is not what
  427. is being said: the fact is that while the gain from the stolen base is
  428. entirely visible--an extra base which may be followed by a hit that would
  429. otherwise not have produced a run--the cost of the caught stealing is entirely
  430. invisible, or conjectural, except with the aid of statistics. How many big
  431. innings did Cobb run his team out of?  How many batters reached base in
  432. ensuing innings who might, in an earlier inning, have had their contributions
  433. count for runs?  What Stolen Base Runs indicate are that, on balance, not on a
  434. specific-case basis, the stolen base is at best a dubious method of increasing
  435. a team's run production.
  436.      Now let's take a look at what Henderson did. His record 130 stolen bases
  437. in 1982 produced 39 runs for his team. His 42 failed attempts took away 25.2
  438. possible runs. Net effect: approximately 14 runs, or one and a half wins, a
  439. performance nearly three times as good as Cobb's. In 1983, stealing 22 fewer
  440. bases, he was even better, accounting for 21.0 runs. However, the all-time
  441. best stealing record is that of Maury Wills in 1962, when he stole 104 bases
  442. and was caught only 13 times. Wills' 104 stolen bases produced 31.2 runs;
  443. his 13 failed attempts cost only 7.8. So, his baserunning contribution was
  444. 23.4, or a little over two wins.
  445.  
  446.  
  447. Fielding Runs
  448.  
  449.      As mentioned earlier, in 1954 when Branch Rickey and Allan Roth came up
  450. with their "efficiency formula" for run scoring and run prevention, the
  451. defensive half of the equation was divided into five segments, the last of
  452. which was fielding, to which they assigned a mathematical value of zero.
  453. "There is nothing on earth," Rickey declared, "anyone can do with fielding."
  454.      Since then many have tried, with mixed results, to improve upon the mere
  455. toting up of raw data--putouts, assists, errors, double plays. In the second
  456. edition of Total Baseball, we improved upon the Fielding Runs formula by
  457. calculating innings played at each position, plate appearances for all players
  458. on the team, and then rating each fielder based on his chances per inning.
  459. (Formerly we had rated each position on each team based on totals for all
  460. players on that team at that position; then we split up the total based on
  461. putouts. For more on the formula, see the Introduction to the new Fielding
  462. Register, and the Glossary.)
  463.      In the current edition we have also rated left fielders against left
  464. fielders, center fielders against center fielders, and right fielders against
  465. right fielders; where previously all outfield positions had been grouped
  466. together. We revised thoroughly the formula for catchers, which retains the
  467. highest degree of subjectivism because their primary defensive contribution
  468. comes not with the glove but through calling the pitches.
  469.      More on this complex subject in the Glossary.
  470.  
  471.  
  472. Pitching Runs
  473.  
  474.      Determining the run contributions of pitchers is much easier than
  475. determining those of fielders or batters, though not quite so simple as that
  476. of base stealers. Actual runs allowed are known, as are innings pitched.
  477. Let's assume that a pitcher is responsible only for earned runs. Then why, we
  478. hear some of you asking, is the ERA not measure enough of his ability?
  479. Because it tells only the pitcher's rate of efficiency, not his actual benefit
  480. to the team. In a league with an ERA of 3.50, a starter who throws 300
  481. innings with an ERA of 2.50 must be worth twice as much to his team as a
  482. starter with the same ERA who appears in only 150 innings. Through Pitching
  483. Runs, we seek to determine the number of beyond-average runs a pitcher
  484. saved--the number he prevented from scoring that an average pitcher would have
  485. allowed.
  486.      The formula for Earned Run Average is:
  487.  
  488. ERA = (Earned Runs x 9)/Innings Pitched
  489.  
  490.      The number of average, or par, runs for a pitcher, which is represented
  491. by a Pitching Runs figure of zero, is equal to:
  492.  
  493. (League ERA X IP)/9
  494.  
  495.      If the league ERA is 3.79 (as the National League's was in 1990) and a
  496. pitcher's ERA is also 3.79, he will by definition have held batters in check
  497. at the league average no matter how many innings he pitched. If, however, his
  498. ERA was 2.67 and he hurled 249 innings (as Frank Viola did for the Mets in
  499. '90), he will have saved a certain number of runs that an average pitcher
  500. might have allowed in his place; to find that number we employ the Pitching
  501. Runs formula:
  502.  
  503. Pitcher's Runs = Innings Pitched X (League ERA/9) - ER
  504.  
  505.      This represents the difference between the number of earned runs allowed
  506. at the league average for the innings pitched and the actual earned runs
  507. allowed. For the case of Viola, we get
  508.  
  509. Runs = 249 X 3.79/9 - 74 = 31.2
  510.  
  511.      Viola was 31.2 runs better than the average National League pitcher in
  512. 1990, and had he been transported to an average NL team--that mythical entity
  513. that scores as many runs as it allows while winning 81 and losing 81--he would
  514. have made that team's mark 84-78. An alternative way to calculate pitchers'
  515. Linear Weights, useful with oldtimers for whom you may have the ERA but not
  516. the number of earned runs allowed, is to use the pitcher's ERA, subtracted
  517. from the league's ERA, multiplying by the innings pitched, then dividing by
  518. nine. In Viola's case, this approach would look like:
  519.  
  520. (3.79 - 2.67) X 249/9 = 31.0
  521.  
  522.      The difference of two tenths of a point is accounted for because we are
  523. using the ERA of 2.69, which has been rounded off, rather than the absolute
  524. figure of the pitcher's earned runs allowed, 74.
  525.      The two parts of performance--efficiency and durability, or how well and
  526. how long--are incorporated into all Linear Weights measures. If you are
  527. performing at a better than average clip, the more regularly you do so, the
  528. more your team will benefit and thus the higher your Linear Weights measure.
  529. If you are stealing bases nine times out of ten, your team will benefit more
  530. from sixty attempts than from forty; if you are batting at an above average
  531. clip, it's better to play in 160 games than 110; if you're allowing one earned
  532. run per game less than the average pitcher, your LWTS will increase with
  533. innings pitched.
  534.      A problem emerges in this regard when trying to compare the Pitching Runs
  535. of a pitcher from 1978 like Ron Guidry, with that of Hoss Radbourn in 1884.
  536. In the "efficiency" component of the formula, which may be understood as the
  537. league ERA minus the individual's ERA, the two compare this way:
  538.  
  539. Guidry = 3.76 - 1.74 = 2.02
  540. Radbourn = 2.98 - 1.38 = 1.60
  541.  
  542.      Guidry's differential is "unfairly" boosted by the higher league ERA of
  543. 1978; in fact, if we had compared the two by their normalized ERAs, which is
  544. logically more sound, the results would have been:
  545.  
  546. Guidry = 3.76/1.74 = 2.16              Radbourn = 2.98/1.38 = 2.16
  547.  
  548.      Yet because rules and playing conditions allowed Radbourn to extend his
  549. efficiency over 679 innings, while Guidry hurled "only" 274, their Pitching
  550. Runs look like this:
  551.  
  552. Guidry = 62.0    Radbourn = 120.6
  553.  
  554.      There is a great deal more to say on the subject of pitching and
  555. sabermetric stats: see the Introduction to the Pitching Register and the
  556. Glossary.
  557.  
  558.  
  559. Linear Weights in Practice
  560.  
  561.      Having formulas for pitching, fielding, baserunning, and batting, we can
  562. assess the run-scoring contribution of every individual who has ever played
  563. the game, and thus the number of wins that he has contributed in a given
  564. season or over his career. The number of runs required to produce an
  565. additional win has varied over the years between 9 and 11 runs, with a very
  566. few league seasons outside those parameters.
  567.      Limited by conventional baseball statistics, one might, in 1990, have
  568. uttered something like, "Barry Bonds hit .293 with 33 homers and 114 RBIs--the
  569. guy must have been worth 10 extra wins to Pittsburgh all by himself!"  Or:
  570. "The White Sox are only one pitcher away from winning the division."  Or:
  571. "The Yankees are only three players away from being a contender."  Or,
  572. "Letting Darryl Strawberry get away was the worst thing the Mets ever did;
  573. they'll be a second-division club for a decade."  With Linear Weights, these
  574. statements, or rather the concerns they reflect, can be approached with some
  575. data and with some degree of objectivity. First: Bobby Bonds had a fine year
  576. in 1990, but to have contributed 10 wins by himself he would have had to
  577. account for nearly 100 Linear Weights runs, a mark that has been attained by
  578. only three men in major-league history. In fact, Bonds contributed 6.5 wins
  579. in '90, though he did post 9.0 wins in 1992.
  580.      As to the White Sox, they finished 94-68 in 1990, while their Linear
  581. Weights projected them to finish at 81-81. The Athletics, who won the AL West
  582. at 103-59, actually projected to finish 96-66. So, the Sox management might
  583. have asked, how to close ground on the Athletics?  Could one pitcher--like Bob
  584. Welch, for whom they bid in the free-agent bazaar--make the difference?  To do
  585. so, he would have to contribute about 150 Pitching Runs, a feat no pitcher has
  586. ever accomplished. In 1990, pitching for Oakland--and remember, the Linear
  587. Weights formula is divorced from considerations of batter support--Welch
  588. contributed 20.7 park-adjusted Pitching Runs. So presuming that he pitched as
  589. well for the White Sox as he did for the Athletics, or even slightly better,
  590. he would not be enough to "win" Chicago the flag on paper; Chicago would need
  591. help from other quarters.
  592.      Regarding the other statements, you get the picture: sabermetric
  593. analyses like the ones above that employed the Linear Weights System will tend
  594. to puncture fantasies.
  595.  
  596. Park Factor
  597.  
  598.      A central issue for sabermetricians is the network of illusion created by
  599. home-park dimensions, atmospheric conditions, and visibility for batters. How
  600. many home runs would Mark McGwire hit if he played half his games in Fenway
  601. Park?  Will the Atlanta Braves and Chicago Cubs keep "failing" to put together
  602. solid pitching staffs--or has their pitching been adequate all along?  Why
  603. have the American League leaders in triples so often worn a Royals uniform?
  604. One's home park has a powerful effect on a player or pitcher's record,
  605. elevating some good players to greatness and denying the spotlight to some
  606. outstanding performers.
  607.      It should be understood that the average player does better at home
  608. regardless of the park--familiarity breeds success, it seems. Individuals bat
  609. and pitch at a rate 10 percent higher at home, on average. But parks don't
  610. create performance; they only affect it. For example, a lefthanded hitter at
  611. Fenway can do very well indeed, as Wade Boggs has, by learning to take the
  612. outside pitch to left field. Likewise, a righthanded batter can make the
  613. friendly Green Monster into his nemesis by trying to pull every pitch.
  614.      For hard luck in home parks, it is tough to top the record of Dave
  615. Winfield, who has had the misfortune to call both San Diego and Yankee
  616. stadiums home before landing in the more or less neutral Big A in Anaheim.
  617. Through 1990, his lifetime Production, normalized to league average but not
  618. adjusted for park effects, was 117th best on the all time list of those
  619. playing in 1,000 games. Had he played his home games instead in Fenway Park,
  620. his PRO would have projected to the 45th best of all time. Had he even played
  621. in an average hitters' park--which is what PRO+ measures--his record would
  622. show itself to be the 80th best ever.
  623.      If we desire to remove the silver spoon or the millstone that a home park
  624. can be, and measure individual ability alone, we must create a statistical
  625. balancer that diminishes the individual batting marks created in parks like
  626. Fenway and augments those created in San Diego. Pete Palmer developed an
  627. adjustment that enables us, for the first time, to measure a player's
  628. accomplishments apart from the influence of his home park.
  629.      Parks differ in so many ways that it may be hard to imagine how their
  630. differences can be quantified. The most obvious way in which they differ is
  631. in their dimensions, from home plate to the outfield walls, and from the base
  632. lines to the stands. The older arenas--Fenway Park, Wrigley Field, Tiger
  633. Stadium--tend to favor hitters in both regards, with reachable fences and
  634. little room to pursue a foul pop. The exception among the older parks was
  635. Chicago's Comiskey, which, in keeping with the theories of Charles Comiskey
  636. back in 1910 and the team's perceived strength, was built as a pitcher's park.
  637. Yet two parks can have nearly equal dimensions, like Pittsburgh's Three Rivers
  638. Stadium and Atlanta's Fulton County Stadium, yet have highly dissimilar
  639. impacts upon hitters because of climate (balls travel farther in hot weather),
  640. elevation (travel farther above sea level), and playing surface (travel faster
  641. and truer on artificial turf). Yet another factor is how well batters think
  642. they see the ball; Shea Stadium is notorious as a cause of complaints.
  643.      And perhaps more important than any of the objective park
  644. characteristics, suggested Robert Kingsley in a 1980 study of why so many
  645. homers were hit in Atlanta, is the attitude of the players, the way that the
  646. park changes their view of how the game must be played in order to win. Every
  647. team that comes into Atlanta in August knows that the ball is going to fly
  648. and, whether it is a team designed for power or not, it plays ball there as if
  649. it were the 1927 Yankees. In their own home park the Astros may peck and
  650. scratch for runs, but in Atlanta they will put the steal and hit-and-run in
  651. mothballs. Conversely, a team which comes into the Astrodome and plays for
  652. the big inning will generally get what it deserves--a loss. The successful
  653. team is one that can play its game at home--the game for which the team was
  654. constructed--yet is flexible enough to adapt when on the road. How to
  655. quantify attitude?
  656.      Rather than try to assign a numerical value to each of the six or more
  657. variables that might go into establishing an estimator of homepark impact,
  658. Pete looked to the single measure in which all these variables are
  659. reflected--runs. After all, why would we assign one value to dimensions,
  660. another to climate, and so on, except to identify their impact on scoring?  If
  661. a stadium is a "hitters' park," it stands to reason that more runs would be
  662. scored there than in a park perceived as neutral, just as a "pitchers' park"
  663. could be expected to depress scoring.
  664.      The full and lengthy explanation for the computation of the Park Factor
  665. is left to the Glossary, where hardy readers might consider taking a peek
  666. right now. For most of us, though, it will be enough to understand that the
  667. Park Factor consists mainly of the team's home-road ratio of runs allowed,
  668. computed as it was above for the league, compared to the league's home-road
  669. ratio.
  670.      Just as Dave Winfield's stats suffered for the home parks he played in
  671. until he joined the California Angels, Dean Chance, star pitcher of the Angels
  672. in the mid-1960s, benefited from playing in Chavez Ravine when it was
  673. notoriously rough on hitters. This is not to say Chance had anything but a
  674. marvelous year in 1964: 20 wins, a 1.65 ERA, and 11 shutouts are hard to
  675. argue with. Still, in 81 home games in 1964, the Angels allowed 226 runs; in
  676. 81 games on the road, they allowed 325--44 percent more, where a 10 to 11
  677. percent increase would have been normal. If one is to compare Chance and,
  678. say, Bert Blyleven in his years with Minnesota fairly, you must deny one the
  679. benefit of his home park and remove from the other the onus of his. This is
  680. what Park Factor does.
  681.      For decades, the all-time scoring squelcher was Chicago's South Side
  682. Park, which saw service at the dawn of the American League. From 1901 through
  683. 1909, its last full year of service to the White Sox, this cavernous stadium
  684. produced home run totals like the 2 in 1904, 3 in 1906, and 4 in 1909; in two
  685. years the Sox failed to hit any homers at home, thus earning the nickname
  686. "Hitless Wonders."  In 1906, Chicago pitchers held opponents to 180 runs at
  687. South Side Park, an average of 2.28 runs per game, earned and unearned, in a
  688. decade when 4 of every 10 runs were unearned. This mark held until 1981, when
  689. the Astrodome intimidated opposing hitters to such a point that in the 51 home
  690. dates of that strike-shortened season, Astro hurlers were touched for only 106
  691. runs--2.08 per game. The Pitcher Park Factor of .817 for the Astrodome was
  692. the lowest ever. Those who suspected that men like Joe Niekro, Don Sutton,
  693. Vern Ruhle, et al., were perhaps not world beaters after all were right: Look
  694. at the ERAs the Astro starters registered that year, and what these ERAs might
  695. have been in an average park like Shea that year (BPF: 1.00) or a moderately
  696. difficult pitchers' park like San Francisco (BPF: 1.06).
  697.  
  698.  
  699. Houston Pitchers, 1982
  700.  
  701.                          ERA      BPF: 1.00     BPF: 1.06
  702. -----------------------------------------------------------
  703. Nolan Ryan              1.69         2.07           2.19
  704. Joe Niekro              2.82         3.43           3.64
  705. Vern Ruhle              2.91         3.56           3.77
  706. Bob Knepper             2.18         2.66           2.82
  707. Don Sutton              2.60         3.17           3.36
  708. HOUSTON (all)           2.66         3.24           3.44
  709. SAN FRANCISCO
  710. (all)                   3.28         3.09           3.28
  711. -----------------------------------------------------------
  712.  
  713. Some observations prompted by this table: San Francisco with its team ERA of
  714. 3.28 had a better pitching staff than Houston with its 2.66; and Houston
  715. batters, regarded as a Punch-and-Judy crew by all observers, must have been a
  716. lot more effective than heretofore suspected. In fact, when Houston batters'
  717. totals (eighth in runs scored, eighth in LWTS) are adjusted for park, the
  718. Astros emerge on ability as the best hitting team in the National League of
  719. 1981!  Even without the application of Park Factor, one might have come to a
  720. similar conclusion by examining the runs scored totals for all NL clubs on the
  721. road in 1981. Houston's total was exceeded only by those of the Dodgers and
  722. Reds.
  723.      Proceeding from a similar hunch, we may look at the batting record of the
  724. "Hitless Wonders" of 1906, who won the pennant (and the World Series, in four
  725. straight over a Cubs team which went 116-36 during the season). Baseball lore
  726. has it that a magnificent pitching staff (Ed Walsh, Doc White, Nick Altrock,
  727. and others) overcame a puny batting attack (BA of .230, 6 homers, slugging
  728. percentage of .286). In fact, the Sox scored more runs on the road than all
  729. but one AL team, and their Batting Linear Weights, when adjusted for park, was
  730. third in the league--the same rank achieved by their pitching. (How they won
  731. the pennant remains a mystery, though, for both Cleveland and New York had
  732. vastly superior teams on paper.)
  733.  
  734.  
  735. Relativity
  736.  
  737.      Sabermetric statistics can be marvelous tools for cross-era comparisons,
  738. enabling us to determine if baseball's history is truly a seamless web or if
  739. its seams are real enough, but are camouflaged by traditional statistics.
  740.      If Batter A presented himself to you for approval with these
  741. statistics--.330 batting average, 16 home runs, 107 RBIs--what would your
  742. reaction be?  You'd like to have him on your team, right?  And what to make of
  743. Batter B, who presents these numbers--.257 batting average, 14 home runs, 53
  744. RBIs?  Not bad for a middle infielder with a good glove, you say, but
  745. otherwise undistinguished?  In fact, the "impressive" figures of Batter A
  746. represent the average performance of a National League outfielder in 1930,
  747. while the "blah" figures of Batter B are those of the average American League
  748. outfielder of 1968: The former has more than twice the RBIs of the latter,
  749. along with a batting average 73 points higher, yet the two performed at
  750. identical levels, and an argument could be made that Batter B was superior.
  751.      In a similar comparison involving those two years of extremes, Bill Terry
  752. led the National League in 1930 with a BA of .401, a mark surpassed by Ted
  753. Williams in 1941 but not equaled since; Carl Yastrzemski led the American
  754. League of 1968 with a performance that oldtimers held to be a disgrace, a
  755. lowly BA of .301, the worst ever to win a batting championship. Terry's mark
  756. was achieved at a time when most pitchers had only two pitches, a fastball and
  757. a curve, and not enough confidence in the latter to throw it when behind in
  758. the count at 2-0 or 3-1. The parks were smaller; there was no night ball; the
  759. game was segregated racially; and you played 22 games with each team, none
  760. farther west of the Mississippi than St. Louis. Moreover, 1930 was the year
  761. in which National League officials, attempting to match the popularity of the
  762. slugging American League, juiced the ball to such an extent that the entire
  763. league batted .312 (if you remove pitcher batting). In other words, the
  764. average nonpitcher in the NL of 1930 batted higher than the AL leader in 1968!
  765. When Yaz hit .301, pitchers dominated the game and the average American League
  766. nonpitcher hit .238. How to compare Terry and Yaz, who played under such
  767. different conditions thirty-eight years apart?
  768.      You could view Terry's .401 in relation to his league's BA of .312,
  769. concluding that Memphis Bill was a better hitter (by BA alone, which despite
  770. its previously cited deficiencies remains the most comfortable stat by which
  771. to introduce this technique) by 28.5 percent. You could compare Yaz's .301 to
  772. his league's BA of .238 and conclude that he was a better than average hitter
  773. by 26.5 percent. A mere 2 percentage points separate the men--had they both
  774. played in the National League of 1983, when the league average was .255, the
  775. Terry of 1930 might have hit .328, the Yaz of 1968, .323. (A further
  776. refinement of this method would be to delete Terry's at bats and hits from his
  777. league's, and those of Yastrzemski from his league's, so that the batters are
  778. not in effect compared with themselves. This, however, necessitates the use
  779. of at bats and hits rather than simply the averages and does not significantly
  780. alter the results.)
  781.      Why do we need relative measures?  Basically, for the same reason we need
  782. statistics altogether, to compare, to interpret, and to comprehend, but in a
  783. more reasonable and accurate manner when the disparity of the data sources
  784. makes the use of absolute, unadjusted numbers illogical. If the analysis
  785. involves data produced under widely varying conditions, such as a sample
  786. including performances 20, 50, or 100 years apart, any comparison will be
  787. meaningless without dragging in a series of rather complex historical
  788. understandings to modify the analysis--and in a highly subjective, unreliable
  789. manner. To compare Terry's .401 with Yastrzemski's .301 with no recognition
  790. of the context in which these marks were achieved, that is, to infer that
  791. Terry was 100 points better than Yaz, is equivalent to comparing Babe Ruth's
  792. salary of $80,000 in 1930 with Pete Rose's $806,250 of fifty years later and
  793. concluding that Rose was $726,250 richer. To understand those figures we must
  794. place them within a context which includes such factors as I.R.S. regulations
  795. and inflation: We might think to re-express the two salaries in terms of
  796. their purchasing power, multiplying each by the Consumer Price Index of its
  797. time as expressed in 1967 dollars; doing this would be to compute a "relative
  798. salary" for Ruth and Rose, just as we computed a Relative Batting Average for
  799. Terry and Yaz. (And just as we discovered there was little difference between
  800. the BAs of the latter couple, we would discover there is little difference
  801. between the salaries of the former pair.)
  802.      Few are the fans who could cite the context of Ross Barnes' .429 batting
  803. average of 1876, let alone evaluate its ingredients (these include
  804. considerations of equipment, schedule, travel, physiology, racial exclusion,
  805. daytime games, rules variations, attitudes, and customs). A statistic removed
  806. from its historical context can be as deceptive as a quotation pulled out of
  807. context. How, then, to compare Barnes' .429 with, say, Bill Madlock's
  808. league-leading figure of .339 a century later?  Should we discount Barnes'
  809. average 10 percent because in his day batters could demand a pitch above the
  810. waist or below?  Or should we augment it 17 percent because a pitcher could
  811. throw eight "balls" before allowing a walk?
  812.      We are confronted with a similar problem in trying to quantify the
  813. various differences between home parks; our solution there was to look at the
  814. single measure which reflected all the variables--runs--and from that measure
  815. we proceeded to devise a formula for Park Factor. Similarly, the many
  816. variables that supply the context for Barnes in 1876 supplied an identical
  817. context for every other batter in that year--and the context in which Bill
  818. Madlock hit .339 prevailed for every other National League batter in 1976
  819. (except for home park, of course). Accordingly, if we form a ratio of
  820. Barnes' .429 to his league's average (.265) and another of Madlock's to his
  821. league's average (.263) we obtain figures (1.62 for Barnes, 1.28 for
  822. Madlock--stated for convenience in Total Baseball as 162 and 128), which may
  823. reasonably be compared with each other: Barnes was 62 percent better than his
  824. league in BA, while Madlock was 28 percent better than his; these become the
  825. comparables, not the .429 and .339. The method will not become a time
  826. machine--putting Barnes on a modern club and Madlock on an old-time one--any
  827. more than Park Factor is a place machine, switching Joe DiMaggio to Beantown
  828. and Ted Williams to the Bronx. However, the relativist approach offers
  829. suggestive truths and does measure precisely the extent to which Barnes' and
  830. Madlock's BAs dominated those of their contemporaries.
  831.      Until the 1970s, when David Shoebotham ("Relative Batting Averages,"
  832. Baseball Research Journal, 1976) and Merritt Clifton ("Relative Baseball,"
  833. Samisdat, 1979) introduced the relativist approach, all baseball stats were
  834. absolute. And for cross-era comparison, that favorite Hot Stove League
  835. activity, absolute stats were absolutely useless, generating plenty of heat
  836. and precious little light. What the theory of relativity, baseball-style,
  837. does beautifully is to eliminate the need for bringing historical baggage to
  838. statistical analysis. The normalized or relative versions of any
  839. statistic--batting average, Production, ERA, slugging average, you name it;
  840. even homers or strikeouts, though there are problems with these--will be
  841. greater than 1.00 for all above-average performers (1.41, for example, means
  842. 41 percent better than average in the given category) while relative
  843. statistics less than 1.00 will indicate a below average level of play (0.88
  844. means 12 percent below the norm).
  845.      It is as simple as can be. So Early Wynn had a 3.20 ERA in 1950?  What
  846. does that mean?  Well, the league ERA was 4.58, so Wynn did very well indeed.
  847. His normalized ERA thus was 143, a mark better than that earned by Tom Seaver
  848. in 1968, when he had an absolute ERA a full run lower at 2.20.
  849.      We cannot employ a Relative Won-Lost record, for the league average is
  850. every year the same: .500. (A logical corollary is that one cannot fruitfully
  851. use relative measures of any sort for a single season's analysis, as all like
  852. figures will be compared to the same league average. The numbers may be
  853. changed into normalized form, but the players' rankings will be unchanged:
  854. The top ten in batting average in 1990, for example, will retain their ranks
  855. in Relative Batting Average.)
  856.      Relativism in baseball echoes not only Einstein but also Shakespeare,
  857. whose words in Hamlet might be modified to read "There is nothing either good
  858. or bad, but context makes it so."  No longer must we accept arbitrary
  859. assessments of performance or regard with awe such old-time figures as Hugh
  860. Duffy's BA of .438 in 1894 (not the accomplishment that Rod Carew's .388 was
  861. in 1977) or George Sisler's .407 in 1920 (not as good as Roberto Clemente's
  862. .357 in 1967). Conversely, a "mediocre" performance of recent years, such as
  863. Bobby Murcer's .292 of 1972, for instance, stacks up as the equal of Eddie
  864. Collins' .360 in 1923, while Charlie Grimm's seemingly solid .298 in 1929
  865. compares unfavorably to Mike Cubbage's .260 in 1976.
  866.      Relativism redefines our understanding not only of particular
  867. accomplishments but also of baseball history itself. We see that the men who
  868. batted .400 with numbing regularity in the 1890s and 1920s were not supermen
  869. (would you swap Wade Boggs for Tuck Turner?  George Brett for Harry Heilmann?)
  870. anymore than the sub-2.00 ERA pitchers of the late 1960s (Gary Peters, Bob
  871. Bolin, Dave McNally, et al.). Absolute figures lie. Are hitters today worse
  872. because none has hit .400 since 1941?  Or are they superior because a Dave
  873. Kingman can average nearly 30 homers a year while Cap Anson only averaged 4?
  874. Are infielders better today because they make fewer errors than their
  875. counterparts of 50, 75, or 100 years ago?  Do modern outfielders have
  876. limp-noodle arms because their assist totals pale before those registered in
  877. the early decades of the 1900s?  Is baseball improving or declining, and has
  878. its rise or fall been steady?  One can spit absolute stats on the hot stove
  879. all winter long and get no closer to the answer, but with relative statistics,
  880. the issues are clarified.
  881.      In the May 1983 issue of The Coffin Corner, the newsletter of the
  882. Professional Football Researchers Association, Bob Carroll offered a witty and
  883. perceptive dissection of the relative approach to football statistics. It was
  884. based upon a comparison of two great running backs, Tuffy Leemans of the New
  885. York Giants of the late 1930s and early '40s and George Rogers, then with the
  886. New Orleans Saints. "I've always liked the story," Carroll wrote, "of the
  887. little old lady who scornfully toured a Picasso exhibit and then sniffed, 'If
  888. Rembrandt were alive today, he wouldn't paint this way!'  To which a bystander
  889. replied, 'Ah, but if Rembrandt were alive today, he wouldn't be Rembrandt.'"
  890.      There are things that relative baseball stats won't do, questions they
  891. won't answer. What would Ty Cobb bat if he were playing today?  Lefty O'Doul
  892. was asked this question by a fan at an offseason baseball banquet in 1960.
  893. "Maybe .340," O'Doul answered. "Then why do you say Cobb was so great," the
  894. fan remarked, "if he could only hit .340 with the lively ball today?" "Well,"
  895. O'Doul said, "you have to take into consideration that the man is now 74 years
  896. old."  Relative Batting Average cannot tell with certainty what Cobb would hit
  897. today, for as Carroll wrote of Tuffy Leemans, if Cobb were playing today he
  898. wouldn't be the same Cobb; he would be bigger, stronger, and faster, and he
  899. might choose to steal less and go for the long ball more.
  900.  
  901.  
  902. Relief Pitching
  903.  
  904.      Absent from the chapter to this point has been the relief pitcher, a
  905. modern specialist who because of his still-evolving role in baseball, presents
  906. a variety of sabermetric problems and opportunities. The nature of the job is
  907. such that his won-lost record is not meaningful (even less so today than ten
  908. or fifteen years ago, with the ace in most bullpens being called upon--in
  909. highly dubious wisdom--only when his team has a lead in the eighth or ninth
  910. inning). A reliever may pick up a win with as little as a third of an
  911. inning's work, if he is lucky, while a starter must go five innings; a
  912. reliever may also pick up a loss more easily, for if he allows a run there may
  913. be little or no opportunity for his teammates to get it back, as they can for
  914. a starter. Earned run average is meaningful for the reliever, but it must be
  915. .15 to .25 lower to equate with that of a starter of comparable ability: a
  916. reliever frequently begins his work with a man or two already out, and thus
  917. can put men on base and strand them without having to register three outs.
  918.      Ratios of hits to innings, strikeouts to innings, strikeouts to
  919. walks--all of these have their interest, but none is sufficient by itself to
  920. measure relief-pitcher effectiveness. Relievers may also have an edge in
  921. these ratios because they generally face each batter only once in a game, thus
  922. leading to fewer hits and more strikeouts per inning. Before discussing the
  923. modern alternatives of saves or Relief Points, and our own Relief Ranking,
  924. let's review briefly the rise of the relief pitcher from the role of a mere
  925. hanger-on to, some would say, the most indispensable part of a winning team.
  926.      Relief pitching before 1891 was limited, with rare exceptions, to the
  927. starting pitcher exchanging places with one of the fielders, who was known as
  928. the "change pitcher."  Substitutions from the bench were not permitted except
  929. in case of injury until 1889, when a tenth man became entitled to designation
  930. as a substitute for all positions; free substitution came in two years later,
  931. but no relief specialists emerged until Claude Elliott, Cecil Ferguson, and
  932. Otis Crandall in the first decade of this century.
  933.      The next decade's best relievers were starters doing double duty--notably
  934. Ed Walsh, Chief Bender, and Three Finger Brown. The 1920s, and up to the end
  935. of World War II, brought the first firemen to be employed in the modern way,
  936. although they tended to work more innings and fewer games than today. These
  937. were men such as Firpo Marberry, Johnny Murphy, Ace Adams, and several other
  938. worthies.
  939.      When you think of a relief pitcher in the modern-day sense--that is, a
  940. man who can appear in 50 or more ballgames a year, all or nearly all in
  941. relief, and win/save 30 or more--you begin with Joe Page of the 1947-49
  942. Yankees and Jim Konstanty of the 1950 Phils, though Marberry had one such
  943. season in 1926. None of the three, however, ever heard of a "save" in his
  944. playing days--this term wasn't introduced until 1960, the year after Larry
  945. Sherry's heroic World Series in which he finished all four Dodger victories,
  946. garnering two for himself and saving the others; 1959 was also the year
  947. fireman Roy Face went 18-1, not losing until September 11.
  948.      Before Jerry Holtzman of the Chicago Sun Times devised the save, baseball
  949. people were looking at really only one figure to measure a reliever's work,
  950. and that was the number of games in which he appeared; any other appreciation
  951. of his efforts was expressed impressionistically. A reliever did not work
  952. enough innings to qualify for an ERA title (Hoyt Wilhelm in 1952 being the
  953. exception), nor could he expect to win 20 games. The introduction of a
  954. specialized statistic for the fireman was acknowledgement of his specialized
  955. employment and conferred upon it a status it had never enjoyed, not even after
  956. the exploits of Konstanty, Page, Wilhelm, and Face. Only when the save came
  957. into being did the majority of relievers take pride in their work and stop
  958. regarding their time in the bullpen as an extended audition for a starting
  959. role.
  960.      When The Sporting News, spurred by Holtzman, began recording saves in its
  961. weekly record of the 1960 season, the save was defined in a way different from
  962. today. Then, upon entering the game, a reliever had to confront the tying or
  963. winning run on base or at the plate, and of course finish the game with the
  964. lead. This definition later became eased, so that simply finishing a game
  965. would get the reliever a save; a memorably absurd result of the new ruling was
  966. that the Mets' Ron Taylor gained a save in 1969 by pitching the final inning
  967. of a 20-6 win over Atlanta. This outraged sportswriters and fans alike, so in
  968. 1973 the definition was changed yet again: a reliever had to work three
  969. innings or come in with the tying or winning run on base or at bat. This
  970. definition was relaxed yet again in 1975 so that the tying run could be on
  971. deck, thus giving the relief pitcher license to allow a baserunner. It was a
  972. good thing for statisticians when Dan Quisenberry surpassed John Hiller's 1973
  973. record of 38 saves by a decisive margin of 7. Today, of course, Bobby
  974. Thigpen's 1990 mark of 57 saves seems beyond challenge . . . but back in 1920
  975. so did Babe Ruth's 29 homers.
  976.      There was a blip in the relievers' trend of rising importance when the
  977. American League introduced the designated hitter in 1973. The predicted
  978. outcome, based on the first few years' experience of the DH, was: increased
  979. offensive production, no more need to pinch-hit for the pitcher, and thus a
  980. greater number of complete games and fewer saves. All those things did happen
  981. in 1973-76, although not quite to the degree expected--and soon the American
  982. League's use of relief pitchers became as extensive as it had been in the
  983. early 1970s. In 1982, despite the DH, American League starters completed only
  984. 19.6 percent of their games, an all-time league low (though still
  985. substantially higher than the National League, where CGs dropped below 15
  986. percent the last few years). In 1990 the AL and NL each logged complete games
  987. at about a 16 percent rate.
  988.      Relief Points is an improvement over saves, in all of its various
  989. incarnations including the one that provides a penalty for a blown save as
  990. well as for a defeat.
  991.      Some folks still long for a measure of middle-relief effectiveness, that
  992. statistical no-man's land. In April 1981 Sports Illustrated came up with an
  993. incredibly complicated series of tabulations to address these final
  994. injustices, and they were dazzling. However, the SI method dazzled in the
  995. same way that the Mills brothers' Player Win Average did--it was ingenious and
  996. well conceived, but involved too much work. Not only did it require
  997. play-by-play analysis, but it also reminded one (queasily) of the National
  998. Football League's quarterback-rating system. Quarterbacks are rated in four
  999. categories, variously weighted, to arrive at a number of "rating points."  Not
  1000. one fan in a thousand could tell you how the rating points are derived, and
  1001. the same holds for the SI relievers' formulas.
  1002.      The final relief statistic to be discussed is the one we think is the
  1003. best--Relief Ranking, which is a weighted variant of park-adjusted Relief Runs
  1004. (in the first edition of Total Baseball, we applied the measure to all
  1005. pitchers who averaged less than three innings per appearance, and this
  1006. resulted in some needless inclusions of pitchers who were primarily starters;
  1007. this time around we have broken out all pitchers' relief innings). Relief
  1008. Ranking tends to favor closers, while Relief Runs provides a good measure for
  1009. middle-relief outings. See the Relief Pitcher Register, a new feature in
  1010. this third edition of Total Baseball.
  1011.  
  1012.  
  1013. The Future
  1014.  
  1015.      The most exciting frontier for sabermetrics is in situational stats, the
  1016. type employed by Elias, Stats, Inc., and The BaseBall Workshop; as the years
  1017. go by and their data bases grow, the sampling sizes of the data will enlarge
  1018. and their figures for day vs. night, turf vs. grass, and so on, will be
  1019. statistically meaningful as well as statistically correct. Cross-era
  1020. comparison remains a subject of intense interest, and the debate over
  1021. average-player skill rages on. Fielding and relieving, as discussed, also
  1022. provide fertile ground for invention.
  1023.      Fantasy baseball aficionados seem caught up in the competition and
  1024. deal-making (as well as player evaluation), but some of the newsletters, such
  1025. as John Benson's, provide sound analysis and trend-spotting tips. It would not
  1026. be surprising if Rotisserie-type Leagues, rather than SABR, furnish the best
  1027. sabermetricians of the 1990s. See also, in the Appendix, Gary Gillette's
  1028. article, "Baseball, Computers, and New Statistics."
  1029.