home *** CD-ROM | disk | FTP | other *** search
/ Total Baseball (1994 Edition) / Total_Baseball_1994_Edition_Creative_Multimedia_1994.iso / dp / 0019 / 00190.txt next >
Text File  |  1994-02-14  |  113KB  |  1,614 lines

  1. $Unique_ID{BAS00190}
  2. $Pretitle{}
  3. $Title{Statistics:  Introduction}
  4. $Subtitle{}
  5. $Author{}
  6. $Subject{Registers Leaders Rosters Introduction statistic Statistics
  7. statistical stat stats Chadwick Origins Flowering Golden Computer Age
  8. Batting Base Stealing Fielding Pitching Errors Controversies Sources Missing
  9. Incomplete data}
  10. $Log{}
  11.  
  12. Total Baseball:  Registers, Leaders, and Rosters
  13.  
  14.  
  15. Statistics:  Introduction
  16.  
  17.  
  18. Part Two, the statistical section of Total Baseball, presents the record of
  19. major league contests played from 1871 through 1993--all 158,982 of them. It
  20. details the accomplishments of the game's 2,153 teams and 14,052 players more
  21. completely and more accurately than any other encyclopedic work; it applies to
  22. all of baseball's glorious past the "sabermetric" stats that fans first
  23. embraced in the 1980s; it introduces original measures of player performance.
  24. Yet for all its innovation, Total Baseball stands squarely in the tradition of
  25. baseball record keeping; it is--like each new spring of our national
  26. pastime--a link in a long, long chain. As the game of one hundred and fifty
  27. years ago lives on in the game of today, so is this volume enriched by the
  28. labors of statisticians from Henry Chadwick to Ernie Lanigan, from S.C.
  29. Thompson to David Neft to Bill James.
  30.  
  31. The Origins, 1845-1875
  32.  
  33.      In fact, baseball and stats were a tandem from the outset of the game's
  34. history, as the editors of this volume first discussed in their earlier Hidden
  35. Game of Baseball (1984), from which portions of this introduction are adapted.
  36. The first box score appeared in the New York Morning News on October 22, 1845,
  37. just a month after Alexander Cartwright and his Knickerbocker teammates
  38. codified the first set of rules. Why did these early players and scribes
  39. measure individual performance rather than simply count the score? In part to
  40. imitate the custom of cricket; yet the larger explanation is that the numbers
  41. served to legitimize men's concern with a boys' pastime. The pioneers of
  42. baseball reporting--William Cauldwell of the Sunday Mercury, William Porter of
  43. Spirit of the Times, the unknown annalist at the News, and later Henry
  44. Chadwick--may indeed have reflected that if they did not cloak the game in the
  45. "importance" of statistics, it might not seem worthwhile for adults to read
  46. about, let alone play. Statistics elevated baseball from other boys' field
  47. games of the 1840s and '50s to make it somehow "serious", like business; its
  48. essential simplicity was adorned with intricate detail that suited it
  49. perfectly to quantification.
  50.      In the development of baseball statistics, no man is more important than
  51. Father Chadwick. Born in England in 1824, he came to these shores at age
  52. thirteen steeped in the tradition of cricket. In his teens he played the
  53. English game and in his twenties he reported on it for a variety of
  54. newspapers, including the Long Island Star and the New York Times. In the
  55. early 1840s, before the Knickerbocker rules eliminated the practice of
  56. retiring a base runner by throwing the ball at him rather than to the base,
  57. Chadwick occasionally played baseball too, but he was not favorably impressed,
  58. having received "some hard hits in the ribs."  Not until 1856, by which time
  59. he had been a cricket reporter for a decade, were Chadwick's eyes opened to
  60. the possibilities in the American game, which had improved dramatically since
  61. his youth. In 1868 he recalled, "On returning from the early close of a
  62. cricket match on Fox Hill, I chanced to go through the Elysian Fields during
  63. the progress of a contest between the noted Eagle and Gotham clubs. The game
  64. was being sharply played on both sides, and I watched it with deeper interest
  65. than any previous ball game between clubs that I had seen. It was not long
  66. before I was struck with the idea that baseball was just the game for a
  67. national sport for Americans . . . as much so as cricket in England. At the
  68. time I refer to I had been reporting cricket for years, and, in my method of
  69. taking notes of contests, I had a plan peculiarly my own. It was not long,
  70. therefore, after I had become interested in baseball, before I began to invent
  71. a method of giving detailed reports of leading contests at baseball . . ."
  72.      Thus Chadwick's cricket background was largely the impetus to his method
  73. of scoring a baseball game, the format of his early box scores, and the
  74. copious if primitive statistics that appeared in his year-end summaries in the
  75. New York Clipper, Beadle's Dime Base-Ball Player, and other publications.
  76.      Actually, cricket had begun to shape baseball statistics even before
  77. Chadwick's conversion. The first box score reported on two categories, outs
  78. and runs: outs, or "hands out," counted both unsuccessful times at bat and
  79. outs run into on the basepaths; "runs" were runs scored, not those driven in.
  80. The reason for not recording hits in the early years, when coverage of
  81. baseball matches appeared alongside that of cricket matches, was that, unlike
  82. baseball, cricket had no such category as the successful hit which did not
  83. produce a run. To reach "base" in cricket is to run to the opposite wicket,
  84. which tallies a run; if you hit the ball and do not score a run, you have been
  85. put out.
  86.      Cricket box scores were virtual play-by-plays, a fact made possible by
  87. the lesser number of possible events. This play-by-play aspect was applied to
  88. a baseball box score as early as 1856; interestingly, despite the abundance of
  89. detail, hits were not accounted, nor did they appear in Chadwick's own box
  90. scores until 1867. The batting champion as declared by Chadwick, whose
  91. computations were immediately and universally accepted as "official," was the
  92. man with the highest average of runs per game. An inverse though imprecise
  93. measure of batting quality was outs per game. After 1863, when a fair ball
  94. caught on one bounce was no longer an out, fielding leaders were those with
  95. the greatest total of fly catches, assists, and "foul bounds" (fouls caught on
  96. one bounce). Pitching effectiveness was based purely on control, with the
  97. leader recognized as the one whose delivery offered the most opportunities for
  98. outs at first base and led to the fewest passed balls.
  99.      In a sense, Chadwick's measuring of baseball as if it were cricket can be
  100. viewed as correct in that when you strip the game to its basic elements, those
  101. that determine victory or defeat, outs and runs are all that count in the end.
  102. No individual statistic is meaningful to the team unless it relates directly
  103. to the scoring of runs. Chadwick's blind spot in his early years of baseball
  104. reporting lay in not recognizing the linear character of the game, the
  105. sequential nature whereby a string of base hits or men reaching base on error
  106. (there were no walks then) was necessary in most cases to produce a run. In
  107. cricket each successful hit must produce at least one run, while in baseball,
  108. more of a team game on offense, a successful hit may produce none.
  109.      Early player stats were of the most primitive kind, the counting kind.
  110. They'd tell you how many runs, or outs, or fly catches had occurred--later,
  111. how many hits or total bases. Counting is the most basic of all statistical
  112. processes; the next step up is averaging, and Chadwick was the first to put
  113. this into practice.
  114.      As professionalism infiltrated the game, teams began to bid for
  115. star-caliber players. Stars were known not by their stats but by their style
  116. until 1865, when Chadwick began to record in the Clipper a form of batting
  117. average taken from the cricket pages--runs per game. Two years later, in his
  118. newly founded baseball weekly, The Ball Players' Chronicle, he began to record
  119. not only average runs and outs per game, but also home runs, total bases,
  120. total bases per game--and hits per game. The averages were expressed not with
  121. decimal places but in the standard cricket format of the "average and over."
  122. Thus a batter with 23 hits in 6 games would have an average expressed not as
  123. 3.83 but as "3-5"--an average of 3 with an overage, or remainder, of 5.
  124. Another innovation was to remove from the individual accounting all bases
  125. gained through errors. Runs scored by a team, beginning in 1867, were divided
  126. between those scored after a man reached base on a clean hit and those arising
  127. from a runner's having reached base on an error. This was, of course, a
  128. precursor of today's earned run average.
  129.      In 1868, despite Chadwick's derision, the Clipper continued to award the
  130. prize for the batting championship to the player with the greatest average of
  131. runs per game. Actually, the old yardstick had been less preposterous a
  132. measure of batsmanship than one might imagine today, because team defense was
  133. so much poorer and the pitcher, with severe restrictions on his method of
  134. delivery, was so much less important. If you reached first base, whether by a
  135. hit or by an error, your chances of scoring were excellent; indeed, teams of
  136. the mid-1860s registered more runs than hits!  By 1876, the caliber of both
  137. pitching and defense had improved to the extent that the ratio of runs to hits
  138. was about 6.5 to 10; today the ratio stands at roughly 5 to 10.
  139.      By the end of the decade Chadwick was recording total bases and home
  140. runs, but he placed little stock in either, as conscious attempts at slugging
  141. violated his cricket-bred image of "form". Just as cricket aficionados watch
  142. the game for the many opportunities for fine fielding it affords, so was
  143. baseball from its inception perceived as a fielders' sport. The original
  144. Cartwright rules of 1845, in fact, specified that a ball hit out of the
  145. field--in fair territory or foul--was a foul ball!  "Long hits are showy,"
  146. Chadwick wrote in the Clipper in 1868, "but they do not pay in the long run.
  147. Sharp grounders insuring the first-base certain, and sometimes the second-base
  148. easily, are worth all the hits made for home-runs which players strive for."
  149.      Chadwick prevailed, and hits per game became the criterion for the
  150. Clipper batting championship and remained so until 1876, when the problem with
  151. using games as the denominator in the average at last became clear. If you
  152. were playing for a successful team, and thus were surrounded by good batters,
  153. or if your team played several weak rivals who committed many errors, the
  154. number of at-bats for each individual in that lineup would increase. The more
  155. at-bats one is granted in a game, the more hits one is likely to have. So, for
  156. example, if Player A had 10 at-bats in a game, which was not so unusual in the
  157. 1860s, he might have 4 base hits. In a more cleanly played game, Player B
  158. might bat only 6 times, and get 3 base hits. Yet Player A, with his 4-for-10,
  159. would achieve an average of 4.00; the average of Player B, who went 3-for-6,
  160. would be only 3.00. By modern standards, of course, Player A would be batting
  161. .400 while Player B would be batting .500.
  162.      In short, the batting average used in the 1860s is the same as that used
  163. today except in its denominator, with at-bats replacing games. Moreover,
  164. Chadwick created a measure in the 1860s that divided total bases by games
  165. played; change the denominator to at-bats and you have today's slugging
  166. average--which, incidentally, was not accepted by the National League as an
  167. official statistic until 1923 and by the American until 1946 (baseball was
  168. born and bred conservative).
  169.      Chadwick's "total bases average" represents the game's first attempt at a
  170. weighted average--an average in which the elements collected together in the
  171. numerator or the denominator are recognized numerically as being unequal. In
  172. this instance, a single is the unweighted unit, the double is weighted by a
  173. factor of two, the triple by three, and the home run by four. Statistically,
  174. this is a distinct leap forward from, first, counting, and next, averaging.
  175. The weighted average is in fact the cornerstone of today's statistical
  176. innovations, or "sabermetrics."
  177.      The 1870s gave rise to some new batting stats and to the first attempt to
  178. quantify thoroughly the other principal facets of the game, pitching and
  179. fielding. Although the Clipper recorded base hits and total bases as early as
  180. 1868, a significant wrinkle was added in 1870 when at-bats were listed as
  181. well. This was a critical introduction because it permitted the improvement of
  182. the batting average, first introduced in its current form by H.A. Dobson of
  183. Washington, D.C., in the Dime Base-Ball Player of 1872, and first computed
  184. officially--that is, for the National League--in 1876. Since then the batting
  185. average has not changed, except for 1876, when bases on balls were figured as
  186. outs, and 1887, when they were counted as hits. Total Baseball counts a walk
  187. as neither an at-bat nor an out for all years since 1871.
  188.      The objections to the batting average are well known, but to date have
  189. not dislodged it from its place as the most popular measure of hitting
  190. ability. First of all, the batting average makes no distinction between the
  191. single, the double, the triple, and the home run, treating all as the same
  192. unit. This objection had been addressed in 1868 by Chadwick's total bases
  193. average.
  194.      Second, it gives no indication of the effect of that base hit--that is,
  195. its value to the team. This was the reason Chadwick clung to runs per game as
  196. the best possible batting measure. Third, the batting average does not take
  197. into account those occasions when first base is reached via a walk, hit by
  198. pitch, or error. This last point was addressed at a surprisingly early date,
  199. too, as for 1879 the National League adopted as an official statistic a
  200. forerunner of the on-base percentage; it was called "reached first base,"
  201. which included times reached by error as well as base on balls and base hits.
  202. (Being hit by a pitch did not give the batter first base until 1884 in the
  203. American Association, 1887 in the National League.)
  204.  
  205. The Flowering, 1876-1920
  206.  
  207.      Ever since the Civil War, serial guides like Beadle and DeWitt and
  208. sporting columns like those in the Clipper had carried year-end tabulations of
  209. batting, fielding, and pitching exploits, varying from year to year with the
  210. brainstorms of Chadwick or other demon compilers like New York's M.J. Kelly or
  211. Philadelphia's Al Wright. But the year 1876 was special. It was significant
  212. not only for the founding of the National League and the official debut of the
  213. batting average in its current form, it was also the Centennial of the United
  214. States, which was marked by a giant exposition in Philadelphia celebrating the
  215. mechanical marvels of the day. American ingenuity reigned, and technology was
  216. seen as the new handmaiden of democracy. Baseball, that mirror of American
  217. life, reflected the fervor for things scientific with an explosion of
  218. statistics far more complex than those seen before, particularly in the
  219. previously neglected areas of pitching and fielding. The increasingly minute
  220. statistical examination of the game met a responsive audience, one primed to
  221. view complexity as a measure of worth.
  222.      The crossroads year of 1876 highlights how the game had changed to that
  223. point, as well as how it has changed since.
  224.      In that year, the number of offensive stats tabulated at season's end in
  225. any of the publications inspired by Chadwick or Spalding was six: games,
  226. at-bats, runs, hits, runs per game, and batting average. (And as with all the
  227. various guides until 1941, the stats of men who played in fewer than a
  228. specified minimum number of games were not noted.)  Of these six, only runs
  229. and runs per game were common in the 1860s, while that decade's tabulation of
  230. total bases vanished. The number of offensive stats a hundred years later?
  231. Twenty. (Today the number is twenty-one, with the addition of on base
  232. percentage).
  233.      The number of pitching categories in 1876 was eleven, and there were some
  234. surprises, such as earned run average, hits allowed, hits per game, and
  235. opponents' batting average. Strikeouts were not recorded, for Chadwick saw
  236. them strictly as a sign of poor batting rather than good pitching (his view
  237. had such an impact that pitcher strikeouts were not kept officially until
  238. 1889). The number of pitching stats today? Twenty-four.
  239.      The number of fielding categories in 1876 was six. One hundred years
  240. later it was still six (with the exception of the catcher, who gets a seventh:
  241. passed balls), dramatizing how the game, which originated as a showcase for
  242. fielders, had changed. The fielding stats of 1876 lumped "battery errors" with
  243. fielding errors, so that wild pitches and passed balls--in some years, even
  244. walks--diminished one's fielding percentage. This practice continued until
  245. 1887, but in Total Baseball battery errors are not included in fielding stats.
  246. Battery-mates' fielding stats were boosted by the awarding of an assist to the
  247. pitcher on strikeouts. This practice lasted until 1889, but is not reflected
  248. in Total Baseball.
  249.      The custom in 1876, as it is now, was to combine putouts, assists, and
  250. errors to form a "percentage of chances accepted," or what is today known as
  251. fielding average or fielding percentage. A "missing link" variant, devised by
  252. Al Wright in 1875, was to form averages by dividing the putouts by the number
  253. of games to yield a "putout average"; dividing the assists similarly to arrive
  254. at an "assist average"; and dividing putouts plus assists by games to get
  255. "fielding average."  These averages took no account of errors. (Wright's
  256. "fielding average" was reborn a century later as Bill James' Range Factor.)
  257.      The public's appetite for new statistics was not sated by the outburst of
  258. 1876. New measures were introduced in dizzying profusion in the remaining
  259. years of the century. Some of these did not catch on and were soon dropped for
  260. all time, like the ridiculous "total bases run," while others fizzled only to
  261. reappear with new vigor in the twentieth century. These include (a) the
  262. above-mentioned "reached first base," which resurfaced in the early 1950s in
  263. an unofficial, improved form called on base percentage and became an official
  264. stat more than thirty years later, and (b) an 1860s stat, earned run average,
  265. which was periodically revived before dropping from sight in the 1880s, only
  266. to return triumphant to the NL in 1912 and the AL in 1913. In 1913 Ban Johnson
  267. not only proclaimed the ERA official but became so enamored with it that he
  268. also instructed American League scorers to compile no official won-lost
  269. records (this state of affairs lasted for seven years, 1913-1919).
  270.      Another stat that was "sent back to the minors" before its eventual
  271. adoption as an official stat in 1920 was the run batted in. Introduced by a
  272. Buffalo newspaper in 1879, the stat was picked up the following year by the
  273. Chicago Tribune and even became an official NL stat for the opening months of
  274. 1891. By season's end it had faded as most NL scorers declined to account for
  275. it in their summaries (The American Association, however, recorded it all year
  276. long.)  Ernie Lanigan picked up the RBI baton with his reports to the New York
  277. Press in 1907, but only about a third of his data has been found, and he did
  278. not figure RBIs for men who played in fewer than ten games, or club totals for
  279. traded players. For Total Baseball we have placed much reliance upon the
  280. source material donated by Information Concepts, Inc. (ICI) to the National
  281. Baseball Library in Cooperstown following publication of its Baseball
  282. Encyclopedia for Macmillan in 1969. David Neft also kindly supplied us with
  283. his unpublished RBI data for the previously missing National League seasons of
  284. 1880-1885. The John Tattersall collection of nineteenth century game accounts
  285. and box scores was valuable as well.
  286.      Other statistics introduced officially before the turn of the century
  287. were stolen bases (though not caught stealing); doubles, triples, and homers;
  288. and sacrifice bunts (though an at-bat was charged from 1889 through 1893).
  289. Pitcher strikeouts, bases on balls, and the hit-by-pitch also appeared before
  290. 1900, but hit-by-pitch stats were not kept for batters on a systematic basis
  291. until 1917 in the NL and 1920 in the AL. Through newspaper research, we have
  292. filled in HBP data from 1884 through 1916 in the National League, Players
  293. League, and American Association, from 1901 through 1919 in the American
  294. League, and the 1914-1915 Federal League.
  295.      Hit into double play--including line outs as well as groundouts--was
  296. recorded erratically in the nineteenth century, but separate stats for
  297. groundouts into double plays have been kept by the leagues only since 1933 in
  298. the NL and 1939 in the AL. Batters' strikeouts were reported unofficially in
  299. 1891, but not as a league stat until 1910 in the NL and 1913 in the AL.
  300. Innings pitched were not kept until 1908 in the AL and 1903 in the NL.
  301.      Stolen bases were awarded not only for clean steals but also for extra
  302. bases taken through daring, from the first year in which totals were kept,
  303. 1886, until 1898 (the Macmillan Baseball Encyclopedia begins its record of
  304. stolen bases with 1887). Because the figures reported in the guides were
  305. grossly inflated (such as Harry Stovey's ostensible 156 steals in 1888), the
  306. figures in Total Baseball reflect game-by-game research and refiguring.
  307. Caught-stealing (CS) figures are available on a very sketchy basis in some of
  308. the later years of the century, as some newspapers carried the data in the box
  309. scores of hometown games. From 1912 on, Lanigan recorded CS in box scores of
  310. the New York Press, but the leagues did not keep the figure officially until
  311. 1920. The AL has tabulated CS from that year to the present, excepting 1927,
  312. which members of the Society for American Baseball Research reconstructed from
  313. newspaper box scores. National League caught-stealing data exists for
  314. 1920-1925, and for 1951 to the present.
  315.      The new century added little in the way of new official statistics--ERA,
  316. RBI, and slugging average are better regarded as revivals despite their
  317. respective adoption dates of 1912, 1920, and 1923. But back in 1908 there was
  318. a classic case of a statistic rushing in to fill a void, as Phillies' manager
  319. Billy Murray observed that his outfielder Sherry Magee had the happy facility
  320. of providing a long fly ball whenever presented with a situation of a man on
  321. third and fewer than two outs. Taking up the cudgels on his player's behalf,
  322. Murray protested to the National League office that it was unfair to charge
  323. Magee with an unsuccessful time at bat when he was in fact succeeding, doing
  324. precisely what the situation demanded.
  325.      Murray won his point, but baseball flip-flopped a couple of times on this
  326. stat, in some years reverting to calling it a time at bat, in other years not
  327. even crediting an RBI. The sacrifice-fly rule was in effect from 1908 through
  328. 1930, with a sacrifice being given for advancing any runner, not just to home,
  329. for the final four years of this period. The rule was revived for one year in
  330. 1939. In none of these years was a distinction made between a sacrifice bunt
  331. or fly. When the rule came back into force in 1954, there was a breakdown of
  332. each.
  333.      More recent stats that have followed from this sort of perception--that
  334. something important was occurring on the field which had no verifiable reality
  335. because it was not yet being measured--are the save and the late, lamented
  336. game-winning RBI, which will be discussed later.
  337.      A signal event took place in 1912: the publication by Baseball Magazine
  338. editor John Lawres of Who's Who in Baseball, a small book that became the
  339. first to provide career statistics and personal facts for a group of players.
  340. Although thoroughly inadequate by today's standards--its only tabulations were
  341. games, batting average, and fielding average (even for pitchers, who were
  342. given no mound records!)--Who's Who was a groundbreaking work, giving rise to
  343. a much-expanded format in 1916 and inspiring two other significant
  344. encyclopedic works: in 1914, George Moreland's self-published opus called
  345. Balldom (grandiosely subtitled "The Britannica of Baseball," which it surely
  346. wasn't), and Ernest J. Lanigan's Baseball Cyclopedia, also sponsored by
  347. Baseball Magazine, which debuted in 1922 and was updated annually through
  348. 1933.
  349.  
  350. The Golden Age, 1920-1968
  351.  
  352.      There have been other new statistical tabulations in this century, but
  353. generally of the counting sort: complete games (NL 1910, AL 1922), games
  354. started (AL 1926, NL 1938), games finished (NL 1920, AL 1926). And there were
  355. sacrifice bunts allowed (NL 1916, AL 1922), intentional bases on balls (only
  356. since 1955), and, in the next period, saves (1969) and game-winning RBIs
  357. (1980). The only new average since slugging average was adopted in 1923 has
  358. been the on base percentage, adopted in 1985. The ICI group computed saves for
  359. prior years. Another such stat that failed to survive, alas, was stolen bases
  360. off pitchers, which the American League recorded only in 1920-1924; it has
  361. been recorded on an unofficial basis in the 1980s by the Elias Sports Bureau
  362. and Project Scoresheet. The only new fielding measure was team double plays,
  363. added to the AL list in 1912 and the NL in 1919. Other new and more
  364. interesting stats appeared in the 1940s and '50s but have not yet gained the
  365. official stamp of approval, such as Ted Oliver's Weighted Rating System,
  366. Alfred P. Berry's Average Bases Allowed (opponents' slugging average), and
  367. Branch Rickey and Allan Roth's Isolated Power.
  368.      This period of baseball's history may have fielded its most dazzling
  369. array of stars, but strategically and statistically it was pretty dim. There
  370. was some excitement, however, in baseball record keeping. First came
  371. Daguerreotypes, issued by The Sporting News in 1934, featuring the playing
  372. records of many retired players both celebrated and obscure; most if not all
  373. of these statistical and biographical profiles originally appeared in the
  374. pages of TSN. Although its number of statistical categories was fewer than one
  375. might have wished, Daguerreotypes was very useful and, through its several
  376. editions ably edited by Paul MacFarlane, long-lived.
  377.      In 1940 came The Sporting News' Baseball Register, which supplied full
  378. records for active players, managers, coaches, and umpires, plus a grab bag of
  379. former stars. Since the expansion of the major leagues from sixteen teams to
  380. twenty-six, the Register has only accommodated contemporary players and
  381. managers, but it remains a valuable source. One year later, TSN issued a
  382. notable edition of its Official Baseball Record Book, giving for the first
  383. time full statistical lines for all men who played in a major league game the
  384. previous year.
  385.      In 1944 a little-known man named Ted Oliver published in obscurity a
  386. booklet called Kings of the Mound. It introduced a new stat called the
  387. Weighted Rating System for pitchers, a stat that we modified and continue to
  388. employ as Wins Above Team. Moved by the inadequacy of both the won-lost
  389. percentage and the ERA to reflect the value of a decent pitcher laboring for a
  390. lousy club, Oliver ingeniously subtracted the pitcher's decisions from his
  391. team's, then took the difference between the pitcher's won-lost percentage and
  392. his team's and multiplied that difference by the pitcher's number of
  393. decisions. Although his concept and his math were flawed, his
  394. principles--viewing a pitcher's record in relation to his team and weighting
  395. the result of his calculation by the number of decisions--were of unparalleled
  396. sophistication for the time. (Oliver's formula for his Weighted Rating System
  397. and its modification in Total Baseball are detailed in the Glossary, as are
  398. the calculations behind every statistic employed in this book.)
  399.      Then in 1951 came the first true encyclopedia of baseball, the claims of
  400. Moreland and Lanigan notwithstanding. Compiled by Hy Turkin and S.C. Thompson,
  401. The Official Encyclopedia of Baseball was published by the A.S. Barnes
  402. Company. Its 620 pages contained a wealth of features such as manager and
  403. umpire rosters, historical essays, playing tips, a bibliography, and much
  404. more. But the heart of the volume and the key to its subsequent success was a
  405. register of nearly nine thousand men who played one or more games at the major
  406. league level from 1871 through 1949 (the 1950 record of players appearing in
  407. ten games or more was tacked on to the end). In this register, Turkin/
  408. Thompson also offered birth and death data and what today seems fairly limited
  409. statistical information but by previous standards was a veritable cornucopia:
  410. year, club, league, position, games, and batting average or won-lost record. A
  411. landmark volume that did much to inspire this one, The Official Encyclopedia
  412. of Baseball lasted through ten revised editions, the last being published in
  413. 1979, ten years after the initial appearance of Macmillan's Baseball
  414. Encyclopedia.
  415.      The genesis of the Turkin/Thompson opus was one day in September 1944
  416. when musician Thompson invited his neighbor, New York Daily News sportswriter
  417. Turkin, to "look over his baseball collection."  What Turkin saw was a massive
  418. treasure chest of data, collected and collated over twenty years. "Tommy"
  419. Thompson was a baseball nut--a figure filbert, in the parlance of the
  420. time--who researched baseball just for the love of it. He was not alone in
  421. this pursuit, although very nearly so--other baseball archaeologists of the
  422. time who contributed to this encyclopedia were Frank Marcellus, Tom Shea, Lee
  423. Allen, Ralph Lin Weber, Joe Overfield, Bob McConnell, and the aforementioned
  424. Ernie Lanigan.
  425.      The Official Encyclopedia of Baseball went a long way toward making the
  426. study of baseball history and records a respectable pursuit, just as a century
  427. earlier the statistical accounting of a boys' game had helped to make baseball
  428. a sport for grown men. The researchers' ranks expanded to include such men as
  429. Bob Davids, who in 1971, aided by other experts like Cliff Kachline, Bill
  430. Haber, Ray Nemec, John Pardon, and Joe Simenic, would create SABR, the Society
  431. for American Baseball Research (pronounced "saber"). Formerly the lonely
  432. pursuit of a handful of "nuts" like S.C. Thompson, baseball research and
  433. sabermetrics--a neologism coined in honor of SABR, signifying the statistical
  434. analysis of the game's records--would become the pastime of thousands.
  435.      An article in Life magazine by Branch Rickey on August 2, 1954, gave
  436. further impetus to the study of baseball statistics, but not just to set the
  437. historical record straight. Indeed, this article may be viewed as the opening
  438. shot of the sabermetric assault of the 1980s. In "Goodby to Some Old Baseball
  439. Ideas," Rickey, with the aid of some new mathematical tools supplied by Dodger
  440. statistician Allan Roth, sought to puncture some long-held conceptions about
  441. how the game was divided among its elements (batting, baserunning, pitching,
  442. fielding), who was best at playing it, and what caused one team to win and
  443. another to lose. This is a pretty fair statement of what sabermetrics is
  444. about.
  445.      Rickey attacked the batting average and proposed in its place the on base
  446. percentage; advocated the use of Isolated Power (extra bases beyond singles,
  447. divided by at-bats) as a better measure than slugging average; introduced a
  448. "clutch" measure of run-scoring efficiency for teams, and a similar concept
  449. for pitchers (earned runs divided by baserunners allowed); reaffirmed the
  450. basic validity of the ERA; saw the strikeout as the insubstantial thing it
  451. was--and more. But the most important thing Rickey did for baseball statistics
  452. was to pull it back from the wrong path it had taken with the introduction of
  453. the batting average in 1876: to strip the game and its stats to their
  454. essentials and start again, this time remembering that individual stats came
  455. into being as an attempt to apportion the players' contributions to achieving
  456. a team victory, for that is what the game is about.
  457.      Rickey and Roth devised a formula to measure a team's efficiency in
  458. turning its offensive and defensive statistics into runs, and thus wins. They
  459. realized, and had confirmed for them by mathematicians at the Massachusetts
  460. Institute of Technology, that just as the team which scores more runs in a
  461. game gets the win, so a team which over the course of a season scores more
  462. runs than it allows should win more games than it loses--and by an extent
  463. correlated to its run differential. From this startlingly simple (or rather,
  464. seemingly simple) observation in 1954 flowed: first, the trailblazing but
  465. little noted work of George Lindsey in the 1950s and early 1960s, when he
  466. developed a model for run-scoring probability from the twenty-four
  467. combinations of outs and bases occupied; the development of "percentage
  468. baseball" stats and strategies by Earnshaw Cook in the 1960s; the play-by-play
  469. analysis of complete seasons by the Mills brothers, Eldon and Harlan, in
  470. 1969-1970; and, over the next two decades, the statistical and historical
  471. works of several sabermetricians, most notably Bill James.
  472.  
  473. The Computer Age, 1969-
  474.  
  475.      Despite the death of Turkin in 1957 and Thompson ten years later, their
  476. Official Encyclopedia of Baseball remained the dominant book of baseball
  477. statistics, although many fans were frustrated with the fragmentary records it
  478. presented. As Frank V. Phelps wrote in the 1987 edition of The National
  479. Pastime, "Gaps and obvious errors in official averages, the lack of many early
  480. records, difficulty in securing the records of players who appeared in only a
  481. few games, and frustrating discrepancies among existing guides and registers
  482. had long since created a desire for an ultimate, complete, correct set of
  483. major league records. But it wasn't until the mid-1960s that the development
  484. of sophisticated computers which could absorb, retain, order, and output huge
  485. amounts of data finally made a project feasible."
  486.      Beginning in 1967, a battalion of researchers commanded by David Neft
  487. foraged through the official records and newspaper box scores to provide
  488. freshly compiled figures for those who had no ERAs, RBIs, slugging averages,
  489. saves, and all manner of wonderful things. The material which finally appeared
  490. in the tome was entered into a data bank, and the book was the first typeset
  491. entirely by computer, now a common practice. Published in 1969, The Baseball
  492. Encyclopedia was a milestone in computer technology, but as indispensable as
  493. the computer were the old-fashioned scrapbooks and files of Lee Allen and John
  494. Tattersall. The result was a mammoth ledger book of the major leagues more
  495. thorough than any that had appeared before.
  496.      The Baseball Encyclopedia researchers not only found new data to correct
  497. old inaccuracies but also applied new yardsticks to men who had gone to their
  498. graves never having heard of an RBI or a save. They also raised the hackles of
  499. traditionalists with many of their findings, which prompted the formation of a
  500. Special Baseball Records Committee. Its members ruled upon such matters as
  501. whether, for the historical record, bases on balls should be counted as hits
  502. (as they were in 1887), outs (as they were in 1876), or neither (as has been
  503. the practice in all other years); or whether "sudden-death" home
  504. runs--thirty-seven game-winning blows with men on base that they identified as
  505. having occurred in the bottom half of the ninth or extra inning--would be
  506. credited as homers or, in the practice before 1920, would count for only as
  507. many bases as needed to push across the winning run. In the latter
  508. controversy, committee members first decided to count the disputed blows as
  509. homers, but then, when complaints arose that Babe Ruth's famous total of 714
  510. would change to 715, they reversed themselves. They decided that the National
  511. Association of 1871-1875 was not a major league, while the Federal League,
  512. Union Association, and Players League were; and they ruled on several other
  513. issues, all of which were published in the Appendix to The Baseball
  514. Encyclopedia.
  515.      In Total Baseball, we have abided by most of the committee's
  516. decisions--not to preserve Ruth's total, but because there were many more such
  517. homers before 1920 than the thirty-seven the committee identified, and the
  518. disputes surrounding some of them are now beyond settling. We have, however,
  519. treated the National Association as a major league, as Turkin/ Thompson and
  520. all previous record books did, and in accordance with the views of most
  521. historians. And we have differed from the committee's ruling on awarding
  522. pitchers wins and losses in the years before 1920. Not finding any official
  523. scoring rule or practice for that time, they chose to apply 1950 guidelines to
  524. decisions awarded in 1876-1920. This well-intentioned decision produced
  525. substantial alterations in the records of such hurlers as Cy Young, Christy
  526. Mathewson, Grover Alexander, and others. In the ensuing years, the notable
  527. research of Frank Williams (reported in "All the Record Books Are Wrong," The
  528. National Pastime, 1982) revealed that there was indeed a pattern and a
  529. rationale for the way decisions were awarded in those days; the data in Total
  530. Baseball conforms with his findings.
  531.      ICI research created new stars, launching several previously
  532. underappreciated heroes of old into the Hall of Fame. Sam Thompson, Addie
  533. Joss, Roger Connor, Amos Rusie--their phenomenal level of play was hidden
  534. simply because statisticians back then were not recording the particular
  535. numbers which would show them off to best advantage. If sabermetrics consists
  536. of finding things in the existing data that were not seen before, or
  537. collecting that data which makes possible the application of new statistics to
  538. old performances, the first edition of The Baseball Encyclopedia was a
  539. monument in the course of sabermetrics.
  540.      However, its subsequent editions declined from that standard, dropping
  541. valuable data, jimmying figures for star players in a misguided homage to
  542. tradition, and making a shambles of individual/team balance in the totals. As
  543. Phelps wrote of the second edition, edited by Joseph L. Reichler for the
  544. Macmillan Company after the ICI group broke up and relinquished supervision:
  545.      "Players' batting statistics were changed without compensating for
  546. changes in the records of other players on the same teams or in the
  547. corresponding team and league totals. Later editions included even more
  548. unbalanced adjustments . . .
  549.      "Quite apart from the problem of record-balancing, the numerous changes
  550. in players' totals and averages has caused serious misapprehensions and
  551. confusions for fans, writers, and researchers. The records of Fred Clarke and
  552. Cy Young differ in all six editions [to 1987] even without counting Clarke's
  553. astronomical 1899 BA [in the third edition, Clarke was credited with a batting
  554. average of .986 that boosted his lifetime mark by 15 points]. The figures for
  555. Burkett, Chesbro, Duffy, Hornsby, Walter Johnson, Radbourn, Speaker, and
  556. Waddell differ in five of the six books. The same is so in four of six for at
  557. least twenty-three other Hall of Famers, and many more less gifted players."
  558. The seventh edition was issued in 1988 and, like the five that preceded it,
  559. was less accurate than the classic first issue. The eighth edition, published
  560. in 1990, corrected many of the errors in the seventh but--perhaps because of
  561. its marketing link with Major League Baseball--retained many once-contested
  562. errors that historians had long since expunged from the record, while changing
  563. other statistics in a manner at variance with Major League Baseball's wishes.
  564. For the ninth edition, MLB withdrew its product endorsement. (David Neft of
  565. ICI, along with Baseball Encyclopedia staff alumni Dick Cohen and Jordan
  566. Deutsch, went on to form Sport Products, Inc. Since 1974 they have issued the
  567. excellent Sports Encyclopedia: Baseball, which has endured as the baseball
  568. reference of choice for thousands of sophisticated fans.)
  569.      We will have more to add about accuracy and balance in the "Errors and
  570. Controversies" section of this Introduction.
  571.      There were two other interesting developments in 1969. The first and less
  572. celebrated was a research project launched by Eldon and Harlan Mills that,
  573. like the ICI encyclopedia, could not have been contemplated without the
  574. computer. The Mills brothers tracked the entire major league seasons of 1969
  575. and 1970 on a play-by-play basis. Then they applied to that record the
  576. probabilities of winning which derived from each possible outcome of a plate
  577. appearance, as determined by a computer simulation incorporating nearly eight
  578. thousand possibilities. What, for example, was the visiting team's chance of
  579. winning the game before the first pitch was thrown? Fifty percent, if we are
  580. pitting two theoretical teams of equal or unknown ability on a neutral site.
  581. If the first man fails to get on base, the chances of the visiting team
  582. winning are reduced to 49.8 percent; should he hit a double, the visiting
  583. team's chance of victory is raised to 55.9 percent, as determined by the
  584. probabilistic simulation. Every possible situation--combining half inning,
  585. score, men on base, and men out--was tested by the simulator to arrive at "Win
  586. Points."
  587.      The Millses' purpose was to determine the clutch value of, say, hitting a
  588. homer with two men on and one man out in the bottom of the ninth, with the
  589. team trailing by two runs, the situation Bobby Thomson faced in the climactic
  590. National League game of 1951--oddly, the rookie year of the first modern
  591. computer. (It gained for him 1,472 Win Points; had it come with no one on in
  592. the eighth inning of a game in which his team led 4-0, the homer would have
  593. been worth only 12 Win Points.)  What the Mills brothers were attempting to do
  594. was to evaluate not only the what of a performance, which traditional
  595. statistics indicate, but the when, or clutch factor, which no statistic to
  596. that time could provide.
  597.      This project, detailed in a small book issued in 1970 called Player Win
  598. Averages, proceeded from the same impulse that led to other measures of clutch
  599. performance: the game winning RBI, introduced as an official major league stat
  600. in 1980 and scrapped in 1989; the measure of batting performance in
  601. late-inning pressure situations first published by Seymour Siwoff, Steve
  602. Hirdt, and Peter Hirdt of the Elias Sports Bureau in 1985; and the
  603. historically complete indexes of clutch hitting and clutch pitching developed
  604. for this book.
  605.      The other noteworthy baseball event of 1969 (besides the centennial of
  606. professional baseball and the miracle of the Mets) was the adoption by the
  607. major leagues of the save, the stat associated with the most significant
  608. strategic development since the advent of the gopher ball. Now shown in the
  609. papers on a daily basis, saves were not officially recorded at all until 1960;
  610. it was at the instigation of Jerry Holtzman of the Chicago Sun-Times, with the
  611. cooperation of The Sporting News, that this statistic was finally accepted.
  612. (Although Pat McDonough, a founding member of SABR, had developed a similar
  613. stat in 1924 which he called "games finished by relief hurlers"; its first
  614. appearance in print came in the New York Telegram three years later.) The need
  615. for the save arose because relievers operated at a disadvantage when it came
  616. to picking up wins. The bullpen specialists were a new breed, and as their
  617. role increased, the need arose to identify excellence, as it had long ago for
  618. batters, starting pitchers, and fielders. The save's prime statistical
  619. drawback is that there is no negative to counteract the positive, no stat for
  620. saves blown (except, all too often, a victory for the "fireman"); unofficial
  621. attempts to develop such a stat have accelerated in recent years, and now are
  622. part of the formula for the Fireman of the Year award.
  623.      August 10, 1971, marked another milestone, the founding in Cooperstown of
  624. SABR, the group in whose annual publications most of today's sabermetricians
  625. cut their analytical teeth. Its statistical analysis research committee,
  626. headed for more than a decade by Pete Palmer, has served as a sounding board
  627. for the inventive approaches of such men as Dallas Adams, Dick Cramer, Steve
  628. Mann, Craig Wright, and Bill James.
  629.      James published The Baseball Abstract from his home in Lawrence, Kansas,
  630. for five years to a minute if appreciative audience (its 1977 publication
  631. budget: $112.73). In 1982 Ballantine Books, recognizing the increasing
  632. sophistication of baseball fans in the computer age, assumed publication of
  633. the Abstract, and the audience for sabermetrics became sizable indeed, with
  634. James' annuals reaching the bestseller lists and his Historical Baseball
  635. Abstract becoming an essential book for anyone who viewed himself as a serious
  636. fan. James has popularized a different approach to the whole question of what
  637. baseball statistics are for--that they are not brass knuckles to beat a
  638. barroom adversary with, but a means of achieving a better understanding of the
  639. game and heightening one's pleasure in it.
  640.      Among the many valuable analytical tools he has developed are the Brock-2
  641. System of projecting career totals, the Victory Important RBI, Offensive and
  642. Defensive Winning Percentages, Secondary Average, Range Factor, and Runs
  643. Created. The last-mentioned, perhaps because James developed it earlier in his
  644. career, is the most widely known, and we apply it in this book to all batters,
  645. in all fourteen variations of the formula, bringing in data for stolen bases,
  646. caught stealing, hit-by-pitch, and grounded into double play for those years
  647. in which it is available. (See the Glossary for the formulas.)
  648.      The 1980s also brought attention to another attempt to redefine the
  649. measure of individual performance. In 1978 Barry Codell of Chicago distributed
  650. a paper describing his new statistic, the Base-Out Percentage, to fellow
  651. statisticians and figures in the sports media. At about the same time, Tom
  652. Boswell, not a statistician by trade or inclination but rather a sportswriter
  653. for the Washington Post, developed a stat called Total Average. Like the
  654. Base-Out Percentage, Total Average is a gauge of offensive proficiency which
  655. takes into account not only batting but also base-running skills. (See the
  656. Glossary.)
  657.      Dallas Adams and Dick Cramer devoted themselves in the late 1970s to a
  658. discussion of average batting, pitching, and fielding skill, which more than a
  659. decade later remains a subject of intense interest and passionate
  660. disagreement. The question, roughly put, is: How would Cy Young do against the
  661. batters of today? Or Wade Boggs against the pitchers of the 1890s? How many
  662. homers would Babe Ruth hit if he were active today? Or how many strikeouts
  663. would Nolan Ryan have registered in 1880, pitching from a fifty-foot distance?
  664. In other words, how can we adjust the statistics of players to reflect the
  665. certainty that the average batter, pitcher, and fielder have improved over
  666. time, thus narrowing the gap between each succeeding era's peak performance
  667. and its average one? (For more on this philosophically and mathematically
  668. complex subject, we refer you to The Hidden Game of Baseball.)
  669.      Adams and Cramer advanced a discussion that had begun in 1976 with the
  670. first article on cross-era comparison, in which David Shoebotham proposed a
  671. new statistic called the Relative Batting Average. Shoebotham recognized that
  672. a .320 batting average in 1893, when the National League batted .280, did not
  673. represent the same level of accomplishment as that average did in 1968 when,
  674. for a number of reasons, the National League batted a measly .243. His
  675. solution? To normalize the players' averages to their respective league
  676. averages simply by dividing the player's batting average by that of his
  677. league.
  678.      In this fashion he demonstrated, for example, that Pete Rose, who led the
  679. NL with a .335 BA in 1968, had a Relative BA of 1.38; while Ed Delahanty, who
  680. led the NL with a BA of .380 in 1893, had a Relative BA of only 1.36. Another
  681. way of stating this conclusion is that Rose's .335 was 38 percent above the
  682. average batting performance in the NL of 1968, while Delahanty exceeded his
  683. league's norm by 36 percent. The inferences that might be drawn from this
  684. approach are many: that batting skill has not declined since the days of Ruth,
  685. Gehrig, Foxx, et al., but that pitching skill might have increased; that no
  686. batting average of the years around 1930 ought to be taken without a carload
  687. of salt; that some of the most notable batting performances of all time, as
  688. measured by the batting average, have occurred right under our noses,
  689. unbeknownst to us.
  690.      Normalizing a statistic to its league average is a valuable analytical
  691. tool if employed logically. A Relative Batting Average, for example, tells a
  692. good deal more, and tells it more straightforwardly, than Relative Homers or
  693. Relative Strikeouts. The relativist approach works better with ratios such as
  694. batting average, on base percentage, or slugging average--or for that matter
  695. with Runs Created or Total Average--than it does for simple counter stats.
  696.      Another worthwhile adjustment to various averages is for home-park
  697. effects. The pioneering work in this area was done by Robert Kingsley,
  698. particularly in regard to why homers flew out of Atlanta's park despite its
  699. "normal" dimensions, but Pete Palmer was first to measure the effects of home
  700. parks on run totals and then to devise a park adjustment for the records of
  701. batters and pitchers. These were discussed in depth in The Hidden Game of
  702. Baseball, and the data base for park factor in this book has been upgraded to
  703. include runs scored and runs allowed at home parks instead of just the latter.
  704.      In 1984 the editors of this volume introduced, in The Hidden Game, the
  705. Linear Weights System of assessing players' contributions to their teams--at
  706. the bat, on the basepaths, in the field, or on the mound--in terms of runs,
  707. which are the currency of the game. Its back-to-basics foundation is the same
  708. as that underlying the Rickey formula of 1954 and most of the new statistics
  709. developed since then: that wins and losses are what the game is about; that
  710. wins and losses are proportional in some way to runs scored and runs allowed;
  711. and that runs in turn are proportional to the events which go into their
  712. making.
  713.      In the Linear Weights System, these events are expressed not in the
  714. familiar yet deceptive ratios--base hits to at-bats, wins to decisions,
  715. etc.--but in runs themselves, the runs contributed (by batting or base
  716. stealing) or saved (by pitching or fielding). Computer simulations of over
  717. 100,000 games produced the run values of, for example: a single (.47 runs),
  718. double (.78), triple (1.09), home run (1.40), walk (.33), steal (.30), caught
  719. stealing (-.60), out (-.25), and out made on base (-.50). Using a
  720. straightforward additive formula, one can calculate a batter or baserunner's
  721. contribution to his team in runs. These would be expressed in terms of runs
  722. contributed beyond what a league-average replacement player could contribute
  723. in his stead, and that average is defined as a baseline of zero. A team
  724. composed entirely of average performers would finish with a record of .500, as
  725. the league must--so each above-average player contributes positive runs toward
  726. a win, and each subpar player contributes negative runs.
  727.      Normalizing factors (to league average) are built into the formulas for
  728. all but base stealing, where league average is not a shaping force; these
  729. factors enable us to compute, for example, the number of runs (Batting Runs)
  730. that Cecil Fielder provided in 1990 beyond those an average hitter might have
  731. produced in an equivalent number of plate appearances. And by adjusting
  732. Fielder's Batting Runs for Detroit's homepark influences, the Linear Weights
  733. comparison may be extended to how many runs he accounted for beyond what an
  734. average player might have produced in the same number of at-bats had he too
  735. played half his games in Tiger Stadium.
  736.      Furthermore, having determined the number of runs above average required
  737. to transform a loss to a win in the final standings (generally around ten,
  738. historically in the range of nine to eleven; for more on the theory behind
  739. this, see the Glossary), we can convert a player's Linear Weights
  740. record--expressed as Batting Runs, Base Stealing Runs, Pitching Runs, or
  741. Fielding Runs--to the number of wins above average he alone contributed. What
  742. are individual statistics for if not to achieve some understanding of this?
  743. Last, by reviewing the win contributions of all a team's personnel, we may
  744. establish a solid assessment of that team's strength and weaknesses--either to
  745. predict a team's chances for success in the upcoming season or, in an
  746. encyclopedia like Total Baseball, to analyze how and even why it failed its
  747. reasonable statistical expectations or exceeded them.
  748.      Formulas for the Linear Weights measures for batting, baserunning,
  749. fielding, and pitching will be found in the Glossary.
  750.      Other developments of the decade include the previously mentioned
  751. adoption of the game-winning RBI (GWRBI) in 1980; it credited the batter who
  752. drove in a run to give his club a lead that it never relinquished. This stat
  753. was pilloried in the press from its introduction, with merit, until Major
  754. League Baseball finally gave up on it before the 1989 season. In 1984 on base
  755. percentage was made official, thirty years after its introduction to the
  756. general baseball public by Branch Rickey and Allan Roth. Subsequent years
  757. brought the Quality Start, which takes note of a pitcher who gives his club
  758. six innings or more while allowing three runs or less. Under this
  759. construction, an ERA of 4.50 in a mercifully shortened outing is held to be
  760. commendable. The editors of this book do not regard the Quality Start as a
  761. quality stat.
  762.      More interesting are the situational stats which are the specialty of
  763. the Elias Sports Bureau and Project Scoresheet--performance in day games vs.
  764. night, grass vs. artificial turf, lefty vs. righty, day game following night,
  765. bases-loaded situations, and so on. When the data is drawn from a large enough
  766. sample, these stats can be provocative and meaningful; too often, however,
  767. television announcers desperate to maintain conversation flow will burden
  768. their listeners with something like, "Over the last two seasons, he's batted
  769. .375 against this guy" (not bothering to add that the figure represents three
  770. hits in eight times at bat). Situational stats are the wave of the future in
  771. baseball, but are not yet of much use for reviewing the past--Elias has kept
  772. them systematically only since 1975.
  773.  
  774. Total Baseball
  775.  
  776.      The next major event in the history of baseball record keeping is Total
  777. Baseball. Founded upon a unique historical database that Pete Palmer has
  778. cultivated for decades--in the tradition of baseball archivists like S.C.
  779. Thompson, Bradshaw Swales, Leonard Gettelson, and John Tattersall--Total
  780. Baseball is the third-generation encyclopedia of the game. Just as the advent
  781. of the Macmillan/ICI encyclopedia supplanted Turkin/ Thompson, the standard
  782. for two decades, Total Baseball has taken advantage of new technology and new
  783. research, notably by members of the Society for American Baseball Research, to
  784. present more accurate data than ever before, and more of it. There are, of
  785. course, the traditional stats one would expect in a baseball reference work;
  786. there are many of the new, more revealing stats discussed above; there are
  787. stats never published before and developed now for this book. And as you have
  788. seen in Part One, there is a recognition that baseball history and knowledge
  789. resides not only in its numbers.
  790.      But returning to the statistics and records which make up this second
  791. part of Total Baseball, here is a brief rundown of what's coming (full
  792. descriptions will be found in the separate introduction to each section):
  793.  
  794.   -  The Annual Record: Season-by-season standings and records for all teams
  795.      since 1871, plus the top five league leaders in generally forty-eight
  796.      categories per season.
  797.  
  798.   -  The Rosters: A completely revised manager roster, courtesy of some
  799.      splendid research into the early years by SABR's Bob Tiemann and Richard
  800.      Topp; and the application to all managers of the "actual vs. expected
  801.      win" method introduced in the editors' Baseball Annual 1990 (with Eliot
  802.      Cohen); a definitive roster of the men in blue, compiled by expert Larry
  803.      Gerlach; a roster of coaches, never before compiled; a roster of club
  804.      owners and presidents; and a roster of all the black men who played
  805.      professionally in the years of segregated ball.
  806.  
  807.   -  The Player, Pitcher, and Relief Pitcher Registers: The heart of this
  808.      section of Total Baseball, presenting complete seasonal and lifetime
  809.      records for every major leaguer, with twenty-three stats for players,
  810.      twenty-five for pitchers, and ten for relievers.
  811.  
  812.   -  All-Time Leaders: The top one hundred lifetime and single-season
  813.      performers in 219 categories, including important conventional stats not
  814.      found in other encyclopedias and dozens of the sabermetric variety.
  815.  
  816.      Now that the genealogy of the more significant records and record books
  817. has been described, it's time to say a few words about the measures you'll
  818. find in the main statistical sections of Total Baseball: the annual record and
  819. the player/pitcher registers. We will not attempt to define the basic counting
  820. stats such as games, at-bats, wins, losses, and so on; if these are puzzling
  821. to you, you have picked up the wrong book.
  822.  
  823. Batting
  824.  
  825.      Let's start with the batting statistics, and the first of these to
  826. consider will be that venerable, uncannily durable fraud, the batting average.
  827. (It consists simply of hits divided by at-bats.)  We know as well as anyone
  828. else that this monument just won't topple; the best that can be hoped is that
  829. in time fans and officials will recognize it as a bit of nostalgia, a
  830. throwback to the period of its invention when power counted for naught, bases
  831. on balls were scarce, and no one wanted to place a statistical accomplishment
  832. in historical context because there wasn't much history yet.
  833.      Time has given the batting average a powerful hold on the American
  834. baseball public; everyone knows that a man who hits .300 is a good hitter
  835. while one who hits .250 is not. Everyone knows that--no matter that it is not
  836. true. You want to trade Lenny Dykstra for Kevin Mitchell? Willie McGee for
  837. Will Clark? Batting average treats all hits in an egalitarian fashion. A
  838. two-out bunt single in the ninth with no one on base and your team trailing by
  839. six runs counts the same as Bobby Thomson's "shot heard 'round the world." And
  840. what about a walk? Say you foul off four 3-2 pitches, then watch a close one
  841. go by to take your base. Where's your credit for a neat bit of offensive work?
  842. Not in this stat. And a .250 batting average may have represented a distinct
  843. accomplishment in certain years, like 1968 when the American League mean was
  844. .230. That .250 hitter stood in the same relation to an average hitter of his
  845. season as a .282 hitter did in the American League in 1988--or a .329 hitter
  846. in the National League of 1930!  If .329 and .282 and .250 all mean roughly
  847. the same thing, it raises questions about the value of the measure.
  848.      And yet, the batting champion each year is declared to be the one with
  849. the highest batting average, and this will not soon change. And the Hall of
  850. Fame is filled with .300 hitters who couldn't carry the pine tar of many who
  851. will stay forever on the outside looking in. Knowledgeable fans have long
  852. realized that the ability to reach base and to produce runs are not adequately
  853. measured by batting average, and they have looked to other measures--for
  854. example, the other two components of the Triple Crown, home runs and RBIs.
  855. Still more sophisticated fans have looked to the slugging average or on base
  856. percentage, and in the 1980s to various sabermetric measures.
  857.      The slugging average does acknowledge the role of the man whose talent is
  858. for the long ball and who may, with management's blessing, be sacrificing bat
  859. control and thus batting average in order to let'er rip. (Slugging average is
  860. the number of total bases divided by at-bats.)  But the slugging average has
  861. its problems, too. It declares that a double is worth two singles, that a
  862. triple is worth one and a half doubles, and that a home run is worth four
  863. singles. All of these proportions are intuitively pleasing, for they relate to
  864. the number of bases touched on each hit, but in terms of the hits' value in
  865. generating runs, the proportions are wrong. One home run in four at-bats is
  866. not worth as much as four singles, for instance, in part because the total run
  867. potential for the team of four singles is greater, and in part because the man
  868. who hit the four singles did not also make three outs; yet the man who goes
  869. one for four at the plate, that one being a homer, has the same slugging
  870. percentage of 1.000 as a man who singles four times in four at-bats.
  871.      Moreover, it is possible to attain a high slugging average without being
  872. a slugger. In other words, if you have a high batting average, you must have a
  873. decent slugging average; it's difficult to hit .350 and have a slugging
  874. percentage of only .400. Even a bunt single boosts not only your batting
  875. average but also your slugging average. (The attempt to counteract this
  876. problem is a statistic called Isolated Power, which divides only extra bases
  877. by at-bats.)  Other things the slugging average does not do are: indicate how
  878. many runs were produced by the hits; give any credit for other offensive
  879. categories, such as walks, hit-by-pitch, or steals; permit the comparison of
  880. sluggers from different eras (if Jimmie Foxx had a slugging percentage of
  881. .749 in 1932 and Mickey Mantle had one of .705 in 1957, was Fox 7 percent
  882. superior? The answer is no, and the reason is in the higher slugging average
  883. of the AL in 1932.
  884.      Well, how about on base percentage? (To calculate this stat, divide hits,
  885. walks, and hit-by-pitch by at-bats, walks, hit-by-pitch, and sacrifice flies.)
  886. On base percentage has the advantage of giving credit for walks and
  887. hit-by-pitch, but it is an unweighted average and thus makes no distinction
  888. between those two events and, say, a grand-slam homer. A fellow like Eddie
  889. Yost, who, in some years when he hit under .250, drew nearly a walk a game,
  890. gets his credit with this stat as does a Gene Tenace, one of those guys whose
  891. statistical line looks puny without his walks. Similarly, players like Mickey
  892. Rivers or Omar Moreno, leadoff hitters with a lot of speed, no power, and no
  893. patience, are exposed by the OBP as distinctly marginal major leaguers, even
  894. in years when their batting averages look respectable or excellent. In short,
  895. on base percentage does tell you more about a man's ability to get on than
  896. does the batting average, and thus is a better indicator of run generation,
  897. but it's not enough by itself to separate the "good" hitters from the
  898. "average" or "poor" ones.
  899.      Not by itself, no . . . but when you add it to slugging average, you
  900. come up with a very powerful indicator of batting ability. These two
  901. one-legged men, when joined together, make for a very sturdy tandem, the
  902. infirmity of the one being almost exactly compensated by the power of the
  903. other. The virtues of on base plus slugging, a combined stat called
  904. Production, are that it is easily computed from officially issued stats and
  905. that it is the most accurate of all the newer stats except those denominated
  906. directly in runs. Its weaknesses are that because it is stated as the sum of
  907. two averages, it is--like a batting average or earned run average or any other
  908. average--a measure of the rate of success rather than the amount, and the fan
  909. needs considerable context to know what it means. Is a Production mark of
  910. .750 poor, average, or outstanding? (Answer: pretty good, because the league
  911. average figure in recent years has been in the low .700s--although in the NL
  912. of 1930 it exceeded .800.)
  913.      This second drawback may be eliminated in the same manner for all
  914. averages: by normalizing, or adjusting, each individual performance to the
  915. league average in that category for the year in which it took place. If a
  916. batter's Production was .700 in a year when the league average was .700, he
  917. performed at a rate of 100 (his Production divided by the league's, discarding
  918. the decimal point for ease of expression). If his Production was .800, his
  919. league-adjusted mark would be 114. The meaningfulness of that performance
  920. might be further refined by adjusting it once more, to take into account the
  921. run-producing characteristics of the man's home park: a batter whose home park
  922. was a hitters' haven like Wrigley Field might have his Production adjusted
  923. downward, while another playing half his games in the Astrodome might have his
  924. adjusted upward. In Total Baseball, figures adjusted for league average and
  925. park factor are denoted by "/ A" following the raw figure, and the Park Factor
  926. (PF) is expressed with a baseline of 100--a hitter's park might have a factor
  927. of 110, a pitcher's park 90. In this third edition of Total Baseball, we state
  928. Production in the Player Register only in its normalized, park-adjusted form,
  929. here termed "Production+."
  930.      RBIs? Don't they indicate run production and clutch ability? Yes and no.
  931. The RBI does tell you something about run-producing ability, but not enough:
  932. it's a situation-dependent statistic, inextricably tied to factors which vary
  933. wildly for individuals on the same team or on others (including, importantly,
  934. the position of each player in the batting order). And the RBI makes no
  935. distinction between being hit by a pitch to drive in the twelfth run of a game
  936. that concludes 14--3 and, again for comparison, the Thomson blast. RBIs tell
  937. how many runs a batter pushed across the plate, all right, but they don't tell
  938. how many fewer he might have driven in had he batted eighth rather than
  939. fourth, or how many more he might have driven in on a team that put more men
  940. on base. They don't even tell how many more runs a batter might have driven in
  941. if he had delivered a higher proportion of his hits with men on base.
  942.      The American League kept RBI Opportunities--men on base presented to each
  943. batter--as an official stat for the first three weeks of 1918, then saw how
  944. much work was involved and ditched it. The problem remains: how to assess run
  945. productivity for batters. Pitchers are easier. Their accomplishments are
  946. directly measured in runs allowed. But batters, baserunners, and fielders make
  947. their contributions in the constituent parts of runs--outs, hits, and a
  948. variety of more or less successful other events. (Even a batter who hits a
  949. solo homer contributes more than one run to his team, because he permits
  950. another player to bat who otherwise would not have, and each batter has a
  951. potential for producing further runs.)
  952.      You hear a lot in the media about the value of Runs Produced, a stat we
  953. track in Total Baseball in the top five section of the Annual Record. Runs
  954. Produced is simply runs scored plus runs batted in, subtracting homers because
  955. a dinger gives a batter "double credit"--a run scored plus an RBI. The editors
  956. view Runs Produced as an odd linkage of one opportunity-dependent stat with
  957. another that depends upon largely the same factors, but we offer the stat for
  958. those who like that sort of thing.
  959.      And so we come to the recently formulated game-winning RBI (GWRBI)--a
  960. noble attempt at describing the value of a hit to the team, its "clutchness,"
  961. but a measure which was misconceived in its presumption that a game could be
  962. won with a hit in the first inning. A man who drives in a run in the first
  963. inning is simply doing his job, not performing an extraordinary feat; if the
  964. pitcher makes that run hold up by throwing a shutout, bully for him, but why
  965. credit the hitter? Were he to drive in the lone run of the game in the seventh
  966. inning or later, that would be different. Nonetheless, the latest formulation
  967. of the stat gave the man who drove in that first-inning run a GWRBI even if
  968. his team eventually won 22-0, since it gave the team a lead that was never
  969. relinquished.
  970.      Worse, the GWRBI was situation-dependent to an even greater degree than
  971. the RBI. You can't play for a lousy team and lead the league in GWRBIs because
  972. there aren't enough games won to go around. And it's even harder to accumulate
  973. GWRBIs from the eighth place in the batting order than it is to accumulate
  974. RBIs. Last, if you put your team ahead with an RBI in the bottom of the
  975. eighth, why should you lose your GWRBI simply because the pitcher allows the
  976. lead to be lost? Wasn't your hit "clutch"? Say the pitcher allows the score to
  977. be tied, then a teammate might pick up the GWRBI that should have been safely
  978. tucked away for you. Nicely motivated, the GWRBI, but utterly without merit
  979. and thus we barred it from the first edition of Total Baseball, no matter that
  980. at the time we prepared that book the GWRBI was still an official Major League
  981. Baseball stat. It is no longer.
  982.      We do, however, present a measure called Clutch Hitting Index, which
  983. addresses the problem of run-producing opportunities on a historical basis. We
  984. offer this with several reservations, including the classic philosophical one
  985. about whether clutch ability exists at all. Is a man who hits .280 with men on
  986. base and .240 with the sacks clear a hero in the former situation or a bum in
  987. the latter? The Clutch Hitting Index measures actual RBIs over expected RBIs,
  988. which have been calculated on the basis of a man's extra-base hits and the
  989. opportunities he could have been expected to have, based on the average RBIs
  990. per league and where he batted in the lineup and who batted above him. This
  991. is, by admission, a rough measure indeed, but we think it's an interesting
  992. one. We included it in the Player Register in the first edition; since then we
  993. have confined the stat to the Annual Record and Leaders Sections. For teams,
  994. the measure of clutch hitting is more elegant: the ratio of its actual runs to
  995. its runs as calculated by the Linear Weights method.
  996.      Previously discussed were Runs Created, Total Average, and Batting Runs.
  997. Total Average numbers will tend to look like those of Production, which
  998. measures largely the same things only in a different manner; for this reason
  999. we have removed it from the Player Register in this edition while retaining it
  1000. in the Annual Record and Leaders. The numerical expression of Runs Created
  1001. exceeds that of Batting Runs, except that its baseline of zero defines the
  1002. worst player in the league rather than the average one.
  1003.  
  1004. Base Stealing
  1005.  
  1006.      Many fans understand, as a result of sabermetric findings of the 1980s,
  1007. that a man with a lot of stolen bases is not necessarily the best baserunner,
  1008. nor even an asset to his team; he might have been caught nearly as often as he
  1009. stole and thus may have cost his team many runs on balance. The game's
  1010. encyclopedic reference works have in years past contained stolen base totals,
  1011. even if the tabulations for the early years were suspect because of unclear
  1012. standards for what differentiated a steal from clever baserunning. What they
  1013. have not offered is the flip side of the steal--the caught-stealing numbers
  1014. that make sense of the steal itself.
  1015.      As mentioned above, caught stealing was recorded officially in the AL
  1016. beginning in 1920, then was dropped for 1927, was resumed in 1928, and has
  1017. been continuously in use ever since. In the NL, it was computed for 1920-1925,
  1018. then was dropped until 1951, when it resumed on a continuous basis. We have
  1019. figures kept by Ernie Lanigan for the years 1914-1916 in the AL and for
  1020. 1915-1916 in the NL, and in the second edition we have added caught-stealing
  1021. data for 1927 from newspaper accounts (about 90 percent complete). In Total
  1022. Baseball we present, for those years in which the data exists, the raw CS
  1023. data, Stolen Base Averages, and Stolen Base Runs. This last is expressed in
  1024. runs, based on the computer-derived value of .30 runs for a stolen base and
  1025. -.60 runs for a thwarted steal. To make a positive contribution to his team, a
  1026. base thief must be successful in more than two-thirds of his attempts.
  1027.  
  1028. Fielding
  1029.  
  1030.      When, back in 1954, Rickey and Roth came up with their "efficiency
  1031. formula" for run scoring and run prevention, the defensive half of the
  1032. equation was divided into five segments. The first was opponents' batting
  1033. average; the second was opponents' reaching base through bases on balls or hit
  1034. batsmen; the third was a measure of a pitcher's clutch ability; the fourth was
  1035. his strikeout capability; and the fifth was fielding, to which they assigned a
  1036. mathematical value of zero. "There is nothing on earth," Rickey declared,
  1037. "anyone can do with fielding."  Besides, he added, good fielding might account
  1038. for the critical run in a ballgame only four or five times a year.
  1039.      Was Rickey right? The central weakness of the fielding average has long
  1040. been known: you can't make an error on a ball you don't touch. To counter this
  1041. weakness in fielding average and to credit the plays made as well as the plays
  1042. not made, total chances per game is a more useful statistic--and when errors
  1043. are deducted from chances, you have a fielder's Range Factor. James pointed
  1044. out how absurd it had become, in a time when the best-fielding second baseman
  1045. might commit ten errors a season and the worst twenty, to focus on this
  1046. difference of ten rather than on the 250-300 in total chances which might
  1047. separate the most agile keystoner from the exemplar of Lot's wife.
  1048.      Another difficulty with the fielding average is that to understand what
  1049. figure represents mean performance (and thus be able to identify inferior and
  1050. superior fielders), one must adjust for position: a shortstop who fields
  1051. .980 has done quite well, but a first baseman, catcher, or outfielder with
  1052. that figure would have been below average. Thus the fan must bring to the
  1053. fielding average a great deal of background knowledge--the mean for each
  1054. fielding average for each position in each season. This is a demand that, on
  1055. first reflection, is not created by the batting average (all men stepping to
  1056. the plate occupy the same position--batter). On second thought, however, the
  1057. knowledgeable fan recognizes that a batting line of .267, 10 HRs, 80 RBIs will
  1058. mean different things when applied to a shortstop or to a left fielder. In
  1059. other words, just as any evaluation of fielding performance carries an
  1060. inherent positional bias, so does batting performance.
  1061.      High double-play totals are believed to indicate excellence among middle
  1062. infielders, but the more double plays a club turns, as a rule, the worse the
  1063. pitching. Which teams had the most double plays in major league history? In
  1064. the 154-game season, the Philadelphia A's of 1949 and the Los Angeles Dodgers
  1065. of 1958; in the 162-game season, Toronto and Boston of 1980 and Pittsburgh of
  1066. 1966. Of these, only the last-mentioned had a team ERA better than the league
  1067. average. If the pitchers are putting a lot of men on base, the team can get a
  1068. lot of double plays even without a great-fielding shortstop and second
  1069. baseman.
  1070.      So what to do? How do we assess fielding excellence? The idea of
  1071. crediting stellar fielding plays individually has been proposed occasionally
  1072. ever since 1868, when Chadwick wrote: "The best player in a nine is he who
  1073. makes the most good plays in a match, not the one who commits the fewest
  1074. errors, and it is in the record of his good plays that we are to look for the
  1075. most correct data for an estimate of his skill in the position he occupies."
  1076. Father Chadwick was correct to see that fielding percentage emphasized failure
  1077. rather than success, but in truth the fielding percentage was a far better
  1078. measure of ability in the 1860s, when one play in four produced an error, than
  1079. now, when only two plays in a hundred are flubbed.
  1080.      The choice in Total Baseball has been to concentrate on Total Chances but
  1081. not to disregard the error, as Range Factor does; nor to include it in Total
  1082. Chances, as David Neft would favor; nor to subtract it from Total Chances, as
  1083. Barry Codell once advocated. The error may be infrequent today but it is not
  1084. insignificant; instead, it is a peculiarly damaging event, turning an out
  1085. (with its computer-derived run value of -.25) to, in effect, a hit (with its
  1086. run value of +.50). This is a turnaround of .75 runs, or the equivalent of
  1087. three outs; an outfield error costs even more, because it so often produces
  1088. more than one base for batter and runners both. Thus the defensive stats we
  1089. favor in this book and include in the Player Register and Pitcher Register are
  1090. Linear Weights formulas, expressed in runs and computed differently for the
  1091. different positions (see the Glossary for the formulas, which have a
  1092. significant refinement in this edition). However, in all cases the elements of
  1093. the statistics are putouts, assists, double plays, and errors (and for
  1094. catchers, passed balls).
  1095.      Position players are gauged by Fielding Runs, a Linear Weights measure of
  1096. the runs they saved (or allowed) through their play that an average man at
  1097. that position would not have (second baseman are compared with other second
  1098. baseman rather than, say, with left fielders--even the worst-fielding second
  1099. sacker would cost his team fewer runs at the position than the best defensive
  1100. left fielder). Pitcher Defense (like Pitcher Batting) is to be found in the
  1101. Pitcher Register. Raw fielding statistics, of questionable value in and of
  1102. themselves, have been excluded from this third edition of Total Baseball. An
  1103. innovation this time around is the placement of the fielding average in the
  1104. Player Register. It is computed for the position at which a man played the
  1105. most games.
  1106.  
  1107. Pitching
  1108.  
  1109.      On to the pitching statistics you will see in the Annual Record and
  1110. Pitcher Register. First to be reviewed are wins and losses, and won-lost
  1111. percentage. Wins are a team statistic, obviously, as are losses, but we credit
  1112. a win entirely to one pitcher in each game. Why not to the shortstop? Or the
  1113. left fielder? Or some combination of the three? In a 13-11 game, several
  1114. players may have had more to do with the win than any pitcher. No matter.
  1115. We're not going to change this custom, though Ban Johnson gave it a good try
  1116. when he banished it from the American League records for seven years beginning
  1117. in 1913.
  1118.      To win many games a pitcher generally must play for a team that wins many
  1119. games. Look at Red Ruffing's won-lost record with the miserable Red Sox of the
  1120. 1930s, then at his mark with the Yankees. Or at Danny Jackson, first with
  1121. Kansas City, then with Cincinnati. There is an endless list of good pitchers
  1122. traded to stronger offensive clubs who "emerge" as stars.
  1123.      The recognition of the weakness of this statistic came early. Originally
  1124. it was not computed by such men as Chadwick because most teams leaned heavily,
  1125. if not exclusively, on one starter, and relievers as we know them today did
  1126. not exist. As the season schedules lengthened, the need for a pitching staff
  1127. became evident, and separating out the team's record on the basis of who was
  1128. in the box seemed a good idea. However, it was not then nor is it now a good
  1129. measure of performance, for the simple reason that one may pitch poorly and
  1130. win, or pitch well and lose.
  1131.      The natural corrective to this deficiency of the won-lost percentage is
  1132. the earned run average--which, strangely, preceded it, gave way to it in the
  1133. 1880s, and then returned in 1912. Originally, the ERA was computed as earned
  1134. runs per game because pitchers almost invariably went nine innings. In this
  1135. century it has been calculated as earned runs times nine, divided by innings
  1136. pitched.
  1137.      The purpose of the earned run average is noble: to give a pitcher credit
  1138. for doing what he can to prevent runs from scoring, aside from his own
  1139. fielding lapses and those of the men around him. It succeeds to a remarkable
  1140. extent in isolating the performance of the pitcher from his situation, but
  1141. objections to the statistic remain. Say a pitcher retires the first two men in
  1142. an inning, then has the shortstop kick a ground ball to allow the batter to
  1143. reach first base. Six runs follow before the third out is secured. How many of
  1144. these runs are earned? None.
  1145.      The prime difficulty with the ERA in the early days, say 1913, when one
  1146. of every four runs scored was unearned, was that a pitcher got a lot of credit
  1147. in his ERA for playing with a bad defensive club. The errors would serve to
  1148. cover up in the ERA a good many runs which probably should not have scored.
  1149. Those runs would hurt the team, but not the pitcher's record. This situation
  1150. has been aggravated further by the use of newly computed ERAs for pitchers
  1151. prior to 1913, the first year of its official status. Example: Bobby Mathews,
  1152. sole pitcher for the New York Mutuals of 1876, allowed 7.19 runs per game, yet
  1153. his ERA was only 2.86--almost a perfect illustration of the league's 40
  1154. percent proportion of earned runs.
  1155.      It is not an accident that pitchers of the dead-ball era of this century
  1156. (1900-1919) dominate the lifetime and seasonal leaders tables in ERA. Yes,
  1157. there were circumstances away from the mound that depressed batting, but the
  1158. pitchers of that period also benefited mightily in the ERA column from the
  1159. high number of errors, as compared to today. How to compare the ERA of an Ed
  1160. Walsh or Three Finger Brown with a Frank Viola or a Dwight Gooden? As with
  1161. batting stats, normalize the ERA to league average and adjust for home park
  1162. effects. A pitcher from 1908 whose Adjusted ERA was 150 can be compared to one
  1163. from 1988 with the same Adjusted ERA--each stood in the same relation to his
  1164. peers, that is, 50 percent better than average.
  1165.      What gave rise to the ERA, and what we appreciate about it, is that like
  1166. the batting average it is an attempt at an isolating stat, a measure of
  1167. individual performance not dependent upon one's own team. Its principal
  1168. shortcoming is that it indicates only a pitcher's rate of efficiency, not his
  1169. actual benefit to the team. In a league with an ERA of 4.00, a starter who
  1170. throws 300 innings with an ERA of 3.50 must be worth more to his team than a
  1171. starter whose ERA is the same but who pitches in only half as many innings.
  1172. Through the Linear Weights figures of Pitching Runs (broken out in the
  1173. top-five section of the Annual Record as Starter Runs and Relief Runs), we can
  1174. determine the number of runs a pitcher saved his team beyond what a pitcher
  1175. performing at the league-average ERA would have allowed. A truly simple stat,
  1176. it consists of nothing more than a pitcher's normalized, or league-adjusted,
  1177. earned run average weighted by his innings pitched.
  1178.      Because Pitching Runs has a built-in normalizing factor, when you see it
  1179. in Total Baseball under a heading for "/A," that adjustment will be for park
  1180. factor. Pitchers' park factor is calculated differently from batters' park
  1181. factor, for a number of fairly complex reasons that technical-minded readers
  1182. might best consult in the Glossary.
  1183.      While the ERA is a far more accurate reflection of a pitcher's value than
  1184. the BA is of a hitter's, it fails to a greater degree than the BA in offering
  1185. an isolated measure. For a truly unalloyed individual pitching measure, we
  1186. must look to the glamour statistic of strikeouts, the pitcher's mate to the
  1187. home run (though home runs are highly dependent upon home park, strikeouts are
  1188. to only a slight degree).
  1189.      Is a strikeout artist a good pitcher? Maybe yes, maybe no; a good
  1190. analogue would be to ask whether a home run slugger is a good hitter. The two
  1191. stats run together: periods of high home run activity (as a percentage of all
  1192. hits) invariably are accompanied by high strikeout totals. Strikeout totals,
  1193. however, may soar even in the absence of overzealous swingers, say, as the
  1194. result of a rules change such as the legalization of overhand pitching in
  1195. 1884, the introduction of the foul strike (NL, 1901; AL, 1903), or the
  1196. expanded strike zone in 1963.
  1197.      Just as home run totals are a function of the era in which one plays, so
  1198. are strikeouts. The great nineteenth-century totals--Matches Kilroy's 513,
  1199. Toad Ramsey's 499, One Arm Daily's 483--were achieved under different rules
  1200. and fashions. No one in that era fanned batters at the rate of one per inning;
  1201. indeed, among regular pitchers (those with 154 innings pitched or more), only
  1202. Herb Score did until 1960. In the next five years the barrier was passed by
  1203. Sandy Koufax, Jim Maloney, Bob Veale, Sam McDowell, and Sonny Siebert. Walter
  1204. Johnson, Rube Waddell, and Bob Feller didn't run up numbers like that. Were
  1205. they slower, or easier to hit, than Sonny Siebert?
  1206.      Even in today's game, which lends itself to the accumulation of, by
  1207. historic standards, high strikeout totals for a good many pitchers and
  1208. batters, the strikeout is, as it always has been, just another way to make an
  1209. out. Yes, it is a sure way to register an out without the risk of advancing
  1210. baserunners and so is highly useful in a situation such as when there is a man
  1211. on third with fewer than two outs; otherwise, it is a vastly overrated stat
  1212. because it has nothing to do with victory or defeat--it is mere spectacle. A
  1213. high strikeout total indicates raw talent and overpowering stuff, but the
  1214. imperative of the pitcher is simply to retire the batter, not to crush him.
  1215. What's not listed in your daily averages are strikeouts by batters--fans are
  1216. not as interested in that because it's a negative measure--yet the strikeout
  1217. may be a more significant stat for batters than it is for pitchers.
  1218.      Bases on balls will drive a manager crazy and put lead in fielders' feet,
  1219. but it is possible to survive, even to excel, without first-rate
  1220. control--provided your stuff is good enough to hold down the number of hits.
  1221. Total Baseball offers two stats that are, like strikeouts, highly interesting
  1222. but ultimately of debatable value: Opponents' Batting Average and Opponents'
  1223. On Base Percentage. (The same could be said of Fewest Hits Per Game and Fewest
  1224. Walks Per Game, of course.)  It is illuminating to compare one or the other
  1225. with a pitcher's ERA or Pitching Runs, but both calculations are somewhat
  1226. academic, for at the end of a game, season, or career, it doesn't matter how
  1227. many men a pitcher puts on base. Theoretically he can put three men on every
  1228. inning, leave the twenty-seven baserunners allowed, and pitch a shutout. A man
  1229. who gives up one hit over nine innings can lose 1-0; it's even possible to
  1230. allow no hits and lose. Who is the better pitcher? The man with the shutout
  1231. and twenty-seven baserunners allowed, or the man who allows one hit? No matter
  1232. how sophisticated your measurements for pitchers, the best ones are counted in
  1233. runs.
  1234.      The nature of baseball at all points is one man against nine. It's the
  1235. pitcher against a series of batters. With that situation prevailing, we have
  1236. tended to examine batting with intricate, ingenious stats, while viewing
  1237. pitching through generally much weaker, though perhaps more copious,
  1238. measurements. What if the game were to be turned around so that we had a
  1239. "pitching order"--nine pitchers facing one batter? Think of that for a minute.
  1240. The nature of the statistics would change, too, so that your batting stats
  1241. would be vastly simplified. You wouldn't care about all the individual
  1242. components of the batter's performance, all combining in some obscure fashion
  1243. to reveal run production. You'd care only about runs. Yet what each of the
  1244. nine pitchers did would bear intense scrutiny, and over the course of a year
  1245. each pitcher's Opponents' Batting Average, Opponents' On Base Percentage,
  1246. Opponents' Slugging Average, and so forth, would be recorded and spun to come
  1247. up with a sense of how many runs each pitcher had saved.
  1248.      A pitching stat with an interesting history is complete games. This is
  1249. your basic counter stat, but it's taken to mean more than most of those
  1250. measurements by baseball people and knowledgeable fans. When everyone was
  1251. completing 90-100 percent of his starts, the stat was without meaning and thus
  1252. was not kept. As relief pitchers crept into the game after 1905, the
  1253. percentage of completed games declined rapidly. By the 1920s it became a point
  1254. of honor to complete three quarters of one's starts; today the man who
  1255. completes half is quite likely to lead his league. So with these shifting
  1256. standards, what do CGs tell you? About pitchers, not a lot anymore: about
  1257. managers and bullpens, a great deal.
  1258.      Can we say that a pitcher with 18 complete games out of 37 starts is
  1259. better than one with 12 complete games in 35 starts? Not without a lot of
  1260. supporting help, we can't, not without a store of knowledge about the
  1261. individuals, the teams, and especially the eras involved. The more uses to
  1262. which we attempt to put the stat, the weaker it becomes, the more attenuated
  1263. its force. If we declare the hurler with 18 CGs "better," how are we to
  1264. compare him with another pitcher from, say, fifty years earlier who completed
  1265. 27 out of 30 starts? Or another pitcher of eighty years ago who completed all
  1266. the games he started? (Jack W. Taylor completed every one of the 187 games he
  1267. started over five years.) Or what about Will White, who in 1880 started 75
  1268. games and completed every blessed one of them? But the rules were different,
  1269. you say, or the ball was less resilient, or they pitched from a different
  1270. distance, with a different motion, or this, or that. The point is, there are
  1271. limits to what a traditional, unadjusted baseball statistic can tell you about
  1272. a player's performance in any given year, let alone compare his efforts to
  1273. those of a player from a different era.
  1274.      Of shutouts there is little to say that is not perfectly obvious, except
  1275. that historical totals have been revised because (a) in 1920-1939 the American
  1276. League did not count games of less than nine innings as shutouts, and (b) in
  1277. those years and before, in both leagues, a pitcher was credited with a shutout
  1278. even if he was pulled midway, if he had pitched enough innings of a combined
  1279. whitewash. Total Baseball counts only complete-game shutouts.
  1280.      Wins Above Team is, as discussed, a variation of Ted Oliver's stat made
  1281. public in 1944, which he called the Weighted Rating System. Apart from
  1282. modifying his math, we have taken Oliver's "points"--the thousands of points
  1283. his formula gave to hurlers who performed well for poor teams--and by
  1284. retaining the decimal that he would have discarded, we have come up with a
  1285. stat that is expressed quite properly in wins. In this edition, Wins Above
  1286. Team is recorded only for the top hundred lifetime and season marks.
  1287.      Newly developed for the first edition of this book was a Clutch Pitching
  1288. Index that, like the measure for clutch hitting, could be applied to
  1289. historical data. The CPI is figured by taking how many earned runs the pitcher
  1290. should have allowed, based on the performance of the batters who faced him,
  1291. and how many he actually allowed (see the Glossary for the formula). The
  1292. Clutch Pitching Index consists of expected runs over actual runs, so marks
  1293. over 100 exceed league-average performance.
  1294.      For relief pitchers, we have previously discussed saves, and Relief Runs
  1295. (the Linear Weights category) are figured no differently than Starter Runs.
  1296. Newly developed here is Relief Ranking, which adjusts Relief Runs for the
  1297. greater situational importance of each run a bullpenner saves or yields. The
  1298. other elements of the formula are wins, losses, and saves, in a proportion
  1299. detailed in the Glossary. Games, innings, and ERA in relief are broken out in
  1300. the new Relief Pitcher Register.
  1301.  
  1302. Bringing It All Together
  1303.  
  1304.      Pitcher Batting and Pitcher Defense are recorded in the Pitcher Register
  1305. as Linear Weights figures, expressed in runs. (Pitcher batting has been
  1306. removed from league stats for such computations, so that the batting records
  1307. of everyday players are compared only with those of their peers and pitchers'
  1308. batting records are compared only with those of their peers.)  For this
  1309. edition we have added to Pitcher Batting Runs the seasonal totals for hits and
  1310. the pitchers' batting averages. The totals for Pitcher Batting Runs and
  1311. Fielding Runs are seldom of a great magnitude--and for AL pitchers since 1973,
  1312. the batting figure is, of course, zero--but in earlier years a pitcher's
  1313. ability to help himself and his team off the mound has occasionally counted
  1314. for a great deal in a given season; spitballer Ed Walsh in 1907, the year
  1315. before he won 40 games for the White Sox, accounted for an astounding 2.3
  1316. Fielding Wins. The hitting ability of a Wes Ferrell or Don Drysdale certainly
  1317. counted for something in their teams' prospects for victory. In Total Baseball
  1318. a pitcher's overall contribution is reflected in the Total Pitcher Index,
  1319. converted from Runs above average to Wins, based on the Runs required to
  1320. create an extra Win in that year.
  1321.      For everyday position players, add Fielding Runs to Stolen Base Runs to
  1322. Batting Runs, then convert those combined Runs to Wins, and you have the best
  1323. measure of the complete ballplayer: the Total Player Rating. We believe,
  1324. however, that a positional adjustment must be made to the above combination to
  1325. reflect the greater skill required to play, for example, second base than left
  1326. field; this adjustment is based on the average batting skill required at that
  1327. position to hold a major league job. Historically, left fielders have
  1328. presented the best record in Batting Runs and middle infielders the worst. In
  1329. other words, a left fielder who accounted for 10 Fielding Runs should not be
  1330. regarded as having the same value to a team as a shortstop who also
  1331. contributed 10 Fielding Runs: Have the two men switch positions and you would
  1332. soon see who made more of a defensive contribution. And because some
  1333. positions--shortstop, catcher, second base, and third base--are harder to play
  1334. than others, we see a relative scarcity of good hitters at these positions and
  1335. an abundance at the others. Again, see the Glossary for more detail.
  1336.      The ultimate stat brings together batters, pitchers, fielders, and
  1337. baserunners in the Total Baseball Ranking. The equivalent of a Most Valuable
  1338. Player Award and Cy Young Award wrapped into one, it reveals the best baseball
  1339. player every season and the best ever. Relief pitchers and shortstops can
  1340. compete on the same plane--wins contributed to their team through all their
  1341. accomplishments. In 1978 the MVP question in the American League was whether
  1342. to vote for Jim Rice, who had 46 homers, 139 RBIs, and 400 total bases (the
  1343. first time for an American Leaguer in forty-one years), or for Ron Guidry,
  1344. 25-3 with an .893 won-lost percentage that was the all-time high for a starter
  1345. with 20 or more wins, and whose ERA of 1.74 was less than half the league
  1346. average. Why don't you flip to the page in the Annual Record for 1978 and see
  1347. for yourself who deserved the MVP Award that year.
  1348.      Total Baseball also sums things up on the team level. Fielding Runs are
  1349. expressed as Wins in the team stats section of the Annual Record, as are
  1350. Batting Runs, Stolen Base Runs, and Pitching Runs. This enables one to see the
  1351. component parts of a team's predicted success or failure--that is, the wins or
  1352. losses beyond the average (a .500 season) that the players' performance could
  1353. have been expected to produce. The Differential figure (DIF) in this section
  1354. of the Annual Record states the spread between the team's actual won-lost
  1355. record and that predicted by the Linear Weights measures of batting, base
  1356. stealing, fielding, and pitching. The miracle Mets of 1969 exceeded
  1357. expectations by 13 Wins--in other words, instead of finishing 87-75 as their
  1358. players' performance would have warranted, they finished 100-62. Did the Blue
  1359. Jays also do it with mirrors in 1992? Check for yourself.
  1360.  
  1361. Errors and Controversies
  1362.  
  1363.      The data ICI reported in the first edition of The Baseball Encyclopedia
  1364. upset many people in baseball, for their numbers were different from those
  1365. traditionally accepted; however, their changes were responsible ones, the
  1366. product of new research that corrected errors of long standing, or in response
  1367. to the rulings of the Special Baseball Records Committee. For example, much of
  1368. the statistical information on Hall of Fame plaques was rendered obsolete. The
  1369. result has been that through the ensuing editions, the offending data has been
  1370. fudged to bring it into line with tradition--more on this in a moment.
  1371.      Despite the uproar that greeted ICI's revised numbers, 1969 was hardly
  1372. the first time corrections had been made to official data. In 1929 Grover
  1373. Cleveland Alexander won his 373rd game, breaking Christy Mathewson's National
  1374. League record, then thought to be 372. He never won another game. A number of
  1375. years later, Joe Reichler found a game in which, by today's rules, Matty
  1376. should have gotten the win, this game taking place on May 21, 1902. The record
  1377. was changed and they were given a tie. The problem was that no one checked all
  1378. of Mathewson's other games to see how many times he received a win under the
  1379. old rules that wouldn't have been credited that way today. When ICI did their
  1380. research in 1968, they found Matty had only 367 wins total by today's rules,
  1381. while Alexander had 374. (Further research, notably by Frank Williams, has
  1382. restored Alexander and Mathewson to a tie at 373 wins.)  The Records Committee
  1383. decided that all wins and losses should be awarded according to the present
  1384. rules, so Macmillan printed the totals as such in the Baseball Encyclopedia.
  1385. However, after the book came out, Commissioner Bowie Kuhn decided that it was
  1386. better to show stats that agreed with previously published recognized sources,
  1387. so all records--not only those of Mathewson and Alexander--were supposed to be
  1388. changed back in accordance with the scoring practices at the time. What
  1389. happened in the next edition was that some records, especially those of the
  1390. stars, were changed, while others were not; team totals and the records of
  1391. other players on the same team were not; and the data base was corrupted.
  1392.      Here's another celebrated example of record-book flip-flops. When the
  1393. American League was formed in 1901, Nap Lajoie was credited with a .422
  1394. average, with 220 hits in 543 at-bats. After a number of years, someone
  1395. noticed that if you take these at-bats and hits, the average comes out only to
  1396. .405, so his average was changed. (Turkin/Thompson gave Nap a mark of .409 in
  1397. its first edition.)  Later in the 1950s, John Tattersall had his doubts and
  1398. decided to go through his newspaper collection of box scores. He found 229
  1399. hits for Lajoie, not 220--the error had been in the figure for hits, not in
  1400. the figure for batting average. Thus his average was restored to .422, which
  1401. happened to be the highest in American League history. Then ICI research in
  1402. this area came up with a .426 mark (232 for 544, based on newspaper accounts),
  1403. which was published in the first edition, then trimmed back to .422 in
  1404. subsequent editions. The .426 figure is the one this book uses.
  1405.      Nap seemed to be involved in a number of controversies. ICI research
  1406. found four more hits for him in 1902, raising his average from .369 to .378.
  1407. Later editions have changed Lajoie's stats back to the old values; we have
  1408. not.
  1409.      In 1910 there was a very close batting race between Cobb and Lajoie. At
  1410. the end of the season, most people thought Nap had won, based on his getting
  1411. seven hits in a doubleheader on the final day of the season. There was talk
  1412. that the opposing Browns had let him get a number of bunts by playing back, so
  1413. that the hated Cobb would lose. However, the AL office went over their figures
  1414. and gave Cobb the title, .385 to .384. Nearly eighty years later, Pete Palmer
  1415. discovered a critical error: a game in which Cobb had two hits in three
  1416. at-bats had been entered twice. This was found because Sam Crawford had 14
  1417. games on his official sheet for the homestand yet the Tigers only played 13.
  1418. It turned out that Detroit played a doubleheader on September 24, but the
  1419. second game inadvertently was inserted in the official sheets as being played
  1420. on September 25. Later, this second game of the twenty-fourth, which appeared
  1421. to have been missing, was put in the scoresheets again. The League Office
  1422. discovered this mistake soon after its official announcement that Cobb had won
  1423. the batting title, because the double entry was corrected for all the other
  1424. Detroit players. However, Ban Johnson had made a big deal out of how carefully
  1425. his people had checked the figures in order to settle the controversy, so they
  1426. kept quiet about the gaffe, leaving Cobb the winner.
  1427.      Appeals to Commissioner Kuhn in 1981 to set the matter straight
  1428. officially were to no avail, because that would not only have changed the
  1429. outcome of the 1910 batting race, it would also have altered Cobb's lifetime
  1430. hit total, then being pursued to massive media attention by Pete Rose. Kuhn's
  1431. statement read, in part, "The passage of 70 years, in our judgment . . .
  1432. constitutes a certain statute of limitation as to recognizing any changes in
  1433. the records with confidence of the accuracy of such changes. . . . Since a
  1434. variety of questions have been raised through the years about the accuracy of
  1435. the statistics of that period, the only way to make changes with confidence
  1436. would be for a complete and thorough review of all team and individual
  1437. statistics. That is not practical."  It may not have not been practical, but
  1438. we have done it, and are continuing to do it. A notable area of change
  1439. reflected in this edition of Total Baseball is the National Association period
  1440. of 1871-1875, in which the research of Michael Stagno and a team of SABR
  1441. researchers have not only supplied new, more accurate statistics but also a
  1442. handful of new players, previously not included in any baseball encyclopedia.
  1443.      In 1912, Heinie Zimmerman got credit for a Triple Crown victory, although
  1444. it wasn't called that then. Ernie Lanigan's RBI figures gave him 98, compared
  1445. to 94 for Honus Wagner. However, ICI research gave Wagner 102 and Zimmerman
  1446. 99. Later editions of The Baseball Encyclopedia changed Zimmerman up to
  1447. 103--giving him back his phony Triple Crown.
  1448.      The National League batting data has been pretty accurate since 1910.
  1449. That was the first year that the NL kept daily game records for teams as well
  1450. as players and compared the team totals to the sum for the players for that
  1451. team and tried to resolve any differences. Before then, the team totals simply
  1452. were the sum for the players. The American League had team totals all the way
  1453. back to 1905, but never compared them with the sum of the players and
  1454. therefore had a great many errors. The AL, however, did introduce team
  1455. pitching first in 1930, while the NL followed in 1941. The AL never published
  1456. league totals, so the fact that the batter hits, strikeouts, walks, etc. did
  1457. not agree with the corresponding pitcher totals was somewhat academic.
  1458. However, the NL did publish league totals starting in 1926, and when they
  1459. first presented team pitching, the totals did not agree. In order to make this
  1460. look correct, they doctored the pitching totals to agree with the batting
  1461. stats. After a few years, this was no longer necessary, as they took the time
  1462. to resolve and correct differences. For the AL, most team totals did not agree
  1463. with the sum of the players for that team until around 1935: the at-bats,
  1464. runs, hits, and extra-base hits usually checked out, but walks and strikeouts
  1465. did not add up until the 1960s. The AL converted to computer in 1973, while
  1466. the NL did in 1981, improving accuracy.
  1467.      On the whole there have been surprisingly few errors in the National
  1468. League stats. Most of the bigger ones have involved innings pitched in the
  1469. years before 1930. Because no one added up the innings and compared them to
  1470. putouts to check for discrepancies, in 1926 Wayland Dean brought up the rear
  1471. in ERA with a 6.10 mark. It turned out that his innings pitched had been added
  1472. up incorrectly, and he should have had 204, not 164. This reduced his ERA to
  1473. 4.90. For a game in 1920, Jimmy Ring had his faced batsman total of 35 put in
  1474. the innings pitched column, giving him 26 extra innings pitched for the game.
  1475. It would seem that someone adding up innings pitched would question a figure
  1476. of 35 for one game, but it slipped through. Ring was also credited for nine
  1477. extra innings in 1923. But the strangest mix-up in the NL was in 1909, the
  1478. year before the team totals were kept. For some strange reason, 700 putouts
  1479. were dropped from the team totals, all the result of adding mistakes for
  1480. catchers. Pat Moran and Red Dooin each lost 200, while Peaches Graham, Bill
  1481. Bergen, and Doc Marshall lost 100 each.
  1482.      The American League has had many errors of 100 or more putouts or assists
  1483. over the years due to addition mistakes, as well as quite a few blunders in
  1484. innings pitched. Ed Willett in 1910 lost 77 innings, showing only 147 instead
  1485. of 224. The correction lowered his ERA from 3.60 to 2.36. However, this was
  1486. still more than a run behind the leader, Ed Walsh. Frank Williams discovered a
  1487. dozen or more errors in entering wins and losses for pitchers in the AL every
  1488. year from 1905 through 1919. And John Tattersall, in his home run research,
  1489. found over 100 official errors, about 80 percent in the AL and most before
  1490. 1920. George Sisler picked up 3 new homers, These were on April 12, 1916,
  1491. September 22, 1921, and June 29, 1929.
  1492.      From 1912 to 1914, the AL statistician decided not to enter anything for
  1493. a player who had all zeroes for his line in any given game. Most of these were
  1494. relief pitchers, but they had entries on their pitching sheets and these games
  1495. were restored by the ICI researchers. There were about 600 other cases where
  1496. nonpitchers had games omitted. These are included in Total Baseball. This kind
  1497. of record keeping over the early years kept some men out of the encyclopedias
  1498. altogether, like pinch runners or defensive replacements. SABR research has
  1499. added several of these one-time ciphers to The Baseball Encyclopedia over the
  1500. years, as well as to Total Baseball.
  1501.      For the American League records of 1913, the official sheets disagree
  1502. with the data published in the baseball guides for almost every player. The
  1503. only logical explanation is that the official figures weren't ready when it
  1504. came time to publish the guide, so they must have used data from another
  1505. source. Total Baseball uses the official figures, as they have daily sheets to
  1506. support the data.
  1507.      An interesting quirk in the way records are kept--and another reminder,
  1508. as if one needed it, that baseball record keeping remains subject to error and
  1509. controversy--occurred as recently as 1981. The league rule was to round off
  1510. the innings pitched at the end of the season, although the weekly reports
  1511. showed thirds of innings. Baltimore's Sammy Stewart had 29 earned runs in 112
  1512. 1/3 innings, while Oakland's Steve McCatty had 48 in 185 2/3 innings. This
  1513. gave Stewart the ERA title, 2.323 to 2.327. But when the innings were rounded
  1514. off, McCatty won, 2.32 to 2.33. McCatty got the title, but the next year both
  1515. leagues decided to count thirds of innings.
  1516.  
  1517. Sources
  1518.  
  1519.      The computer has made possible the rapid analysis of mountains of raw
  1520. baseball data based upon observed games or mathematically accurate,
  1521. probabilistic computer simulations. Questions once thought to be unanswerable
  1522. are mysteries no longer. What is the worth, in terms of its run-producing
  1523. capacity, of a single, or a walk, or a homer? How valuable is a stolen base?
  1524. Who were the best clutch hitters? But as invaluable as the computer has been
  1525. in producing the statistical data for Total Baseball, the editors owe more to
  1526. the people who have contributed their time, their expertise, their love of the
  1527. game, and their passion for getting things right. These individuals are listed
  1528. here, in the Acknowledgements, or in the table at the end of the book of those
  1529. readers of the first two editions who helped us improve the accuracy of Total
  1530. Baseball this time around. A collective debt is owed to the Society for
  1531. American Baseball Research and the National Baseball Library.
  1532.      The statistics were obtained primarily from the following sources:
  1533.  
  1534.   -  John Tattersall Collection of newspaper box scores and compilations for
  1535.      1876-1890 NL.
  1536.  
  1537.   -  ICI computer printouts, National Baseball Library, 1891-1902 NL,
  1538.      1882-1891 AA, 1884 UA, 1890 PL, 1901-1904 AL, 1914-1915 FL.
  1539.  
  1540.   -  Official league averages, 1903-date NL, 1905-date AL.
  1541.  
  1542.   -  Michael Stagno Collection of newspaper box scores and compilations for
  1543.      1871-1875 NA, supplemented by research of SABR's nineteenth century
  1544.      research committee, headed by Bob Tiemann, Bob Richardson,
  1545.      and Fred Ivor-Campbell.
  1546.  
  1547.      Supplemental sources were:
  1548.  
  1549.   -  For batters hit by pitch, 1884-1896 AA/NL/PL, 1909-1916 NL, 1909-1919 AL,
  1550.      research from newspapers by Alex Haas, Pete Palmer, John Schwartz, Bob
  1551.      Davids, John Tattersall, Lyle Spatz, Herb Goldman, Keith Carlson, and
  1552.      others.
  1553.      (Note: research continues for the 1897-1908 period, but the data is, at
  1554.      this writing, about 90 percent complete.)
  1555.  
  1556.   -  For home runs allowed by pitchers, 1876-1950 AL/NL, the Tattersall
  1557.      Collection, reviewed and corrected by Bob McConnell.
  1558.  
  1559.   -  For runs batted in, 1903-1919 NL, 1905-1919 AL, ICI research.
  1560.  
  1561.   -  For runs batted in, 1880-1885 NL, David Neft.
  1562.  
  1563.   -  For pitcher saves (except 1901-1919 AL) 1876-1968 NL/AA/UA/PL/AL.
  1564.  
  1565.   -  For stolen bases, 1886 NL, Spalding Baseball Guide.
  1566.  
  1567.   -  For wins and losses for pitchers, 1876-1900 NL/AA/PL, and for wins,
  1568.      losses, games started, complete games, shutouts, saves, 1901-1919 AL, and
  1569.      complete pitching data, 1892, research from newspapers and official
  1570.      sheets by Frank Williams.
  1571.  
  1572.   -  For shutouts, 1876-1939, Joe Wayman.
  1573.  
  1574.   -  For biographical data, the biographical research committee of SABR,
  1575.      notably Richard Topp, Bill Carle.
  1576.  
  1577.   -  For caught-stealing data, 1914-1916 AL, 1915-1916 NL, Ernie Lanigan,
  1578.      courtesy of Bob Davids.
  1579.  
  1580.   -  For home/away data, 1876-1891 NL/AA/UA/PL, Bob McConnell.
  1581.  
  1582.   -  For game scores, 1876-1884 NL/AA/UA, Bob Tiemann.
  1583.  
  1584.   -  For game scores, 1885-1891 NL/AA/PL, Richard Topp.
  1585.  
  1586.   -  For runs and homers home/away, 1980s NL/AL, Bill Carr.
  1587.  
  1588.      Missing data includes:
  1589.  
  1590.   -  Hit batters: 1897-1908, scattered data, especially for New York and
  1591.      Cincinnati.
  1592.  
  1593.   -  Caught stealing: 1886-1914, 1916 (players with fewer than 20 steals),
  1594.      1917-1919, 1926-1950 NL; 1886-1891 AA; 1890 PL; 1901-1913, 1916 (players
  1595.      with fewer than 20 steals), 1917-1919, 1914-15 FL.
  1596.  
  1597.   -  Sacrifice hits: 1927-1930 (fly balls advancing runners to any base
  1598.      counted as sacrifice hits).
  1599.  
  1600.   -  Sacrifice flies: 1908-1930, 1939.
  1601.  
  1602.   -  Runs batted in, 1882-1887, 1890 AA; 1884 UA.
  1603.  
  1604.   -  Strikeouts for batters: 1882-1888, 1890 AA; 1884 UA; 1897-1909 NL;
  1605.      1901-1912 AL. (Team batting strikeouts are presented for 1897-1902
  1606.      NL and 1901-1904 AL.)
  1607.  
  1608.      Incomplete data for those years through 1902 NL and 1904 AL are available
  1609. from the ICI computer printouts at the National Baseball Library. Additional
  1610. research could turn up more data. If your research or sharp eye should detect
  1611. errors or gaps in Total Baseball, please write us in care of the publisher and
  1612. we'll be delighted to improve our data and credit your catch in the next
  1613. edition.
  1614.