home *** CD-ROM | disk | FTP | other *** search
/ ftp.pasteur.org/FAQ/ / ftp-pasteur-org-FAQ.zip / FAQ / sci-lang-faq < prev    next >
Internet Message Format  |  2002-06-22  |  74KB

  1. Path: senator-bedfellow.mit.edu!bloom-beacon.mit.edu!nycmny1-snh1.gtei.net!news.gtei.net!news-out.visi.com!hermes.visi.com!feed2.news.rcn.net!feed1.news.rcn.net!rcn!not-for-mail
  2. From: markrose@enteract.com (Mark Rosenfelder)
  3. Newsgroups: sci.lang,sci.answers,news.answers
  4. Subject: sci.lang FAQ (Frequently Asked Questions)
  5. Followup-To: sci.lang
  6. Date: 21 Jun 2002 17:12:05 GMT
  7. Organization: SPSS Inc.
  8. Lines: 1433
  9. Approved: news-answers-request@MIT.Edu
  10. Expires: Sat, 27 Jul 2002 00:00:00 GMT
  11. Message-ID: <aevmp5$lha$1@bob.news.rcn.net>
  12. X-Trace: UmFuZG9tSVZgU3tB/I4RVw0pSrqd3MJrNn836dsgyULnf1S/Ww8jqaIv4UxaI/ew
  13. X-Complaints-To: abuse@rcn.com
  14. NNTP-Posting-Date: 21 Jun 2002 17:12:05 GMT
  15. X-Newsreader:  trn 4.0-test74 (May 26, 2000)
  16. Originator:  markrose@enteract.com (Mark Rosenfelder)
  17. Xref: senator-bedfellow.mit.edu sci.lang:210767 sci.answers:14332 news.answers:232788
  18.  
  19. Archive-name: sci-lang-faq
  20. Version: 2.29
  21. Last-modified: 3 Mar 2002
  22. Last-posted: 20 Jun 2002
  23.  
  24. Except where noted, written by Michael Covington (mcovingt@ai.uga.edu)
  25. Maintained by Mark Rosenfelder (markrose@zompist.com)
  26.  
  27.       The Web version of this FAQ can be found at:
  28.          http://www.zompist.com/langfaq.html
  29.      (The most up-to-date FAQ will always be the Web version.)
  30.  
  31.       Changes this month: Added a question on etymology.
  32.  
  33. NOTE: This FAQ file doesn't cover everything!  Many good books and many 
  34.       important ideas are left unmentioned.  All readers should be aware 
  35.       that linguistics is a young science and that linguists rarely agree 
  36.       100% on anything.
  37.  
  38. DISTRIBUTION: This file may be freely distributed electronically, or 
  39.       as handouts in linguistics classes.  Please retain the author
  40.       attributions and addresses, and this paragraph.  Before using it 
  41.       in print, please contact the authors.
  42. ===============================================================================
  43. CONTENTS
  44.  
  45.  1. What is sci.lang for?
  46.  2. What is linguistics?
  47.  3. Does linguistics tell people how to speak or write properly?
  48.  4. What are some good books about linguistics?
  49.  5. How did language originate?
  50.  6. What is known about prehistoric language?
  51.  7. What do those asterisks mean?
  52.  8. How are present-day languages related?
  53.  9. Why do Hebrew and Yiddish [etc.] look alike if they aren't related?
  54. 10. How do linguists decide that languages are related?
  55. 11. What is Noam Chomsky's transformational grammar all about?
  56. 12. What is a dialect?  (Relation between dialects and languages.)
  57. 13. Are all languages equally complex, or are some more primitive than others?
  58. 14. What about artificial languages, such as Esperanto?          
  59. 15. What are some stories and novels that involve linguistics?
  60. 16. What about those Eskimo words for snow? (and other myths about language)
  61. 17. Where can I get an electronic IPA font (or other electronic resources)?
  62. 18. How do I subscribe to the LINGUIST list?
  63. 19. How can I represent phonetic symbols in ASCII?
  64. 20. Is English a creole?
  65. 21. How do you look up a word in a Chinese or Japanese dictionary?
  66. 22. What about Nostratic and Proto-World?
  67. 23. What are phonemes and why's it so hard to lose a foreign accent? 
  68. 24. How likely are chance resemblances between languages?
  69. 25. How are tone languages sung?
  70. 26. Why are there so many words for Germany?
  71. 27. Why do both English and French have plurals in -s? 
  72. 28. How did genders and cases develop in IE? 
  73. 29. What is the Sapir-Whorf hypothesis?
  74. 30. Languages keep simplifying-- how did they ever become complex?
  75. 31. Where did (some word or phrase) come from?
  76. ===============================================================================
  77. 1. What is sci.lang for?
  78.  
  79. Discussion of the scientific or historical study of human language(s).
  80. Note the "sci." prefix.  The main concern here is with _facts_ and
  81. theories accounting for them.
  82.  
  83. For advice on English usage, see alt.usage.english or misc.writing.
  84. For casual chatter about other languages see soc.culture.<whatever>.
  85. Discussion of or in Greek or Latin is available in sci.classics.
  86. The sci.lang.translation newsgroup focusses on translation and issues of 
  87.   concern to translators and interpreters.
  88. The comp.ai.nat-lang newsgroup focusses on natural language processing
  89.   by computers.
  90.  
  91. Like all "sci." newsgroups, sci.lang is not meant to substitute for
  92. a dictionary or even a college library.  If the answer to your question
  93. can be looked up easily, then do so rather than using the net.
  94. If you don't have a library, then ask away, but explain your situation.
  95. ===============================================================================
  96. 2. What is linguistics?
  97.  
  98.   The scientific study of human language, including:
  99.      Phonetics (physical nature of speech)
  100.      Phonology (use of sounds in language)
  101.      Morphology (word formation)
  102.      Syntax (sentence structure)
  103.      Semantics (meaning of words & how they combine into sentences)
  104.      Pragmatics (effect of situation on language use)
  105.  
  106.   Or, carving it up another way:
  107.      Theoretical linguistics (pure and simple: how languages work)
  108.      Historical linguistics (how languages got to be the way they are)
  109.      Sociolinguistics (language and the structure of society)
  110.      Psycholinguistics (how language is implemented in the brain)
  111.      Applied linguistics (teaching, translation, etc.)
  112.      Computational linguistics (computer processing of human language)
  113.  
  114.   Some linguists also study sign languages, non-verbal communication,
  115.   animal communication, and other topics besides spoken language.
  116. ===============================================================================
  117. 3. Does linguistics tell people how to speak or write properly?
  118.  
  119. No.  Linguistics is descriptive, not prescriptive.
  120. Linguistics can often supply facts which help people arrive at a
  121. recommendation or value judgement, but the recommendation or value
  122. judgement is not part of linguistic science itself.
  123. ===============================================================================
  124. 4. What are some good books about linguistics?
  125.  
  126. (These are cited by title and author only. Full ordering information
  127. can be obtained from BOOKS IN PRINT, available at most bookstores and
  128. at even the smallest public libraries.)
  129.  
  130.   CAMBRIDGE ENCYCLOPEDIA OF LANGUAGE, by David Crystal (1987) is a good place 
  131.      to start if you are new to this field.
  132.   LANGUAGE, by Edward Sapir (1921), is a readable survey of linguistics 
  133.      that is still worthwhile despite its age.
  134.   Some good surveys of linguistics:
  135.      An Introduction to Language - Fromkin and Rodman (1974)
  136.      The Social Art - Ronald Macaulay (1995)
  137.      The Language Web - Jean Aitchison 
  138.      Language: The Basics - R.L. Trask (1996)
  139.   AN INTRODUCTION TO LANGUAGE, by Fromkin and Rodman (1974), is one of the 
  140.      best intro linguistics survey texts.  There are many others.
  141.   THE WORLD'S MAJOR LANGUAGES, edited by Bernard Comrie (1987) contains
  142.      meaty descriptions of fifty languages.
  143.   AN INTRODUCTION TO THE LANGUAGES OF THE WORLD by Anatole Lyovin (1997)
  144.      surveys everything and has good sketches of some languages Comrie skips. 
  145.   CAMBRIDGE TEXTBOOKS IN LINGUISTICS (a series) consists of good,
  146.      modestly priced introductions to all the areas of linguistics.
  147.   Any encyclopedia will give you basic information about widely studied
  148.      languages, alphabets, etc.
  149. ===============================================================================
  150. 5. How did language originate?
  151.  
  152. Nobody knows.  Very little evidence is available.
  153. See however D. Bickerton, LANGUAGE AND SPECIES (1990).
  154. ===============================================================================
  155. 6. What is known about prehistoric language?
  156.  
  157. Quite a lot, if by "prehistoric" you'll settle for maybe 2000 years
  158. before the development of writing.  (Language is many thousands of years
  159. older than that.)
  160.  
  161. Languages of the past can be recovered by comparative reconstruction
  162. from their descendants.  The comparative method relies mainly on
  163. pronunciation, which changes very slowly and in highly systematic
  164. ways.  If you apply it to French, Spanish, and Italian, you 
  165. reconstruct late colloquial Latin with a high degree of accuracy;
  166. this and similar tests show us that the method works.
  167.  
  168. Also, if you use the comparative method on unrelated languages,
  169. you get nothing. So comparative reconstruction is a test of whether 
  170. languages are related (to a discernible degree).
  171.  
  172. The ancient languages Latin, Greek, Sanskrit, and several others form 
  173. a group known as "Indo-European."  Comparative reconstruction from 
  174. them gives a language called Proto-Indo-European which was spoken 
  175. around 2500 B.C.  Many Indo-European words can be reconstructed with 
  176. considerable confidence (e.g., *ekwos 'horse').  The grammar was 
  177. similar to Homeric Greek or Vedic Sanskrit.  Similar reconstructions are
  178. available for some other language families, though none has been as 
  179. thoroughly reconstructed as Indo-European.
  180. ===============================================================================
  181. 7. What do those asterisks mean?
  182.  
  183. Attached to a word, either of 2 things.
  184. An unattested, reconstructed word (such as Indo-European *ekwos);
  185. or an ungrammatical sentence (such as *Himself saw me).
  186.  
  187. (In a generative rule, such as AP -> Adj (AP)*, it indicates that
  188. an element may be repeated zero or more times.)
  189. ===============================================================================
  190. 8. How are present-day languages related?
  191.                                                            [--Scott DeLancey]
  192.  
  193. This is an INCOMPLETE list of some of the world's language families.  More
  194. detailed classifications can be found in Voegelin and Voegelin, CLASSIFICATION
  195. AND INDEX OF THE WORLD'S LANGUAGES (1977), and M. Ruhlen, A GUIDE TO THE 
  196. WORLD'S LANGUAGES (1987).  (Note: Ruhlen's classification recognizes a 
  197. number of higher-order groups which most linguists regard as speculative).
  198.  
  199. A language family is a group of languages that have been proven to have
  200. descended from a common ancestral language.  Branches of families likewise
  201. represent groups of languages with a more recent common ancestor.  For 
  202. example, English, Dutch, and German have a common ancestor which we label
  203. Proto-West-Germanic, and thus belong to the West Germanic branch of Germanic.
  204. Icelandic and Norwegian are descended from Proto-North Germanic, a separate 
  205. branch of Germanic.  All the Germanic languages have a common ancestor, 
  206. Proto-Germanic; farther back, this ancestor was descended from Proto-Indo-
  207. European, as were the ancestors of the Italic, Slavic, and other branches.
  208.  
  209. Not all languages are known to be related to each other.  It is possible that 
  210. they are related but the evidence of relationship has been lost; it's also 
  211. possible they arose separately.  It is likely that some of the families 
  212. listed here will eventually turn out to be related to one another.
  213.  
  214. While low-level close relationships are easy to demonstrate, higher-order 
  215. classification proposals must rely on more problematic evidence and tend to 
  216. be controversial.  Recently linguists such as Joseph Greenberg and Vitalij 
  217. Shevoroshkin have attracted attention both in linguistic circles and in the 
  218. popular press with claims of larger genetic units, such as Nostratic 
  219. (comprising Indo-European, Uralic, Altaic, Dravidian, and Afroasiatic) or 
  220. Amerind (to include all the languages of the New World except Na-Dene and
  221. Eskimo-Aleut).  Most linguists regard these hypotheses as having a grossly 
  222. insufficient empirical foundation, and argue that comparisons at that depth 
  223. are not possible using available methods of historical linguistics.
  224.  
  225. This list isn't intended to be exhaustive, even for families like Germanic
  226. and Italic.  Nor is it the last word on what's a "language"; see question 12.
  227.  
  228.   Note: English is not descended from Latin.
  229.         English is a Germanic language with a lot of Latin vocabulary,
  230.         borrowed from French in the Middle Ages.
  231.  
  232. INDO-EUROPEAN
  233.     GERMANIC
  234.       North Germanic:  Icelandic, Norwegian / Swedish / Danish
  235.       East Germanic:  Gothic (extinct)
  236.       West Germanic:  English, Dutch, German, Yiddish
  237.     ITALIC
  238.       Osco-Umbrian:  Oscan, Umbrian (extinct languages of Italy)
  239.       Latin and its modern descendants (Italian, Spanish, Portuguese, 
  240.          Catalan, Rumanian, French, etc.)
  241.     CELTIC
  242.       P-Celtic:  Welsh, Breton, Cornish
  243.       Q-Celtic:  Irish, Scots Gaelic, Manx
  244.       Some extinct European languages were also Celtic, notably those of Gaul
  245.     HELLENIC:  Greek (ancient and modern)
  246.     SLAVIC:  Russian, Bulgarian, Polish, Czech, Serbo-Croatian, etc. 
  247.          (not Rumanian or Albanian)
  248.     BALTIC:  Lithuanian and Latvian
  249.     INDO-IRANIAN
  250.       Indic:  Sanskrit and its modern descendants (Hindi-Urdu, 
  251.          Gypsy (Romany), Bengali, etc.)
  252.       Iranian: Persian (ancient and modern), Pashto (Afghanistan), others
  253.     ALBANIAN:  Albanian
  254.     ARMENIAN:  Armenian
  255.     TOKHARIAN (an extinct language of NW China)
  256.     HITTITE (extinct language of Turkey)
  257.  
  258. AFRO-ASIATIC
  259.     SEMITIC:  Arabic, Hebrew (not Yiddish; see above), Aramaic, Amharic
  260.       and other languages of Ethiopia
  261.     CHADIC:  languages of northern Africa, e.g. Hausa
  262.     CUSHITIC:  Somali, other languages of eastern Africa
  263.     EGYPTIAN:  Ancient Egyptian
  264.     BERBER:  languages of North Africa
  265.  
  266. NIGER-KORDOFANIAN:  includes most of the languages of sub-Saharan 
  267.     Africa.  Most of the languages are in the NIGER-CONGO branch; the
  268.     most widely known subgroup of N-C is BANTU (Swahili, Zulu, Xhosa, etc.) 
  269.  
  270. URALIC 
  271.     Finnish, Estonian, Saami (Lapp), Hungarian, and several 
  272.     languages of central Russia
  273.  
  274. MONGOL:  Mongolian, Buryat, Kalmuck, etc.
  275. TURKIC:  Turkish, Azerbaijani, Kazakh, and other languages of Central Asia
  276. TUNGUSIC: Manchu, Juchen, Evenki, Even, Oroch, and other languages of NE Asia
  277.  
  278.     Some linguists group these three families together as ALTAIC.
  279.     Rather more controversially, some add Korean and Japanese to this group.
  280.  
  281.     It has been claimed that URALIC and ALTAIC are related (as URAL-ALTAIC),
  282.     but this idea is not widely accepted.
  283.  
  284. DRAVIDIAN:  languages of southern India, including Tamil, Telugu, etc.
  285.  
  286. SINO-TIBETAN
  287.     SINITIC:  Chinese (several "dialects", or arguably distinct languages:
  288.       Mandarin, Wu (Shanghai), Min (Hokkien [Fujian], Taiwanese), 
  289.       Yue (Cantonese), Hakka, Gan, Xiang
  290.     TIBETO-BURMAN: Tibetan, Burmese, various languages of Burma,
  291.       China, India, and Nepal
  292.  
  293. AUSTROASIATIC
  294.     MON-KHMER:  Vietnamese, Khmer (Cambodian), and various minority 
  295.       and tribal languages of Southeast Asia
  296.     MUNDA:  tribal languages of eastern India
  297.  
  298. AUSTRONESIAN
  299.     Malay-Indonesian, other languages of Indonesia (Javanese, etc.)
  300.     Philippine languages: Tagalog, Ilocano, Bontoc, etc.
  301.     Aboriginal languages of Taiwan (Tsou, etc.)
  302.     Polynesian languages: Hawaiian, Maori, Samoan, Tahitian, etc.
  303.     Micronesian:  Chamorro (spoken in Guam), Yap, Truk, etc.
  304.     Malagasy (spoken in Madagascar)
  305.   Most of these languages fall in a branch called MALAYO-POLYNESIAN
  306.  
  307. JAPANESE:  A number of linguists argue that Japanese is ALTAIC; others,
  308.     that it is most closely related to AUSTRONESIAN, or that it represents 
  309.     a mixture of AUSTRONESIAN and ALTAIC elements.
  310.  
  311. TAI-KADAI:  Thai, Lao, and other languages of southern China and 
  312.     northern Burma.  Possibly related to AUSTRONESIAN.  
  313.     An outdated hypothesis that TAI is part of SINO-TIBETAN is still 
  314.     often found in reference works and introductory texts.
  315.  
  316. AUSTRALIA:  the Aboriginal languages of Australia are conservatively 
  317.     classified into 26 families, the largest being PAMA-NYUNGAN, consisting
  318.     of about 200 languages originally spoken over 80-90% of Australia.
  319.  
  320. A large number of language families are found in North and South America.
  321. There are numerous proposals which group these into larger units, some of
  322. which will probably be demonstrated in time.  To date no New World language 
  323. has been proven to be related to any Old World family.  The larger North 
  324. American families include:
  325.  
  326. ESKIMO-ALEUT:  two Eskimo languages and Aleut.
  327. ATHAPASKAN:  most of the languages of Alaska and northwestern Canada,
  328.     also includes Navajo and Apache.  Eyak (in Alaska) is related to
  329.     Athapaskan; some linguists put these together with Tlingit and Haida
  330.     in a NA-DENE family.
  331. ALGONQUIAN:  most of Canada and the Northeastern U.S., includes
  332.     Cree, Ojibwa, Cheyenne, Blackfoot
  333. IROQUOIAN:  the languages of NY state (Mohawk, Onondaga, etc.) and Cherokee
  334. SIOUAN:  includes Dakota/Lakhota and other languages of the Plains
  335.     and Southeast U.S.
  336. MUSKOGEAN: Choctaw, Alabama, Creek, Mikasuki (Seminole) and other
  337.     languages of the southeast U.S.
  338. UTO-AZTECAN:  a large family in Mexico and the Southwestern U.S., 
  339.     includes Nahuatl (Aztec), Hopi, Comanche, Paiute, etc.
  340. SALISH:  languages of Washington and British Columbia
  341. HOKAN:  languages of California and Mexico; a controversial grouping
  342. PENUTIAN:  languages of California and Oregon; also controversial
  343.  
  344. Work on documentation and classification of South American languages still 
  345. has a long way to go.  Generally recognized families include:
  346.  
  347. ARAWAKAN, TUCANOAN, TUPI-GUARANI (including Guarani, a national language
  348. of Paraguay), CARIBAN, ANDEAN (including Quechua and Aymara)
  349.  
  350. LANGUAGE ISOLATES:  A number of languages around the world have never been
  351. successfully shown to be related to any others-- in at least some cases 
  352. because any related languages have long been extinct.  The most famous 
  353. isolate is Basque, spoken in northern Spain and southern France; it is 
  354. apparently a survival from before the Indo-Europeanization of Europe.
  355. ===============================================================================
  356. 9. Why do  Hebrew and Yiddish
  357.            Japanese and Chinese
  358.            Persian and Arabic
  359.    look so much alike if they aren't related?
  360.  
  361. Distinguish LANGUAGE from WRITING SYSTEM.
  362. In each of these cases one language has adopted part or all of the 
  363. writing system of an unrelated language.
  364.  
  365. (To a Chinese, English and Finnish look alike, because they're written 
  366. in the same alphabet.  Yet they are not historically related.)
  367.  
  368. An excellent introduction to writing systems is Geoffrey Sampson's
  369. WRITING SYSTEMS (1985).  The authoritative (but expensive) reference
  370. is Daniels and Bright's THE WORLD'S WRITING SYSTEMS (1996), which
  371. discusses every known script.
  372. ===============================================================================
  373. 10. How do linguists decide that languages are related?           [--markrose]
  374.  
  375. When linguists say that languages are related, they're not just remarking 
  376. on their surface similarity; they're making a technical statement or claim
  377. about their history-- namely, that they can be regularly derived from a 
  378. common parent language.
  379.  
  380. Proto-languages are reconstructed using the comparative method.  The 
  381. first stage is to inspect and compare large amounts of vocabulary from the 
  382. languages in question.  Where possible we compare entire _paradigms_ (sets 
  383. of related forms, such as the those of the present active indicative in 
  384. Latin), rather than individual words.
  385.  
  386. The inspection should yield a set of regular sound correspondences between 
  387. the languages.  By regular, we mean that the same correspondences are 
  388. consistently observed in identical phonetic environments.  Finally, _sound 
  389. changes_ are formulated: language-specific rules which specify how the 
  390. original common form changed in order to produce those observed in each 
  391. descendent language.
  392.  
  393. Applying the comparative method to the Romance languages, we might find
  394.  
  395.   'I sense'  Sard /sento/  French /sa~/   Italian /sento/   Spanish /sjEnto/
  396.   'sleep'         /sonnu/         /som/           /sonno/           /suEn^o/
  397.  
  398.   'hundred'       /kentu/         /sa~/           /tSento/          /sjEnto/
  399.   'five'          /kimbe/         /sE~k/          /tSinkwe/         /sinko/
  400.  
  401.   'I run'         /kurro/         /kur/           /korro/           /korro/
  402.   'story'         /kontu/         /ko~t@/         /(rak)konto/      /kuEnto/
  403.  
  404. and hundreds of similar examples.  We see some correspondences--
  405.  
  406.   (1)        Sard /s/      French /s/     Italian /s/       Spanish /s/
  407.   (2)             /k/             /s/             /tS/              /s/
  408.   (3)             /k/             /k/             /k/               /k/
  409.  
  410. but they seem to conflict: does Sard /k/ correspond to Spanish /s/ or /k/?
  411. Does French /s/ correspond to Italian /s/ or /tS/?
  412.  
  413. In fact we will find that the correspondences are regular, once we observe
  414. that (2) is seen before a front vowel (i or e), while (3) is seen in other
  415. environments.  Alternations within paradigms, such as It. /diko/ 'I say' 
  416. vs. /ditSe/ 'says', will help us make and confirm such generalizations.
  417.  
  418. We may interpret these now-regular correspondences as indicating that an 
  419. initial /s/ in the proto-language has been retained in all four languages, 
  420. and likewise initial /k/ in Sard; but that /k/ changed to /s/ or /tS/ in 
  421. the other languages in the environment of a front vowel.
  422.  
  423. Actually, this process is iterative.  For instance, at first glance we 
  424. might think that German _haben_ and Latin _habere_ 'have' are obvious 
  425. cognates.  However, after noting the regular correspondence of German h to 
  426. Latin c, we are forced to change our minds, and look to _capere_ 'seize' 
  427. as a better cognate for _haben_.
  428.  
  429. Thus, similarity of words is only a clue, and perhaps a misleading one.
  430. Linguists conclude languages are related, and thus derive from a common
  431. ancestor, only if they find *regular* sound correspondences between them.
  432.  
  433. To complicate things, derivations may be obscured by irregular changes,
  434. such as dissimilation, borrowing, or analogical change.  For instance, 
  435. the normal development of Middle English _kyn_ is 'kine', but this word
  436. has been largely replaced by 'cows', formed from 'cow' (ME _cou_) on the 
  437. analogy of word-pairs like stone : stones.  Analogy often serves to reduce 
  438. irregularities in a language (here, an unusual plural).
  439.  
  440. _Borrowing_ refers to taking words from other languages, as English has
  441. taken 'search' and 'garage' from French, 'paternal' from Latin, 'anger' from 
  442. Old Norse, and 'tomato' from Nahuatl.  How do we know that English doesn't
  443. derive from French or Nahuatl?  The latter case is easy to eliminate: 
  444. regular sound correspondences can't be set up between English and Nahuatl.
  445.  
  446. But English has borrowed so heavily from French that regular correspondences 
  447. do occur.  Here, however, we find that the French borrowings are thickest in 
  448. government, legal, and military domains; while the basic vocabulary (which 
  449. languages borrow less frequently) is more akin to German.  Paradigmatic 
  450. correspondences like sing/sang/sung vs. singen/sang/gesungen also help show
  451. that the Germanic words are inherited, the French ones borrowed.
  452.  
  453. If you want more, Theodora Bynon's HISTORICAL LINGUISTICS (1977) is
  454. very good, and not long; R.L. Trask's HISTORICAL LINGUISTICS (1996)
  455. is very readable and covers more recent studies.
  456. Anthony Fox's LINGUISTIC RECONSTRUCTION: AN INTRODUCTION
  457. TO THEORY AND METHOD (1995) concentrates on the reconstruction process
  458. itself, and assumes some knowledge of linguistics.  On Indo-European,
  459. try Beekes, COMPARATIVE INDO-EUROPEAN LINGUISTICS: AN INTRODUCTION (1995).
  460. ===============================================================================
  461. 11. What is Noam Chomsky's transformational grammar all about?
  462.  
  463. Several things; it really comprises several layers of theory:
  464.  
  465. (1) The hypothesis that much of the structure of human language is
  466. inborn ("built-in") in the human brain, so that a baby learning to
  467. talk only has to learn the vocabulary and the structural "parameters"
  468. of his native language -- he doesn't have to learn how language works
  469. from scratch.
  470.  
  471. The main evidence consists of:
  472.    - The fact that babies learn to talk remarkably well from what seems
  473.      to be inadequate exposure to language; it is claimed
  474.      that babies acquire some rules of grammar that they could never
  475.      have "learned" from what is available to them, if the structure of
  476.      language were not partly built-in.
  477.    - The fact that the structure of language on different levels
  478.      (vocabulary, ability to connect words, etc.) can be lost by injury
  479.      to specific areas of the brain.
  480.    - The fact that there are unexpected structural similarities between
  481.      all known languages.
  482. For detailed exposition see Cook, CHOMSKY'S UNIVERSAL GRAMMAR (1988), 
  483. Newmeyer, GRAMMATICAL THEORY: ITS LIMITS AND POSSIBILITIES (1983), and
  484. Pinker, THE LANGUAGE INSTINCT (1994).
  485.  
  486. This theory is by no means accepted by all linguists, though many   
  487. would agree that some core part of language is innate.
  488.  
  489. (2) The hypothesis that to adequately describe the grammar of a human
  490. language, you have to give each sentence at least two different structures, 
  491. called "deep structure" and "surface structure", together with rules
  492. called "transformations" that relate them. 
  493.  
  494. This is hotly debated.  Some theories of grammar use two levels and
  495. some don't.  Chomsky's original monograph, SYNTACTIC STRUCTURES (1957),
  496. is still well worth reading; this is what it deals with.
  497.  
  498. (3) Chomsky's name is associated with specific flavors of transformational
  499. grammar.  The model elaborated over the last few years is called GB
  500. (government and binding) theory; however, Chomsky's 1995 book on Minimalism
  501. contains significant departures from earlier work in GB.
  502.  
  503. (4) Some people think Chomsky is the source of the idea that grammar ought
  504. to be viewed with mathematical precision.  (Thus there are occasional
  505. vehement anti-Chomsky polemics such as THE NEW GRAMMARIAN'S FUNERAL, which
  506. are really polemics against grammar per se.)
  507.  
  508. Although Chomsky contributed some valuable techniques, grammarians have
  509. _always_ believed that grammar was a precise, mechanical thing.  They
  510. are highly divided, however, on the nature and function of those mechanisms!
  511. ===============================================================================
  512. 12. What is a dialect?
  513.                                                               [--M.C. + M.R.]
  514. A dialect is any variety of a language spoken by a specific community of
  515. people. Most languages have many dialects.
  516.  
  517. Everyone speaks a dialect.  In fact everyone speaks an _idiolect_, i.e.,
  518. a personal language.  (Your English language is not quite the same as
  519. my English language, though they are probably very, very close.)
  520.  
  521. A group of people with very similar idiolects are considered to be
  522. speaking the same dialect.  Some dialects, such as Standard American
  523. English, are taught in schools and used widely around the world.
  524. Others are very localized.  
  525.  
  526. Localized or uneducated dialects are _not_ merely failed attempts to speak
  527. the standard language.  William Labov and others have demonstrated, for
  528. example, that the speech of inner-city blacks has its own intricate
  529. grammar, quite different in some ways from that of Standard English.
  530.  
  531. It should be emphasized that linguists do not consider some dialects 
  532. superior to others-- though speakers of the language may do so;
  533. and linguists do study people's attitudes toward language, since 
  534. these have a strong effect on the development of language.
  535.  
  536. Linguists call varieties of language "dialects" if the speakers can
  537. understand each other and "languages" if they can't.  For example,
  538. Irish English and Southern American English are dialects of English,
  539. but English and German are different languages (though related).
  540.  
  541. This criterion is not always as easy to apply as it sounds.
  542. Intelligibility may vary with familiarity and interest, or may depend
  543. on the subject.  A more serious problem is the _dialect continuum_: a
  544. chain of dialects such that any two adjoining dialects are mutually
  545. intelligible, but the dialects at the ends are not.  Speakers of
  546. Belgian Dutch, for instance, can't understand Swiss German, but
  547. between them there lies a continuum of mutually intelligible dialects.
  548.  
  549. Sometimes the use of the terms "language" or "dialect" is politically
  550. motivated.  Norwegian and Danish (being mutually intelligible) are
  551. dialects of the same language, but are considered separate languages
  552. because of their political independence.  By contrast, Mandarin and
  553. Cantonese, which are mutually unintelligible, are often referred to
  554. as "dialects" of Chinese, due to the political and cultural unity of
  555. China, and because they share a common _written_ language.
  556.  
  557. At this point we usually quote Max Weinreich: "A language is a dialect 
  558. with an army and a navy."
  559.  
  560. Because of such problems, some linguists reject the mutual
  561. intelligibility criterion; but they do not propose to return to
  562. arguments on political and cultural grounds.  Instead, they prefer
  563. not to speak of dialects and languages at all, but only of different
  564. varieties, with varying degrees of mutual intelligibility.
  565. ===============================================================================
  566. 13. Are all languages equally complex, or are some more primitive than others?
  567.                                                               [--M.C. + M.R.]
  568. Before the 1900s many people believed that so-called "primitive 
  569. peoples" would have primitive languages, and that Latin and Greek--
  570. or their own languages-- were inherently superior to other tongues.
  571.  
  572. In fact, however, there is no correlation between type or complexity of
  573. culture and any measure of language complexity.  Peoples of very simple
  574. material culture, such as the Australian Aborigines, are often found to 
  575. speak very complex languages.
  576.  
  577. Obviously, the size of the vocabulary and the variety and sophistication of
  578. literary forms will depend on the culture.  The _grammar_ of all languages,
  579. however, tends to be about equally complex-- although the complexity may 
  580. be found in different places.  Latin, for instance, has a much richer
  581. system of inflections than English, but a less complicated syntax.
  582.  
  583. As David Crystal puts it, "All languages meet the social and psychological
  584. needs of their speakers, are equally deserving of scientific study, and can
  585. provide us with valuable information about human nature and society."
  586.  
  587. There are only two case of really simple languages:
  588.  
  589. * _Pidgins_, which result when speakers of different languages come to live 
  590. and work together.  Vocabulary is drawn from one or both languages, and a 
  591. very forgiving grammar devised.  Grammars of pidgins from around the world 
  592. have interesting similarities (e.g. they are likely to use repetition to 
  593. express plurals).  
  594.  
  595. A pidgin becomes a _creole_ when children acquire it as a native language;
  596. as it evolves to meet the needs of a primary language, its vocabulary and
  597. grammar become much richer.  If a pidgin is used over a long period (for
  598. example, Tok Pisin in Papua New Guinea), it may similarly develop into a 
  599. more complex language known as an _extended pidgin_.
  600.  
  601. * _Language death_, what happens when a language falls out of use-- an
  602. alarmingly widespread phenomenon, which has been studied in detail by
  603. linguists.  The process typically takes several generations, and involves
  604. an increasingly simplified grammar and impoverished lexicon.
  605. ===============================================================================
  606. 14. What about artificial languages, such as Esperanto?          [--markrose]
  607.  
  608. Hundreds of constructed languages have been devised in the last few centuries.
  609. Early proposals, such as those of Lodwick (1647), Wilkins, or Leibniz, were 
  610. attempts to devise an ideal language based on philosophical classification 
  611. of concepts, and used wholly invented words.  Most were too complex to learn,
  612. but one, Jean Francois Sudre's Solresol, achieved some popularity in the last
  613. century; its entire vocabulary was built from the names of the notes of 
  614. the musical scale, and could be sung as well as spoken.
  615.  
  616. Later the focus shifted to languages based on existing languages, with a 
  617. polyglot (usually European) vocabulary and a simplified grammar, whose purpose
  618. was to facilitate international communication.  Johann Schleyer's Volapu"k 
  619. (1880) was the first to achieve success; its name is based on English 
  620. ("world-speech"), and reflects Schleyer's notions of phonetic simplicity.  
  621.  
  622. It was soon eclipsed by Ludwig Zamenhof's Esperanto (1887), whose grammar 
  623. was simpler and its vocabulary more recognizable.  Esperanto has remained 
  624. the most successful and best-known artificial language, with a million or 
  625. more speakers and a voluminous literature; children of Esperantists have 
  626. even learned it as a native language.
  627.  
  628. Its relative success hasn't prevented the appearance of new proposals, such
  629. as Ido, Interlingua, Occidental, and Novial.  There have also been attempts
  630. to simplify Latin (Latino Sine Flexione, 1903) and English (Basic English, 
  631. 1930) for international use.  The recent Loglan and Lojban, based on 
  632. predicate logic, may represent a revival of a priori language construction.
  633.  
  634. See also Andrew Large, THE ARTIFICIAL LANGUAGE MOVEMENT (1985); Mario Pei, 
  635. ONE LANGUAGE FOR THE WORLD (1958); Detlev Blanke, INTERNATIONALE 
  636. PLANSPRACHEN (in German).  For websites, see the web version of the FAQ.
  637.  
  638. There is a newsgroup, soc.culture.esperanto, dedicated to Esperanto.  Also 
  639. see alt.language.artificial, dedicated to artificial languages in general.
  640.  
  641. The ConLang mailing list is devoted to the discussion of constructed and 
  642. artificial languages for general communication; its FAQ is on the web at
  643. http://personalweb.sierra.net/~spynx/FAQ/index.html.  To subscribe, 
  644. e-mail a message to listserv@brownvm.brown.edu consisting of the single
  645. line: subscribe conlang
  646.  
  647. The AuxLang list is devoted to discussions of the merits and
  648. practicality of particular international auxiliary languages.  To
  649. subscribe, send mail to listserv@brownvm.brown.edu consisting of the
  650. single line: subscribe auxlang
  651. ===============================================================================
  652. 15. What are some stories and novels that involve linguistics?    [--markrose]
  653.  
  654. The following list is by no means exhaustive.  It's based on James Myers'
  655. list of books, which was compiled the last time the subject came up on 
  656. sci.lang.  Additions and corrections are welcome; please suggest the
  657. approximate category and give the publication date, if possible.
  658.  
  659. ALIENS AND LINGUISTS: Language Study and Science Fiction, by Walter Meyers
  660. (1980) contains a general discussion and lists more works.
  661.  
  662. alien languages
  663.  
  664.     "Tlon, Uqbar, Orbis Tertius" in FICCIONES - Jorge Luis Borges (1956)
  665.     40000 IN GEHENNA - C.J. Cherryh (1983)
  666.     BABEL-17 - Samuel R. Delany (1966)
  667.     FLIGHT OF THE DRAGONFLY - Robert L. Forward (1984)
  668.     THE HAUNTED STARS - Edmond Hamilton
  669.     HELLSPARK - Janet Kagan (1988)
  670.     INHERIT THE STARS - James P. Hogan
  671.     "Not So Certain" - David I. Masson
  672.     "Omnilingual", in FEDERATION - H. Beam Piper
  673.     CONTACT - Carl Sagan (1985)
  674.     PSYCHAOS - E. P. Thompson
  675.     "A Martian Odyssey" in SF HALL OF FAME - Stanley Weinbaum (1934)
  676.     "A Rose for Ecclesiastes" in SF HALL OF FAME - Roger Zelazny (1963)
  677.     WELTGEIST SUPERSTAR - P.M. (1980)
  678.  
  679. futuristic varieties of English
  680.  
  681.     "Barrier" - Anthony Boucher
  682.     A CLOCKWORK ORANGE - Anthony Burgess (1962)
  683.     HELLFLOWER - eluki bes shahar (1991)
  684.     THE INHERITORS - William Golding (1955)
  685.     THE MOON IS A HARSH MISTRESS - Robert Heinlein (1966)
  686.     RIDDLEY WALKER - Russel Hoban (1980)
  687.     1984 - George Orwell (1948)
  688.  
  689. other invented languages
  690.  
  691.     NATIVE TONGUE - Suzette Haden Elgin (1984)
  692.     THE GAMEPLAYERS OF ZAN - M A Foster
  693.     "Gulf" in ASSIGNMENT IN ETERNITY - Robert A. Heinlein (1949)
  694.     ALWAYS COMING HOME - Usrula K. Le Guin
  695.     PALE FIRE - Vladimir Nabokov
  696.     THE KLINGON DICTIONARY - Marc Okrand (1985)
  697.     THE VOID-CAPTAIN'S TALE - Norman Spinrad
  698.     THE LORD OF THE RINGS - J R R Tolkien (1954-55)
  699.     THE MEMORANDUM - Vaclav Havel (1966)
  700.     THE LANGUAGES OF PAO - Jack Vance (1957)
  701.  
  702. linguist heroes
  703.  
  704.         RATES OF EXCHANGE - Malcolm Bradbury 
  705.     DOUBLE NEGATIVE - David Carkeet
  706.     THE FULL CATASTROPHE - David Carkeet
  707.     PYGMALION - George Bernard Shaw (1912)
  708.     THE POISON ORACLE - Peter Dickinson (1974)
  709.     OUT OF THE SILENT PLANET - C.S. Lewis (1943)
  710.     HANDS ON - Andrew Rosenheim (1992)
  711.     LEAR'S DAUGHTERS - M. Bradley Kellogg w/ William Rossow (1986)
  712.     THE SPARROW, CHILDREN OF GOD - Mary Doria Russell (1996, 98)
  713.  
  714. animal language
  715.  
  716.     WATERSHIP DOWN - Richard Adams (1972)
  717.     TARZAN OF THE APES - Edgar Rice Burroughs (1912)
  718.     CONGO - Michael Crichton (1980)
  719.  
  720. use of linguistic theory
  721.  
  722.     SNOW CRASH - Neal Stephenson (1992)
  723.     GULLIVER'S TRAVELS - Jonathan Swift (1726)
  724.     THE EMBEDDING - Ian Watson (1973)
  725.     Ozark trilogy - Suzette Haden Elgin
  726.     YONDER COMES THE OTHER END OF TIME - Suzette Haden Elgin
  727.  
  728. other
  729.  
  730.     THE TROIKA INCIDENT - James Cooke Brown (1969)   [Loglan]
  731.     ETXEMENDI - Florence Delay  [Chomsky ref]
  732.     TRITON - Samuel Delany [reflections on meaning]
  733.     SO YOU WANT TO BE A WIZARD - Diane Duane
  734.     TONGUES OF THE MOON - Philip Jose Farmer
  735.     DUNE - Frank Herbert (1965)
  736.     THE DISPOSSESSED - Ursula LeGuin (1974)
  737.     LOVE ME TOMORROW - Robert Rimmer (1976)   [Loglan]
  738. ===============================================================================
  739. 16. What about those Eskimo words for snow? (and other myths about language)
  740.                                                                [--markrose]
  741.  
  742. For more myths and what's really going on, see LANGUAGE MYTHS (1999), 
  743. edited by Laurie Bauer and Peter Trudgill (no linguistics knowledge needed).
  744.  
  745.    "The Eskimos have hundreds of words for snow."
  746.  
  747. This story is constantly being repeated, with various numbers given,
  748. despite the fact that it has no basis at all.  No one who repeats this
  749. pseudo-factoid can list the hundreds of words for you, or even cite a 
  750. work that does.  They just heard it somewhere.
  751.  
  752. The anthropologist Laura Martin has traced the development of this myth
  753. (including the steady growth in the number of words claimed).  Geoffrey
  754. Pullum summarizes her report in THE GREAT ESKIMO VOCABULARY HOAX (1991).
  755.  
  756. How many words are there really?  Well, the Yup'ik language in particular
  757. has about two dozen roots describing snow or things related to snow.  This
  758. is not particularly significant; English can amass about the same total:
  759. snow, sleet, slush, blizzard, flurry, avalanche, powder, hardpack,
  760. snowball, snowman, and other derivatives.
  761.  
  762. The Yup'ik total could be greatly expanded by other derived words, since
  763. the Inuit languages can form hundreds of words from a single root.  But
  764. this is true of all words in the language (and indeed of all agglutinative
  765. languages), not just the words for snow.
  766.  
  767.    "There's a town in Appalachia that speaks pure Elizabethan English."
  768.  
  769. There isn't.  All languages, everywhere, are constantly changing.  Some
  770. areas speak more conservative dialects, but we know of no case where 
  771. people speak exactly as their ancestors spoke centuries ago.
  772.  
  773. Of course, ancient languages are sometimes revived; biblical Hebrew has
  774. been revived (with some modifications) in modern Israel; and there's a
  775. village in India in which Sanskrit is being taught as an everyday
  776. language.  But these are conscious revivals of languages which have
  777. otherwise died out in everyday use, not survivals of living languages.
  778.  
  779.    "Chinese characters directly represent ideas, not spoken words."
  780.  
  781. Westerners have been taken by this notion for centuries, ever since
  782. missionaries started describing the Chinese writing system.  However, it's
  783. quite false.  Chinese characters represent specific Chinese words.  
  784.  
  785. (To be precise, almost all characters represent a particular syllable with
  786. a particular meaning; about 10% however represent one syllable of a 
  787. particular two-syllable word.)
  788.  
  789. The vast majority of characters consist of a _phonetic_ giving the
  790. approximate pronunciation of the word, plus a _signific_ giving a clue to
  791. its meaning (thus distinguishing different syllables having different
  792. meanings).  As an added difficulty, many of the phonetics are no longer
  793. helpful, because of sound changes since the characters were devised, over
  794. 2000 years ago.  However, it is estimated that 60% of the phonetics still
  795. give useful information about the character's pronunciation.
  796.  
  797. To be sure, Japanese (among other languages) uses Chinese characters too,
  798. and it is a very different language from Chinese.  However, we must look
  799. at exactly how the Japanese use the Chinese characters.  Generally they
  800. borrowed both the characters and the words represented; it's rather as if
  801. when we borrowed words like _psychology_ from Greek, we wrote them in the
  802. Greek alphabet.  Native Japanese words are also written using the Chinese
  803. characters for the closest Chinese words: if the Japanese word overlaps
  804. several Chinese words, different characters must be written in different
  805. contexts, according to the meanings in Chinese.
  806.  
  807. A good demythologizing of common notions about Chinese writing is found in
  808. THE CHINESE LANGUAGE: FACT AND FANTASY, by John DeFrancis (1984).
  809.  
  810.    "German lost out to English as the US's official language by 1 vote."
  811.  
  812. This entertaining story is also told of Greek, Latin, and even Hebrew.
  813.  
  814. There was never any such vote.  Dennis Baron, in THE ENGLISH ONLY QUESTION
  815. (1990), thinks the legend may have originated with a 1795 vote concerning
  816. a proposal to publish federal laws in German as well as English.  At one
  817. point a motion to table discussion (rather than referring the matter back
  818. to committee) was defeated 41-40.  The proposal was eventually defeated. 
  819.  
  820.    "Sign language isn't really a language."
  821.    "ASL is a gestural version of English."
  822.  
  823. Sign languages are true languages, with vocabularies of thousands of words,
  824. and grammars as complex and sophisticated as those of any other language,
  825. though with fascinating differences from speech.  If you think they are
  826. merely pantomime, try watching a mathematics lecture, a poetry reading, or
  827. a religious service conducted in Sign, and see how much you understand.
  828.  
  829. ASL (American Sign Language) is not an invented system like Esperanto; it
  830. developed gradually and naturally among the Deaf.  It has no particular
  831. relation to English; the best demonstration of this is that it is quite
  832. different from British Sign.  Curiously enough, it is most closely related
  833. to French Sign Language, due to the influence of Laurent Clerc, who came
  834. from Paris in 1817 to be the first teacher of the Deaf in the US.
  835.  
  836. ASL is not to be confused with Signed English, which is a word-for-word
  837. signed equivalent of English.  Deaf people tend to find it tiring, because
  838. its grammar, like that of spoken languages, is linear, while that of ASL is
  839. primarily spatial.
  840.  
  841. For more on Sign and the Deaf community, see Oliver Sacks' SEEING VOICES
  842. (1989), or Harlan Lane, WHEN THE MIND HEARS (1984) and THE MASK OF 
  843. BENEVOLENCE.
  844. ===============================================================================
  845. 17. Where can I get an electronic IPA font (or other electronic resources)?
  846.                                                                   [--markrose]
  847.      [Adapted from information posted to sci.lang by Sean Redmond,
  848.      Evan Antworth, Chris Brockett, Roy Cochrun, J"org Knappen, 
  849.      Harlan Messinger, Alex Rudnicky, Enrico Scalas, Mark Kantrowitz.
  850.  
  851.      If you know of other publicly available (and legal) fonts or 
  852.      other linguistic resources, please e-mail me or post to sci.lang, 
  853.      so they can be listed here.]
  854.  
  855. * A number of Postscript Type 1 and TrueType fonts (including IPA, Greek,
  856.   Cyrillic, Armenian, etc.) are available by ftp from 
  857.  
  858.      host       ftp.winsite.com
  859.      directory: pub/pc/win3/fonts/truetype
  860.  
  861.   List (ls) the directory to see what's available.  The files are zipped; 
  862.   a version of unzip is usually available on whatever host you use 
  863.   to ftp with.
  864.  
  865.   Note: TrueType files can be used under Windows or on the Macintosh.
  866.   I'm not sure if the unzipped files can be inserted directly into the
  867.   Mac's Fonts folder; I ran them through Fontographer first.
  868.  
  869. * The SIL IPA fonts (also in PostScript Type 1 and TrueType versions)
  870.   are also available by ftp from
  871.  
  872.      host:      linguistics.archive.umich.edu [141.211.32.2]
  873.      directory: 
  874.         Windows version: /msdos/windows/fonts/truetype/sil-ipa12.exe
  875.         Mac version:     /mac/system.extensions/font/type1/silipa1.2.cpt.hqx
  876.  
  877. * They are also available on diskette for $5.00 plus postage: $2.00 in U.S. 
  878.   or $5.00 outside U.S.  Order from:
  879.  
  880.      SIL Printing Arts Department
  881.      7500 W. Camp Wisdom Road
  882.      Dallas TX  75236   USA
  883.  
  884.      tel:    214-709-2495, -2440
  885.      fax:    214-709-3387.
  886.      e-mail: Margaret.Swauger@sil.org
  887.  
  888. * University College London also sells these fonts on disk ($32).  See:
  889.  
  890.      http://www.phon.ucl.ac.uk/home/wells/fonts.htm
  891.  
  892. * Some IPA fonts for TeX can be found in the CTAN archives
  893.  
  894.      ftp.dante.de
  895.      ctan.tug.org  (finger ctan@ftp.dante.de for mirrors)
  896.      ftp.tex.ac.uk
  897.  
  898.   in the directories
  899.  
  900.      tex-archive/fonts/wsuipa
  901.      tex-archive/fonts/tsipa
  902.      tex-archive/fonts/tipa     <-- the most recent
  903.  
  904. * The Carnegie-Mellon 100,000-word English dictionary can be retrieved
  905.   as follows.
  906.  
  907.      host:      ftp.cs.cmu.edu [128.2.206.173]
  908.      directory: project/fgdata/dict
  909.  
  910.   Retrieve the following files:
  911.  
  912.      README
  913.      cmudict.0.2.Z (compressed)
  914.      cmulex.0.1.Z (compressed)
  915.      phoneset.0.1
  916.  
  917. * WEBSITES related to linguistics or languages are listed in the web 
  918.   version of the FAQ: http://www.zompist.com/lang17.html#Websites
  919.  
  920. * sci.lang (since October 1994) is archived at
  921.  
  922.     ftp.cs.cmu.edu
  923.     /user/ai/pubs/news/sci.lang
  924.  
  925. * Kenneth Hyde maintains OUT In Linguistics, a mailing list for
  926.   lesbian/gay/bi folk interested in linguistics.  (Both qualifiers--
  927.   "lgb(-friendly)" and "linguistics"-- are important, please.)  For
  928.   information, e-mail kenny@udel.edu (Kenneth Hyde). To subscribe, send a
  929.   message with an empty subject and "subscribe outil-list" as the body
  930.   of the message to majordomo@udel.edu.
  931. ===============================================================================
  932. 18. How do I subscribe to the LINGUIST list?
  933.  
  934. The LINGUIST list is a mailing list dedicated to linguistics; it's more
  935. technical than sci.lang.  The easiest way to read and post to it is on
  936. its website at http://linguistlist.org; you can also use the website
  937. to have postings e-mailed to you.
  938. ===============================================================================
  939. 19. How can I represent phonetic symbols in ASCII?
  940.  
  941. The following table is a summary of Evan Kirshenbaum's IPA/ASCII schema,
  942. which a number of posters have been using in sci.lang and alt.usage.english.
  943. For more information, see the Web page at
  944.      http://www.hpl.hp.com/personal/Evan_Kirshenbaum/IPA/
  945.  
  946. This summary is presented for convenience only, and is not intended to
  947. forestall discussion of alternative systems.
  948.  
  949.      blb-- -lbd-- --dnt-- --alv-- -rfx- -pla-- --pal--- --vel-- -----uvl-----
  950.  
  951. nas    m      M       n[      n      n.            n^      N           n"
  952. stp  p b           t[ d[    t d   t. d.        c   J     k g      q    G
  953. frc  F V    f v    T  D     s z   s. z.  S Z   C C<vcd>  x Q      X    g"
  954. apr        r<lbd>     r[      r      r.            j       j<vel>      g"
  955. lat                   l[      l      l.            l^      L
  956. trl  b<trl>                r<trl>                                      r"
  957. flp                           *      *. 
  958. ejc  p`            t[`      t`                 c`        k'
  959. clk  p!            t!       c!                   c!      k!
  960. imp    b`             d`      d`                   J`      g`     q`   G`
  961.  
  962.  
  963.      ---- lbv ----   --phr--  ---glt---
  964.  
  965. nas         n<lbv>                               alv lat frc: s<lat> z<lat>
  966. stp  t<lbv> d<lbv>              ?                    lat flp: *<lat>
  967. frc  w<vls>   w      H H<vcd>   h<?>                 lat clk: l!
  968. apr           w                 h
  969.  
  970.  
  971.     ----- unr -----     unr     ----- rnd -----
  972.     fnt   cnt   bck     cnt     fnt   cnt   bck
  973.                         rzd
  974. hgh  i     i"    u-              y     u"    u
  975. smh  I                           I.          U
  976. umd  e   @<umd>  o-    R<umd>    Y           o
  977. mid        @             R             @.
  978. lmd  E     V"    V               W     O"    O
  979. low  &     a     A               &.    a.    A.
  980.  
  981.  
  982. Diacritics:
  983.       Vowels:     Consonants:            + =   ad hoc diacritic
  984.   ~   nasalized   velarized              [     dental
  985.   :   long                               !     click  
  986.   -   unrounded   syllabic               <H>   pharyngealized
  987.   .   rounded     retroflex              <h>   aspirated
  988.   `               ejective/implosive     <o>   unexploded or voiceless
  989.   ^               palatal                <r>   rhotacized
  990.   ;               palatalized            <w>   labialized
  991.   "   centered    uvular                 <?>   murmured
  992.    
  993. Other symbols:
  994.   $ %     ad hoc segment
  995.   []      phonetic transcription
  996.   //      phonemic transcription
  997.   #       syllable or word boundary
  998.   space   word/segment separator
  999.   ' ,     primary and secondary stress
  1000.   0-9     tones
  1001. ===============================================================================
  1002. 20. Is English a creole?
  1003.                                                                 [--markrose]
  1004. The change from Anglo-Saxon to Modern English (loss of gender and of
  1005. case inflection, phonological change, acquisition of a huge stock of French
  1006. and Latin vocabulary) is certainly dramatic, and has led some sci.lang 
  1007. posters, and even some linguists (e.g. Domingue, Bailey & Maroldt, 
  1008. Milroy) to the provocative suggestion that English suffered pidginization
  1009. or creolization at the time of the Norman Conquest (1066) or the Norse
  1010. invasions (from 865), or both.
  1011.  
  1012. This hypothesis, as Sarah Grey Thomason and Terrence Kaufman have
  1013. shown in LANGUAGE CONTACT, CREOLIZATION, AND GENETIC LINGUISTICS (1988), 
  1014. rests on an incomplete understanding of creolization and a shaky grasp on 
  1015. the history of English.  There is a wide range of language contact 
  1016. situations, from casual contact to deep structural interference; English is 
  1017. by no means the most striking of these cases.  It looks like a creole only 
  1018. if one ignores this range of phenomena and labels any case of moderate 
  1019. interference as creolization.
  1020.  
  1021. For many of the changes in question, the chronology does not work out.
  1022. For instance, the reduction of unstressed vowels to /@/, largely responsible
  1023. for the loss of Old English nominal declensions, had taken place *before*
  1024. the Conquest, and affected all of England, including areas never settled
  1025. by the Norse.  And English did absorb an immense amount of French and
  1026. Latin vocabulary, but most of this occurred well *after* the Conquest--
  1027. past 1450, two centuries after the nobility ceased to be French-speaking.
  1028.  
  1029. Other points to note: 1) most of the simplifications and foreign borrowings
  1030. seen in English occurred as well in other Germanic languages, notably
  1031. Dutch, Low German, and the Scandinavian languages; 2) a particularly
  1032. striking borrowing from Norse, the pronoun 'they', was probably adopted
  1033. to avoid what otherwise would have been a merge of 'he/him' with 'they/them';
  1034. 3) the total number of French-speaking invaders was not more than
  1035. 50,000, compared to an English-speaking population of over 1.5 million--
  1036. nowhere near the proportions that would threaten the normal inheritance
  1037. of English.
  1038. ===============================================================================
  1039. 21. How do you look up a word in a Chinese or Japanese dictionary?
  1040.                                                                 [--markrose]
  1041.  
  1042. The vast majority of Chinese characters can be divided into two parts, the
  1043. radical and the phonetic.  Each part is another, simpler character.  The
  1044. _radical_ gives an idea of the meaning-- rather a vague idea, since
  1045. traditionally there were only 214 different radicals.  The _phonetic_
  1046. identifies the sound, with a bit more precision: generally, all the
  1047. characters that share a phonetic rhymed 2000 years ago in Archaic Chinese.
  1048.  
  1049. (It's impossible to give examples in ASCII; see the Web page for more:
  1050. http://www.zompist.com/lang21.html)
  1051.  
  1052. Characters are arranged in most Chinese dictionaries by radical.  To find
  1053. an unknown character, then, you identify the radical, and look up its
  1054. section in the dictionary.  The radicals are arranged in order of increasing
  1055. complexity.  Each radical's section is ordered by the number of strokes in
  1056. the character.  Several characters may have the same number of strokes;
  1057. these must simply be scanned till the right one is found.
  1058.  
  1059. Sometimes it isn't easy to identify the radical-- it's in an odd position
  1060. (e.g. on the bottom or the right rather than the top or left side); or it's
  1061. drawn in an abbreviated form; or it's not clear which of several similar
  1062. radicals the character is listed under.  It's also important to know the
  1063. proper method for counting strokes.
  1064.  
  1065. If a character isn't composed of a radical + phonetic, it's usually treated
  1066. as one, graphically, for the purposes of dictionary lookup.  For instance,
  1067. the character for hao3 'good' is composed of the characters for 'woman' and
  1068. 'child'-- a _semantic_ compound.  It's simply listed under the 'woman'
  1069. radical, although zi3 'child' is not its phonetic.
  1070.  
  1071. The People's Republic simplified a number of characters and radicals, and
  1072. this changed the number of radicals-- there's 224 in my dictionary, for
  1073. instance.  The Japanese have made their own separate simplification.
  1074. ===============================================================================
  1075. 22. What about Nostratic and Proto-World?
  1076.                                                                 [--markrose]
  1077. In recent years some some linguists have attempted to reconstruct languages
  1078. far older than Indo-European.
  1079.  
  1080. *Nostratic*, said to underlie the Indo-European, Kartvelian (South Caucasion), 
  1081. Afro-Asiatic, Dravidian, Uralic, Altaic, Chukchi-Kamchatkan, and Eskimo-Aleut 
  1082. families, was first proposed by Holger Pedersen in 1903.  More recently
  1083. the greater part of work on Nostratic is due to Soviet linguists led by 
  1084. Vladislav Illich-Svitych, Aaron Dolgopolsky, and Vitaly Shevoroshkin.
  1085.  
  1086. The methodology is the traditional comparative method, and over 600 roots
  1087. have been proposed.  Most linguists remain skeptical, believing that chance
  1088. processes will have obscured any relationship at this level beyond
  1089. reconstruction, or question the accuracy of the derivations (a charge which
  1090. makes Nostraticists bristle).   Others simply suspend judgment, especially
  1091. since much of the supporting material for Nostratic is available only in
  1092. Russian.
  1093.  
  1094. A good overview on Nostratic is Kaiser and Shevoroshkin, "Nostratic", in
  1095. the _Annual Review of Anthropology_, 17:309.  Illich-Svitych's original
  1096. Russian article (from _Etymologia_, 1965) has been translated in
  1097. Shevoroshkin, ed., RECONSTRUCTING LANGUAGES AND CULTURES (1989).
  1098.  
  1099. Joseph Greenberg has proposed a grouping which covers much the same language
  1100. areas (omitting Afro-Asiastic and Dravidian, but adding Ainu and Gilyak),
  1101. called *Eurasiatic*.  Greenberg's method of _mass comparison_ (which he has
  1102. also used to group together almost all Native American languages into one
  1103. superfamily, Amerind) basically consists of assembling huge lists of
  1104. common words and doing eyeball comparisons.
  1105.  
  1106. This methodology has been severely criticized by many historical linguists.
  1107. If 'mass comparison' were applied to the Indo-European languages, it would
  1108. be bedevilled by false positives (caused by borrowing or chance) and by
  1109. specious phonetic or semantic similarites.  Greenberg's methods seem to
  1110. linguists to abandon the very methodological severity which has put
  1111. Indo-European linguistics on a scientific footing, and distinguished it from
  1112. the work of cranks.  Relax the rules enough, and you can derive any language
  1113. from any other.
  1114.  
  1115. Greenberg replies that the patterns he has found are compelling enough to
  1116. justify his methods, and that he is merely following in the footsteps of 
  1117. the originators of the comparative method: linguists had to decide that the 
  1118. Indo-European languages were related before attempting reconstructions.
  1119.  
  1120. The ultimate areal comparison would be *Proto-World*, the hypothetical
  1121. ancestor of all human languages.  Greenberg has mentioned Proto-World, but
  1122. since he is not much interested in reconstruction, his proposal is not much
  1123. more than a statement of the monogenetic theory (a single origin for all
  1124. languages).  Most linguists are skeptical that anything could be
  1125. reconstructed at this hypothetical time depth.
  1126.  
  1127. Greenberg's work on Amerind can be found in LANGUAGE IN THE AMERICAS (1987);
  1128. on Eurasiatic, in the forthcoming INDO-EUROPEAN AND ITS CLOSEST RELATIVES:
  1129. THE EURASIATIC LANGUAGE FAMILY.  Introductions to the Nostratic and
  1130. Proto-World controversies were published in both _The Atlantic_ and
  1131. _Scientific American_ in April 1991.  The essays in Lamb and Mitchell, eds.,
  1132. SPRUNG FROM SOME COMMON SOURCE (1991), are also relevant.
  1133.  
  1134. Loren Petrich maintains an annotated bibliography on Indo-European,
  1135. Nostratic, and Proto-World.  I am also indebted to Peter Michalove for
  1136. citations used in this entry.
  1137. ===============================================================================
  1138. 23.  What are phonemes and why's it so hard to lose a foreign accent? 
  1139.                                                                 [--markrose] 
  1140. The sounds (*phones*) humans can make are infinite; there's (almost always) 
  1141. a continuum of phones in between any two phones. 
  1142.  
  1143. In any one language, however, phones are grouped into 20 to 60 or so discrete 
  1144. groups of sounds called *phonemes*. The range of variation for each phoneme 
  1145. is discounted by speakers and hearers of the language, who perceive the 
  1146. entire range as "the same sound." 
  1147.  
  1148. The English phoneme /p/ has two phonetic realizations or *allophones*: 
  1149. aspirated [ph] beginning a word and non-aspirated [p] elsewhere. But
  1150. since the two types of /p/ never distinguish one word from another, speakers 
  1151. of English generally don't even notice the difference. (Linguists
  1152. write phonemic transcriptions between /slashes/, and phonetic transcriptions 
  1153. in [brackets].) 
  1154.  
  1155. If we can find two words with different meaning but only one difference in 
  1156. sound between them-- a *minimal pair*-- then we've found distinct phonemes; 
  1157. e.g. /p/ and /b/ in English 'pit' and 'bit'. If two sounds never occur in 
  1158. the same phonetic environment (e.g. English [p] and [ph])-- if they're in 
  1159. *complementary distribution*-- then they're probably allophones of a single 
  1160. phoneme.  (I say 'probably' because English [h] and [ng] are also in 
  1161. complementary distribution, but linguists balk at assigning them to one
  1162. phoneme.)
  1163.  
  1164. Other languages do not divide up the phonetic space in the same way.  For 
  1165. instance, /p/ and /ph/ are separate phonemes in Mandarin Chinese (as in 
  1166. /pa1/ 'eight' and /pha1/ 'flower').  And the vowels of 'late' and 'let', 
  1167. phonemes in English, are allophones of a single phoneme /e/ in Spanish. 
  1168.  
  1169. We're trained from childhood to make the phonetic distinctions our language 
  1170. uses to keep its phonemes apart, and to ignore those it doesn't.
  1171. Learning to make different distinctions in a foreign language is quite 
  1172. difficult-- usually harder than making new sounds our native language lacks 
  1173. entirely.  We'll continue to have an accent in the new language so long as 
  1174. we hear its sounds through our native language's phonemic filter. 
  1175. ===============================================================================
  1176. 24. How likely are chance resemblances between languages?
  1177.                                                                [--markrose]
  1178. It depends-- to an astonishing degree-- on the amount of phonetic and
  1179. semantic leeway you allow for a match.  But in general the answer is 
  1180. "Quite likely."
  1181.  
  1182. For the sort of comparisons that are often posted to sci.lang, where
  1183. perhaps just two consonants match, or nearly match, and the semantic 
  1184. matchups are quirky, one can expect literally hundreds of random matches.
  1185.  
  1186. For a detailed discussion, see the web version of the FAQ.
  1187. ===============================================================================
  1188. 25. How are tone languages sung?
  1189.                                                                [--markrose]
  1190. It varies.  Tones are basically ignored in Mandarin Chinese songs, 
  1191. for instance.  (Does this make them hard to understand?  Often, yes.)
  1192. However, Cantonese songs are generally written in such a way as to 
  1193. preserve the relative pitch of successive syllables.  E.g. a low tone 
  1194. following a high tone will be on a lower note.
  1195.  
  1196. For more, see: http://deall.ohio-state.edu/chan.9/articles/bls13.htm
  1197. ===============================================================================
  1198. 26. Why are there so many words for Germany?
  1199.                                                                [--markrose]
  1200. Basically, because there were Germans before there was a Germany. Each of 
  1201. the Germans' neighbors came up with their own name for them, long before 
  1202. there was a German state that people might want to refer to uniformly. 
  1203.  
  1204. _German_ is a relatively recent borrowing from Latin _Germanus_, whose origins
  1205. are uncertain. It's been referred to Latin _germanus_ 'brotherly', Germanic 
  1206. _*geromann-_ 'spear-man', Old Irish _gair_ 'neighbour', etc. 
  1207.  
  1208. _Deutsch_ comes from Proto-Germanic _*theudisko-z_ 'of the people', from 
  1209. _*theuda_ 'people, nation'; originally it was used to distinguish the speech 
  1210. of the people from Latin, the language of scholarship. The English word 
  1211. 'Dutch' is a derivative, and used to be used for any northern Germanic 
  1212. people, later narrowed down to those closest to England; the older usage is 
  1213. preserved in 'Pennsylvania Dutch'. 
  1214.  
  1215. The word *theuda survived into Middle English as _thede_, but was supplanted 
  1216. by Romance borrowings such as 'people' and 'nation'. Non-Germanic cognates 
  1217. include Oscan touto, Irish tu:ath, and Lithuanian tauta, all meaning 'people'. 
  1218.  
  1219. Italian _tedesco_ is another derivative of *theudisko-z. 
  1220.  
  1221. _Teutonic_ derives from a name of an ancient tribe in Jutland, the Teutones; 
  1222. if these were a German tribe their name is presumably another derivative of 
  1223. *theuda. 
  1224.  
  1225. French _allemand_ (and Spanish _alema'n_, etc., as well as older English 
  1226. _Almain_) derive from a particular tribe of Germans, the Alemanni ('all men'). 
  1227.  
  1228. Finnish _saksa_ derives from the name of another tribe, the Saxons. 
  1229.  
  1230. Russian _nemets_ is related to _nemoj_ 'dumb, mute'; to the ancient Slavs, not
  1231. speaking in an understandable language was as good as not speaking at all.
  1232. Hungarian _nemet_ is borrowed from Slavic. 
  1233.  
  1234. Latvian _Va:cija_ may derive from a word meaning 'west'. 
  1235. ===============================================================================
  1236. 27. Why do both English and French have plurals in -s? 
  1237. -Miguel Carrasquer Vidal (adapted by markrose)] 
  1238.  
  1239. Despite what one might think, these are independent developments. 
  1240.  
  1241. The English s-plural comes from the PIE o-stem nominative plural ending *-o:s, 
  1242. *-o:s, apparently extended in Germanic to *-o:s-es by addition of the PIE plural
  1243. suffix *-es (*-o:s itself comes from *-o-es). This *-o:ses became Proto-Germanic
  1244. *-o:ziz or *-o:siz, depending on the accent, which gave the attested forms--
  1245. Gothic -o:s, Old English -as, Old Saxon -os, and Old Norse -ar (with the change
  1246. to words that were not a-stems, a tendency which has since become nearly
  1247. universal.
  1248.  
  1249. The n-plural of German is generalized from the PIE n-stems (*-on-es --> -en).
  1250. It was still present in Old English n-stems, and survives today in a few words
  1251. like 'oxen'.
  1252.  
  1253. The Romance s-plurals (-as, -os, -es) are derived from the accusative (PIE
  1254. *-a:ns, *-ons, *-ens). Old French still had separate nominative and oblique
  1255. (accusative/ablative) forms, but in the end, grammatical cases were dropped
  1256. completely, and usually only the oblique forms were retained. 
  1257.  
  1258. In Italian and Romanian, final -s was phonetically lost, and the plurals are
  1259. based on the nominative. The Latin nominative plural, at least in the o- and
  1260. a:-stems, was based on PIE *-i, of pronominal origin, not *-es as in most other
  1261. IE languages.
  1262. ===============================================================================
  1263. 28. How did genders and cases develop in IE?
  1264.                                                    [--Mikael Thompson]
  1265. Early stages of proto-Indo-European (PIE) didn't have feminine gender. This 
  1266. is attested in Hittite, the oldest recorded IE language; it had only 
  1267. masculine and neuter genders, divided basically between animate and 
  1268. inanimate objects. For most noun classes the PIE endings can be reconstructed 
  1269. as follows: 
  1270.               Animate Inanimate 
  1271.    Subject     *-s      *-0 
  1272.    Object      *-m      *-0 
  1273. For animate nouns, *-s indicated the source of action, *-m the thing acted 
  1274. upon; the zero ending indicates no syntactic role. The basic idea is that 
  1275. only living things can act upon other things, so only animate nouns could 
  1276. take the *-s. 
  1277.  
  1278. Such a system is characteristic of active/stative languages. Other
  1279. features of PIE fit in with this observation; for instance, in PIE objects
  1280. like fire and water which are inanimate but move seemingly of their own
  1281. will have two separate names. In many languages with an active-stative
  1282. distinction there are such pairs of words. As this distinction was lost in
  1283. IE, different branches retained just one of the words: e.g. English water,
  1284. Greek hydor, Hittite watar form one group (from PIE *wed-), while Latin
  1285. aqua is from PIE *akwa:-.
  1286.  
  1287. The animate nouns are the historical source for the masculine gender, and
  1288. the inanimate nouns for the neuter. This is why in all the classic IE
  1289. languages the neuter nominative and accusative have identical forms, and
  1290. the only basic difference between masculine and neuter nouns is in the
  1291. accusative.
  1292.  
  1293. Earlier historical linguists cheerfully reconstructed eight cases for PIE,
  1294. on the model of Sanskrit; but the IE languages with many cases are now
  1295. considered to be innovative, not conservative. The other cases developed
  1296. from postpositions or derivational suffixes.  Luwian, a sister language of
  1297. Hittite, for instance, has no genitive, but has an adjective-forming
  1298. suffix -assi, as in harmah-assi-s 'of the head'. (This is an adjective,
  1299. not a genitive, because it can be declined.) Genitives in other languages
  1300. often seem to be developments of cognates to this suffix. 
  1301.  
  1302. PIE didn't bother much with specifying plurals, but when it did, it added
  1303. an *-s or other endings. The neuter plural in all IE languages is not
  1304. descended from this, however-- active/stative languages typically don't
  1305. mark plurals for inanimate nouns-- but is instead a collective noun,
  1306. treated grammatically as a singular. This collective noun ended in *-a in
  1307. the nominative and accusative, and eventually it developed into the
  1308. feminine, which in all the old IE languages has the same form in the
  1309. nominative singular as does the neuter plural nominative- accusative. It
  1310. is also why the Greek neuter plural took a singular verb. 
  1311.  
  1312. The reason it is called the feminine, of course, is that nouns indicating
  1313. females fell in this gender most of the time. This is puzzling, and
  1314. probably we must accept it as a fact whose explanation can't be recovered
  1315. from the depths of time.
  1316. ===============================================================================
  1317. 29. What is the Sapir-Whorf hypothesis?
  1318.                                                                 [--markrose] 
  1319. According to the Sapir-Whorf hypothesis, language determines the
  1320. categories and much of the content of thought. "We dissect nature along
  1321. lines laid down by our native languages... We cannot talk at all except by
  1322. subscribing to the organization and classification of data which the
  1323. [speech community] decrees," said Whorf, in LANGUAGE, THOUGHT, AND REALITY
  1324. (1956). "The fact of the matter is that the 'real world' is to a large
  1325. extent unconsciously built up on the language habits of the group," said
  1326. Sapir. 
  1327.  
  1328. Both were students of Amerindian languages, and were drawn to this
  1329. conclusion by analysis of the grammatical categories and semantic
  1330. distinctions found in these languages, fascinatingly different from those
  1331. found in European ones. (Neither linguist used the term 'Sapir-Whorf
  1332. hypothesis', however; Whorf referred to the 'linguistic relativity
  1333. principle'. Moreover, the principle was almost entirely elaborated by
  1334. Whorf alone.)
  1335.  
  1336. The idea enjoyed a certain vogue in the mid-20th century, not only among linguists but
  1337. among anthropologists, psychologists, and science fiction writers.
  1338.  
  1339. However, the strong form of the hypothesis is not now widely believed. The
  1340. conceptual systems of one language, after all, can be explained and
  1341. understood by speakers of another. And grammatical categories do not
  1342. really explain cultural systems very well.  Indo-European languages make
  1343. gender a grammatical category, and their speakers may be sexist-- but
  1344. speakers of Turkish or Chinese, languages without grammatical gender, are
  1345. not notably less sexist.
  1346.  
  1347. Whorf's analysis of what he called "Standard Average European" languages
  1348. is also questionable. E.g. he claims that "the three-tense system of SAE
  1349. verbs colors all our thinking about time." Only English doesn't have three
  1350. tenses; it has two, past and present; future events are expressed by the
  1351. present ("I see him tomorrow"), or by a modal expression, merely one of a
  1352. large class of such synthetic expressions. And for that matter, English
  1353. distinguishes more like six than three times ("I had gone, I went, I just
  1354. arrived, I'm going, I'm about to go, I'll go").
  1355.  
  1356. To prove his point, Whorf collected stories of confusions brought about by
  1357. language. For instance, a man threw a spent match into what looked like a
  1358. pool of water; only there was decomposing waste in the water, and escaping
  1359. gas was ignited by the spark-- boom!  But it's not clear that any
  1360. *linguistic* act is involved here. The man could think the pool looked
  1361. like water without thinking of the word 'water'; and he could fail to
  1362. notice the flammable vapors without doing any thinking at all. 
  1363.  
  1364. A weak form of the Sapir-Whorf hypothesis-- that language influences
  1365. without determining our categories of thought-- still seems reasonable,
  1366. and is even backed up by some psychological experiments-- e.g. Kay &
  1367. Kempton's finding that, in distinguishing color triads, a pair
  1368. distinguished by color names can seem more distinct than a pair with the
  1369. 'same' name which are actually more divergent optically (American
  1370. Anthropologist, March 1984).
  1371.  
  1372. It should be emphasized that, in their willingness to consider the idea
  1373. that non-Western people have languages and worldviews that match the
  1374. European's in precision and elegance, Sapir and Whorf were far ahead of
  1375. their time.
  1376.  
  1377. For a spirited and very readable defense of Whorf, see Suzette Haden
  1378. Elgin's THE LANGUAGE IMPERATIVE (2000).
  1379. ===============================================================================
  1380. 30. Languages keep simplifying-- how did they ever become complex?
  1381.                                                                [--markrose]
  1382. This question starts with an observation: the classical Indo-European 
  1383. languages, such as Latin, Greek, Old English, and Sanskrit, were highly 
  1384. inflected, while their modern descendants are not. For instance, French 
  1385. nouns have entirely lost the Latin case system, and French verbs have lost 
  1386. entire classes of forms, such as the passive voice. 
  1387.  
  1388. It's natural to ask: how did the classical languages get so complex in the 
  1389. first place? Why are there inflecting languages at all?  Why don't they 
  1390. all become isolating, like Chinese? 
  1391.  
  1392. The answer is that there are also complicating tendencies in language. 
  1393. Habitual idioms can become particles, which can become inflections-- 
  1394. a process called grammaticalization. 
  1395.  
  1396. For instance, the future and conditional tenses in Romance languages don't 
  1397. derive from classical Latin, but the infinitive plus forms of 'to have'. 
  1398. French has rather complicated verb clusters (je ne le lui ai pas donne) 
  1399. which are perhaps best analyzed as single verbs showing both subject and 
  1400. object agreement. 
  1401.  
  1402. Another example is the plethora of cases in Finnish, many of which derive 
  1403. from postpositions. Roger Lass has pointed out a cycle in Germanic 
  1404. languages where perfectives are developed, merge with the imperfect, 
  1405. and are developed anew. 
  1406.  
  1407. Chinese is not immune from this phenomenon-- Mandarin already has verbal 
  1408. particles like perfective le, or nominal particles like the possessive
  1409. /adjectivizing de. The diminutive -r even merges with the preceding 
  1410. syllable; e.g. dian3 + -r --> diar3 'a bit'.
  1411. ===============================================================================
  1412. 31. Where did (some word or phrase) come from?
  1413.                                                             [--markrose]
  1414. If you get a snarky response to such questions on sci.lang, it's because 
  1415. some people think you ought to look in a dictionary first. The American 
  1416. Heritage Dictionary traces words back (where possible) to Proto-Indo-European; 
  1417. and the massive Oxford English Dictionary, available at most libraries, 
  1418. contains not only etymologies but illustrative citations through the centuries. 
  1419.  
  1420. When it comes to word and phrase origins, most people's standard of proof 
  1421. seems to be "Doesn't violate the laws of physics!" But a plausible story is 
  1422. not a proof. The three most important types of evidence in etymology are 
  1423. citations, citations, citations. If you have some amusing theory that "the 
  1424. whole nine yards" derives from haberdashery, or baseball, or mortuaries, 
  1425. you'd better have appropriate examples from those fields in the right 
  1426. historical period. 
  1427.  
  1428. Anyway, here are brief notes on a few terms that have been asked about 
  1429. more than once on sci.lang. (Also see the alt.usage.english FAQ.) 
  1430.  
  1431. OK 
  1432.  
  1433. There's half a dozen explanations for this, but only one correct one, 
  1434. demonstrated with hundreds of citations by Allen Walker Read in 1964: 
  1435. OK stands for oll korrect, and dates to a fad for humorous mis-abbreviations 
  1436. which started in Boston newspapers in 1838. It spread nationwide when 
  1437. supporters of Martin Van Buren organized the "OK Club" during the 1840 
  1438. presidential campaign (giving the term a double meaning, since Van Buren's 
  1439. nickname was Old Kinderhook). 
  1440.  
  1441. Usted 
  1442.  
  1443. Some people have wondered if the Spanish formal second person pronoun Usted 
  1444. came from the Arabic honorific 'usta:dh. It doesn't; it's a well-attested 
  1445. abbreviation of vuestra merced 'your mercy'. There are transitional forms 
  1446. such as vuasted, vuesarced, voarced, as well as parallel constructions like 
  1447. usia from vuestra sen~oria, ucencia from vuestra excelencia. Compare also
  1448. Portuguese vossa merce^ --> vosmece^ --> voce^, as well as Catalan voste 
  1449. and Gallego vostede. Finally, note that the abbreviation Usted doesn't appear 
  1450. until 130 years after the Moors had been kicked out of Spain. 
  1451.  
  1452.