home *** CD-ROM | disk | FTP | other *** search
/ Internet Info 1997 December / Internet_Info_CD-ROM_Walnut_Creek_December_1997.iso / faqs / sci / answers / sci-lang-faq < prev    next >
Encoding:
Internet Message Format  |  1997-10-24  |  56.0 KB

  1. Path: senator-bedfellow.mit.edu!bloom-beacon.mit.edu!news-out.internetmci.com!newsfeed.internetmci.com!204.128.247.5!tezcat!user!not-for-mail
  2. From: markrose@xochi.tezcat.com (Mark Rosenfelder)
  3. Newsgroups: sci.lang,sci.answers,news.answers
  4. Subject: sci.lang FAQ (Frequently Asked Questions)
  5. Followup-To: sci.lang
  6. Date: 23 Oct 1997 13:14:57 -0500
  7. Organization: SPSS Inc.
  8. Lines: 1148
  9. Approved: news-answers-request@MIT.Edu
  10. Expires: Sat, 27 Dec 1997 00:00:00 GMT
  11. Message-ID: <62o471$e2e@xochi.tezcat.com>
  12. NNTP-Posting-Host: xochi.tezcat.com
  13. Xref: senator-bedfellow.mit.edu sci.lang:78984 sci.answers:7269 news.answers:115238
  14.  
  15. Archive-name: sci-lang-faq
  16. Version: 2.16.1
  17. Last-modified: 23 Oct 1997
  18. Last-posted: 23 Oct 1997
  19.  
  20. Except where noted, written by Michael Covington (mcovingt@ai.uga.edu)
  21. Maintained by Mark Rosenfelder (markrose@spss.com)
  22.  
  23.       The Web version of this FAQ is at
  24.          http://www.tezcat.com/~markrose/langfaq.html
  25.  
  26.       changes this month: added another sf book
  27.       
  28.  
  29. NOTE: This FAQ file doesn't cover everything!  Many good books and many 
  30.       important ideas are left unmentioned.  All readers should be aware 
  31.       that linguistics is a young science and that linguists rarely agree 
  32.       100% on anything.
  33.  
  34. DISTRIBUTION: This file may be freely distributed electronically, or 
  35.       as handouts in linguistics classes.  Please retain the author
  36.       attributions and addresses, and this paragraph.  Before using it 
  37.       in print, please contact the authors.
  38. ===============================================================================
  39. CONTENTS
  40.  
  41.  1. What is sci.lang for?
  42.  2. What is linguistics?
  43.  3. Does linguistics tell people how to speak or write properly?
  44.  4. What are some good books about linguistics?
  45.  5. How did language originate?
  46.  6. What is known about prehistoric language?
  47.  7. What do those asterisks mean?
  48.  8. How are present-day languages related?
  49.  9. Why do Hebrew and Yiddish [etc.] look alike if they aren't related?
  50. 10. How do linguists decide that languages are related?
  51. 11. What is Noam Chomsky's transformational grammar all about?
  52. 12. What is a dialect?  (Relation between dialects and languages.)
  53. 13. Are all languages equally complex, or are some more primitive than others?
  54. 14. What about artificial languages, such as Esperanto?          
  55. 15. What are some stories and novels that involve linguistics?
  56. 16. What about those Eskimo words for snow? (and other myths about language)
  57. 17. Where can I get an electronic IPA font (or other electronic resources)?
  58. 18. How do I subscribe to the LINGUIST list?
  59. 19. How can I represent phonetic symbols in ASCII?
  60. 20. Is English a creole?
  61. 21. How do you look up a word in a Chinese or Japanese dictionary?
  62. 22. What about Nostratic and Proto-World?
  63. 23. What are phonemes and why's it so hard to lose a foreign accent? 
  64. ===============================================================================
  65. 1. What is sci.lang for?
  66.  
  67. Discussion of the scientific or historical study of human language(s).
  68. Note the "sci." prefix.  The main concern here is with _facts_ and
  69. theories accounting for them.
  70.  
  71. For advice on English usage, see alt.usage.english or misc.writing.
  72. For casual chatter about other languages see soc.culture.<whatever>.
  73. Discussion of or in Greek or Latin is available in sci.classics.
  74. The sci.lang.translation newsgroup focusses on translation and issues of 
  75.   concern to translators and interpreters.
  76. The comp.ai.nat-lang newsgroup focusses on natural language processing
  77.   by computers.
  78.  
  79. Like all "sci." newsgroups, sci.lang is not meant to substitute for
  80. a dictionary or even a college library.  If the answer to your question
  81. can be looked up easily, then do so rather than using the net.
  82. If you don't have a library, then ask away, but explain your situation.
  83. ===============================================================================
  84. 2. What is linguistics?
  85.  
  86.   The scientific study of human language, including:
  87.      Phonetics (physical nature of speech)
  88.      Phonology (use of sounds in language)
  89.      Morphology (word formation)
  90.      Syntax (sentence structure)
  91.      Semantics (meaning of words & how they combine into sentences)
  92.      Pragmatics (effect of situation on language use)
  93.  
  94.   Or, carving it up another way:
  95.      Theoretical linguistics (pure and simple: how languages work)
  96.      Historical linguistics (how languages got to be the way they are)
  97.      Sociolinguistics (language and the structure of society)
  98.      Psycholinguistics (how language is implemented in the brain)
  99.      Applied linguistics (teaching, translation, etc.)
  100.      Computational linguistics (computer processing of human language)
  101.  
  102.   Some linguists also study sign language, non-verbal communication,
  103.   animal communication, and other topics besides spoken language.
  104. ===============================================================================
  105. 3. Does linguistics tell people how to speak or write properly?
  106.  
  107. No.  Linguistics is descriptive, not prescriptive.
  108. Linguistics can often supply facts which help people arrive at a
  109. recommendation or value judgement, but the recommendation or value
  110. judgement is not part of linguistic science itself.
  111. ===============================================================================
  112. 4. What are some good books about linguistics?
  113.  
  114. (These are cited by title and author only. Full ordering information
  115. can be obtained from BOOKS IN PRINT, available at most bookstores and
  116. at even the smallest public libraries.)
  117.  
  118.   CAMBRIDGE ENCYCLOPEDIA OF LANGUAGE, by David Crystal (1987) is a good place 
  119.      to start if you are new to this field.
  120.   LANGUAGE, by Edward Sapir (1921), is a readable survey of linguistics 
  121.      that is still worthwhile despite its age.
  122.   AN INTRODUCTION TO LANGUAGE, by Fromkin and Rodman (1974), is one of the 
  123.      best intro linguistics survey texts.  There are many others.
  124.   CAMBRIDGE TEXTBOOKS IN LINGUISTICS (a series) consists of good,
  125.      modestly priced introductions to all the areas of linguistics.
  126.   Any encyclopedia will give you basic information about widely studied
  127.      languages, alphabets, etc.
  128. ===============================================================================
  129. 5. How did language originate?
  130.  
  131. Nobody knows.  Very little evidence is available.
  132. See however D. Bickerton, LANGUAGE AND SPECIES (1990).
  133. ===============================================================================
  134. 6. What is known about prehistoric language?
  135.  
  136. Quite a lot, if by "prehistoric" you'll settle for maybe 2000 years
  137. before the development of writing.  (Language is many thousands of years
  138. older than that.)
  139.  
  140. Languages of the past can be recovered by comparative reconstruction
  141. from their descendants.  The comparative method relies mainly on
  142. pronunciation, which changes very slowly and in highly systematic
  143. ways.  If you apply it to French, Spanish, and Italian, you 
  144. reconstruct late colloquial Latin with a high degree of accuracy;
  145. this and similar tests show us that the method works.
  146.  
  147. Also, if you use the comparative method on unrelated languages,
  148. you get nothing. So comparative reconstruction is a test of whether 
  149. languages are related (to a discernible degree).
  150.  
  151. The ancient languages Latin, Greek, Sanskrit, and several others form 
  152. a group known as "Indo-European."  Comparative reconstruction from 
  153. them gives a language called Proto-Indo-European which was spoken 
  154. around 2500 B.C.  Many Indo-European words can be reconstructed with 
  155. considerable confidence (e.g., *ekwos 'horse').  The grammar was 
  156. similar to Homeric Greek or Vedic Sanskrit.  Similar reconstructions are
  157. available for some other language families, though none has been as 
  158. thoroughly reconstructed as Indo-European.
  159. ===============================================================================
  160. 7. What do those asterisks mean?
  161.  
  162. Attached to a word, either of 2 things.
  163. An unattested, reconstructed word (such as Indo-European *ekwos);
  164. or an ungrammatical sentence (such as *Himself saw me).
  165.  
  166. (In a generative rule, such as AP -> Adj (AP)*, it indicates that
  167. an element may be repeated zero or more times.)
  168. ===============================================================================
  169. 8. How are present-day languages related?
  170.                                                            [--Scott DeLancey]
  171.  
  172. This is an INCOMPLETE list of some of the world's language families.  More
  173. detailed classifications can be found in Voegelin and Voegelin, CLASSIFICATION
  174. AND INDEX OF THE WORLD'S LANGUAGES (1977), and M. Ruhlen, A GUIDE TO THE 
  175. WORLD'S LANGUAGES (1987).  (Note: Ruhlen's classification recognizes a 
  176. number of higher-order groups which most linguists regard as speculative).
  177.  
  178. A language family is a group of languages that have been proven to have
  179. descended from a common ancestral language.  Branches of families likewise
  180. represent groups of languages with a more recent common ancestor.  For 
  181. example, English, Dutch, and German have a common ancestor which we label
  182. Proto-West-Germanic, and thus belong to the West Germanic branch of Germanic.
  183. Icelandic and Norwegian are descended from Proto-North Germanic, a separate 
  184. branch of Germanic.  All the Germanic languages have a common ancestor, 
  185. Proto-Germanic; farther back, this ancestor was descended from Proto-Indo-
  186. European, as were the ancestors of the Italic, Slavic, and other branches.
  187.  
  188. Not all languages are known to be related to each other.  It is possible that 
  189. they are related but the evidence of relationship has been lost; it's also 
  190. possible they arose separately.  It is likely that some of the families 
  191. listed here will eventually turn out to be related to one another.
  192.  
  193. While low-level close relationships are easy to demonstrate, higher-order 
  194. classification proposals must rely on more problematic evidence and tend to 
  195. be controversial.  Recently linguists such as Joseph Greenberg and Vitalij 
  196. Shevoroshkin have attracted attention both in linguistic circles and in the 
  197. popular press with claims of larger genetic units, such as Nostratic 
  198. (comprising Indo-European, Uralic, Altaic, Dravidian, and Afroasiatic) or 
  199. Amerind (to include all the languages of the New World except Na-Dene and
  200. Eskimo-Aleut).  Most linguists regard these hypotheses as having a grossly 
  201. insufficient empirical foundation, and argue that comparisons at that depth 
  202. are not possible using available methods of historical linguistics.
  203.  
  204. This list isn't intended to be exhaustive, even for families like Germanic
  205. and Italic.  Nor is it the last word on what's a "language"; see question 12.
  206.  
  207.   Note: English is not descended from Latin.
  208.         English is a Germanic language with a lot of Latin vocabulary,
  209.         borrowed from French in the Middle Ages.
  210.  
  211. INDO-EUROPEAN
  212.     GERMANIC
  213.       North Germanic:  Icelandic, Norwegian / Swedish / Danish
  214.       East Germanic:  Gothic (extinct)
  215.       West Germanic:  English, Dutch, German, Yiddish
  216.     ITALIC
  217.       Osco-Umbrian:  Oscan, Umbrian (extinct languages of Italy)
  218.       Latin and its modern descendants (Italian, Spanish, Portuguese, 
  219.          Catalan, Rumanian, French, etc.)
  220.     CELTIC
  221.       P-Celtic:  Welsh, Breton, Cornish
  222.       Q-Celtic:  Irish, Scots Gaelic, Manx
  223.       Some extinct European languages were also Celtic, notably those of Gaul
  224.     HELLENIC:  Greek (ancient and modern)
  225.     SLAVIC:  Russian, Bulgarian, Polish, Czech, Serbo-Croatian, etc. 
  226.          (not Rumanian or Albanian)
  227.     BALTIC:  Lithuanian and Latvian
  228.     INDO-IRANIAN
  229.       Indic:  Sanskrit and its modern descendants (Hindi-Urdu, 
  230.          Gypsy (Romany), Bengali, etc.)
  231.       Iranian: Persian (ancient and modern), Pashto (Afghanistan), others
  232.     ALBANIAN:  Albanian
  233.     ARMENIAN:  Armenian
  234.     TOKHARIAN (an extinct language of NW China)
  235.     HITTITE (extinct language of Turkey)
  236.  
  237. AFRO-ASIATIC
  238.     SEMITIC:  Arabic, Hebrew (not Yiddish; see above), Aramaic, Amharic
  239.       and other languages of Ethiopia
  240.     CHADIC:  languages of northern Africa, e.g. Hausa
  241.     CUSHITIC:  Somali, other languages of eastern Africa
  242.     EGYPTIAN:  Ancient Egyptian
  243.     BERBER:  languages of North Africa
  244.  
  245. NIGER-KORDOFANIAN:  includes most of the languages of sub-Saharan 
  246.     Africa.  Most of the languages are in the NIGER-CONGO branch; the
  247.     most widely known subgroup of N-C is BANTU (Swahili, Zulu, Xhosa, etc.) 
  248.  
  249. URALIC 
  250.     Finnish, Estonian, Saami (Lapp), Hungarian, and several 
  251.     languages of central Russia
  252.  
  253. MONGOL:  Mongolian, Buryat, Kalmuck, etc.
  254. TURKIC:  Turkish, Azerbaijani, Kazakh, and other languages of Central Asia
  255.  
  256.     Some linguists group the Mongol and Turkic families together as ALTAIC.
  257.     Rather more controversially, some add Korean and Japanese to this group.
  258.  
  259.     It has been claimed that URALIC and ALTAIC are related (as URAL-ALTAIC),
  260.     but this idea is not widely accepted.
  261.  
  262. DRAVIDIAN:  languages of southern India, including Tamil, Telugu, etc.
  263.  
  264. SINO-TIBETAN
  265.     SINITIC:  Chinese (several "dialects", or arguably distinct languages:
  266.       Mandarin, Wu (Shanghai), Min (Hokkien [Fujian], Taiwanese), 
  267.       Yue (Cantonese), Hakka, Gan, Xiang
  268.     TIBETO-BURMAN: Tibetan, Burmese, various languages of Burma,
  269.       China, India, and Nepal
  270.  
  271. AUSTROASIATIC
  272.     MON-KHMER:  Vietnamese, Khmer (Cambodian), and various minority 
  273.       and tribal languages of Southeast Asia
  274.     MUNDA:  tribal languages of eastern India
  275.  
  276. AUSTRONESIAN
  277.     Malay-Indonesian, other languages of Indonesia (Javanese, etc.)
  278.     Philippine languages: Tagalog, Ilocano, Bontoc, etc.
  279.     Aboriginal languages of Taiwan (Tsou, etc.)
  280.     Polynesian languages: Hawaiian, Maori, Samoan, Tahitian, etc.
  281.     Micronesian:  Chamorro (spoken in Guam), Yap, Truk, etc.
  282.     Malagasy (spoken in Madagascar)
  283.   Most of these languages fall in a branch called MALAYO-POLYNESIAN
  284.  
  285. JAPANESE:  A number of linguists argue that Japanese is ALTAIC; others,
  286.     that it is most closely related to AUSTRONESIAN, or that it represents 
  287.     a mixture of AUSTRONESIAN and ALTAIC elements.
  288.  
  289. TAI-KADAI:  Thai, Lao, and other languages of southern China and 
  290.     northern Burma.  Possibly related to AUSTRONESIAN.  
  291.     An outdated hypothesis that TAI is part of SINO-TIBETAN is still 
  292.     often found in reference works and introductory texts.
  293.  
  294. AUSTRALIA:  the Aboriginal languages of Australia are conservatively 
  295.     classified into 26 families, the largest being PAMA-NYUNGAN, consisting
  296.     of about 200 languages originally spoken over 80-90% of Australia.
  297.  
  298. A large number of language families are found in North and South America.
  299. There are numerous proposals which group these into larger units, some of
  300. which will probably be demonstrated in time.  To date no New World language 
  301. has been proven to be related to any Old World family.  The larger North 
  302. American families include:
  303.  
  304. ESKIMO-ALEUT:  two Eskimo languages and Aleut.
  305. ATHAPASKAN:  most of the languages of Alaska and northwestern Canada,
  306.     also includes Navajo and Apache.  Eyak (in Alaska) is related to
  307.     Athapaskan; some linguists put these together with Tlingit and Haida
  308.     in a NA-DENE family.
  309. ALGONQUIAN:  most of Canada and the Northeastern U.S., includes
  310.     Cree, Ojibwa, Cheyenne, Blackfoot
  311. IROQUOIAN:  the languages of NY state (Mohawk, Onondaga, etc.) and Cherokee
  312. SIOUAN:  includes Dakota/Lakhota and other languages of the Plains
  313.     and Southeast U.S.
  314. MUSKOGEAN: Choctaw, Alabama, Creek, Mikasuki (Seminole) and other
  315.     languages of the southeast U.S.
  316. UTO-AZTECAN:  a large family in Mexico and the Southwestern U.S., 
  317.     includes Nahuatl (Aztec), Hopi, Comanche, Paiute, etc.
  318. SALISH:  languages of Washington and British Columbia
  319. HOKAN:  languages of California and Mexico; a controversial grouping
  320. PENUTIAN:  languages of California and Oregon; also controversial
  321.  
  322. Work on documentation and classification of South American languages still 
  323. has a long way to go.  Generally recognized families include:
  324.  
  325. ARAWAKAN, TUCANOAN, TUPI-GUARANI (including Guarani, a national language
  326. of Paraguay), CARIBAN, ANDEAN (including Quechua and Aymara)
  327.  
  328. LANGUAGE ISOLATES:  A number of languages around the world have never been
  329. successfully shown to be related to any others-- in at least some cases 
  330. because any related languages have long been extinct.  The most famous 
  331. isolate is Basque, spoken in northern Spain and southern France; it is 
  332. apparently a survival from before the Indo-Europeanization of Europe.
  333. ===============================================================================
  334. 9. Why do  Hebrew and Yiddish
  335.            Japanese and Chinese
  336.            Persian and Arabic
  337.    look so much alike if they aren't related?
  338.  
  339. Distinguish LANGUAGE from WRITING SYSTEM.
  340. In each of these cases one language has adopted part or all of the 
  341. writing system of an unrelated language.
  342.  
  343. (To a Chinese, English and Finnish look alike, because they're written 
  344. in the same alphabet.  Yet they are not historically related.)
  345.  
  346. An excellent introduction to writing systems is Geoffrey Sampson's
  347. WRITING SYSTEMS (1985).
  348. ===============================================================================
  349. 10. How do linguists decide that languages are related?           [--markrose]
  350.  
  351. When linguists say that languages are related, they're not just remarking 
  352. on their surface similarity; they're making a technical statement or claim
  353. about their history-- namely, that they can be regularly derived from a 
  354. common parent language.
  355.  
  356. Proto-languages are reconstructed using the comparative method.  The 
  357. first stage is to inspect and compare large amounts of vocabulary from the 
  358. languages in question.  Where possible we compare entire _paradigms_ (sets 
  359. of related forms, such as the those of the present active indicative in 
  360. Latin), rather than individual words.
  361.  
  362. The inspection should yield a set of regular sound correspondences between 
  363. the languages.  By regular, we mean that the same correspondences are 
  364. consistently observed in identical phonetic environments.  Finally, _sound 
  365. changes_ are formulated: language-specific rules which specify how the 
  366. original common form changed in order to produce those observed in each 
  367. descendent language.
  368.  
  369. Applying the comparative method to the Romance languages, we might find
  370.  
  371.   'I sense'  Sard /sento/  French /sa~/   Italian /sento/   Spanish /sjEnto/
  372.   'sleep'         /sonnu/         /som/           /sonno/           /suEn^o/
  373.  
  374.   'hundred'       /kentu/         /sa~/           /tSento/          /sjEnto/
  375.   'five'          /kimbe/         /sE~k/          /tSinkwe/         /sinko/
  376.  
  377.   'I run'         /kurro/         /kur/           /korro/           /korro/
  378.   'story'         /kontu/         /ko~t@/         /(rak)konto/      /kuEnto/
  379.  
  380. and hundreds of similar examples.  We see some correspondences--
  381.  
  382.   (1)        Sard /s/      French /s/     Italian /s/       Spanish /s/
  383.   (2)             /k/             /s/             /tS/              /s/
  384.   (3)             /k/             /k/             /k/               /k/
  385.  
  386. but they seem to conflict: does Sard /k/ correspond to Spanish /s/ or /k/?
  387. Does French /s/ correspond to Italian /s/ or /tS/?
  388.  
  389. In fact we will find that the correspondences are regular, once we observe
  390. that (2) is seen before a front vowel (i or e), while (3) is seen in other
  391. environments.  Alternations within paradigms, such as It. /diko/ 'I say' 
  392. vs. /ditSe/ 'says', will help us make and confirm such generalizations.
  393.  
  394. We may interpret these now-regular correspondences as indicating that an 
  395. initial /s/ in the proto-language has been retained in all four languages, 
  396. and likewise initial /k/ in Sard; but that /k/ changed to /s/ or /tS/ in 
  397. the other languages in the environment of a front vowel.
  398.  
  399. Actually, this process is iterative.  For instance, at first glance we 
  400. might think that German _haben_ and Latin _habere_ 'have' are obvious 
  401. cognates.  However, after noting the regular correspondence of German h to 
  402. Latin c, we are forced to change our minds, and look to _capere_ 'seize' 
  403. as a better cognate for _haben_.
  404.  
  405. Thus, similarity of words is only a clue, and perhaps a misleading one.
  406. Linguists conclude languages are related, and thus derive from a common
  407. ancestor, only if they find *regular* sound correspondences between them.
  408.  
  409. To complicate things, derivations may be obscured by irregular changes,
  410. such as dissimilation, borrowing, or analogical change.  For instance, 
  411. the normal development of Middle English _kyn_ is 'kine', but this word
  412. has been largely replaced by 'cows', formed from 'cow' (ME _cou_) on the 
  413. analogy of word-pairs like stone : stones.  Analogy often serves to reduce 
  414. irregularities in a language (here, an unusual plural).
  415.  
  416. _Borrowing_ refers to taking words from other languages, as English has
  417. taken 'search' and 'garage' from French, 'paternal' from Latin, 'anger' from 
  418. Old Norse, and 'tomato' from Nahuatl.  How do we know that English doesn't
  419. derive from French or Nahuatl?  The latter case is easy to eliminate: 
  420. regular sound correspondences can't be set up between English and Nahuatl.
  421.  
  422. But English has borrowed so heavily from French that regular correspondences 
  423. do occur.  Here, however, we find that the French borrowings are thickest in 
  424. government, legal, and military domains; while the basic vocabulary (which 
  425. languages borrow less frequently) is more akin to German.  Paradigmatic 
  426. correspondences like sing/sang/sung vs. singen/sang/gesungen also help show
  427. that the Germanic words are inherited, the French ones borrowed.
  428. ===============================================================================
  429. 11. What is Noam Chomsky's transformational grammar all about?
  430.  
  431. Several things; it really comprises several layers of theory:
  432.  
  433. (1) The hypothesis that much of the structure of human language is
  434. inborn ("built-in") in the human brain, so that a baby learning to
  435. talk only has to learn the vocabulary and the structural "parameters"
  436. of his native language -- he doesn't have to learn how language works
  437. from scratch.
  438.  
  439. This is widely (but not universally) believed; the main evidence consists of:
  440.    - The fact that babies learn to talk remarkably well from what seems
  441.      to be inadequate exposure to language; it can be shown in detail
  442.      that babies acquire some rules of grammar that they could never
  443.      have "learned" from what is available to them, if the structure of
  444.      language were not partly built-in.
  445.    - The fact that the structure of language on different levels
  446.      (vocabulary, ability to connect words, etc.) can be lost by injury
  447.      to specific areas of the brain.
  448.    - The fact that there are unexpected structural similarities between
  449.      all known languages.
  450. For detailed exposition see Cook, CHOMSKY'S UNIVERSAL GRAMMAR (1988), 
  451. Newmeyer, GRAMMATICAL THEORY: ITS LIMITS AND POSSIBILITIES (1983), and
  452. Pinker, THE LANGUAGE INSTINCT (1994).
  453.  
  454. (2) The hypothesis that to adequately describe the grammar of a human
  455. language, you have to give each sentence at least two different structures, 
  456. called "deep structure" and "surface structure", together with rules
  457. called "transformations" that relate them. 
  458.  
  459. This is hotly debated.  Some theories of grammar use two levels and
  460. some don't.  Chomsky's original monograph, SYNTACTIC STRUCTURES (1957),
  461. is still well worth reading; this is what it deals with.
  462.  
  463. (3) Chomsky's name is associated with specific flavors of transformational
  464. grammar.  The model elaborated over the last few years is called GB
  465. (government and binding) theory; however, Chomsky's 1995 book on Minimalism
  466. contains significant departures from earlier work in GB.
  467.  
  468. Bill Turkel (bill@hivnet.ubc.ca) runs a mailing list on Minimalism; e-mail
  469. him for more information. 
  470.  
  471. (4) Some people think Chomsky is the source of the idea that grammar ought
  472. to be viewed with mathematical precision.  (Thus there are occasional
  473. vehement anti-Chomsky polemics such as THE NEW GRAMMARIAN'S FUNERAL, which
  474. are really polemics against grammar per se.)
  475.  
  476. Although Chomsky contributed some valuable techniques, grammarians have
  477. _always_ believed that grammar was a precise, mechanical thing.  They
  478. are highly divided, however, on the nature and function of those mechanisms!
  479. ===============================================================================
  480. 12. What is a dialect?
  481.                                                               [--M.C. + M.R.]
  482. A dialect is any variety of a language spoken by a specific community of
  483. people. Most languages have many dialects.
  484.  
  485. Everyone speaks a dialect.  In fact everyone speaks an _idiolect_, i.e.,
  486. a personal language.  (Your English language is not quite the same as
  487. my English language, though they are probably very, very close.)
  488.  
  489. A group of people with very similar idiolects are considered to be
  490. speaking the same dialect.  Some dialects, such as Standard American
  491. English, are taught in schools and used widely around the world.
  492. Others are very localized.  
  493.  
  494. Localized or uneducated dialects are _not_ merely failed attempts to speak
  495. the standard language.  William Labov and others have demonstrated, for
  496. example, that the speech of inner-city blacks has its own intricate
  497. grammar, quite different in some ways from that of Standard English.
  498.  
  499. It should be emphasized that linguists do not consider some dialects 
  500. superior to others-- though speakers of the language may do so;
  501. and linguists do study people's attitudes toward language, since 
  502. these have a strong effect on the development of language.
  503.  
  504. Linguists call varieties of language "dialects" if the speakers can
  505. understand each other and "languages" if they can't.  For example,
  506. Irish English and Southern American English are dialects of English,
  507. but English and German are different languages (though related).
  508.  
  509. This criterion is not always as easy to apply as it sounds.
  510. Intelligibility may vary with familiarity and interest, or may depend
  511. on the subject.  A more serious problem is the _dialect continuum_: a
  512. chain of dialects such that any two adjoining dialects are mutually
  513. intelligible, but the dialects at the ends are not.  Speakers of
  514. Belgian Dutch, for instance, can't understand Swiss German, but
  515. between them there lies a continuum of mutually intelligible dialects.
  516.  
  517. Sometimes the use of the terms "language" or "dialect" is politically
  518. motivated.  Norwegian and Danish (being mutually intelligible) are
  519. dialects of the same language, but are considered separate languages
  520. because of their political independence.  By contrast, Mandarin and
  521. Cantonese, which are mutually unintelligible, are often referred to
  522. as "dialects" of Chinese, due to the political and cultural unity of
  523. China, and because they share a common _written_ language.
  524.  
  525. Because of such problems, some linguists reject the mutual
  526. intelligibility criterion; but they do not propose to return to
  527. arguments on political and cultural grounds.  Instead, they prefer
  528. not to speak of dialects and languages at all, but only of different
  529. varieties, with varying degrees of mutual intelligibility.
  530. ===============================================================================
  531. 13. Are all languages equally complex, or are some more primitive than others?
  532.                                                               [--M.C. + M.R.]
  533. In the last century many people believed that so-called "primitive 
  534. peoples" would have primitive languages, and that Latin and Greek--
  535. or their own languages-- were inherently superior to other tongues.
  536.  
  537. In fact, however, there is no correlation between type or complexity of
  538. culture and any measure of language complexity.  Peoples of very simple
  539. material culture, such as the Australian Aborigines, are often found to 
  540. speak very complex languages.
  541.  
  542. Obviously, the size of the vocabulary and the variety and sophistication of
  543. literary forms will depend on the culture.  The _grammar_ of all languages,
  544. however, tends to be about equally complex-- although the complexity may 
  545. be found in different places.  Latin, for instance, has a much richer
  546. system of inflections than English, but a less complicated syntax.
  547.  
  548. As David Crystal puts it, "All languages meet the social and psychological
  549. needs of their speakers, are equally deserving of scientific study, and can
  550. provide us with valuable information about human nature and society."
  551.  
  552. The only really simple languages are _pidgins_, which result when speakers
  553. of different languages come to live and work together.  Vocabulary is drawn
  554. from one or both languages, and a very forgiving grammar devised.  Grammars
  555. of pidgins from around the world have interesting similarities (e.g. they
  556. are likely to use repetition to express plurals).  
  557.  
  558. A pidgin becomes a _creole_ when children acquire it as a native language;
  559. as it evolves to meet the needs of a primary language, its vocabulary and
  560. grammar become much richer.  If a pidgin is used over a long period (for
  561. example, Tok Pisin in Papua New Guinea), it may similarly develop into a 
  562. more complex language known as an _extended pidgin_.
  563. ===============================================================================
  564. 14. What about artificial languages, such as Esperanto?          [--markrose]
  565.  
  566. Hundreds of constructed languages have been devised in the last few centuries.
  567. Early proposals, such as those of Lodwick (1647), Wilkins, or Leibniz, were 
  568. attempts to devise an ideal language based on philosophical classification 
  569. of concepts, and used wholly invented words.  Most were too complex to learn,
  570. but one, Jean Francois Sudre's Solresol, achieved some popularity in the last
  571. century; its entire vocabulary was built from the names of the notes of 
  572. the musical scale, and could be sung as well as spoken.
  573.  
  574. Later the focus shifted to languages based on existing languages, with a 
  575. polyglot (usually European) vocabulary and a simplified grammar, whose purpose
  576. was to facilitate international communication.  Johann Schleyer's Volapu"k 
  577. (1880) was the first to achieve success; its name is based on English 
  578. ("world-speech"), and reflects Schleyer's notions of phonetic simplicity.  
  579.  
  580. It was soon eclipsed by Ludwig Zamenhof's Esperanto (1887), whose grammar 
  581. was simpler and its vocabulary more recognizable.  Esperanto has remained 
  582. the most successful and best-known artificial language, with a million or 
  583. more speakers and a voluminous literature; children of Esperantists have 
  584. even learned it as a native language.
  585.  
  586. Its relative success hasn't prevented the appearance of new proposals, such
  587. as Ido, Interlingua, Occidental, and Novial.  There have also been attempts
  588. to simplify Latin (Latino Sine Flexione, 1903) and English (Basic English, 
  589. 1930) for international use.  The recent Loglan and Lojban, based on 
  590. predicate logic, may represent a revival of a priori language construction.
  591.  
  592. See also Andrew Large, THE ARTIFICIAL LANGUAGE MOVEMENT (1985); Mario Pei, 
  593. ONE LANGUAGE FOR THE WORLD (1958); Detlev Blanke, INTERNATIONALE 
  594. PLANSPRACHEN (in German).
  595.  
  596. There is a newsgroup, soc.culture.esperanto, dedicated to Esperanto.  Also 
  597. see alt.language.artificial, dedicated to artificial languages in general.
  598.  
  599. The ConLang mailing list is devoted to the discussion of constructed 
  600. languages.  To subscribe, e-mail a message to majordomo@diku.dk consisting
  601. of the single line
  602.     subscribe conlang 
  603. ===============================================================================
  604. 15. What are some stories and novels that involve linguistics?    [--markrose]
  605.  
  606. The following list is by no means exhaustive.  It's based on James Myers'
  607. list of books, which was compiled the last time the subject came up on 
  608. sci.lang.  Additions and corrections are welcome; please suggest the
  609. approximate category and give the publication date, if possible.
  610.  
  611. ALIENS AND LINGUISTS: Language Study and Science Fiction, by Walter Meyers
  612. (1980) contains a general discussion and lists more works.
  613.  
  614. alien languages
  615.  
  616.     "Tlon, Uqbar, Orbis Tertius" in FICCIONES - Jorge Luis Borges (1956)
  617.     40000 IN GEHENNA - C.J. Cherryh (1983)
  618.     BABEL-17 - Samuel R. Delany (1966)
  619.     FLIGHT OF THE DRAGONFLY - Robert L. Forward (1984)
  620.     THE HAUNTED STARS - Edmond Hamilton
  621.     HELLSPARK - Janet Kagan (1988)
  622.     INHERIT THE STARS - James P. Hogan
  623.     "Not So Certain" - David I. Masson
  624.     "Omnilingual", in FEDERATION - H. Beam Piper
  625.     CONTACT - Carl Sagan (1985)
  626.     PSYCHAOS - E. P. Thompson
  627.     "A Martian Odyssey" in SF HALL OF FAME - Stanley Weinbaum (1934)
  628.     "A Rose for Ecclesiastes" in SF HALL OF FAME - Roger Zelazny (1963)
  629.  
  630. futuristic varieties of English
  631.  
  632.     "Barrier" - Anthony Boucher
  633.     A CLOCKWORK ORANGE - Anthony Burgess (1962)
  634.     HELLFLOWER - eluki bes shahar (1991)
  635.     THE INHERITORS - William Golding (1955)
  636.     THE MOON IS A HARSH MISTRESS - Robert Heinlein (1966)
  637.     RIDDLEY WALKER - Russel Hoban (1980)
  638.     1984 - George Orwell (1948)
  639.  
  640. other invented languages
  641.  
  642.     NATIVE TONGUE - Suzette Haden Elgin (1984)
  643.     THE GAMEPLAYERS OF ZAN - M A Foster
  644.     "Gulf" in ASSIGNMENT IN ETERNITY - Robert A. Heinlein (1949)
  645.     ALWAYS COMING HOME - Usrula K. Le Guin
  646.     PALE FIRE - Vladimir Nabokov
  647.     THE KLINGON DICTIONARY - Marc Okrand (1985)
  648.     THE VOID-CAPTAIN'S TALE - Norman Spinrad
  649.     THE LORD OF THE RINGS - J R R Tolkien (1954-55)
  650.     THE MEMORANDUM - Vaclav Havel (1966)
  651.     THE LANGUAGES OF PAO - Jack Vance (1957)
  652.  
  653. linguist heroes
  654.  
  655.     DOUBLE NEGATIVE - David Carkeet
  656.     THE FULL CATASTROPHE - David Carkeet
  657.     PYGMALION - George Bernard Shaw (1912)
  658.     THE POISON ORACLE - Peter Dickinson (1974)
  659.     OUT OF THE SILENT PLANET - C.S. Lewis (1943)
  660.     HANDS ON - Andrew Rosenheim (1992)
  661.  
  662. animal language
  663.  
  664.     WATERSHIP DOWN - Richard Adams (1972)
  665.     TARZAN OF THE APES - Edgar Rice Burroughs (1912)
  666.     CONGO - Michael Crichton (1980)
  667.  
  668. use of linguistic theory
  669.  
  670.     SNOW CRASH - Neal Stephenson (1992)
  671.     GULLIVER'S TRAVELS - Jonathan Swift (1726)
  672.     THE EMBEDDING - Ian Watson (1973)
  673.     Ozark trilogy - Suzette Haden Elgin
  674.     YONDER COMES THE OTHER END OF TIME - Suzette Haden Elgin
  675.  
  676. other
  677.  
  678.     THE TROIKA INCIDENT - James Cooke Brown (1969)   [Loglan]
  679.     ETXEMENDI - Florence Delay  [Chomsky ref]
  680.     TRITON - Samuel Delany [reflections on meaning]
  681.     SO YOU WANT TO BE A WIZARD - Diane Duane
  682.     TONGUES OF THE MOON - Philip Jose Farmer
  683.     DUNE - Frank Herbert (1965)
  684.     THE DISPOSSESSED - Ursula LeGuin (1974)
  685.     LOVE ME TOMORROW - Robert Rimmer (1976)   [Loglan]
  686. ===============================================================================
  687. 16. What about those Eskimo words for snow? (and other myths about language)
  688.                                                                [--markrose]
  689.  
  690.    "The Eskimos have hundreds of words for snow."
  691.  
  692. This story is constantly being repeated, with various numbers given,
  693. despite the fact that it has no basis at all.  No one who repeats this
  694. pseudo-factoid can list the hundreds of words for you, or even cite a 
  695. work that does.  They just heard it somewhere.
  696.  
  697. The anthropologist Laura Martin has traced the development of this myth
  698. (including the steady growth in the number of words claimed).  Geoffrey
  699. Pullum summarizes her report in THE GREAT ESKIMO VOCABULARY HOAX (1991).
  700.  
  701. How many words are there really?  Well, the Yup'ik language in particular
  702. has about two dozen roots describing snow or things related to snow.  This
  703. is not particularly significant; English can amass about the same total:
  704. snow, sleet, slush, blizzard, flurry, avalanche, powder, hardpack,
  705. snowball, snowman, and other derivatives.
  706.  
  707. The Yup'ik total could be greatly expanded by other derived words, since
  708. the Inuit languages can form hundreds of words from a single root.  But
  709. this is true of all words in the language (and indeed of all agglutinative
  710. languages), not just the words for snow.
  711.  
  712.    "There's a town in Appalachia that speaks pure Elizabethan English."
  713.  
  714. There isn't.  All languages, everywhere, are constantly changing.  Some
  715. areas speak more conservative dialects, but we know of no case where 
  716. people speak exactly as their ancestors spoke centuries ago.
  717.  
  718. Of course, ancient languages are sometimes revived; biblical Hebrew has
  719. been revived (with some modifications) in modern Israel; and there's a
  720. village in India in which Sanskrit is being taught as an everyday
  721. language.  But these are conscious revivals of languages which have
  722. otherwise died out in everyday use, not survivals of living languages.
  723.  
  724.    "Chinese characters directly represent ideas, not spoken words."
  725.  
  726. Westerners have been taken by this notion for centuries, ever since
  727. missionaries started describing the Chinese writing system.  However, it's
  728. quite false.  Chinese characters represent specific Chinese words.  
  729.  
  730. (To be precise, almost all characters represent a particular syllable with
  731. a particular meaning; about 10% however represent one syllable of a 
  732. particular two-syllable word.)
  733.  
  734. The vast majority of characters consist of a _phonetic_ giving the
  735. approximate pronunciation of the word, plus a _signific_ giving a clue to
  736. its meaning (thus distinguishing different syllables having different
  737. meanings).  As an added difficulty, many of the phonetics are no longer
  738. helpful, because of sound changes since the characters were devised, over
  739. 2000 years ago.  However, it is estimated that 60% of the phonetics still
  740. give useful information about the character's pronunciation.
  741.  
  742. To be sure, Japanese (among other languages) uses Chinese characters too,
  743. and it is a very different language from Chinese.  However, we must look
  744. at exactly how the Japanese use the Chinese characters.  Generally they
  745. borrowed both the characters and the words represented; it's rather as if
  746. when we borrowed words like _psychology_ from Greek, we wrote them in the
  747. Greek alphabet.  Native Japanese words are also written using the Chinese
  748. characters for the closest Chinese words: if the Japanese word overlaps
  749. several Chinese words, different characters must be written in different
  750. contexts, according to the meanings in Chinese.
  751.  
  752. A good demythologizing of common notions about Chinese writing is found in
  753. THE CHINESE LANGUAGE: FACT AND FANTASY, by John DeFrancis (1984).
  754.  
  755.    "German lost out to English as the US's official language by 1 vote."
  756.  
  757. This entertaining story is also told of Greek, Latin, and even Hebrew.
  758.  
  759. There was never any such vote.  Dennis Baron, in THE ENGLISH ONLY QUESTION
  760. (1990), thinks the legend may have originated with a 1795 vote concerning
  761. a proposal to publish federal laws in German as well as English.  At one
  762. point a motion to table discussion (rather than referring the matter back
  763. to committee) was defeated 41-40.  The proposal was eventually defeated. 
  764.  
  765.    "Sign language isn't really a language."
  766.    "ASL is a gestural version of English."
  767.  
  768. Sign languages are true languages, with vocabularies of thousands of words,
  769. and grammars as complex and sophisticated as those of any other language,
  770. though with fascinating differences from speech.  If you think they are
  771. merely pantomime, try watching a mathematics lecture, a poetry reading, or
  772. a religious service conducted in Sign, and see how much you understand.
  773.  
  774. ASL (American Sign Language) is not an invented system like Esperanto; it
  775. developed gradually and naturally among the Deaf.  It has no particular
  776. relation to English; the best demonstration of this is that it is quite
  777. different from British Sign.  Curiously enough, it is most closely related
  778. to French Sign Language, due to the influence of Laurent Clerc, who came
  779. from Paris in 1817 to be the first teacher of the Deaf in the US.
  780.  
  781. ASL is not to be confused with Signed English, which is a word-for-word
  782. signed equivalent of English.  Deaf people tend to find it tiring, because
  783. its grammar, like that of spoken languages, is linear, while that of ASL is
  784. primarily spatial.
  785.  
  786. For more on Sign and the Deaf community, see Oliver Sacks' SEEING VOICES
  787. (1989), or Harlan Lane, WHEN THE MIND HEARS (1984).
  788. ===============================================================================
  789. 17. Where can I get an electronic IPA font (or other electronic resources)?
  790.                                                                   [--markrose]
  791.      [Adapted from information posted to sci.lang by Sean Redmond,
  792.      Evan Antworth, Chris Brockett, Roy Cochrun, J"org Knappen, 
  793.      Alex Rudnicky, Enrico Scalas, Mark Kantrowitz, and Arnold Zwicky.
  794.  
  795.      If you know of other publically available (and legal) fonts or 
  796.      other linguistic resources, please e-mail me or post to sci.lang, 
  797.      so they can be listed here.]
  798.  
  799. * A number of Postscript Type 1 and TrueType fonts (including IPA, Greek,
  800.   Cyrillic, Armenian, etc.) are available by ftp from 
  801.  
  802.      host       ftp.cica.indiana.edu [129.79.26.27]
  803.      directory: pub/pc/win3/fonts/truetype
  804.  
  805.   List (ls) the directory to see what's available.  The files are zipped; 
  806.   a version of unzip is usually available on whatever host you use 
  807.   to ftp with.
  808.  
  809.   Note: TrueType files can be used under Windows or on the Macintosh.
  810.   I'm not sure if the unzipped files can be inserted directly into the
  811.   Mac's Fonts folder; I ran them through Fontographer first.
  812.  
  813. * The SIL IPA fonts (also in PostScript Type 1 and TrueType versions)
  814.   are also available by ftp from
  815.  
  816.      host:      linguistics.archive.umich.edu [141.211.32.2]
  817.      directory: 
  818.         Windows version: /msdos/windows/fonts/truetype/sil-ipa12.exe
  819.         Mac version:     /mac/system.extensions/font/type1/silipa1.2.cpt.hqx
  820.  
  821. * They are also available on diskette for $5.00 plus postage: $2.00 in U.S. 
  822.   or $5.00 outside U.S.  Order from:
  823.  
  824.      SIL Printing Arts Department
  825.      7500 W. Camp Wisdom Road
  826.      Dallas TX  75236   USA
  827.  
  828.      tel:    214-709-2495, -2440
  829.      fax:    214-709-3387.
  830.      e-mail: Margaret.Swauger@sil.org
  831.  
  832. * University College London also sells these fonts on disk ($32).  See:
  833.  
  834.      http://www.phon.ucl.ac.uk/home/wells/fonts.htm
  835.  
  836. * Some IPA fonts for TeX can be found in the CTAN archives
  837.  
  838.      ftp.dante.de
  839.      ftp.shsu.edu
  840.      ftp.tex.ac.uk
  841.  
  842.   in the directories
  843.  
  844.      tex-archive/fonts/wsuipa
  845.      tex-archive/fonts/tsipa
  846.  
  847. * The Carnegie-Mellon 100,000-word English dictionary can be retrieved
  848.   as follows.
  849.  
  850.      host:      ftp.cs.cmu.edu [128.2.206.173]
  851.      directory: project/fgdata/dict
  852.  
  853.   Retrieve the following files:
  854.  
  855.      README
  856.      cmudict.0.2.Z (compressed)
  857.      cmulex.0.1.Z (compressed)
  858.      phoneset.0.1
  859.  
  860. * If you have access to the World Wide Web, the following servers contain
  861.   information of interest on linguistics or languages.
  862.  
  863.   John Lawler's Eclectic Company - a comprehensive, annotated list of
  864.   linguistics resources and essays, including the captivating Chomskybot
  865.     http://www.ling.lsa.umich.edu/jlawler/lingmarks.html
  866.  
  867.   The Linguist List website:
  868.     http://engserve.tamu.edu/files/linguistics/linguist/datasources.html
  869.  
  870.   The Brown University linguistics page:
  871.   Brown University linguistics page
  872.     http://www.cog.brown.edu/pointers/linguistics.html
  873.  
  874.   Summer Institute of Linguistics Ethnologue (languages database)
  875.     http://www.sil.org/ethnologue/ethnologue.html
  876.     also: SIL home page, http://www.sil.org
  877.  
  878.   Association for Computational Linguistics homepage:
  879.     http://www.cs.columbia.edu/~acl/home.html
  880.  
  881.   University of Virginia electronic text center
  882.     http://www.lib.virginia.edu/etext/ETC.html
  883.  
  884.   University of Stuttgart - Institute for Natural Language Processing
  885.     http://www.ims.uni-stuttgart.de/IMS.html
  886.  
  887.   Tyler Jones' Human-Languages Page
  888.     http://www.willamette.edu/~tjones/Language-Page.html
  889.  
  890.   List of conferences of interest to linguists, translators, etc.:
  891.     http://www.clark.net/pub/royfc/confer.html
  892.  
  893.   Sound files demonstrating the standard IPA phones 
  894.     http://www.unil.ch/ling/phonetique/api.html
  895.  
  896.   The Metalleus archives (Metalleus is the Monty Python of linguistics)
  897.     http://www.umich.edu/~archive/linguistics/texts/papers/metalleus
  898.  
  899. * sci.lang (since October 1994) is archived at
  900.  
  901.     ftp.cs.cmu.edu
  902.     /user/ai/pubs/news/sci.lang
  903.  
  904. * Arnold Zwicky maintains OUT In Linguistics, a mailing list for
  905.   lesbian/gay/bi folk interested in linguistics.  (Both qualifiers-- 
  906.   "lgb(-friendly)" and "linguistics"-- are important, please.)
  907.   For information, e-mail zwicky@ling.ohio-state.edu.
  908. ===============================================================================
  909. 18. How do I subscribe to the LINGUIST list?
  910.  
  911. The LINGUIST list is a mailing list dedicated to linguistics; it's more
  912. technical than sci.lang.  To subscribe, send an e-mail message to
  913.  
  914.      Listserv@tamvm1.tamu.edu
  915.  
  916. containing the single line
  917.  
  918.      subscribe linguist firstname lastname
  919.      
  920. for example:
  921.  
  922.      subscribe linguist Edward Sapir
  923.  
  924. Presumably the same message with "unsubscribe" will take you off the
  925. mailing list.
  926. ===============================================================================
  927. 19. How can I represent phonetic symbols in ASCII?
  928.  
  929. The following table is a summary of Evan Kirshenbaum's IPA/ASCII schema,
  930. which a number of posters have been using in sci.lang and alt.usage.english.
  931. For more information, see the Web page at
  932.      http://www.hpl.hp.com/personal/Evan_Kirshenbaum/IPA/
  933.  
  934. This summary is presented for convenience only, and is not intended to
  935. forestall discussion of alternative systems.
  936.  
  937.      blb-- -lbd-- --dnt-- --alv-- -rfx- -pla-- --pal--- --vel-- -----uvl-----
  938.  
  939. nas    m      M       n[      n      n.            n^      N           n"
  940. stp  p b           t[ d[    t d   t. d.        c   J     k g      q    G
  941. frc  F V    f v    T  D     s z   s. z.  S Z   C C<vcd>  x Q      X    g"
  942. apr        r<lbd>     r[      r      r.            j       j<vel>      g"
  943. lat                   l[      l      l.            l^      L
  944. trl  b<trl>                r<trl>                                      r"
  945. flp                           *      *. 
  946. ejc  p`            t[`      t`                 c`        k'
  947. clk  p!            t!       c!                   c!      k!
  948. imp    b`             d`      d`                   J`      g`     q`   G`
  949.  
  950.  
  951.      ---- lbv ----   --phr--  ---glt---
  952.  
  953. nas         n<lbv>                               alv lat frc: s<lat> z<lat>
  954. stp  t<lbv> d<lbv>              ?                    lat flp: *<lat>
  955. frc  w<vls>   w      H H<vcd>   h<?>                 lat clk: l!
  956. apr           w                 h
  957.  
  958.  
  959.     ----- unr -----     unr     ----- rnd -----
  960.     fnt   cnt   bck     cnt     fnt   cnt   bck
  961.                         rzd
  962. hgh  i     i"    u-              y     u"    u
  963. smh  I                           I.          U
  964. umd  e   @<umd>  o-    R<umd>    Y           o
  965. mid        @             R             @.
  966. lmd  E     V"    V               W     O"    O
  967. low  &     a     A               &.    a.    A.
  968.  
  969.  
  970. Diacritics:
  971.       Vowels:     Consonants:            + =   ad hoc diacritic
  972.   ~   nasalized   velarized              [     dental
  973.   :   long                               !     click  
  974.   -   unrounded   syllabic               <H>   pharyngealized
  975.   .   rounded     retroflex              <h>   aspirated
  976.   `               ejective/implosive     <o>   unexploded or voiceless
  977.   ^               palatal                <r>   rhotacized
  978.   ;               palatalized            <w>   labialized
  979.   "   centered    uvular                 <?>   murmured
  980.    
  981. Other symbols:
  982.   $ %     ad hoc segment
  983.   []      phonetic transcription
  984.   //      phonemic transcription
  985.   #       syllable or word boundary
  986.   space   word/segment separator
  987.   ' ,     primary and secondary stress
  988.   0-9     tones
  989. ===============================================================================
  990. 20. Is English a creole?
  991.                                                                 [--markrose]
  992. The change from Anglo-Saxon to Modern English (loss of gender and of
  993. case inflection, phonological change, acquisition of a huge stock of French
  994. and Latin vocabulary) is certainly dramatic, and has led some sci.lang 
  995. posters, and even some linguists (e.g. Domingue, Bailey & Maroldt, 
  996. Milroy) to the provocative suggestion that English suffered pidginization
  997. or creolization at the time of the Norman Conquest (1066) or the Norse
  998. invasions (from 865), or both.
  999.  
  1000. This hypothesis, as Sarah Grey Thomason and Terrence Kaufman have
  1001. shown in LANGUAGE CONTACT, CREOLIZATION, AND GENETIC LINGUISTICS (1988), 
  1002. rests on an incomplete understanding of creolization and a shaky grasp on 
  1003. the history of English.  There is a wide range of language contact 
  1004. situations, from casual contact to deep structural interference; English is 
  1005. by no means the most striking of these cases.  It looks like a creole only 
  1006. if one ignores this range of phenomena and labels any case of moderate 
  1007. interference as creolization.
  1008.  
  1009. For many of the changes in question, the chronology does not work out.
  1010. For instance, the reduction of unstressed vowels to /@/, largely responsible
  1011. for the loss of Old English nominal declensions, had taken place *before*
  1012. the Conquest, and affected all of England, including areas never settled
  1013. by the Norse.  And English did absorb an immense amount of French and
  1014. Latin vocabulary, but most of this occurred well *after* the Conquest--
  1015. past 1450, two centuries after the nobility ceased to be French-speaking.
  1016.  
  1017. Other points to note: 1) most of the simplifications and foreign borrowings
  1018. seen in English occurred as well in other Germanic languages, notably
  1019. Dutch, Low German, and the Scandinavian languages; 2) a particularly
  1020. striking borrowing from Norse, the pronoun 'they', was probably adopted
  1021. to avoid what otherwise would have been a merge of 'he/him' with 'they/them';
  1022. 3) the total number of French-speaking invaders was not more than
  1023. 50,000, compared to an English-speaking population of over 1.5 million--
  1024. nowhere near the proportions that would threaten the normal inheritance
  1025. of English.
  1026. ===============================================================================
  1027. 21. How do you look up a word in a Chinese or Japanese dictionary?
  1028.                                                                 [--markrose]
  1029.  
  1030. The vast majority of Chinese characters can be divided into two parts, the
  1031. radical and the phonetic.  Each part is another, simpler character.  The
  1032. _radical_ gives an idea of the meaning-- rather a vague idea, since
  1033. traditionally there were only 214 different radicals.  The _phonetic_
  1034. identifies the sound, with a bit more precision: generally, all the
  1035. characters that share a phonetic rhymed 2000 years ago in Archaic Chinese.
  1036.  
  1037. (It's impossible to give examples in ASCII; see the Web page for more:
  1038. http://www.tezcat.com/~markrose/lang21.html)
  1039.  
  1040. Characters are arranged in most Chinese dictionaries by radical.  To find
  1041. an unknown character, then, you identify the radical, and look up its
  1042. section in the dictionary.  The radicals are arranged in order of increasing
  1043. complexity.  Each radical's section is ordered by the number of strokes in
  1044. the character.  Several characters may have the same number of strokes;
  1045. these must simply be scanned till the right one is found.
  1046.  
  1047. Sometimes it isn't easy to identify the radical-- it's in an odd position
  1048. (e.g. on the bottom or the right rather than the top or left side); or it's
  1049. drawn in an abbreviated form; or it's not clear which of several similar
  1050. radicals the character is listed under.  It's also important to know the
  1051. proper method for counting strokes.
  1052.  
  1053. If a character isn't composed of a radical + phonetic, it's usually treated
  1054. as one, graphically, for the purposes of dictionary lookup.  For instance,
  1055. the character for hao3 'good' is composed of the characters for 'woman' and
  1056. 'child'-- a _semantic_ compound.  It's simply listed under the 'woman'
  1057. radical, although zi3 'child' is not its phonetic.
  1058.  
  1059. The People's Republic simplified a number of characters and radicals, and
  1060. this changed the number of radicals-- there's 224 in my dictionary, for
  1061. instance.  The Japanese have made their own separate simplification.
  1062. ===============================================================================
  1063. 22. What about Nostratic and Proto-World?
  1064.                                                                 [--markrose]
  1065. In recent years some some linguists have attempted to reconstruct languages
  1066. far older than Indo-European.
  1067.  
  1068. *Nostratic*, said to underlie the Indo-European, Kartvelian (South Caucasion), 
  1069. Afro-Asiatic, Dravidian, Uralic, Altaic, Chukchi-Kamchatkan, and Eskimo-Aleut 
  1070. families, was first proposed by Holger Pedersen in 1903.  More recently
  1071. the greater part of work on Nostratic is due to Soviet linguists led by 
  1072. Vladislav Illich-Svitych, Aaron Dolgopolsky, and Vitaly Shevoroshkin.
  1073.  
  1074. The methodology is the traditional comparative method, and over 600 roots
  1075. have been proposed.  Most linguists remain skeptical, believing that chance
  1076. processes will have obscured any relationship at this level beyond
  1077. reconstruction, or question the accuracy of the derivations (a charge which
  1078. makes Nostraticists bristle).   Others simply suspend judgment, especially
  1079. since much of the supporting material for Nostratic is available only in
  1080. Russian.
  1081.  
  1082. A good overview on Nostratic is Kaiser and Shevoroshkin, "Nostratic", in
  1083. the _Annual Review of Anthropology_, 17:309.  Illich-Svitych's original
  1084. Russian article (from _Etymologia_, 1965) has been translated in
  1085. Shevoroshkin, ed., RECONSTRUCTING LANGUAGES AND CULTURES (1989).
  1086.  
  1087. Joseph Greenberg has proposed a grouping which covers much the same language
  1088. areas (omitting Afro-Asiastic and Dravidian, but adding Ainu and Gilyak),
  1089. called *Eurasiatic*.  Greenberg's method of _mass comparison_ (which he has
  1090. also used to group together almost all Native American languages into one
  1091. superfamily, Amerind) basically consists of assembling huge lists of
  1092. common words and doing eyeball comparisons.
  1093.  
  1094. This methodology has been severely criticized by many historical linguists.
  1095. If 'mass comparison' were applied to the Indo-European languages, it would
  1096. be bedevilled by false positives (caused by borrowing or chance) and by
  1097. specious phonetic or semantic similarites.  Greenberg's methods seem to
  1098. linguists to abandon the very methodological severity which has put
  1099. Indo-European linguistics on a scientific footing, and distinguished it from
  1100. the work of cranks.  Relax the rules enough, and you can derive any language
  1101. from any other.
  1102.  
  1103. Greenberg replies that the patterns he has found are compelling enough to
  1104. justify his methods, and that he is merely following in the footsteps of 
  1105. the originators of the comparative method: linguists had to decide that the 
  1106. Indo-European languages were related before attempting reconstructions.
  1107.  
  1108. The ultimate areal comparison would be *Proto-World*, the hypothetical
  1109. ancestor of all human languages.  Greenberg has mentioned Proto-World, but
  1110. since he is not much interested in reconstruction, his proposal is not much
  1111. more than a statement of the monogenetic theory (a single origin for all
  1112. languages).  Most linguists are skeptical that anything could be
  1113. reconstructed at this hypothetical time depth.
  1114.  
  1115. Greenberg's work on Amerind can be found in LANGUAGE IN THE AMERICAS (1987);
  1116. on Eurasiatic, in the forthcoming INDO-EUROPEAN AND ITS CLOSEST RELATIVES:
  1117. THE EURASIATIC LANGUAGE FAMILY.  Introductions to the Nostratic and
  1118. Proto-World controversies were published in both _The Atlantic_ and
  1119. _Scientific American_ in April 1991.  The essays in Lamb and Mitchell, eds.,
  1120. SPRUNG FROM SOME COMMON SOURCE (1991), are also relevant.
  1121.  
  1122. Loren Petrich maintains an annotated bibliography on Indo-European,
  1123. Nostratic, and Proto-World.  I am also indebted to Peter Michalove for
  1124. citations used in this entry.
  1125. ===============================================================================
  1126. 23.  What are phonemes and why's it so hard to lose a foreign accent? 
  1127.                                                                 [--markrose] 
  1128. The sounds (*phones*) humans can make are infinite; between any two phones, 
  1129. there's (almost always) a continuum of phones in between them. 
  1130.  
  1131. In any one language, however, phones are grouped into 20 to 60 or so discrete 
  1132. groups of sounds called *phonemes*. The range of variation for each phoneme 
  1133. is discounted by speakers and hearers of the language, who perceive the 
  1134. entire range as "the same sound." 
  1135.  
  1136. The English phoneme /p/ has two phonetic realizations or *allophones*: 
  1137. aspirated [ph] beginning a word and non-aspirated [p] elsewhere. But
  1138. since the two types of /p/ never distinguish one word from another, speakers 
  1139. of English generally don't even notice the difference. (Linguists
  1140. write phonemic transcriptions between /slashes/, and phonetic transcriptions 
  1141. in [brackets].) 
  1142.  
  1143. If we can find two words with different meaning but only one difference in 
  1144. sound between them-- a *minimal pair*-- then we've found distinct phonemes; 
  1145. e.g. /p/ and /b/ in English 'pit' and 'bit'. If two sounds never occur in 
  1146. the same phonetic environment (e.g. English [p] and [ph])-- if they're in 
  1147. *complementary distribution*-- then they're probably allophones of a single 
  1148. phoneme.  (I say 'probably' because English [h] and [ng] are also in 
  1149. complementary distribution, but linguists balk at assigning them to one
  1150. phoneme.)
  1151.  
  1152. Other languages do not divide up the phonetic space in the same way.  For 
  1153. instance, /p/ and /ph/ are separate phonemes in Mandarin Chinese (as in 
  1154. /pa1/ 'eight' and /pha1/ 'flower').  And the vowels of 'late' and 'let', 
  1155. phonemes in English, are allophones of a single phoneme /e/ in Spanish. 
  1156.  
  1157. We're trained from childhood to make the phonetic distinctions our language 
  1158. uses to keep its phonemes apart, and to ignore those it doesn't.
  1159. Learning to make different distinctions in a foreign language is quite 
  1160. difficult-- usually harder than making new sounds our native language lacks 
  1161. entirely.  We'll continue to have an accent in the new language so long as 
  1162. we hear its sounds through our native language's phonemic filter. 
  1163.