home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #16 / NN_1992_16.iso / spool / comp / ai / neuraln / 2916 < prev    next >
Encoding:
Internet Message Format  |  1992-07-24  |  25.0 KB

  1. Path: sparky!uunet!gatech!destroyer!caen!zaphod.mps.ohio-state.edu!pacific.mps.ohio-state.edu!linac!att!ucbvax!cattell.psych.upenn.edu!neuron-request
  2. From: neuron-request@cattell.psych.upenn.edu ("Neuron-Digest Moderator")
  3. Newsgroups: comp.ai.neural-nets
  4. Subject: Neuron Digest V9 #39 (misc + jobs + papers)
  5. Message-ID: <8024.711945768@cattell.psych.upenn.edu>
  6. Date: 24 Jul 92 02:42:48 GMT
  7. Sender: daemon@ucbvax.BERKELEY.EDU
  8. Reply-To: "Neuron-Request" <neuron-request@cattell.psych.upenn.edu>
  9. Distribution: world
  10. Organization: University of Pennsylvania
  11. Lines: 595
  12.  
  13. Neuron Digest   Thursday, 23 Jul 1992
  14.                 Volume 9 : Issue 39
  15.  
  16. Today's Topics:
  17.              Administrivia - ND on vacation for over 3 weeks
  18.                         NIPS 92 advance program?
  19.                 research post in cortical neural networks
  20.                          NEURAL NETWORK WORKSHOP
  21.                 Call for Papers, Applications of AI (XI)
  22.               IJCNN 92 Beijing Call For Papers *Extension*
  23.                TR - Determining the Number of Hidden Units
  24.  
  25.  
  26. Send submissions, questions, address maintenance, and requests for old
  27. issues to "neuron-request@cattell.psych.upenn.edu". The ftp archives are
  28. available from cattell.psych.upenn.edu (128.91.2.173). Back issues
  29. requested by mail will eventually be sent, but may take a while.
  30.  
  31. ----------------------------------------------------------------------
  32.  
  33. Subject: Administrivia - ND on vacation for over 3 weeks
  34. From:    "N-D Moderator, Peter Marvit" <neuron@cattell.psych.upenn.edu>
  35. Date:    Thu, 23 Jul 92 22:21:08 -0500
  36.  
  37. Greetings,
  38.  
  39. As promised, the Neuron Digest Moderator will be goig on vacation for
  40. about three weeks starting immediately.  As a result, the Digest will
  41. suspend publication with this issue, to resume sometime during the week
  42. of 17 August.  Obviously, no email/correspondence will be answered during
  43. this time.
  44.  
  45. This issue is a mix of items which seem somewhat time-sensitive.
  46. Observant readers will note a lack of paper announcements recently.
  47. There are some 80 papers in the queue, but they will have to wait until
  48. after break at which time I will try to send out the backlog.
  49.  
  50. As always, thanks to you, faithful readers, for making this Digest
  51. possible and spreading information about Artifical Neural Networks aroudn
  52. the globe.
  53.  
  54.         -Peter Marvit
  55.          N-D Moderator
  56.  
  57.  
  58. ------------------------------
  59.  
  60. Subject: NIPS 92 advance program?
  61. From:    Juan Carlos Guzman <guzman-juan@CS.YALE.EDU>
  62. Date:    Fri, 17 Jul 92 14:18:37 -0500
  63.  
  64. Hi,
  65.  
  66. I would like to know  where I can find an advance schedule for NIPS'92
  67. (Neural Information Processing Systems), to be held in Colorado,Nov 30--
  68. Dec 4, this year.  Any leads would be greatly appreciated.
  69.  
  70. Juan Carlos Guzman.
  71.  
  72. [[ Editor's Note: I expect we'll see a reasonable version in this Digest
  73. in September.  If someone has earlier information... -PM ]]
  74.  
  75. ------------------------------
  76.  
  77. Subject: research post in cortical neural networks
  78. From:    Peter Foldiak <peter@psy.ox.ac.uk>
  79. Date:    Tue, 21 Jul 92 12:15:54 +0000
  80.  
  81.  
  82.                           UNIVERSITY OF OXFORD
  83.                   DEPARTMENT OF EXPERIMENTAL PSYCHOLOGY
  84.                 RESEARCH POST IN CORTICAL NEURAL NETWORKS
  85.  
  86. Applications are invited for a postdoctoral or graduate position to work
  87. on the operation of neuronal networks in the brain, with special
  88. reference to cortical computation. The post available is for a
  89. theoretician to perform analytic and/or simulation work collaboratively
  90. with experimental neuroscientists on biologically realistic models of
  91. computation in cortical structures such as the hippocampus and visual
  92. cortex. The salary is on the RS1A scale, #12,129-#16,432, and is funded
  93. by a three-year grant which provides for international collaboration.
  94. Applications including the names of two referees, or enquiries, to Dr.
  95. Edmund T. Rolls, University of Oxford, Department of Experimental
  96. Psychology, South Parks Road, Oxford OX1 3UD, England (telephone
  97. 0865-271348, e-mail: erolls@vax.ox.ac.uk).  The University is an Equal
  98. Opportunities Employer.
  99.  
  100.  
  101. Peter Foldiak
  102.  
  103.  
  104. ------------------------------
  105.  
  106. Subject: NEURAL NETWORK WORKSHOP
  107. From:    anshu@lexington.rutgers.edu
  108. Date:    Fri, 17 Jul 92 16:32:40 -0500
  109.  
  110.  
  111.         
  112.                              NEURAL NETWORK WORKSHOP
  113.             
  114.                                27-29 October, 1992
  115.                         
  116.                                   held at
  117.                     
  118.                    Ramada Renaissance Hotel, East Brunswick, NJ.
  119.  
  120.                                 sponsored by
  121.  
  122.            The Aviation Security Research and Development Service of
  123.  
  124.                   The Federal Aviation Administration (FAA)
  125.  
  126.                                    and
  127.                    
  128.                       CAIP Center, Rutgers University, NJ
  129.  
  130.         
  131.  
  132.      Leaders in the field from academia, industry and government will
  133.      present the state-of-the-art in Neural Network theory and Applications.
  134.      There will be focussed sessions and panels on Neural Networks for vision,
  135.      speech recognition, speaker identification, language acquisition, 
  136.      hardware implementations and security systems. Special emphasis will
  137.      be given on the future impact of Neural Networks on Aviation Technology.
  138.  
  139.      The workshop will begin with registration at 8:30 a.m. on Tuesday, 27
  140.      October and end at 4:30 p.m. on Thursday. The $395 registration fee
  141.      ($295 for participants from CAIP member organizations), includes the 
  142.      cost of dinners and banquet. Proceedings of the workshop will be 
  143.      published in book form.
  144.  
  145.      Registration is limited to 90 participants, including 30 invited 
  146.      speakers and panelists. Individuals wishing to attend the workshop
  147.      should register by September 27, 1992.
  148.  
  149.      For further information regarding registration, please contact
  150.  
  151.                         Ms. Sandra Epstein
  152.                         email: sepstein@caip.rutgers.edu
  153.                         Telephone: (908)932-4208
  154.                         Fax: (908)932-4775
  155.                         Telex: 65-2497820 mci
  156.  
  157. - ------------------------------------------------------------------------------
  158.  
  159.                        NEURAL NETWORK WORKSHOP
  160.  
  161.                          27-29 October, 1992
  162.     |--------------------------------------------------------------------|
  163.     |  WORKSHOP REGISTRATION FORM                                        |
  164.     |                                                                    |
  165.     | YES! I want to attend the Neural Network Workshop, October 27-29,  |
  166.     | 1992. I understand my registration fee includes all sessions,      |
  167.     | dinners, refreshment breaks, reception and working materials.      |
  168.     |                                                                    |
  169.     | Name ___________________________________________________________   |
  170.     |                                                                    |
  171.     | Company ________________________________________________________   |
  172.     |                                                                    |
  173.     | Address ________________________________________________________   |
  174.     |                                                                    |
  175.     | City/State/Zip _________________________________________________   |
  176.     |                                                                    |
  177.     | Telephone No. __________________________________________________   |
  178.     |                                                                    |
  179.     |--------------------------------------------------------------------|
  180.     REGISTRATION IS LIMITED! APPLICATIONS WILL ONLY BE CONSIDERED WHEN 
  181.     ACCOMPANIED WITH PAYMENT. MAKE CHECKS PAYABLE TO THE CAIP CENTER,
  182.     RUTGERS UNIVERSITY.
  183.     Registration: Non-member fee ($395)                $____________
  184.                   Member fee for participants from 
  185.                   CAIP member organizations ($295)     $____________
  186.  
  187.     EARLY REGISTRATION IS ADVISED! Mail form & payment to: CAIP Center,
  188.     Rutgers Univ, 7th floor, CoRE Blgd., PO Box-1390, Piscataway,NJ-08855.
  189. ...........................................................................
  190.  
  191.     |--------------------------------------------------------------------|
  192.     |  HOTEL REGISTRATION FORM                                           |
  193.     |                                                                    |
  194.     | Name ___________________________________________________________   |
  195.     |                                                                    |
  196.     | Company ________________________________________________________   |
  197.     |                                                                    |
  198.     | Address ________________________________________________________   |
  199.     |                                                                    |
  200.     | Daytime Phone No. ______________________________________________   |
  201.     |                                                                    |
  202.     | A block of rooms for this conference has been reserved at a special|
  203.     | University room rate of $81 per single/double room per night.      |
  204.     | Hotel Reservations will be made through the CAIP Center.           |
  205.     | -------------------------------------------------------            |
  206.     | I will require room(s):                                            |
  207.     |                        Monday, October 26   ( )                    |
  208.     |                        Tuesday, October 27  ( )                    |
  209.     |                        Wednesday, October 28( )                    |
  210.     |                        Thursday, October 29 ( )                    |
  211.     |--------------------------------------------------------------------|
  212.  
  213.  
  214. ------------------------------
  215.  
  216. Subject: Call for Papers, Applications of AI (XI)
  217. From:    fayyad@ai-cyclops.Jpl.Nasa.Gov (Usama Fayyad)
  218. Date:    Tue, 21 Jul 92 18:11:39 -0800
  219.  
  220.  
  221.  ______________________________________________________________________________
  222.  
  223.  CALL FOR PAPERS 9/14/92 -- CALL FOR PAPERS 9/14/92 -- CALL FOR PAPERS 9/14/92 
  224.  ______________________________________________________________________________
  225.  
  226.  
  227.   APPLICATIONS OF AI (XI): Knowledge-Based Systems in Aerospace & Industry
  228.   ------------------------------------------------------------------------
  229.  
  230.                                 April 12-14, 1993
  231.                                 Marriott's Orlando World Center
  232.                                 Resort and Convention Center
  233.                                 Orlando, Florida,  U.S.A.
  234.  
  235. Sponsored by:   SPIE -- The Society for Optical Engineering
  236. In cooperation with:    AAAI -- The American Association for Artificial 
  237.                                 Intelligence
  238.                         AIAA -- The American Institute of Aeronautics
  239.                                 and Astronautics
  240.                         IEEE Computer Society
  241.                         IEEE Systems, Man, and Cybernetics Society
  242.  
  243.   The Eleventh Applications of Artificial Intelligence Conference will be
  244. help April 12-14 in Orlando, FL. We invite you to submit a paper by the
  245. deadline of Sept. 14, 1992. Details of areas and deadlines given below.
  246.  
  247. Conference Co-Chairs:
  248.         Usama M. Fayyad                         Ramasamy Uthurusamy        
  249.         Jet Propulsion Lab                      General Motors Research Laboratories         
  250.         California Institute of Technology    
  251.  
  252. Program Committee: 
  253.  
  254. Ray Bareiss, Northwestern University     
  255. Steven Lytinen, The University of Michigan
  256. James Bezdek, University of West Florida
  257. Stephen C.Y. Lu, University of Illinois
  258. Gautam Biswas, Vanderbilt University
  259. Ray Mooney, University of Texas at Austin
  260. Wray Buntine, NASA Ames Research Center
  261. Gregory Piatetsky-Shapiro,  GTE Laboratories  
  262. Steve Chien, Jet Propulsion Lab
  263. J. Ross Quinlan, Univ. of Sydney, Australia
  264. Tharam Dillon, La Trobe Univ., Australia
  265. Ethan Scarl, Boeing Computer Services  
  266. Richard Doyle, Jet Propulsion Lab
  267. Jude Shavlik, University of Wisconsin, Madison  
  268. Doug Fisher, Vanderbilt University
  269. Prakash Shenoy, University of Kansas 
  270. Paul Fishwick, University of Florida
  271. N.S. Sridharan, Intel Corporation
  272. David Franke, MCC
  273. Evangelos Simoudis, Lockheed Aerospace 
  274. Ashok Goel, Georgia Tech.
  275. Stephen Smith, Carnegie Mellon University 
  276. Larry Hall, University of South Florida
  277. Jon Sticklen, Michigan State University   
  278. Yumi Iwasaki, Stanford University
  279. R. Zurawsky, Swinburne Inst. of Tech., Australia
  280. Ramesh Jain, The University of Michigan
  281.  
  282.    
  283.  This year we will focus on techniques and applications that deal with
  284. actual industrial and aerospace applications of AI, machine learning, and
  285. reasoning systems.
  286.  
  287. Topics of interest include but are not limited to:
  288.  
  289. 1. Machine Learning 
  290. 2. Industrial and Aerospace Applications 
  291. 3. Diagnostic Systems
  292. 4. Knowledge Acquisition and Refinement 
  293. 5. Knowledge Based Systems: Verification and Validation 
  294. 6. Manufacturing Systems 
  295. 7. Case-Based Reasoning  
  296. 8. Functional Reasoning 
  297. 9. Model-Based and Qualitative Reasoning 
  298. 10. Multilevel and Integrated Reasoning Systems
  299. 11. Planning and Scheduling 
  300. 12. Design 
  301. 13. Training and Tutoring Systems 
  302. 14. Intelligent Interfaces and Natural Language Processing
  303. 15. Intelligent Database Systems
  304. 16. Parallel Architectures
  305.  
  306. In addition there will be 2-3 plenary sessions, and one or more panel
  307. discussions.  We also solicit suggestions for special sessions (e.g.,
  308. Case-Based Tutoring, Reactive Planning in Space Missions).  A one-page
  309. description of such a suggestion should be sent to the Conference Chairs,
  310. who will then forward it to appropriate members of the Program Committee
  311. for evaluation.  Selection will be based on how well the topic relates to
  312. the general theme of the conference, and the level of interest it is
  313. likely to generate.
  314.  
  315. To submit a paper, send four copies of a complete paper not exceeding 10
  316. pages single-spaced (approx. 5000 words) including figures and
  317. bibliography by September 14, 1992 to:
  318.         
  319.                  Applications of AI XI: KBS 
  320.                  SPIE, P.O. Box 10
  321.                  1000 20th Street
  322.                  Bellingham, WA 98225.
  323.  
  324.                  Tele: (206)-676-3290;  Telefax: (206)-647-1445.
  325.  
  326. Submissions will be reviewed by at least two members of the program
  327. committee and reviews will be returned to the authors.  It is important
  328. that each paper clearly state the problem which is being addressed, the
  329. contribution that has been made, and the relation to the current state of
  330. the art.
  331.  
  332. The program committee and conference chairs will make a selection of the
  333. best papers accepted, and these authors will be invited to submit a
  334. revised version of their paper to one or more special issues of journals
  335. in AI (to be decided later).
  336.              
  337. Papers submitted to the Knowledge-Based Systems conference should not
  338. also be submitted to the Machine Vision and Robotics conference of
  339. Applications of AI XI.  Questions about which conference is most suitable
  340. for a particular paper should be directed to the program chairmen.
  341.  
  342. Each presenter is generally allowed 20 to 25 minutes for presentation,
  343. plus a brief discussion period (about 5 minutes). SPIE will provide the
  344. following media equipment free of charge: 35 mm carousel slide
  345. projectors, overhead projectors, electronic pointers and VHS format video
  346. display.
  347.  
  348. Author Benefits
  349.   Authors and coauthors who attend the conference will be accorded a 
  350.   reduced-rate registration fee, a complimentary one-year non-voting
  351.   membership in SPIE (if never before a member), and other special benefits.
  352.  
  353. IMPORTANT DATES: PAPERS DUE:                           September 14, 1992.
  354.                  ACCEPT/REJECT LETTERS SENT BY:        November 20, 1992
  355.                  CAMERA-READY PAPERS (5000 words) DUE: January 18, 1993.
  356.                  CONFERENCE DATES:                     April 12-16, 1993.
  357.  
  358. Further questions may be directed to (e-mail preferred):
  359.  
  360.   Dr. Usama Fayyad                                Dr. Ramasamy Uthurusamy
  361.   AI Group  M/S 525-3660                          Computer Science Department
  362.   Jet Propulsion Lab                              General Motors Research Labs
  363.   California Institute of Technology              30500 Mound Rd.
  364.   Pasadena, CA 91109                              Warren, MI 48090-9055
  365.  
  366.   phone: (818) 306-6197                           phone: (313) 986-1989
  367.   fax:   (818)-306-6912.                          fax:   (313) 986-9356
  368.   e-mail: Fayyad@aig.jpl.nasa.gov                 e-mail: Samy@gmr.com
  369.  
  370.  ______________________________________________________________________________
  371.  
  372.  CALL FOR PAPERS 9/14/92 -- CALL FOR PAPERS 9/14/92 -- CALL FOR PAPERS 9/14/92 
  373.  ______________________________________________________________________________
  374.  
  375.  
  376.  
  377. ------------------------------
  378.  
  379. Subject: IJCNN 92 Beijing Call For Papers *Extension*
  380. From:    Wesley R Elsberry <elsberry@cse.uta.edu>
  381. Date:    Tue, 21 Jul 92 15:09:37 -0600
  382.  
  383.  
  384.  
  385.                        IJCNN 92 BEIJING, CHINA
  386.                           November 3-6, 1992
  387.  
  388.                            CALL FOR PAPERS
  389.  
  390.                           --- Extension ---
  391.  
  392. Papers for the upcoming IJCNN 92 Beijing conference will continue to be
  393. accepted through July 31, 1992.  Papers should be submitted in standard
  394. IJCNN format (maximum of six pages, etc.) to:
  395.  
  396.         Dr. Harold Szu
  397.         9402 Wildoak Drive
  398.         Bethesda, MD 20814
  399.  
  400. Dr. Szu indicates that because of the limited technical communication
  401. between the rest of the international ANN research community and the
  402. People's Republic of China, papers submitted may be original work *or*
  403. review articles.
  404.  
  405. Researchers are encouraged to contribute on any topic related to 
  406. artificial neural networks.
  407.  
  408.  
  409. Wesley R. Elsberry
  410. Sysop, CNS BBS 509-627-6267; Moderator Int'l NEURAL_NET Echo;
  411. elsberry@cse.uta.edu; POB 1187, Richland, WA 99352; 509-627-3947 voice
  412.  
  413.  
  414. ------------------------------
  415.  
  416. Subject: TR - Determining the Number of Hidden Units
  417. From:    Shun-ichi Amari <amari@sat.t.u-tokyo.ac.jp>
  418. Date:    Fri, 17 Jul 92 11:16:33 +0200
  419.  
  420. The following technical report has been placed in the Neuroprose Archives
  421. at Ohio State University:
  422.  
  423.                   Network Information Criterion ---
  424.                 Determining the Number of Hidden Units
  425.                 for an Artificial Neural Network Model
  426.                                    
  427.           Noboru Murata, Shuji Yoshizawa and Shun-ichi Amari
  428.                                    
  429.                 Technical Report METR 92-05, June 1992
  430.     Department of Mathematical Engineering and Information Physics
  431.                          University of Tokyo
  432.                Hongo 7-3-1, Bunkyo-ku, Tokyo 113, Japan
  433.  
  434. SUMMARY: (We recommend typesetting this region by Latex.)
  435. \documentstyle{article}
  436. \title{Model selection and effective number of parameters}
  437. \author{Noboru MURATA \and Shuji YOSHIZAWA \and Shun-ichi AMARI}
  438.  
  439. \begin{document}
  440. \maketitle
  441.  
  442. It is an important problem of the neural computation to select an
  443. adequate model for a given set of training data.  This problem
  444. naturally leads us a generalization of the AIC criterion of the model
  445. selection of statistical models (see Murata et al. [1991], Moody
  446. [1992]). The present note points out a natural generalization of the
  447. AIC criterion, showing that the results of the above two papers are
  448. equivalent and that they are applicable to more general situations.
  449.  
  450. Let us consider a stochastic neural network, parameterized by a set of
  451. $m$ weights $\theta=(\theta^1,\cdots,\theta^m)$, whose input-output
  452. behavior is specified by a conditional probability $p(y|x,\theta)$,
  453. namely the probability distribution of output $y$ when the input
  454. signal is $x$ (the signal $x$ might be multi dimensional).  Let
  455. $q(y|x)$ be the true probability from which $n$ examples
  456. $(y_i,x_i)$,$(i=1,\cdots,n)$ are generated, where $x_i$ is generated
  457. from an unknown probability distribution $q(x)$ independently.  We
  458. define a sample $\Xi_t=\{(y_i,x_i); i=1,\cdots,t\}$ as a set of $t$
  459. examples.  The main problem is to find the best candidate $\theta^*$
  460. which approximates the conditional distribution $q(y|x)$ and to
  461. evaluate the model ability, where there might not exist $\hat\theta$
  462. such that $p(y|x,\hat\theta)=q(y|x)$.
  463.  
  464. We use a test criterion
  465. \begin{displaymath}
  466.   D(q,p(\theta))=K[q:p(\theta)]+S(\theta)
  467. \end{displaymath}
  468. to be minimized, where $K[q:p(w)]$ represents a general divergence
  469. measure between two conditional probabilities $q$ and $p(\theta)$, and
  470. $S(\theta)$ is a regularization term which restricts the parameter
  471. $\theta$ within an appropriate area (Moody [1992]).  We give two
  472. typical case of $K$. One is the Kullback-Leibler divergence
  473. \begin{displaymath}
  474.   K[q:p(\theta)]=\int q(x)q(y|x)\log{\frac{q(y|x)}{p(y|x,\theta)}}dydx,
  475. \end{displaymath}
  476. and the other is the squared error
  477. \begin{displaymath}
  478.   K[q:p(\theta)]=\int\|y-f(x,\theta)\|^2q(x)q(y|x)dydx,
  479. \end{displaymath}
  480. where 
  481. \begin{displaymath}
  482.   f(x,\theta)=\int y\ p(y|x,\theta)dy.
  483. \end{displaymath}
  484. Any divergence measure of the type 
  485. \begin{displaymath}
  486.   K[q:p(\theta)]=\int q(x)q(y|x)k(x,y;\theta)dydx
  487. \end{displaymath}
  488. works well.
  489.  
  490. Given the sample $\Xi_t$, we search for the best parameter $\theta^*$
  491. that minimize
  492. \begin{displaymath}
  493.   D(q^*,p(\theta))=K[q^*:p(\theta)]+S(\theta),
  494. \end{displaymath}
  495. where $q^*$ is the empirical distribution given by the sample $\Xi_t$, 
  496. that is,
  497. \begin{displaymath}
  498.   K[q^*:p(\theta)]=\frac{1}{t}\sum_{i=1}^{t} k(x_i,y_i;\theta).
  499. \end{displaymath}
  500. This is because the true distributions $q(x)$ and $q(y|x)$ are
  501. unknown, so we substitute the empirical distribution for the true
  502. joint distribution $q(x)q(y|x)$.  The minimized $D(q^*,p(\theta^*))$ is
  503. called the training loss or the training error, and it can be used for
  504. estimating the test loss or the generalization error $D(q,p(\theta^*))$,
  505. which shows the averaged behavior of the trained network when a new
  506. example is given.
  507.  
  508. Since these quantities depend on the sample $\Xi_t$ whose elements are 
  509. chosen randomly, we take the expectation $\langle\cdot\rangle$ with respect to 
  510. the sample $\Xi_t$. We can the prove the following relation
  511. \begin{displaymath}
  512.   \langle D(q,p(\theta^*))\rangle=\langle D(q^*,p(\theta^*))\rangle
  513.   +\frac{1}{t}\mbox{\rm tr}GQ^{-1}+\frac{1}{\sqrt{t}}U,
  514. \end{displaymath}
  515. where $U$ is an unbiased random value of order $1$, common to all the
  516. models which have the same architecture, $G$ is the covariance matrix
  517. of $\nabla\{k(x,y;\theta^*)+S(\theta^*)\}$ and $Q$ is the Hessian
  518. matrix of $D(q,p(\theta^*)$. These quantities are to be evaluated by
  519. using the empirical distribution $q^*$ instead of the true but unknown
  520. $q(x)$ and $q(y|x)$.  When we compare the abilities of two different
  521. models and chose better model, we can use a quantity
  522. \begin{displaymath}
  523.   D(q^*,p(\theta^*))+\frac{1}{t}\mbox{\rm tr}GQ^{-1},
  524. \end{displaymath}
  525. and select one model whose value of the quantity is smaller than the
  526. other's.
  527.  
  528. Now we can compare this result with others. If the probability
  529. distribution is unconditional, $K$ is the Kullback-Leibler divergence,
  530. $D$ includes no regularization term (S(w)=0), and there exist $\hat\theta$
  531. such that $q=p(\hat\theta)$, then $Q$ and $G$ coincide with the Fisher
  532. information matrix and
  533. \begin{displaymath}
  534.   m^*=\mbox{\rm tr}GQ^{-1}=m,
  535. \end{displaymath}
  536. holds, where $m$ is the dimension number of the parameter $\theta$.
  537. This is the classic AIC result.  When no such $\hat\theta$ exists, $G$
  538. and $Q$ never coincide with the Fisher information matrix (Takeuchi
  539. [1980]), and an effective dimension $m^*$ is different from $m$.  When
  540. $q$ and the optimal $p$ is close, Amari [1980] calculated $m^*$ by
  541. using an ancillary statistics and the $m$-curvature of the model
  542. surface.
  543.  
  544. A sketch of the proof of the present result was given in Murata et al. 
  545. [1991], where the regularization term is not taken into account but
  546. the proof remains valid. Moody [1992] defined the effective dimension
  547. by
  548. \begin{displaymath}
  549.   m^*=\mbox{\rm tr}(TQ^{-1}T^T),
  550. \end{displaymath}
  551. where 
  552. \begin{displaymath}
  553.   G=T^TT
  554. \end{displaymath}
  555. holds, so that it coincides with the above result.  It should be noted
  556. that the above result holds without assuming the linearity of the
  557. model, existence of $\hat\theta$, the additive noise $\xi$ of the form
  558. of
  559. \begin{displaymath}
  560.   z=f(x,w)+\xi,
  561. \end{displaymath}
  562. etc. Therefore, the result of Moody holds under another framework and
  563. the AIC criterion can be applied in a general non-linear model.
  564.  
  565. On the other hand, it should be emphasized that this generalized criterion 
  566. cannot be used when we compare two models of different architectures, 
  567. say a neural network model and a radial basis expansion model.
  568. This is because the quantity $U$ of the order $1/\sqrt{t}$ term is common 
  569. only for two models in which one model is included in the other as a submodel.
  570. The AIC criterion is valid only for such a family of models of submodels.
  571. This important remark should more clearly be recognized,
  572. since it is not clearly written in the original AIC theory.
  573. \end{document}
  574.  
  575. END OF SUMMARY
  576.  
  577. ***** HOW TO OBTAIN A COPY *****
  578.  
  579. a) Via FTP:
  580.  
  581. unix> ftp archive.cis.ohio-state.edu (or 128.146.8.52)
  582. Name: anonymous
  583. Password: (type your E-mail address)
  584. ftp> cd pub/neuroprose
  585. ftp> binary
  586. ftp> get murata.nic.ps.Z
  587. ftp> quit
  588. unix> uncompress murata.nic.ps.Z
  589. unix> lpr murata.nic.ps
  590.  
  591. b) Via postal mail:
  592.  
  593. Request
  594.  
  595. Noboru Murata,
  596. Department of Mathematical Engineering and Information Physics
  597. University of Tokyo
  598. Hongo 7-3-1, Bunkyo-ku, Tokyo 113
  599. Japan.
  600.  
  601. or E-mail: mura@sat.t.u-tokyo.ac.jp
  602.  
  603.  
  604. ------------------------------
  605.  
  606. End of Neuron Digest [Volume 9 Issue 39]
  607. ****************************************
  608.