home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #30 / NN_1992_30.iso / spool / bit / listserv / csgl / 1815 < prev    next >
Encoding:
Text File  |  1992-12-12  |  19.1 KB  |  388 lines

  1. Comments: Gated by NETNEWS@AUVM.AMERICAN.EDU
  2. Path: sparky!uunet!paladin.american.edu!auvm!EID.ANL.GOV!GABRIEL
  3. Message-ID: <9212121946.AA11188@athens.eid.anl.gov>
  4. Newsgroups: bit.listserv.csg-l
  5. Date:         Sat, 12 Dec 1992 13:46:05 CST
  6. Sender:       "Control Systems Group Network (CSGnet)" <CSG-L@UIUCVMD.BITNET>
  7. From:         John Gabriel <gabriel@EID.ANL.GOV>
  8. Subject:      A Long Post
  9. Lines: 377
  10.  
  11. [From Gabriel 921212 12:44CST]
  12.  
  13. This is a long post, being the concatenation of three in an offline
  14. correspondence. I and Bill C. have noted Gary's concern about offline
  15. discussion depriving net mbrs of necessary context. We'd like to share
  16. our whole discussion, but it is complicated by being in part telephone
  17. conversations, in part subject to non-disclosure requirements, and
  18. part very technical and full of alphabet soup.
  19.  
  20. Some background on the participants. One group is the (by now) gang
  21. of five interested in data-fusion/information-fusion, why the two are
  22. so often confused, and uses in better Government and Defense. All of
  23. the gang of five work in more or less defense related institutions,
  24. and are to varying extents "thinking the unthinkable" so as to keep
  25. it from happening.
  26.  
  27. There is also a "gang of three", less active in the discussion, one
  28. being also a member of the gang of five. The gang of three is mainly
  29. interested in making better Management Infomation Systems organisations,
  30. because the present breed work with great expense, low speed, and
  31. terrible cost effectiveness.
  32.  
  33. The thing we all have in common with PCT is feedback paths, the
  34. information that moves along them and the way people behave when
  35. the information is perceived. The gang of five is concerned
  36. with military matters mainly because there is more experimental
  37. data and recorded detailed history, so that we can test theories
  38. best in the military context. The long term agenda is beating swords
  39. into plowshares, even though we still each keep a sword hung by the door
  40. just in case. We feel there is compelling evidence that CEOs and
  41. military commanders have rather largely the same problems except
  42. that being laid off is preferable to being killed or badly wounded.
  43. But each is a likely consequence of utter defeat of your unit.
  44.  
  45. The gang of three are concerned with people and information. There
  46. is no need to cut and weld pipe, or to shoot guns. This makes all
  47. the theory simpler. Our experimental evidence is about a quarter
  48. century of collective experience in the software business. This has
  49. advantages and disadvantges. Having grown up with the industry we
  50. can see the evidence of evolution in the embryology. But three is
  51. a small sample.
  52. ---------------------------------------------------------------------
  53. [Gabriel to Bill Cunningham at some ungodly hour of the morning]
  54.  
  55. This continues our afternoon TELCON about the problem of search/alert modes
  56. in PCT, and also scratches my itch about discovery being a collective
  57. phenomenon of populations of ECSs.
  58.  
  59. For those readers who did not share the earlier discussion, Bill and I
  60. have been discussing the question of how a single control system can
  61. ever "discover" anything, as distinct from "tracking" something already
  62. perceived, and whether this is a fundamentally absent issue in PCT, so
  63. we need to add it to the theory of advice to Cdrs.
  64.  
  65. I think the following suggests an interesting line of thought.
  66.  
  67. An N'th order control system is exactly mimiced by and exactly mimics,
  68. i.e. it is precisely represented by a set of N coupled first order
  69. ordinary differential equations (ODEs) - Bill Gear's lectures 101.
  70. (By the way, Bill is now directing a research consortium in Tokyo,
  71. funded by the Japanese Govt.)
  72.  
  73. A set of N coupled first order ODEs for the kind of N we usually can
  74. think about - say N <= 50 has nothing to do with algorithms to examine
  75. search spaces, that is to say, PCT seems to have little to tell us
  76. intuitively about discovery unless there is some unknown mathematics,
  77. which seems unlikely. N~10**4, N~10**7, or N~10**9 are far enough outside
  78. ordianry experience to make an intuitive argument straight out of PCT
  79. unlikely to carry any weight.
  80.  
  81. How to make a connection?? Well, if you uncouple the ODE's a bit,
  82. you can make them essentially all the same (good neuroanatomy),
  83. and have each one generate a path through state space determined
  84. by initial conditions. Different conditions, different paths.
  85.  
  86. Now, suppose we take a leap of faith, and guess that a collective
  87. set of ECSs (i.e. first order ODEs) are given a set of different
  88. initial conditions such that for any point P in the search space
  89. there exists at least one path passing within distance epsilon
  90. of P, and we can make epsilon as small as we want by taking
  91. enough ECSs (concentrating enough attention on the problem).
  92.  
  93. If as an ECS traverses a path, it notes the minimum value of an
  94. objective function on that path, a vote at the end of the collective
  95. behaviour can tell us which set of initial conditions led to the
  96. closest approach to the global minimum of the objective function
  97. in the search space defined by the set of all sets of initial
  98. conditions tried, one for each ECS in the ECS's assigned to the
  99. task of discovery by focussing attention. This vote is good
  100. neuroanatomy - it's done by a voting tree, and is not very far
  101. from the Kanerva neuroanatomical model for memory.
  102.  
  103. This model also explains some of Joe's and Bill's observations.
  104.  
  105. If you don't have a good set of Bayesian priors (initial conditions)
  106. Joe's observation that you can't cope with soemthing new on short
  107. notice follows, because you have not built the setup to explore
  108. that part of the search space.
  109.  
  110. The thing about false lock, only local minima, and misguided
  111. prosecution at law, is a case where you made a first pass through
  112. the space, decided that you could abandon a large part of the
  113. initial condition sets you tried and concentrate on the promising
  114. ones, which turned out not to go anywhere near the global minimum.
  115. This is one Bill and I have debated, ever since I raised the case
  116. of the possible terrorist found through a pistol permit. Perhaps
  117. we have a resolution.
  118.  
  119. Well, that's my 4AM insight for today. Try it on Stark/Vincennes,
  120. and the other litany of INTEL failures. Note by the way that it's
  121. a devil and deep sea problem. If you don't focus in on the problem
  122. you don't have the resources to solve it. If you focus in too early
  123. you have a high probability of being on the wrong track. Is this
  124. a type 1 vs type 2 error issue too. I have a strong feeling that
  125. the type1/type2 tradeoff in Sequential Statistics a la Abraham Wald
  126. is at the bottom of a lot of things we see.
  127.  
  128. This is the spot incidentally where the exceptionally able strike
  129. team of software developers always beats the Mongolian horde of average
  130. ones, and it's why most software these days is so very bad.
  131.  
  132. It also seems to me to bear on the distinction that Bill and Tom make
  133. between managers and leaders, and what Bill keeps repeating is different
  134. about a 4*.
  135.  
  136.                 John 921211 04:32 CST
  137. -----------------------------------------------------------------------------
  138.  
  139.  
  140. Adopting CSGL date/time conventionsince this discussion likely to expand.
  141.  
  142. :From Bill Cunningham 921211.0830 EST:
  143.  
  144. (John Gabriel 921211.0432 CST)
  145.  
  146. John, Ifind your suggestion "not implausible" and very attractive, on the
  147. surface.  The idea is certainly convenient, but I haven't a clue whether
  148. it's just a convenient model or a DEEP explanation of what actually happens.
  149.  
  150. My first thought is "What do I tell a mathematical illiterate?"  I have to do
  151. that sooner or later.
  152.  
  153. ANS:  "Keep your options open as long as you possibly can, knowing that as
  154. soon as you exclude new ideas you are committed to one/few.   Actively
  155. seek as many working hypotheses as possible.  Use brainstorming.
  156. Be very slow to throw out old data."
  157.  
  158. I think Joe would say play ALL the data (especially negative) against
  159. ALL the hypotheses, and if selection of a promising minimum doesn't
  160. lead to satisfactory closure--reopen the search by generating new
  161. hypotheses.
  162. --------------
  163. I think an action oriented commander would argue that he didn't have time
  164. for that b------t, that most of the time available had to be spent planning
  165. the execution.
  166.  
  167. My response would be, remember your METT-T doctrine.  Mission, enemy, tactics,
  168. terrain--and time available.  Start with mission and time available and
  169. identify drop dead points when you MUST make a decision.
  170.  
  171. I'd remind of Stark/Vincennes and say make your drop dead decision to
  172. defend the ship if you can't find contrary evidence by t=tcrit.  Put
  173. that order into motion and search like hell for the disproof.  But
  174. don't fire til you see the whites of their eyes.
  175.  
  176. I also think I'd drag in the fratricide problem.  If I expect no friendlies,
  177. my range of hypotheses is limited to one and my pucker factor reduces my
  178. search time accordingly.  But if I expect an ambivalent situation
  179. and my mission is say hostage rescue, then I have to allow more decision
  180. time--even at the risk of getting shot at.  I can only justify that if
  181. the mission warrants.  So the critical search is one for those prior
  182. constraints that can't be changed.  And that also restricts the search
  183. space.
  184.  
  185. Or I might cite yesterday's XXX report and say you have to ask the right
  186. question.Shaping the debate so it starts with wide range and narrows
  187. "efficiently/effectively" is the ART of command.  I'll bet I can find
  188. that in Druzhinin & Kontorov.It certainly fits with my telephonic
  189. comments that the great commanders seem to be in a very wide search mode,
  190. and then focus like a hawk on some issue.  They are bimodal to the max.
  191.  
  192. Along the same lines, how about the restraint of the Marines in Somalia?
  193. I'm referring to the incident where the blonde female ABC reporter found
  194. herself face down in the sand with a rifle in her back.  The reporters
  195. had all their lights on the Marines, and a few shots were fired.  My
  196. first reaction, if illuminated and under fire, would be to eliminate the
  197. illuminator whilst my buddy sprayed the area to discourage any aimed
  198. fire that might occur until the lights went out.  Those guys done good.
  199. __________________
  200.  
  201. With respect to the strike team of software writers vs the horde, I'd
  202. comment that, intellect aside, the strike team is deliberately in a search
  203. mode and the horde is deliberately in track mode.  Once you have a horde,
  204. the problem becomes one of work breakdown structure and you've already
  205. constrained the search space.  Now, it certainly helps if the strike
  206. team is made up of associative thinkers with sufficiently different
  207. backgrounds to enrich the search space and sufficiently common background/
  208. focus to communicate efficiently and place SOME constraint on the search.
  209. Rosabeth Moss Kantor (sp?) writes that innovative organizations have very
  210. good lateral communication whilst the stagnant ones are highly vertical.
  211. __________________
  212.  
  213. Now the question for Martin.  How does this square with your dual channel
  214. models?  Particularly the fast association/slow detail?
  215.  
  216.  
  217.  
  218. Bill C
  219. ------------------------------------------------------------------------
  220. Subject: Reply to Bill C's note
  221. Status: R
  222.  
  223. [From Gabriel 921211 11:12CST]
  224. A wondrous bright light Bill, and nobody shoving an M16 in your back
  225. either. Let me respond mathematically, but without formality - I don't
  226. get to do that often which is why you shone such a great light on the
  227. subject. Usually it's not possible to set out the idea without the
  228. formalism. And I truly enjoy talking about my real research to
  229. somebody other than myself.
  230.  
  231. The reason why my 04:30 note is appealing but not proven is that it's
  232. an imagined neuroanatomical implementation of the mathematical
  233. abstractions of search spaces, ordinary differential equations,
  234. optimal decision theory, and Hamiltonian system dynamics.
  235.  
  236. There are lots of other possible implementations, and one can only
  237. tell between them by experiment outside the realm of the common
  238. mathematical abstraction. That is to say, the mathematics has degrees
  239. of freedom which are lost once you go a physical system of any kind.
  240. I can implement the procedure in neuroanatomical wetware (perhaps),
  241. organisational wetware (certainly but I have serious constraints
  242. about who I choose to put in the organisation if I want it to be
  243. cost effective) silicon (at great capital expense, but practically
  244. zero cost of replication) software (same as silicon except easier
  245. to change when I find a mistake).
  246.  
  247. BUT since the mathematical abstraction has lots of properties we
  248. can observe to be approximately true outside the neuroanatomical
  249. black box, and actually observe in operations like YYY,
  250. it's useful independent of the details of wetware or software or
  251. silicon or organisations. Its usefulness lies in the observed
  252. fact that it's a detailed abstract implementation of the phenomena
  253. we observe, or a "model." It's predictive, it elicits strong
  254. recognition reflexes from those who know the physical implementations,
  255. and so on. That is to say, it has the properties of PCT. The
  256. basis for PCT in neuroanatomy is not bad, but certainly not
  257. conclusive for anything much bigger than the Moths and the Bats.
  258. The real justification for PCT is that Bill P. can build the Little Man
  259. and Little Arm models in software, and they have lots of the
  260. properties of their analogues in wetware, but they are built from
  261. the piece parts of the PCT premise.
  262.  
  263. Now, there are some other universal abstractions that have been very
  264. useful, and it's worth giving them a passing glance because they
  265. are meta-meta.....meta theories. Hard to use, but very powerful.
  266. And they have to do with constricting degrees of freedom which
  267. is one of the things that interest us.
  268.  
  269. If you look at planetary dynamics for instance, you find there are
  270. some transformations of coordinates that don't change the equations
  271. of motion. For example those that arise because gravitation is a
  272. central force, and so, although orbits are not circular, one ellipse
  273. is as good an orbit as another of the same size but rotated in 3 space,
  274. and two ellipses with the same T**2/A**3 are both equally good. And
  275. that (r**2)*(d theta/dt) is the same at all points in the orbit.
  276.  
  277. These facts, observed by Kepler, can be made to yield some astonishing
  278. results. That acceleration is directed towards the sun, that it is
  279. inversely proportional to r**2, and that the constant of proportionality
  280. is the same for all the planets.
  281.  
  282. Now we make the great gedanken experiment. Introduce an imaginary
  283. new planet, and assume the same things are true. We can at once
  284. conclude the usual statements of Newton's Laws and Gravitation are
  285. true for this imaginary new planet, and so on .... BUT the conclusion
  286. depends on two things, the Bayesian priors, and the assumption that
  287. they are true for the new planet - which was OK until Einstein, and
  288. still good enough for Govt. work.
  289.  
  290. Now, when we do the same kind of gedanken experiment for the next
  291. level up in the hierarchy, we arrive at the idea of symmetry
  292. operators for the system, and the theorem that initial conditions
  293. and the symmetry operators alone determine an orbit.
  294.  
  295. This has a counterpart in psychology, it's Gestalt theory, and
  296. invariants, and although I still don't really know what reorganisation
  297. is, I suspect it has to do with throwing away some invariants, as
  298. distinct from simply changing initial conditions.
  299.  
  300. Now back to software, which can mimic any physical system, so it's
  301. potentially a useful abstraction too. If we have a program
  302.  
  303.         y = f(x)
  304.  
  305. if it's going to be useful it had better yield reproducible
  306. results, so that for each input x, there is only one possible output y.
  307. That is to say, f is a many:1 mapping - several x may each give the same
  308. answer, but a particular x better not give different answers Mon Tue Wed,
  309. from Thur Fri Sat - on the seventh day f takes a rest.
  310.  
  311. This divides the set of all possible x into subsets, such that for every
  312. x in a subset, y=f(x) is the same.
  313.  
  314. You can see there are all kinds of symmetry lollygagging around -
  315. the "brotherhood" of all the x giving the same y is just a restriction
  316. of necessary varieties from the set of all x to the set of all y, i.e.
  317. a Ross Ashby necessary variety. If you leave a few brotherhoods out
  318. of your consideration of possible inputs, you have left out some
  319. y values, i.e. possible outcomes of running the dynamical system
  320. (campaign, TACWAR model....) represented by f().
  321.  
  322. Better get off my soapbox before it breaks. Merry Christmas to All.
  323.  
  324. This gets mathematical at about the same rate as the deterioration of
  325. enemy war capacity in Bill's example from strategic bombing, where B29s
  326. mined the Straits of Tsushima and damaged the Japanese prosecution
  327. of the war in the Pacific.
  328.  
  329. But the idea of symmetries, brotherhoods of scenarios all leading to
  330. (nearly enough) the same outcome, and Gestalt, and human perception of
  331. same, and search amongst them is very much our business.
  332.  
  333.                 John
  334.  
  335. PS I think I just did Ross Ashby wrong. The set of all brotherhoods
  336. is the necessary variety, and we need just one representative from
  337. each to get all the possible outcomes. But, if a brotherhood ain't
  338. really a brotherhood, i.e. we've put two different phenomena in the
  339. same class (f(x) can be a classifier) we may get an unpleasant
  340. surprise if the actual scenario we face is not the one belonging
  341. with the representative we chose for the "brotherhood". For the
  342. mathematician, there is less error in the abstraction than in
  343. the implementation - that's how I did Ross A. wrong, and why
  344. there are bugs in programs.
  345.  
  346. -------------------------------------------------------------------------
  347. [Cunningham to Gabriel]
  348.  
  349. Ref my 0900 response to John's 0432 post
  350.  
  351. Any military commander will jump down your throat to tell you that
  352. a halfway right solution boldly and fully executed is far more likely
  353. to succeed that the best solution implemented 30 milliseconds later.
  354. This is so well ingrained that search beyond the the first local minimum
  355. isn't likely.
  356.  
  357. This takes us right back to the information campaign, and I suspect
  358. there is a commercial world counterpart.  Given the fog and friction of war,
  359. the above approach is more likely to catch the adversary unable to perceive
  360. and respond to the action boldly taken.  The friction problem places a
  361. premium on early decision. The guy who first perceives more or less the
  362. right situation and who acts immediately upon that perception wins every
  363. meeting engagement.
  364.  
  365. That also applies to predator/prey or breeding competition in nature.  So
  366. good old Ma Nature fosters evolution of a two-channel fusion system.  One
  367. is fast acting, finding approximate solution AND IMMEDIATELY ALERTING THE
  368. PROPER EFFECTORS/OVERRIDING ONGOING CONTROL.  The other is the slower, more
  369. precise tracker.  Rather obviously, you can't survive without both qualities--
  370. and neither can our commander.
  371.  
  372. I guess that argues nature hasn't selected for processing negative information.
  373. Wonder why.  I'll bet because the system is optimized for real time response
  374. to own sensors.  We can certainly point to species alerted by negative
  375. info of "no birds singing==danger"
  376.  
  377. One more great argument for the information campaign is that we can process
  378. much more, and more quickly.  A stated goal should be to extend search time
  379. to permit selection of a global minumum in time to execute fully.  We're
  380. not actually extending the search time, but exploring more possibilities in
  381. less time.  Now, that's going to take a change in commander's mindset!!!!
  382. And that's a training issue, once rest of system is in place.
  383.  
  384. Now, I feel more comfortably aligned with Martin's two channels.
  385.  
  386.  
  387. Bill C.
  388.