home *** CD-ROM | disk | FTP | other *** search
/ PC Online 1997 April / PCO_04_97.ISO / filesbbs / os2 / tton1900.arj / TTON1900.ZIP / docs / templeton.cfg < prev    next >
Encoding:
Text File  |  1997-01-18  |  15.1 KB  |  337 lines

  1. # *************************************************************
  2. #  Templeton, copyright 1995, 1996, 1997 N.A. Krawetz
  3. #  All rights reserved.
  4. # *************************************************************
  5.  
  6. # configuration for Templeton
  7. #
  8. # Lines beginning with a '#' are comments and are ignored.
  9. # Lines should not be more than 80 characters.
  10. # Operands in this file are in the form:
  11. #    parameter value
  12. # The parameter is case insensitive, except where a text string or URL
  13. # is required.
  14. # Boolean values ("true" or "false") are case insensitive.
  15. # Numeric values should be numbers -- non-numbers are regarded as 0.
  16. # All other types of values ARE case sensitive.
  17.  
  18.  
  19. # ******************** Registration ****************************
  20. # Register: registration code
  21. # Software that is registered contains a unique registration
  22. # code.  This code should be entered exactly as it is provided.
  23. # If your site contains multiple registrations, you may list
  24. # each registration code on a line starting with the
  25. # key word "Register".
  26. # Please read the licensing agreement for registration
  27. # information.
  28. #   Register 12-34567-891011
  29.  
  30.  
  31. # ******************* File System *****************************
  32. # LocalPath: absolute path
  33. # LocalPath informs the program where to store the downloaded files.
  34. # IF this path is:
  35. #   LocalPath none
  36. # THEN no files are generated.  Only a log file containing the remote
  37. # servers WWW map is created in the current directory.
  38. #
  39. # Currently, files should be stored in the root directory of the file system.
  40. # For WWW servers, this is the server's root directory.
  41. # (This limitation will be removed in future releases.)
  42. # For DOS based machines, this path may include a drive letter:
  43. #   LocalPath e:\server.www\
  44. #
  45. # Either slash "/" or backslash "\" are valid for specifying a directory.
  46. # The trailing slash or backslash is optional.
  47. #
  48. # This option is only used when the "Interactive" option is FALSE.
  49. LocalPath /
  50.  
  51. # FATFormat: boolean
  52. # Determines the file name format for the current operating system.
  53. # DOS based machines using drives formatted with a File Allocation Table (FAT)
  54. # can only handle file names containing 8 characters and a 3 character
  55. # extension.  Setting this option to TRUE will generate 8.3 character file
  56. # names.  The default is FALSE, and will generate unlimited length file names.
  57. # NOTE: Under DOS, this option is always TRUE (DOS only supports FAT file
  58. # names).  Under OS/2, this value becomes TRUE automatically if the destination
  59. # path (LocalPath) is located on a FAT partition.
  60. FATFormat FALSE
  61.  
  62. # User: e-mail address
  63. # In case of emergency, this is the person who is running the program
  64. # and who should be contacted to stop the program from running.
  65. # This MUST be a valid e-mail address, and SHOULD also be available with
  66. # a "talk" command.
  67. # As a side note, it is never a good idea to let automatic software run
  68. # unsupervised (especially this type of software).  The "User" should be
  69. # available to read their e-mail at all times during the execution of this
  70. # program.
  71. # The default is the account running the program on the current machine.
  72. #  User webmaster@host.machine.org
  73.  
  74.  
  75. # ********************* Network *****************************
  76.  
  77. # ProxyHost: hostname or IP address
  78. # Proxy agents are machines that act as a gateway through a firewall.
  79. # If your local network uses a proxy agent, specify the name of
  80. # the proxy agent here.  If you are uncertain about your network, consult your
  81. # network manager or provider.
  82. # A proxy server is only used when a server is specified.
  83. #  ProxyHost    proxyhost.network.net
  84.  
  85. # ProxyPort: integer
  86. # When using a proxy server (see ProxyHost), the port on the proxy server
  87. # should be specified.  The default port is 80.  This values is not
  88. # used if no proxy host is specified with ProxyHost.
  89. ProxyPort    80
  90.  
  91. # Spoof: text-string
  92. # Some WWW servers make incorrect assumptions about the browser/robots.  (Most
  93. # of these are the Netscape servers.)  These servers assume that, since the
  94. # browser is not "Netscape" the browser cannot handle the HTML documents and
  95. # therefore, the document is not transfered.  By "spoofing" a different name,
  96. # the WWW robot can use a qualified browser name to retrieve the HTML
  97. # document.  
  98. # NOTE: The first word of the spoof-name is used for restrictions when 
  99. # robot exclusion is honored (see Exclusion).  This means, if Templeton tells
  100. # the WWW server that it is "Netscape" and the server does not permit
  101. # Netscape browsers, then the server will also not permit Templeton.
  102. # Common spoof names (and browsers) are:
  103. #   Mozilla    Netscape Browser
  104. #   WebCrawler    WebCrawler robot
  105. #   InfoSeek    InfoSeek robot
  106. #   WebExplorer IBM WebExplorer for OS/2
  107. #   Harvest    a web robot
  108. #   Mosaic    NCSA Mosaic
  109. #   Lynx    Lynx, text browser
  110. #   Microsoft Internet Explorer
  111. #   PRODIGY-WB    Prodigy browser
  112. # Spoof Mozilla (Templeton)
  113.  
  114.  
  115. # ********************* Restrictions *****************************
  116.  
  117. # RestrictHost: boolean
  118. # This parameter informs the program not to leave the designated host.  Links
  119. # to machines not on the current host are not traversed.
  120. RestrictHost TRUE
  121.  
  122. # RestrictPath: absolute path
  123. # This parameter is only used when a host is restricted.
  124. # When a host is restricted, a subpath on that host may also be restricted.
  125. # Hypertext references to documents outside this subtree are not traversed.
  126. # Either slash "/" or backslash "\" are valid for specifying a directory.
  127. # The trailing slash or backslash is optional.
  128. RestrictPath /
  129.  
  130. # RestrictDepth: numeric value
  131. # Hyperlinks are travered in a breadth-first search.  An unrestricted search
  132. # may download an entire WWW server's data.  By restricting the depth,
  133. # only immediate portions of the server will be received.
  134. # Images and non-href links are considered to be at the same depth as the
  135. # document.
  136. # A restricted depth of 0 means no restriction.
  137. # The default is 1
  138. RestrictDepth 1
  139.  
  140. # RemoveRestricted: boolean
  141. # This parameter informs the program to remove untraversed links.  Links to
  142. # restricted machines or restricted depths are removed from the HTML file,
  143. # but the visible test is still available (just not a hyperlink).
  144. # The default value is FALSE.
  145. RemoveRestricted FALSE
  146.  
  147. # Add: URL
  148. # Place a specific URL on the list of URLs to process.
  149. # Be aware that restrictions apply.
  150.  
  151. # Exclusion: boolean
  152. # This parameter determines whether Templeton will support server provided
  153. # robot exclusion files (robots.txt).  Many servers maintain exclusion files
  154. # to prevent robots from wandering around virtual directory trees, from
  155. # retrieving very temporary or uncomplete files, or copyright materials.  It
  156. # is considered "polite" for web agents to obey the exclusion files when they
  157. # exist.  The default value, TRUE, means that robot exclusion files are obeyed.
  158. # Setting Exclusion to FALSE will ignore robot exclusion files.
  159. Exclusion TRUE
  160.  
  161. # Deny: URL
  162. # The URL provided, as well as all subtrees or the URL, are not processed.
  163. # Many times specific directory subtrees are not desirable.  You can deny
  164. # retrieval of these URL's using this setting.
  165. # For example, to NOT retrieve the "archive" subtree of the host loco.com,
  166. # you would specify:
  167. #   Deny http://loco.com/archive/
  168. # If you do not include the trailing slash (http://loco.com/archive) then
  169. # all subdirectories beginning with "archive" are not processed.  This
  170. # includes "archive.1", "archive.old", "archive_from_1994", etc.
  171. # Deny statements may also include a '*' as a wild character.  This
  172. # symbol represents 0 or more characters for matching.  If, for example,
  173. # you wish to retrieve all GIF files, you would use:
  174. #   Deny *.gif
  175. # Only one '*' is permitted, but it may be located anywhere in the URL string.
  176. # Multiple Deny statements may be specified.
  177.  
  178. # Allow: URL
  179. # Similar to "Deny", "Allow" explicitly specifies that a subtree is
  180. # retrievable.  When used in conjunction with Deny URL, branches of a
  181. # subtree may be specified for access, while other subtrees are ignored.
  182. # Multiple Allow statements may be specified.
  183.  
  184. # Authorize: "realm" base64-code
  185. # This complex command allows you to specify a username and password
  186. # for basic WWW-authentication.  The realm is a quoted string.
  187. # The base64-code contains the encoded username and password.  Use
  188. # the pwd64.exe program to generate your base64-code.
  189. # The realm is a case-sensitive string provided by the WWW server. If you
  190. # do not know the realm for the pages you wish to retrieve, use Templeton
  191. # to interactively retrieve the page.  Templeton will display the realm
  192. # name and ask for your username and password.
  193. # Be aware that realms are not unique.  If different documents use the
  194. # same realm but require different passwords, Templeton will require
  195. # you to enter the username and password.
  196. # To skip a realm, use the username "-" and password "-", or the
  197. # base64-code: LTot
  198. #  Authorize "Secret Password" ZHIubmVhbDpyZWdpc3RlciBtZQ==
  199.  
  200. # Sleep: numeric
  201. # Sleep determines the number of seconds to pause before sending a request to
  202. # a WWW server.  SLEEP IS IMPORTANT.
  203. # Warning: Templeton can generate thousands of requests per minute.  Many 
  204. # WWW servers cannot handle a sudden onslaught of requests.  Setting the
  205. # Sleep parameter to 0 (zero) may generate too many requests for the server
  206. # and kill the server.  This is bad.
  207. # A sleep setting of 0 (zero) is known to kill the following types of servers:
  208. #   All WWW servers that run under Microsoft Windows (TM)
  209. #   Old generation (HTML/1.0) CERN servers on all platforms
  210. # Low sleep values may also generate large amounts of network traffic and
  211. # hog network resources.
  212. # For safety, you should set the sleep interval to at least 5 seconds.
  213. # The longer, the better.  Remember, this program is automated and can
  214. # easily run for hours.  What's the rush?
  215. Sleep 10
  216.  
  217.  
  218. # ********************* Preferences *****************************
  219.  
  220. # FileOverwrite: boolean or "modified"
  221. # Files that already exist on the local system are normally overwritten.
  222. # Setting the FileOverwrite option to FALSE will not overwrite files on the
  223. # local file system.  Setting the FileOverwrite option to "Modified"
  224. # (no quotes) will only retrieve documents (non-HTML) that have been changed
  225. # since the last retrieval.  The modified option is useful when retrieving
  226. # the same URL multiple times; modified will not waste time retrieving GIF
  227. # and JPG files that have already been retrieved.
  228. # FileOverwrite does NOT effect HTML documents -- HTML documents are always
  229. # retrieved.  Templeton can only determine links by retrieving HTML documents.
  230. # Skipping an HTML document would mean skipping possible links.
  231. # Default value is MODIFIED, only retrieving newer non-HTML file.
  232. FileOverwrite modified
  233.  
  234. # Index: file name
  235. # For hypertext references that only specify a directory, this is the
  236. # default html file in the directory.
  237. # NOTE: if FATFormat is TRUE, the 8.3 name translation will be applied to
  238. # this file name.
  239. # The default name is "index.html"
  240. Index index.html
  241.  
  242. # ISMAP: absolute path to executable
  243. # For WWW servers, many imagemaps use a program that takes coordinates from
  244. # a selected image <IMG SRC=... ISMAP> and return a new URL.  Some of the
  245. # more common methods use a data file containing known coordinates and a
  246. # program to identify which URL is activated.  Commonly, this program is
  247. # called "imagemap" or "imagemap.exe".
  248. # The ISMAP parameter specifies the WWW server's path to the imagemap program.
  249. ISMAP /cgi-bin/imagemap
  250.  
  251. # MapType: NCSA or CERN
  252. # For the executable specified in the ISMAP parameter (see above), this
  253. # option determines the format of the file.  If the image map file can be
  254. # retrieved, then it is converted into this specified format.
  255. # Valid options are either "CERN" or "NCSA".  The default is NCSA.
  256. MapType NCSA
  257.  
  258.  
  259. # ********************* Logging *****************************
  260. # Mailto-File: file name
  261. # Similar to "Server-File" logging, the file name listed on the "Mailto-File"
  262. # line contains a list of e-mail addresses found in the HTML documents.  Only
  263. # e-mail addresses that are active (hyperlinks) are used.  E-mail addresses
  264. # displayed as plain text in the document or contained in CGI scripts are not
  265. # listed in the mailto logfile.
  266. # NOTE:  This list MAY contain duplicate entries.  Duplication removal may be
  267. # added in later versions.
  268. # (Some people have found this to be a very useful feature for generating
  269. # mailing lists.)
  270. # The default is no mailto logging.
  271. # Mailto-File mailtolist
  272.  
  273. # RemoteMapping: boolean
  274. # Determines whether remote mapping will be done.  The default is TRUE
  275. # while does perform mapping.  The map file name is mapindex.html and is
  276. # either located at the root of the LocalPath or in the current directory
  277. # if the system is not mirroring files.
  278. # Note: if you change the default index name, for example, to "welcome.html"
  279. # then the default map file will be "mapwelcome.html".
  280. RemoteMapping TRUE
  281.  
  282. # Server-File: file name
  283. # A data file is generated containing the host name, IP address, and
  284. # WWW server type for each server visited.  For servers listed as IP
  285. # address only, the host name is also the IP address.
  286. # The default is no server logging.
  287. # Server-File serverlist
  288.  
  289.  
  290. # ********************* Advanced *****************************
  291. # The advanced configuration commands should be used with caution.
  292. # These commands allow other applications to perform tasks on the
  293. # retrieved documents.  Applications that are spawned (operate
  294. # concurrently) with Templeton may overwhelm the user or operating system.
  295. # Spawned applicatons include those begun with "start" under OS/2,
  296. # or followed by "&" under Unix.
  297. # NOTE: Templeton has the capability to spawn thousands of applications
  298. # in a few seconds.
  299. # On Unix-type systems, Templeton introduces security risks when executed
  300. # as root.
  301. # For applications that are not spawned, Templeton will pause until
  302. # the application has ended.  This allows for a guarenteed order of processing
  303. # for the called applications.
  304.  
  305. # Command_html: string
  306. # Command_image: string
  307. # Command_map: string
  308. # Command_default: string
  309. # Execute a system command on each document stored on the file system.
  310. # The different command types are for HTML documents, images, map files,
  311. # or the default command when any of the other commands are not set.
  312. # This are useful for counting documents, storing statistics, printing,
  313. # converting, etc.
  314. # The string "none" turns off these commands.  This default is "none".
  315. # The command string will replace special characters with desired information:
  316. #  characters:   becomes:
  317. #    %d    depth
  318. #    %h      host (server)
  319. #    %u      url
  320. #    %l      local file
  321. #    %s      saved file (same as %l)
  322. #    %r      remote file (URL without server)
  323. #    %%      %
  324. # The special characters ARE case sensitive.
  325. # NOTE: Command_image and Command_default do not distinguish between
  326. #   different file formats.
  327. # Example: to convert all HTML documents to text using the program
  328. # html2txt (not provided with the Templeton distribution), you would use:
  329. #   Command_html html2txt %s
  330.  
  331. # Interactive: boolean
  332. # Determines whether the user should be prompted for
  333. # configuration information or if Templeton should
  334. # start running automatically.
  335. # The default setting is TRUE.
  336.  
  337.