home *** CD-ROM | disk | FTP | other *** search
/ Mac Easy 2010 May / Mac Life Ubuntu.iso / casper / filesystem.squashfs / etc / bogofilter.cf < prev    next >
Encoding:
Text File  |  2008-06-18  |  6.8 KB  |  265 lines

  1. # Comment lines MUST have their hash mark in the leftmost column.
  2. # Comments can be added at the end of any line (after whitespace and a '#').
  3. # Blank lines are allowed.
  4.  
  5. ########### General Settings ########################################
  6.  
  7. #### BOGOFILTER_DIR
  8. #
  9. #    directory for wordlists
  10. #
  11. #bogofilter_dir=~/.bogofilter
  12. ##bogofilter_dir=/var/spool/bogofilter
  13.  
  14. #### name/location of user config file
  15. #
  16. #user_config_file=~/.bogofilter.cf
  17. ##user_config_file=~/.bogofilterrc
  18. ##user_config_file=~/.bogofilter/config
  19.  
  20. #### TRANSACTIONS: enable/disable database transactions
  21. #
  22. #    boolean indicating whether transactions
  23. #    should be enabled (yes) or disabled (no)
  24. #
  25. #db_transaction=no        # default
  26. ##db_transaction=yes        # (alternate)
  27.  
  28. #### WORDLIST: define additional word lists
  29. #
  30. #    char type: 'r' (regular) or 'i' (ignore)
  31. #    char *name: name of list, e.g. "system", "user", "ignore"
  32. #    char *path: absolute path to file or
  33. #            file name (relative to bogofilter_dir)
  34. #    int  order - once found, skip higher numbered lists
  35. #
  36. ##wordlist i,ignore,~/ignorelist.db,1
  37. ##wordlist r,wordlist,~/wordlist.db,2
  38.  
  39. #### SPAM_HEADER_NAME
  40. #
  41. #    used in reporting spamicity and
  42. #    in removing already existing headers
  43. #
  44. #spam_header_name=X-Bogosity
  45.  
  46. #### SPAM_HEADER_PLACE
  47. #
  48. #    used in placing the SPAM_HEADER_NAME line
  49. #
  50. #spam_header_place=DomainKey-Signature
  51.  
  52. #### SPAM_SUBJECT_TAG
  53. #
  54. #    tag added to "Subject: " line for identifying spam or unsure
  55. #    default is to add nothing.
  56. #
  57. ##spam_subject_tag=***SPAM***
  58. ##unsure_subject_tag=???UNSURE???
  59.  
  60. #### STATS_IN_HEADER
  61. #
  62. #    non-zero (default):  put spamicity info in message header
  63. #    zero:  put spamicity info in message body
  64. #    can use "bool" values of True, False, Yes, No, 1, or 0
  65. #
  66. #stats_in_header=Yes        # default
  67. ##stats_in_header=No        # (alternate)
  68.  
  69. #### DB_CACHESIZE
  70. #
  71. #    non-zero: set this as DB cache size (in Mbytes)
  72. #    zero:     use DB default cache size (.25 Mbyte in 4.0.14)
  73. #
  74. #    note that Berkeley DB increases any buffer size below 500 MB
  75. #    by 25%!
  76. #    This helps most when doing massive changes to the data base that
  77. #    involve a lot of overwrites, such as registering mail boxes,
  78. #    whereas it is mostly a waste of memory for read-only
  79. #    applications such as scoring.
  80. #    WARNING: If you set this too large, bogofilter will fail.
  81. #
  82. #db_cachesize=0            # default
  83. ##db_cachesize=16        # (alternate)
  84.  
  85. #### DB_LOG_AUTOREMOVE
  86. #
  87. #    boolean indicating whether auto-removing of
  88. #    logs should be enabled (yes) or disabled (no)
  89. #
  90. #db_log_autoremove=yes        # default
  91. ##db_log_autoremove=no        # (alternate)
  92.  
  93. #### TIMESTAMP
  94. #
  95. #    enables or disables token timestamps
  96. #
  97. #timestamp=Yes
  98.  
  99. #### Format of spamicity output
  100. #
  101. # for two-state output the third entry is not needed and not used
  102. #
  103. #spamicity_tags = Spam, Ham, Unsure
  104. #spamicity_formats = %0.6f, %0.6f, %0.6f
  105. #
  106. ##spamicity_tags = Yes, No, Unsure
  107. ##spamicity_formats = %0.6f, %0.6f, %0.6f
  108.  
  109. #### Format of SPAM_HEADER
  110. #
  111. #    formatting characters:
  112. #
  113. #        h - spam_header_name, e.g. "X-Bogosity"
  114. #
  115. #        c - classification, e.g. Yes/No, Spam/Ham/Unsure, +/-/?
  116. #
  117. #        D - date, fixed ISO-8601 format for Universal Time ("GMT")
  118. #
  119. #        e - spamicity as 'e' format
  120. #        f - spamicity as 'f' format
  121. #        g - spamicity as 'g' format
  122. #
  123. #        A - IP address (from first Received: statement having one)
  124. #        Not guaranteed to be the originating address of the message.
  125. #        I - Message ID
  126. #        Q - Queue ID (from first id tag found in Received: headers)
  127. #
  128. #        l - logging tag (from '-l' option)
  129. #
  130. #        o - spam_cutoff, ex. cutoff=%o
  131. #
  132. #        p - spamicity value
  133. #        d - if ham or unsure, the spamicity
  134. #        if spam, difference of spamicity from 1.0
  135. #
  136. #        r - runtype
  137. #            w - word count
  138. #            m - message count
  139. #
  140. #        u - username - this will either be the login from getlogin(),
  141. #               if that is empty, the pw_name obtained from
  142. #               the password database, or the user id
  143. #               prefixed by #, for instance, #1003
  144. #
  145. #        v - version
  146. #
  147. #    customizable messages:
  148. #
  149. #    header_format - the "X-Bogosity" line that '-p' adds to
  150. #        the message header and '-v' outputs.
  151. #    terse_format - an abbreviated form of header_format;
  152. #        selected by command line option '-t'
  153. #    log_header_format - written to syslog by '-u' option
  154. #        when classifying messages.
  155. #    log_update_format - written to syslog by '-u' option
  156. #        when registering messages.
  157. #
  158. #
  159. #header_format = %h: %c, tests=bogofilter, spamicity=%p, version=%v
  160. #terse_format = %1.1c %f
  161. #log_header_format = %h: %c, spamicity=%p, version=%v
  162. #log_update_format = register-%r, %w words, %m messages
  163. ##log_header_format = %h: %c, spamicity=%f, ipaddr=%A, queueID=%Q, msgID=%I, version=%v
  164.  
  165. #### TERSE
  166. #
  167. #    if enabled, format the X-Bogosity using the 'terse_format' specificaton.
  168. #
  169. #terse=no            # default
  170. ##terse=yes            # (alternate)
  171.  
  172.  
  173. ########### Tokenizer Settings ######################################
  174.  
  175. #### BLOCK ON SUBNETS
  176. #
  177. #    convert IPADDRs into a special token, url:1.2.3.4,
  178. #    and also return url:1.2.3, url:1.2, and url:1
  179. #    to allow identifying spammers by ip address / subnets.
  180. #
  181. #block_on_subnets=no
  182.  
  183. #### CHARSET handling
  184. #
  185. #    specify default charset
  186. #
  187. #charset_default=iso-8859-1        # default
  188. #charset_default=us-ascii        # (alternate)
  189. ##charset_default=cp866            # for Russian
  190.  
  191. #### REPLACE_NONASCII_CHARACTERS
  192. #
  193. #    replace non-7bit chars with '?'
  194. #
  195. #replace_nonascii_characters=N        # default
  196. ##replace_nonascii_characters=Y        # (alternate)
  197.  
  198. #### UNICODE handling
  199. #
  200. #    boolean indicating whether raw storage (no) or unicode (yes)
  201. #    is the default encoding for the wordlist
  202. #
  203. #unicode=yes                # default
  204. ##unicode=no                # (alternate)
  205.  
  206. #### lexer parameters
  207. #
  208. #    minimum and maximum lengths for single tokens
  209. #
  210. #min-token-len=3            # default
  211. #max-token-len=30            # default
  212. #
  213. #    count and length for multi-word tokens
  214. #    Note: if length not specified, defaults to
  215. #          multi-token-count * max-token-len (approx)
  216. #
  217. #multi-token-count=1            # default
  218. #max-multi-token-len=0            # default
  219.  
  220. ########### Classification Constants Settings #######################
  221. #
  222. # See man page for a more detailled description of the parameters.
  223.  
  224. #### MINIMUM DEVIATION
  225. #
  226. #    if token spamicity closer to EVEN_ODDS (0.5)
  227. #    than MIN_DEV, don't use the word in the
  228. #    spamicity calculation
  229. #
  230. #min_dev=0.375                # default
  231.  
  232. #### Robinson Constants
  233. #
  234. #    floating point values for
  235. #    Robinson S and X coefficients.
  236. #
  237. #robs=0.0178                # default
  238. #robx=0.52                # default
  239.  
  240. #### CUTOFF Values
  241. #
  242. #    both ham_cutoff and spam_cutoff are allowed.
  243. #    setting ham_cutoff to a non-zero value will
  244. #    enable tri-state results (Spam/Ham/Unsure).
  245. #
  246. #ham_cutoff = 0.45            # default
  247. #spam_cutoff= 0.99            # default
  248. #
  249. #    for two-state classification:
  250. #
  251. ##ham_cutoff  = 0.00            # default
  252. ##spam_cutoff = 0.99            # default
  253.  
  254. #### Effective Size Factor Values
  255. #
  256. #ns_esf = 1.000                # default
  257. #sp_esf = 1.000                # default
  258.  
  259. #### Auto-update threshold
  260. #
  261. #    Skip autoupdating if the spamicity is within this value
  262. #    of 0.000000 (surely ham) or 1.000000 (surely spam).
  263. #
  264. ## thresh_update=0.01            # (optional)
  265.