home *** CD-ROM | disk | FTP | other *** search
/ ftp.f-secure.com / 2014.06.ftp.f-secure.com.tar / ftp.f-secure.com / support / hotfix / fsis / IS-SpamControl.fsfix / iufssc / rules / 20_phrases.cf < prev    next >
Text File  |  2006-11-29  |  16KB  |  358 lines

  1. # SpamAssassin rules file: phrase tests
  2. #
  3. # Please don't modify this file as your changes will be overwritten with
  4. # the next update. Use @@LOCAL_RULES_DIR@@/local.cf instead.
  5. # See 'perldoc Mail::SpamAssassin::Conf' for details.
  6. #
  7. # Note: body tests are run with long lines, so be sure to limit the
  8. # size of searches; use /.{0,30}/ instead of /.*/ to avoid huge
  9. # search times.
  10. #
  11. # <@LICENSE>
  12. # Copyright 2004 Apache Software Foundation
  13. # Licensed under the Apache License, Version 2.0 (the "License");
  14. # you may not use this file except in compliance with the License.
  15. # You may obtain a copy of the License at
  16. #     http://www.apache.org/licenses/LICENSE-2.0
  17. # Unless required by applicable law or agreed to in writing, software
  18. # distributed under the License is distributed on an "AS IS" BASIS,
  19. # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
  20. # See the License for the specific language governing permissions and
  21. # limitations under the License.
  22. # </@LICENSE>
  23. #
  24. ###########################################################################
  25.  
  26. #require_version @@VERSION@@
  27.  
  28. ###########################################################################
  29.  
  30. # bug 1022: MGM_POSTCARD #2 original
  31. body REMOVE_POSTAL        /(?:Send(?:ing)? a (?:postal mail|postcard) to (?:Unsubscribe|Customer ?Service|remove)|unsubscribe by (?:postal mail|postcard))/i
  32. describe REMOVE_POSTAL        Send real mail to be unsubscribed
  33.  
  34. # new way to phrase unsubscribe link
  35. body REMOVE_BEFORE_LINK        m{(?:no thanks|not interested|unsubscribe here).{0,5}http://}i
  36. describe REMOVE_BEFORE_LINK    Removal phrase right before a link
  37.  
  38. ###########################################################################
  39. # CLICK rules
  40. # note HTML_LINK_CLICK* rules in HTML parser section
  41.  
  42. body CLICK_BELOW_CAPS        /CLICK\s.{0,30}(?:HERE|BELOW)/s
  43. describe CLICK_BELOW_CAPS    Asks you to click below (in capital letters)
  44.  
  45. body CLICK_TO_REMOVE_1        /click here to be (?:permanently )?(?:removed|deleted)/i
  46. describe CLICK_TO_REMOVE_1    Click to be removed
  47.  
  48. body SENT_IN_COMPLIANCE        /(?:e.?mail|message) .{0,10}sen[dt] (?:to you )?in (?:\w{1,10} )?compliance (?:of|with)/i
  49. describe SENT_IN_COMPLIANCE    Claims compliance with spam regulations
  50. body BILL_1618            /\bs\W{0,4}1618\b/i
  51. describe BILL_1618        Possible mention of bill 1618 (anti-spam bill)
  52. body FULL_REFUND        /full refund|refunds? your money in full/i
  53. describe FULL_REFUND        Offers a full refund
  54.  
  55. body NO_COST                    /\bno (?:cost|charge)\b/i
  56. describe NO_COST                No such thing as a free lunch (3)
  57. body GUARANTEED_100_PERCENT    /100% GUARANTEED/i
  58. describe GUARANTEED_100_PERCENT    One hundred percent guaranteed
  59. body DEAR_FRIEND        /^\s*Dear Friend\b/i
  60. describe DEAR_FRIEND        Dear Friend? That's not very dear!
  61. body DEAR_SOMETHING        /\bDear (?:IT\W|Internet|candidate|sirs?|madam|investor|travell?er|car shopper|web)\b/i
  62. describe DEAR_SOMETHING        Contains 'Dear (something)'
  63. body BILLION_DOLLARS        /[BM]ILLION DOLLAR/
  64. describe BILLION_DOLLARS    Talks about lots of money
  65. body OPTING_OUT_CAPS        /\b(?-i:O)pt.?(?-i:O)ut\b/i
  66. describe OPTING_OUT_CAPS    Talks about opting out (capitalized version)
  67.  
  68. body EXCUSE_4            /To Be Removed,? Please/i
  69. describe EXCUSE_4        Claims you can be removed from the list
  70.  
  71. # strange pattern because otherwise it matches the std. majordomo line
  72. # pls note the comment above. DO NOT just put "to" in the first group!
  73. body EXCUSE_6            /\b(?:wish to|click to) remove yourself/i
  74. describe EXCUSE_6        Claims you can be removed from the list
  75.  
  76. body EXCUSE_10            /if you (?:(?:want|wish|care|prefer) not to |do ?n[o']t (?:want|wish|care) to )(?:be contacted again|receive (?:any ?)?(?:more|future|further)\b.{1,10}\b(?:e?-?mail|message|offer|solicitation)s?|be included)/i
  77. describe EXCUSE_10        "if you do not wish to receive any more"
  78.  
  79. body EXCUSE_12            /this (?:e?-?mail|message) (?:(?:has )?reached|was sent to) you in error/i
  80. describe EXCUSE_12        Nobody's perfect
  81.  
  82. body EXCUSE_23            /you have provided permission/i
  83. describe EXCUSE_23        Claims you have provided permission
  84. body EXCUSE_24            /you(?:'ve|'re| have| are)? receiv(?:e|ed|ing) this (?:advertisement|offer|special|recurring|paid).{0,16}\b(?:by either|because)/i
  85. describe EXCUSE_24        Claims you wanted this ad
  86.  
  87. body EXCUSE_REMOVE        /to be removed from.{0,20}(?:mailings|offers)/i
  88. describe EXCUSE_REMOVE        Talks about how to be removed from mailings
  89.  
  90. body STRONG_BUY            /strong buy/i
  91. describe STRONG_BUY        Tells you about a strong buy
  92.  
  93. body WE_HONOR_ALL        /\b(?:honou?r|respect)(?: all)? remov(?:e|al) requests?\b/i
  94. describe WE_HONOR_ALL        Claims to honor removal requests
  95.  
  96. body STOCK_ALERT        /\bstock alert/i
  97. describe STOCK_ALERT        Offers a alert about a stock
  98. body MICRO_CAP_WARNING        /Investing in micro-cap securities is highly speculative/i
  99. describe MICRO_CAP_WARNING    SEC-mandated penny-stock warning
  100. body NOT_ADVISOR        /not a registered investment advisor/i
  101. describe NOT_ADVISOR        Not registered investment advisor
  102.  
  103. body SOME_BREAKTHROUGH        /\b(?:science|medical|major|scientific|fundamental|technology|revolutionary)\s+breakthrough/i
  104. describe SOME_BREAKTHROUGH    Describes some sort of breakthrough
  105.  
  106. body PREST_NON_ACCREDITED    /prestigi?ous\b.{0,20}\bnon-accredited\b.{0,20}\buniversities/i
  107. describe PREST_NON_ACCREDITED    'Prestigious Non-Accredited Universities'
  108.  
  109. body BODY_ENHANCEMENT        /\b(?:enlarge|increase|grow|lengthen|larger\b|bigger\b|longer\b|thicker\b|\binches\b).{0,50}\b(?:penis|male organ|pee[ -]?pee|dick|sc?hlong|wh?anger|breast(?!\s+cancer))/i
  110. describe BODY_ENHANCEMENT    Information on growing body parts
  111.  
  112. body BODY_ENHANCEMENT2        /\b(?:penis|male organ|pee[ -]?pee|dick|sc?hlong|wh?anger|breast(?!\s+cancer)).{0,50}\b(?:enlarge|increase|grow|lengthen|larger\b|bigger\b|longer\b|thicker\b|\binches\b)/i
  113. describe BODY_ENHANCEMENT2    Information on getting larger body parts
  114.  
  115. body     IMPOTENCE              /\b(?:impotence (?:problem|cure|solution)|Premature Ejaculation|erectile dysfunction)/i
  116. describe IMPOTENCE              Impotence cure
  117.  
  118. body MORTGAGE_BEST        /\b(?:low(?:est|er)?|free|second|rate|best|refinanc(?:e|ing)|online|instant) mortgage/i
  119. describe MORTGAGE_BEST        Information on mortgages
  120.  
  121. body MORTGAGE_PITCH        /mortgage (?:rates?|quotes?|approv(?:al|ed)|payment|interest|loans?|app(?:\b|lication))/i
  122. describe MORTGAGE_PITCH        Looks like mortgage pitch
  123.  
  124. body MORTGAGE_RATES        /Mortgage rates/i
  125. describe MORTGAGE_RATES        Information on mortgage rates
  126.  
  127.                     
  128. # this works best as rawbody
  129. # do not add "subscribe", "unsubscribe", or "help"
  130. rawbody MAILTO_SUBJ_REMOVE        /mailto:.{0,64}\@.{0,64}\?subject=(?:\"|3D)*(?:remove?|delete|please.?(?:delete|remove|unsubscribe)|abuse|off\b|stop|take.?me.?off)/i
  131. describe MAILTO_SUBJ_REMOVE    mailto URI includes removal text
  132.  
  133. body NA_DOLLARS            /\b(?:\d{1,3})?Million\b.{0,40}\b(?:Canadian Dollar?s?|US\$|U\.? ?S\.? Dollar)/i
  134. describe NA_DOLLARS        Talks about a million North American dollars
  135.  
  136. body US_DOLLARS_3               /(?:\$|usd).?\d{1,3}[,.]\d{3}[,.]\d{3}(?:[,.]\d\d)?/i
  137. describe US_DOLLARS_3           Mentions millions of $ ($NN,NNN,NNN.NN)
  138.  
  139. body MILLION_USD                  /Million\b.{0,40}\b(?:United States? Dollars?|USD)/i
  140. describe MILLION_USD         Talks about millions of dollars
  141.  
  142. rawbody FRONTPAGE        /FrontPage.Editor/
  143. describe FRONTPAGE        Frontpage used to create the message
  144.  
  145. body RESISTANCE_IS_FUTILE    /Replying to this email will not unsubscribe you./i
  146. describe RESISTANCE_IS_FUTILE    Resistance to this spam is futile
  147.  
  148. body URG_BIZ            /urgent.{0,16}(?:assistance|business|buy|confidential|notice|proposal|reply|request|response)/i
  149. describe URG_BIZ        Contains urgent matter
  150.  
  151. body EARN_PER_WEEK              /\b(?:earn|make).{1,20}\d\d\d+.{1,30}(?:per week|per month|weekly|monthly)/i
  152. describe EARN_PER_WEEK          Contains 'earn $something per week'
  153.  
  154. body     ALL_NATURAL            /\b(?:100%|completely|totally|all) natural/i
  155. describe ALL_NATURAL            Spam is 100% natural?!
  156.  
  157. body     MONEY_BACK             /money back guarantee/i
  158. describe MONEY_BACK             Money back guarantee
  159.  
  160. body     NO_OBLIGATION          /no obligation/i
  161. describe NO_OBLIGATION          There is no obligation
  162.  
  163. body     RISK_FREE              /\b(?:risk[ -]free|no[ -]risk)/i
  164. describe RISK_FREE              Risk free.  Suuurreeee....
  165.  
  166. # "seen on TV", "seen on ABC/NBC/etc", "seen on XYZ TV", or "seen on:"
  167. body AS_SEEN_ON            /seen on\s*(?:T\.?V|A\.?B\.?C|N\.?B\.?C|C\.?B\.?S|C\.?N\.?N|Oprah|U\.?S\.?A\.? Today|48 Hours|New York Times|\w+\s+T\.?V|:)/i
  168. describe AS_SEEN_ON        As seen on national TV!
  169.  
  170. ## Contrib: Marc Perkel
  171. body OFFSHORE_SCAM        /\boffshore\b.{0,20}(?:credit card|companies|account|financ|websites?)/i
  172. describe OFFSHORE_SCAM        Off Shore Scams
  173.  
  174. body WHY_PAY_MORE        /\bwhy pay more\b/i
  175. describe WHY_PAY_MORE        Why Pay More?
  176.  
  177. # similar to OFFER, but fewer FPs
  178. body RECEIVE_OFFER        /receive special offer/i
  179. describe RECEIVE_OFFER        Receive a special offer
  180.  
  181. body FREE_QUOTE_INSTANT        /free.{0,12}(?:(?:instant|express|online|no.?obligation).{0,4})+.{0,32}\bquote/i
  182. describe FREE_QUOTE_INSTANT    Free express or no-obligation quote
  183.  
  184. body BAD_CREDIT                /\b(?:bad|poor|no\b|eliminate|repair|(?:re)?establish|damag).{0,10} (?:credit|debt)\b/i
  185. describe BAD_CREDIT        Eliminate Bad Credit
  186.  
  187. body CONSOLIDATE_DEBT        /(?:consolidate .{0,9} (?:debt|credit|bills)|debt[ -]?(?:consolidation|elimination))/i
  188. describe CONSOLIDATE_DEBT    Consolidate debt, credit, or bills
  189.  
  190. body REFINANCE_YOUR_HOME    /\brefinance your(?: current)? (?:home|house)\b/i
  191. describe REFINANCE_YOUR_HOME    Home refinancing
  192.  
  193. body REFINANCE_NOW              /time to refinance|refinanc\w{1,3}\b.{0,16}\bnow\b/i
  194. describe REFINANCE_NOW          Home refinancing
  195.  
  196. body NO_MEDICAL                /\bno medical exam/i
  197. describe NO_MEDICAL        No Medical Exams
  198.  
  199. body NO_FORMS                /\bno .{0,9}forms\b/i
  200. describe NO_FORMS        No Claim Forms
  201.  
  202. body WHY_WAIT                /\b(?:why wait|what are you waiting for)\b/i
  203. describe WHY_WAIT        What are you waiting for
  204.  
  205. body YOU_CAN_SEARCH        /you can search for anyone/i
  206. describe YOU_CAN_SEARCH        You can search for anyone
  207.  
  208. body GUARANTEED_STUFF            /\bguarantee.{0,15}(?:income|money|monthly)\b/i
  209. describe GUARANTEED_STUFF    Guaranteed Stuff
  210.  
  211. body AMAZING_STUFF            /\bamazing (?:product|rates)/i
  212. describe AMAZING_STUFF        Amazing Stuff
  213.  
  214. # seems like we vastly reduce FPs on this one with a small change or two
  215. body DIET_1             /\b(?:(?:without|no) (?:exercis(?:e(?! price)|ing)|dieting)|weight.?loss|(?:extra|lose|lost|losing).{0,10}(?:pounds|weight|inches|lbs)|burn.{1,10}fat)\b/i
  216. describe DIET_1        Lose Weight Spam
  217.  
  218. body DIET_2        /\blo+se.{1,10}\d+.{1,3}(?:lb|pound|kg|kilo)/i
  219. describe DIET_2        Describes weight loss
  220.  
  221. body DIET_3        /(?:Body Fat Loss|Loss of body fat|lose.{1,10}body fat)/i
  222. describe DIET_3        Describes body fat loss
  223.  
  224. body REVERSE_AGING         /\breverses? aging\b/i
  225. describe REVERSE_AGING        Reverses Aging
  226.  
  227. body HAIR_LOSS            /\b(?=[gnrt])(?:thinn?ing|restore|grow|new) hair|\bhair loss/i
  228. describe HAIR_LOSS        Cures Baldness
  229.  
  230. body WRINKLES                /\bwrinkle reduction\b/i
  231. describe WRINKLES        Removes Wrinkles
  232.  
  233. body WHILE_YOU_SLEEP            /\bwhile you sleep\b/i
  234. describe WHILE_YOU_SLEEP    While you Sleep
  235.  
  236. body HIDDEN_CHARGES            /\bhidden charges\b/i
  237. describe HIDDEN_CHARGES        Talks about Hidden Charges
  238.  
  239. body FIN_FREE                /\bfinancial(?:ly)? free/i
  240. describe FIN_FREE         Freedom of a financial nature
  241.  
  242. body FORWARD_LOOKING            /\bcontains forward-looking statements\b/i
  243. describe FORWARD_LOOKING    Stock Disclaimer Statement
  244.  
  245. body SATIS_GUAR                /\bsatisfaction .{0,9}g(?:ua|au)ranteed\b/i
  246. describe SATIS_GUAR        Mail guarantees satisfaction
  247.  
  248. # Avoid an FP noted by NISHIJIMA Takanori: 'Japanese string sequence:
  249. # "Su" "Ku" "Na"  "I" "Ko" "Su" "To" "De" "Yo" "Ri" ...
  250. # (This string means, "More ...(ex. "productive" or "effective")
  251. # with less cost", and is a popular phrase but have no relations
  252. # with human growth hormone, of course. :-)
  253. # Encoded byte sequence: "$9" "$/" "$J" "$$" "%3" "%9" "%H" "$G" "$h" "$j"'
  254. # note FP:                                              ^^^^^^^^^^^^
  255. body __HG_HORMONE        /\b(?:human growth hormone|(?-i:HGH)|H.G.H)\b/i
  256. meta HG_HORMONE            (!__ISO_2022_JP_DELIM && __HG_HORMONE)
  257. describe HG_HORMONE        Talks about hormones for human growth
  258.  
  259. body EXTRA_CASH                /\bextra cash\b/i
  260. describe EXTRA_CASH        Offers Extra Cash
  261.  
  262. body GET_PAID                /\bget (?-i:P)aid\b/i
  263. describe GET_PAID        Get Paid
  264.  
  265. body ONE_TIME            /\bone\W+time (?:charge|investment|offer|promotion)/i
  266. describe ONE_TIME        One Time Rip Off
  267.  
  268. body COMPETE                /\bcompete for your business\b/i
  269. describe COMPETE        Compete for your business
  270.  
  271. body MEET_SINGLES            /\bmeet .{0,12}singles|thousands of personal/i
  272. describe MEET_SINGLES        Meet Singles
  273.  
  274. body JOIN_MILLIONS            /\bjoin (?:millions|thousands)\b/i
  275. describe JOIN_MILLIONS        Join Millions of Americans
  276.  
  277. body BE_BOSS                /\byour own boss\b/i
  278. describe BE_BOSS        Be your own boss
  279.  
  280. body ML_MARKETING            /\b(?:MLM|multi.level.marketing)\b/i
  281. describe ML_MARKETING        Multi Level Marketing mentioned
  282.  
  283. body CONFIDENTIAL_ORDER        /confidential.{0,9} order/i
  284. describe CONFIDENTIAL_ORDER    Confidentiality on all orders
  285.  
  286. body SAVE_THOUSANDS             /\bsave (?:thousands|millions)\b/i
  287. describe SAVE_THOUSANDS         Save big money
  288.  
  289. body MARKETING_PARTNERS        /\b(?:marketing|network) partner|\bpartner (?:web)?site/i
  290. describe MARKETING_PARTNERS    Claims you registered with a partner
  291.  
  292. body FREE_PREVIEW        /\bfree preview\b/i
  293. describe FREE_PREVIEW        Free Preview
  294.  
  295. body FREE_ACCESS                /(?-i:F)ree access/i
  296. describe FREE_ACCESS            Contains 'free access' with capitals
  297.  
  298. body FREE_SAMPLE                /(?-i:F)ree sample/i
  299. describe FREE_SAMPLE            Contains 'free sample' with capitals
  300.  
  301. body LOW_PRICE                  /\blow.{0,4} (?-i:P)rice/i
  302. describe LOW_PRICE              Lowest Price
  303.  
  304. body UNCLAIMED_MONEY            /\bunclaimed (?:funds|money|prizes?|rewards?)\b/i
  305. describe UNCLAIMED_MONEY        People just leave money laying around
  306.  
  307. body OBSCURED_EMAIL        /\w+\^\S+\(\w{2,4}\b/
  308. describe OBSCURED_EMAIL        Message seems to contain rot13ed address
  309.  
  310. body BANG_EXERCISE            /\bexercis(?:e|er|es)!/i
  311. describe BANG_EXERCISE        Talks about exercise with an exclamation!
  312. body BANG_MORE               /\b(?-i:M)ore!/i
  313. describe BANG_MORE           Talks about more with an exclamation!
  314. body BANG_OPRAH              /\boprah!/i
  315. describe BANG_OPRAH          Talks about Oprah with an exclamation!
  316.  
  317. body ACT_NOW_CAPS               /A(?i:ct) N(?i:ow)/
  318. describe ACT_NOW_CAPS        Talks about 'acting now' with capitals
  319. body MORE_SEX               /increased?.{0,9}(?:sex|stamina)/i
  320. describe MORE_SEX         Talks about a bigger drive for sex
  321.  
  322. body BANG_GUAR                 /\bguaranteed?\!/i
  323. describe BANG_GUAR        Something is emphatically guaranteed
  324.  
  325. body SEE_FOR_YOURSELF        /See (?:for|it|it for) yourself\b/i
  326. describe SEE_FOR_YOURSELF       See for yourself 
  327.  
  328. body __RUDE_HTML_1    /Get a capable html e-mailer/i
  329. body __RUDE_HTML_2    /not support the display of HTML. Please view this message in a different/i
  330. body __RUDE_HTML_3    /This message contains an HTML formatted message but your email client does/i
  331. body __RUDE_HTML_4    /Your mailer do not support HTML messages. Switch to a better mailer/i
  332. meta RUDE_HTML        __RUDE_HTML_1 || __RUDE_HTML_2 || __RUDE_HTML_3 || __RUDE_HTML_4
  333. describe RUDE_HTML    Spammer message says you need an HTML mailer
  334.  
  335. body INVESTMENT_ADVICE        /\binvestment advice/i
  336. describe INVESTMENT_ADVICE    Message mentions investment advice
  337.  
  338. body INVESTMENT_EXPERT        /\binvestment expert/i
  339. describe INVESTMENT_EXPERT    Message mentions investment expert
  340.  
  341. body QUALIFY_FOR_THIS        /qualify for \w{1,5} (?:special|new|promotion)/i
  342. describe QUALIFY_FOR_THIS    Qualify for this special...
  343.  
  344. body MALE_ENHANCE    /male enhancement/i
  345. describe MALE_ENHANCE    Message talks about enhancing men
  346.  
  347. body PRICES_ARE_AFFORDABLE    /\baffordable .{0,10}prices\b/i
  348. describe PRICES_ARE_AFFORDABLE    Message says that prices aren't too expensive
  349.  
  350. body REPLICA_WATCH /\breplica.{1,20}rolex/i
  351. describe REPLICA_WATCH    Message talks about a replica watch
  352.  
  353. body EM_ROLEX /[^\s\w.]rolex/i
  354. describe EM_ROLEX    Message puts emphasis on the watch manufacturer
  355.