home *** CD-ROM | disk | FTP | other *** search
/ Maximum CD 2010 November / maximum-cd-2010-11.iso / DiscContents / calibre-0.7.13.msi / file_3813 < prev    next >
Encoding:
Text File  |  2010-05-01  |  2.4 KB  |  61 lines

  1. #!/usr/bin/env  python
  2. __license__   = 'GPL v3'
  3. __author__    = 'Gabriele Marini, based on Darko Miletic'
  4. __copyright__ = '2009-2010, Darko Miletic <darko.miletic at gmail.com>'
  5. description   = 'Italian daily newspaper - 19-04-2010'
  6.  
  7. '''
  8. http://www.ilgiornale.it/
  9. '''
  10. from calibre.ebooks.BeautifulSoup import BeautifulSoup
  11. from calibre.web.feeds.news import BasicNewsRecipe
  12.  
  13. class IlGiornale(BasicNewsRecipe):
  14.     __author__        = 'Marini Gabriele'
  15.     description   = 'Italian daily newspaper'
  16.  
  17.     cover_url      = 'http://www.ilgiornale.it/img_v1/logo.gif'
  18.     title          = u'Il Giornale'
  19.     publisher      = 'Il Giornale ON-LINE S.r.l.'
  20.     category       = 'News, politics, culture, economy, general interest'
  21.  
  22.     language       = 'it'
  23.     timefmt        = '[%a, %d %b, %Y]'
  24.  
  25.     oldest_article = 7
  26.     max_articles_per_feed = 50
  27.     use_embedded_content  = False
  28.     recursion             = 100
  29.  
  30.     no_stylesheets        = True
  31.     conversion_options = {'linearize_tables':True}
  32.     remove_javascript = True
  33.  
  34.  
  35.     def get_article_url(self, article):
  36.         return article.get('guid', article.get('id', None))
  37.  
  38.     def print_version(self, url):
  39.         raw = self.browser.open(url).read()
  40.         soup = BeautifulSoup(raw.decode('utf8', 'replace'))
  41.         all_print_tags = soup.find('div', {'style':'float:left; width:35%;'})
  42.         print_link = all_print_tags.contents[1]
  43.         if all_print_tags is None:
  44.            return url
  45.         return  print_link['href']
  46.  
  47.  
  48.     feeds = [
  49.              (u'Ultime Notizie',u'http://www.ilgiornale.it/?RSS=S'),
  50.              (u'All\'Interno', u'http://www.ilgiornale.it/la_s.pic1?SID=8&RSS=S'),
  51.              (u'Esteri', u'http://www.ilgiornale.it/la_s.pic1?SID=6&RSS=S'),
  52.              (u'Economia', u'http://www.ilgiornale.it/la_s.pic1?SID=5&RSS=S'),
  53.              (u'Cultura', u'http://www.ilgiornale.it/la_s.pic1?SID=4&RSS=S'),
  54.              (u'Spettacoli', u'http://www.ilgiornale.it/la_s.pic1?SID=14&RSS=S'),
  55.              (u'Sport', u'http://www.ilgiornale.it/la_s.pic1?SID=15&RSS=S'),
  56.              (u'Tech&Web', u'http://www.ilgiornale.it/la_s.pic1?SID=35&RSS=S'),
  57.              (u'Edizione di Roma', u'http://www.ilgiornale.it/roma.pic1?SID=13&RSS=S'),
  58.              (u'Edizione di Milano', u'http://www.ilgiornale.it/milano.pic1?SID=9&RSS=S'),
  59.              (u'Edizione di Genova', u'http://www.ilgiornale.it/genova.pic1?SID=7&RSS=S')
  60.              ]
  61.