RS Mail Extractor
Scopo
Il programma, nato in poche ore di lavoro, si propone di ricercare gli indirizzi e-mail all'interno delle pagine con estensione htm, html, asp o nei files txt e nei files newsgroup dbx di Outlook Express. Nessun altro file con estensione diversa viene preso in esame.
La scansione viene effettuata off-line sulle pagine precedentemente salvate su hard disk manualmente (es. dal menu File-Salva di Explorer), oppure esaminando direttamente la cache del browser (il cui percorso puo` essere letto dalle opzioni del Browser stesso)
Nota: nonostante il programma non sia illegale, certi usi delle informazioni reperite potrebbero esserlo. Riksoft non è responsabile dell'uso delle informazioni raccolte.
Funzionamento
Una delle prime cose da tenere a mente è che il programma lavora su cartelle e non su files. Se i files da scansionare sono localizzati in varie parti dell'hard disk, conviene quindi creare un'apposita cartella e copiarli o trasferirli tutti in tale cartella. Questa cartella verrà poi indicata al programma come cartella da esaminare.
Per effettuare una scansione sulla cartella da esaminare, è inoltre necessario indicare quale tipo di files devono essere presi in esame. Se la cartella contiene pagine web, file txt e dbx, e` necessario fare 3 passate distinte, ricordando di selezionare la casella "Aggiungi al file MailOut esistente", in modo che non vengano cancellati i risultati precedenti, bensì accodati.
Voci
Percorso da controllare
Indicare una cartella di scansione. Il programma analizzera` tutti i files del tipo specificato con la option box sottostante, presenti in tale cartella ed eventuali sotto cartelle.
Percorso di output
Indicare il percorso dove creare il file di output con l'elenco di tutti gli indirizzi trovati. Da notare che il programma non permette di specificare come percorso lo stesso indicato come percorso da controllare. Inoltre il nome del file di output è fisso: MailOut.txt
Aggiungi in coda
Permette di aggiungere al file di output tutti gli indirizzi trovati con successive scansioni.
File html (htm,html,asp)
Nella scansione della cartella indicata (e sotto cartelle) prende in esame solo i file specificati nell'opzione.
File di testo (txt)
Nella scansione della cartella indicata (e sotto cartelle) prende in esame solo i file con estensione txt. Si ricorda che la scansione dei files txt ha una percentuale di errore di importazione piu` alta che non nelle pagine htm o asp.
File News di Outlook Express (dbx)
Nella scansione della cartella indicata (e sotto cartelle) prende in esame solo i file con estensione dbx provenienti dallo scarico di messaggi dai newsgroup. In questo tipo di scansione vengono eliminati tutti coloro che utilizzano prefissi che indicano chiaramente che non vogliono essere disturbati (tanto sarebbe controproducente disturbarli), webmasters e controlli anti-spam. Questo tipo di scansione necessita di un tempo superiore alle altre opzioni, in quanto l'algoritmo e` molto piu` elaborato, ma si possono ottenere migliaia di indirizzi in pochi minuti.
Risultati
Dopo aver premuto il pulsante Estrai, se sono stati trovati indirizzi verranno visualizzati nel file MailOut.txt presente nella cartella specificata come percorso di output.
Conviene sempre effettuare un controllo finale manuale sul file di output per eliminare eventuali indirizzi errati.