|
|
|
![]() |
|
Strumenti |
![]() |
#1 |
Senior Member
Iscritto dal: Jan 2006
Messaggi: 1525
|
[Script] Python per estrarre testo da mail
Come da titolo avrei bisogno di una mano per creare uno script in grado di:
1- accedere ad una determinata etichetta in una casella di posta gmail 2- elencarne il contenuto (titoli mail) 3- selezionare solo le mail nuove 4- estrarre una parte di testo dal corpo delle mail nuove 5- salvare tale parte di testo in modo ricorsivo in un file di testo 6- segnare le mail aperte come lette Per i punti 1-2-6 qualcosa sono riuscito a fare (python non lo conosco pero' mi e' stato consigliato come soluzione migliore ![]() Codice:
#!/usr/bin/env python import sys import imaplib import getpass import email import datetime M = imaplib.IMAP4_SSL('imap.gmail.com') ### define function to list mails and print titles which is used in the appropriate block of code def process_mailbox(M): rv, data = M.search(None, "ALL") if rv != 'OK': print "No messages found!" return for num in data[0].split(): rv, data = M.fetch(num, '(RFC822)') if rv != 'OK': print "ERROR getting message", num return #print data msg = email.message_from_string(data[0][1]) print 'Message %s: %s' % (num, msg['Subject']) ### gmail login try: M.login('email@gmail.com', 'password') except imaplib.IMAP4.error: print "LOGIN FAILED!!! " # ... exit or deal with failure... ### list mailboxes #rv, mailboxes = M.list() #if rv == 'OK': # print "Mailboxes:" # print mailboxes ### open and process a specific mailbox rv, data = M.select("YTsubs") if rv == 'OK': #print "Processing mailbox...\n" process_mailbox(M) M.close() M.logout() ![]()
__________________
-)(- debian -)(- |
![]() |
![]() |
![]() |
#2 |
Senior Member
Iscritto dal: Jan 2006
Messaggi: 1525
|
Aggiornamento: seguendo sempre alcuni esempi sono riuscito a mettere assieme il seguente codice che soddisfa i punti 1-2-3-6.
Codice:
#!/usr/bin/env python import datetime import email import imaplib import mailbox print '----------------------------' print 'Login...' mail = imaplib.IMAP4_SSL('imap.gmail.com') (retcode, capabilities) = mail.login('emailaddress',password') mail.list() mail.select('inbox') print 'Success.' print '----------------------------' n=0 (retcode, messages) = mail.search(None, '(UNSEEN)') if retcode == 'OK': for num in messages[0].split() : #print 'Processing...' n=n+1 typ, data = mail.fetch(num,'(RFC822)') for response_part in data: if isinstance(response_part, tuple): original = email.message_from_string(response_part[1]) print original['From'] print original['Subject'] typ, data = mail.store(num,'+FLAGS','\\Seen') print '----------------------------' print "Unread: " print n print '----------------------------' ![]()
__________________
-)(- debian -)(- |
![]() |
![]() |
![]() |
#3 |
Senior Member
Iscritto dal: Aug 2001
Messaggi: 9538
|
La sezione più indicata sarebbe Programmazione.
Non ho mai usato la libreria imaplib, sei sicuro che il corpo dell'e-mail non sia nel dizionario original ed accessibile attraverso un apposita chiave? Controlla quali sono le chiavi e vedi se c'è qualcosa di corrispondente. Ti posso suggerire di controllare la documentazione della libreria imaplib ed effettuare eventualmente una ricerca con parole chiave adeguate. Salvare tutto in un file di testo è abbastanza banale. ![]() |
![]() |
![]() |
![]() |
#4 |
Senior Member
Iscritto dal: Jan 2006
Messaggi: 1525
|
Hai ragione, ho sbagliato sezione, vado ad aprire una discussionedi la'.
Da quel che posso capire imaplib non ha una apposita chiave per accedere al corpo della mail.
__________________
-)(- debian -)(- |
![]() |
![]() |
![]() |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 08:12.