PDA

View Full Version : [Script] Python per estrarre testo da mail


psimem
04-02-2017, 15:46
Come da titolo avrei bisogno di una mano per creare uno script in grado di:
1- accedere ad una determinata etichetta in una casella di posta gmail
2- elencarne il contenuto (titoli mail)
3- selezionare solo le mail nuove
4- estrarre una parte di testo dal corpo delle mail nuove
5- salvare tale parte di testo in modo ricorsivo in un file di testo
6- segnare le mail aperte come lette

Per i punti 1-2-6 qualcosa sono riuscito a fare (python non lo conosco pero' mi e' stato consigliato come soluzione migliore :read: ) pero' mi mancano i 3-4-5.

#!/usr/bin/env python

import sys
import imaplib
import getpass
import email
import datetime

M = imaplib.IMAP4_SSL('imap.gmail.com')

### define function to list mails and print titles which is used in the appropriate block of code
def process_mailbox(M):
rv, data = M.search(None, "ALL")
if rv != 'OK':
print "No messages found!"
return

for num in data[0].split():
rv, data = M.fetch(num, '(RFC822)')
if rv != 'OK':
print "ERROR getting message", num
return

#print data

msg = email.message_from_string(data[0][1])
print 'Message %s: %s' % (num, msg['Subject'])

### gmail login
try:
M.login('email@gmail.com', 'password')

except imaplib.IMAP4.error:
print "LOGIN FAILED!!! "
# ... exit or deal with failure...

### list mailboxes
#rv, mailboxes = M.list()
#if rv == 'OK':
# print "Mailboxes:"
# print mailboxes

### open and process a specific mailbox
rv, data = M.select("YTsubs")
if rv == 'OK':
#print "Processing mailbox...\n"
process_mailbox(M)
M.close()
M.logout()

:help:

psimem
05-02-2017, 17:51
Aggiornamento: seguendo sempre alcuni esempi sono riuscito a mettere assieme il seguente codice che soddisfa i punti 1-2-3-6.

#!/usr/bin/env python

import datetime
import email
import imaplib
import mailbox

print '----------------------------'
print 'Login...'
mail = imaplib.IMAP4_SSL('imap.gmail.com')
(retcode, capabilities) = mail.login('emailaddress',password')
mail.list()
mail.select('inbox')
print 'Success.'
print '----------------------------'

n=0
(retcode, messages) = mail.search(None, '(UNSEEN)')
if retcode == 'OK':

for num in messages[0].split() :
#print 'Processing...'
n=n+1
typ, data = mail.fetch(num,'(RFC822)')

for response_part in data:
if isinstance(response_part, tuple):
original = email.message_from_string(response_part[1])
print original['From']
print original['Subject']
typ, data = mail.store(num,'+FLAGS','\\Seen')
print '----------------------------'

print "Unread: "
print n
print '----------------------------'

Il prossimo passo sarebbe estrarre anche il corpo della mail e processarlo... :help:

Xfree
05-02-2017, 21:54
La sezione più indicata sarebbe Programmazione.
Non ho mai usato la libreria imaplib, sei sicuro che il corpo dell'e-mail non sia nel dizionario original ed accessibile attraverso un apposita chiave?
Controlla quali sono le chiavi e vedi se c'è qualcosa di corrispondente.
Ti posso suggerire di controllare la documentazione della libreria imaplib ed effettuare eventualmente una ricerca con parole chiave adeguate.
Salvare tutto in un file di testo è abbastanza banale. ;)

psimem
06-02-2017, 07:25
Hai ragione, ho sbagliato sezione, vado ad aprire una discussionedi la'.
Da quel che posso capire imaplib non ha una apposita chiave per accedere al corpo della mail.