PDA

View Full Version : [Python] Parser C/C++


LimiT-MaTz
29-10-2008, 18:49
buongiorno a tutti,
avrei il seguente problema da sottoporvi ( spero di recuperare qualche consiglio ).
Quello che devo ottenere dato un file.c e data una funzione (puo' essere anche il main ) determinare tutte le variabili utilizzate ( nome variabile e tipo ). Nel caso sia utilizzata anche una variabile globale protrarre la ricerca negli include.

Il mio modo di procedere 'barbaro' potrebbe essere quello di leggere la porzione di codice che mi interessa e:
- cliclare al fine di leggere la dichiarazione delle variabili
- ricerca delle variabili globali ( per determinare quali sono le variabili globali: itero nel codice e per ogni token verifico che non sia una funzione ( nel formato "nomefunzione(.*)" ) e che non sia una keyword C ). una volta determinato il nome della variabile globale cercare ricorsivamente negli include la definizione in modo da trovare il tipo.

Sono abbastanza sicuro che esista qualche parser (libreria) che mi possa aiutare, ottenendo un prodotto migliore e in meno tempo.

avete qualche consiglio in merito? qualche spunto per fare delle ricerce...

grazie.

cdimauro
29-10-2008, 22:03
http://www.antlr.org/

Scaricalo e installalo. Per lavorare con la grammatica utilizza ANTLRWork che è un bellissimo e comodissimo tool.

Perché ANTLR? Perché permette di scrivere velocemente parser, e può generarli per diversi linguaggi di programmazione (tra cui Python).

Ma la cosa bellissima di ANTLR è che può generare direttamente degli AST (Abstract Syntax Tree (http://en.wikipedia.org/wiki/Abstract_syntax_tree)).

Una volta generato l'AST per risolvere il tuo problema ti basta partire dall'AST della funzione che t'interessa andando a caccia degli identificatori utilizzati al suo interno. Ovviamente nel caso in cui non venga trovata nessuna definizione locale per una certa variabile usata ti basterà esplorare l'AST del livello precedente (che è quello globale) andando a caccia delle definizioni di variabili.

E' chiaro che puoi anche fare a meno degli AST e, quindi, scrivere delle opportune azioni da eseguire man mano che il parser riconosce i vari costrutti sintattici, ma con gli AST secondo me ti sbrighi prima.

Nel sito trovi un sacco di materiale e anche una grammatica per il linguaggio C: http://www.antlr.org/grammar/1153358328744/C.g
Questa genera codice Java e ovviamente il codice delle azioni è Java, ma è molto poco e non dovresti avere difficoltà a riscriverle in Python. ;)