View Full Version : [java]operazioni su file di testo
motogpdesmo16
27-12-2005, 17:07
amici, sono niubbissimo di java.
Vorrei sapere se è possibile effettuare delle operazioni sui file. MI trovo a dover creare un programma che, dato in input un testo, in una non meglio specificata modalità, effettua su di esso alcune operazioni.
L'idea che ho è quella di valorizzare un file e, se possibile appunto, effettuare tali operazioni su di esso trattandolo come un file di testo appunto.
Le operazioni da fare sono: calcolare il numero di parole, di caratteri ecc ecc
Inoltre il testo deve essere scritto a linee.
E' fattibile una cosa del genere oppure mi conviene pensare, per semplicità, ad una struttura dati diversa??
grazie
amici, sono niubbissimo di java.
Vorrei sapere se è possibile effettuare delle operazioni sui file. MI trovo a dover creare un programma che, dato in input un testo, in una non meglio specificata modalità, effettua su di esso alcune operazioni.
L'idea che ho è quella di valorizzare un file e, se possibile appunto, effettuare tali operazioni su di esso trattandolo come un file di testo appunto.
Le operazioni da fare sono: calcolare il numero di parole, di caratteri ecc ecc
Inoltre il testo deve essere scritto a linee.
E' fattibile una cosa del genere oppure mi conviene pensare, per semplicità, ad una struttura dati diversa??
grazie
Ciao, certo che puoi fare delle operazioni sui file in Java. Non ti garantisco che sarà più semplice rispetto a farle in Perl ;) ma si può fare.
Ecco un esempio di lettura, riga per riga, di un file di testo (ho omesso per brevità import, eccezioni, ecc...):
FileReader fr = new FileReader ("testo.txt");
BufferedReader br = new BufferedReader (fr);
String line;
while ((line = br.readLine ()) != null)
{
/* ... fai quello che vuoi ... */
}
motogpdesmo16
27-12-2005, 17:38
grazie per la veloce risposta.
Praticamente posso fare anche i calcoli relativi a lunghezza in caratteri del file di testo, numero di parole ecc ecc.?
Il file di testo poi, in fase di analisi e quindi quando sarà sottoposto agli algoritimi che ho già realizzato, sarà considerato come un testo multilinea oppure un come se fosse scritto di continuo??
grazie per la veloce risposta.
Praticamente posso fare anche i calcoli relativi a lunghezza in caratteri del file di testo, numero di parole ecc ecc.?
Il file di testo poi, in fase di analisi e quindi quando sarà sottoposto agli algoritimi che ho già realizzato, sarà considerato come un testo multilinea oppure un come se fosse scritto di continuo??
L'esempio che ho fatto consente di ottenere il file riga per riga. Cosa ci fai con la riga dipende da cosa devi realizzare. Se per esempio devi contare le parole, puoi splittare la riga in tante stringhe con una regular expression:
String[] stringhe = line.split ("\\s+");Nota che \s+ è una espressione regolare che corrisponde a una sequenza di "whitespace character". E poi conti quante stringhe hai ottenuto (stringhe.length) e le totalizzi.
Comunque, oltre al modo riga-per-riga, puoi anche leggere il file carattere per carattere.
motogpdesmo16
27-12-2005, 18:07
Ho creato un piccolo programmino che deve essere alla base di quello che sarà il progetto:
import java.lang.Object;
public class textanalyzer
{
public static void main (String[] args)
{
FileReader fr = new FileReader ("c:\testo.txt");
BufferedReader br = new BufferedReader (fr);
String line;
while ((line = br.readLine ()) != null)
{
system.out.println ("FIle" +fr+ "letto correttamente");
}
}
}
E' giusta l'importazione che faccio??
Perchè ottengo errori "Cannot find symbol Filereader" e stesso errore con "BufferReader" finale.
motogpdesmo16
27-12-2005, 18:12
L'esempio che ho fatto consente di ottenere il file riga per riga. Cosa ci fai con la riga dipende da cosa devi realizzare. Se per esempio devi contare le parole, puoi splittare la riga in tante stringhe con una regular expression:
String[] stringhe = line.split ("\\s+");Nota che \s+ è una espressione regolare che corrisponde a una sequenza di "whitespace character". E poi conti quante stringhe hai ottenuto (stringhe.length) e le totalizzi.
Comunque, oltre al modo riga-per-riga, puoi anche leggere il file carattere per carattere.
come detto, sul file devo effettuare operazioni quali: calcolare il numero di parole, di caratteri ecc ecc.
Nel codice che hai scritto all'inzio non riesco a capire in base a cosa viene effettuata la divisione in righe del file. C'è il "diverso da null" ma non capisco con cosa viene relazionato.
Inoltre hai scritto \s+ che hai detto ha una funzione particolare. Praticamente, se non ho capito male, splitta il testo ogni qual volta trova il blank (whitespace character). Ne esistono altre di queste espressioni regolari?
grazie.
Ho creato un piccolo programmino che deve essere alla base di quello che sarà il progetto:Per le importazioni:
import java.lang.*;
import java.io.*;(al momento penso che ti bastino queste)
Inoltre se in una stringa devi mettere un backslash "\" lo devi raddoppiare "\\" quindi ... FileReader ("c:\\testo.txt");
motogpdesmo16
27-12-2005, 21:05
grazie.
Per quanto riguarda il nome file, me ne sono accorto cercando su internet altre informazioni.
motogpdesmo16
27-12-2005, 21:15
allora tramite una interfaccia grafica seleziono il file da far analizzare e poi, per l'analisi, lo associo ad un oggetto scanner.
Come si fa a passare come parametro questo oggetto scanner??
Fino ad ora ho scritto questo:
import java.io.*;
import java.util.Scanner;
import javax.swing.JFileChooser;
import java.lang.*;
public class textAnalyzer
{
String nomefile;
int sommaCar;
int numero_linee;
int numero_parole;
int palindrome;
private textAnalyzer(String file)
{
nomefile="";
sommaCar=0;
numero_linee=0;
numero_parole=0;
palindrome=0;
}
public int contaCaratteri(InputStream in)
{
while (in.hasNextLine())
{
String line=in.nextLine();
sommaCar=sommaCar+line.length();
}
return sommaCar;
}
public int contaLinee(InputStream in)
{
while (in.hasNextLine())
{
String line=in.nextLine();
numero_linee++;
}
return numero_linee;
}
public static void main (String[] args)
{
try
{
JFileChooser chooser= new JFileChooser();
FileReader fr=null;
if (chooser.showOpenDialog(null)==JFileChooser.APPROVE_OPTION)
{
File selectedFile=chooser.getSelectedFile();
fr=new FileReader(selectedFile);
}
Scanner in=new Scanner(fr);
textAnalyzer testo=new textAnalyzer(in);
System.out.println ("File" + in + "letto correttamente");
System.out.println("Numero di caratteri nel file= "+testo.contaCaratteri(in));
System.out.println("Numero di linee nel file= "+testo.contaLinee(in));
}
catch (IOException exception)
{
System.out.println ("errore nel file "+exception);
}
}
}
Accetto critiche, suggerimenti e soprattutto qualcuno che riesca ad aiutarmi su come far capire ad ogni singolo costruttore (contacaratteri e contalinee) che deve effettuare la scansione sull'oggetto In che a sua volta già contiene il nome del file selezionato.
un'ultima cosa: come mai usando JFileChooser, dopo che appare il messaggio che il file è stato letto correttamente, c'è una successione di caratteri e valorizzazioni che non c'entrano nulla con il programma??Le mette di default quella struttura per caso?
grazie.
Nel codice che hai scritto all'inzio non riesco a capire in base a cosa viene effettuata la divisione in righe del file. C'è il "diverso da null" ma non capisco con cosa viene relazionato.
Il metodo readLine della classe BufferedReader legge una singola riga dal file. Secondo la documentazione di questo metodo, una riga è considerata terminata quando incontra un line-feed ("\n") oppure un carriage-return ("\r") oppure ancora la sequenza "\r\n".
La documentazione dice anche che viene restituito null se è stata raggiunta la fine del file (EOF).
Inoltre hai scritto \s+ che hai detto ha una funzione particolare. Praticamente, se non ho capito male, splitta il testo ogni qual volta trova il blank (whitespace character). Ne esistono altre di queste espressioni regolari?
Beh, sì. Spiegare adesso le espressioni regolari in poche righe non è facile. ;)
La documentazione per le espressioni regolari riconosciute in Java si trova <qui> (http://java.sun.com/j2se/1.4.2/docs/api/java/util/regex/Pattern.html#sum). Se invece vuoi vedere la cosa un po' più in generale, puoi iniziare da <qui> (http://java.sun.com/docs/books/tutorial/extra/regex/) (è il tutorial sulle regular expressions presente nel "famoso" Java Tutorial).
Piccola nota: le espressioni regolari sono disponibili in molti linguaggi: Java (1.4 in su), PHP, Perl, Python, Javascript, ecc... Tieni presente che tra queste implementazioni ci sono spesso delle piccole differenze nelle varie regole. C'è comunque una base comune.
allora tramite una interfaccia grafica seleziono il file da far analizzare e poi, per l'analisi, lo associo ad un oggetto scanner.
Come si fa a passare come parametro questo oggetto scanner??
Fino ad ora ho scritto questo:
...
:confused: Ci sono alcune cose non molto chiare: che cosa è la classe "Scanner"?? Poi la classe InputStream non ha dei metodi hasNextLine() e nextLine()!!
motogpdesmo16
28-12-2005, 00:39
allora Scanner serve per leggere in input un determinato dato ed è inserita da java5 (se la memoria non mi inganna)in su importando java.util.scanner
Quelle prove inputstream sono delle emerite castronerie, lo ammetto, perchè stavo effettuando delle prove disperate.
Come metodologia comunque penso sia giusta quella di creare vari costruttori a seconda della finalità che mi pongo (calcolare i caratteri, le righe...) anzichè mettere tutto nel calderone del main o peggio, in un unico costruttore.
Inoltre, dato che le operazioni le devo eseguire sempre scansionando il file, mi converrebbe aprirlo una sola volta, magari nel main, e poi effettuare i vari calcoli. Faccio questa operazione con
Scanner in=new Scanner(fr);
poi creo l'oggetto
textAnalyzer testo=new textAnalyzer(in);
e procedo a chiamare i costruttori..ma cosa ci passo come parametri per far capire che in in c'è il file aperto???
allora Scanner serve per leggere in input un determinato dato ed è inserita da java5 (se la memoria non mi inganna)in su importando java.util.scannerUff ... già è vero. È che io continuo, per i miei sviluppi in Java, ad usare ancora Java 1.4 (quindi l'API reference ce l'ho per la 1.4) e non ho ancora preso confidenza con le (tante) novità del Java 1.5! :D
Quelle prove inputstream sono delle emerite castronerie, lo ammetto, perchè stavo effettuando delle prove disperate.Ok, anche perché tanto non avrebbe compilato. ;)
Come metodologia comunque penso sia giusta quella di creare vari costruttori a seconda della finalità che mi pongo (calcolare i caratteri, le righe...) anzichè mettere tutto nel calderone del main o peggio, in un unico costruttore.
Inoltre, dato che le operazioni le devo eseguire sempre scansionando il file, mi converrebbe aprirlo una sola volta, magari nel main, e poi effettuare i vari calcoli. Faccio questa operazione con
Scanner in=new Scanner(fr);
poi creo l'oggetto
textAnalyzer testo=new textAnalyzer(in);
e procedo a chiamare i costruttori..ma cosa ci passo come parametri per far capire che in in c'è il file aperto???Uhm ... forse non ti è molto chiaro. Quelli che tu hai chiamato:
public int contaCaratteri(InputStream in)
e
public int contaLinee(InputStream in)
non sono dei costruttori ma dei semplici metodi!
Comunque anche ammesso che tu usi un InputStream per effettuare una certa operazione (es. conteggio dei caratteri), una volta che hai "consumato" lo stream, prima di effettuare un'altra operazione (es. conteggio delle linee) dovresti o ricreare un altro InputStream o fargli un "rewind" in qualche modo (la InputStream ha due metodi mark() e reset(), io personalmente non li ho mai usati, vedi tu).
motogpdesmo16
28-12-2005, 12:38
mi confondo sempre...effettivamente sono dei metodi. Il costruttore è relativo all'oggetto che creo con il nome della classe. Passare di botto da vb e suoi derivati a java è leggermente traumatico....
Tornando in tema..mi conviene dunque aprire il file ogni qual volta entro in un metodo (conta caratteri, conta linee ecc) proprio per evitare casini??
Tornando in tema..mi conviene dunque aprire il file ogni qual volta entro in un metodo (conta caratteri, conta linee ecc) proprio per evitare casini??Penso proprio di sì.
Piuttosto, sei sicuro di non poter fare tutto in una sola passata??
motogpdesmo16
28-12-2005, 14:59
indubbiamente posso fare tutto in una sola passata.
Trattandosi però di progettino universitario, contavo di effettuare una bella separazione in classi creandone una per ogni richiesta.
Lo so che dal punto di vista funzionale è inutile aprire/chiudere file per ogni operazione e per ogni riga ma temo che, facendo in una sola passata appunto, possa non essere apprezzato anche se, come detto, dal punto di vista delle risorse è sicuramente una soluzione migliore.
Edit: ripensandoci comunque tutte ste cose che ho scritto qui posso scriverle nella relazione da allegare al progetto e quindi giustificare la mia scelta che si andrà ad orientare nella famosa "unica passata":
Trattandosi però di progettino universitario, contavo di effettuare una bella separazione in classi creandone una per ogni richiesta.
Allora potresti appunto creare una serie di classi es. ContaCaratteri, ContaLinee, ecc... e in ognuna mettere per esempio:
- un costruttore che prende una String con il nome del file.
- un metodo elabora() che apre, legge, conteggia, ecc... e mette i dati in variabili private.
- dei metodi tipo getNumeroCaratteri(), getNumeroLinee(), ecc... per restituire i dati.
Che ti sembra?
vBulletin® v3.6.4, Copyright ©2000-2025, Jelsoft Enterprises Ltd.