Torna indietro   Hardware Upgrade Forum > Software > Programmazione

DJI Osmo Nano: la piccola fotocamera alla prova sul campo
DJI Osmo Nano: la piccola fotocamera alla prova sul campo
La nuova fotocamera compatta DJI spicca per l'abbinamento ideale tra le dimensioni ridotte e la qualità d'immagine. Può essere installata in punti di ripresa difficilmente utilizzabili con le tipiche action camera, grazie ad una struttura modulare con modulo ripresa e base con schermo che possono essere scollegati tra di loro. Un prodotto ideale per chi fa riprese sportive, da avere sempre tra le mani
FUJIFILM X-T30 III, la nuova mirrorless compatta
FUJIFILM X-T30 III, la nuova mirrorless compatta
FUJIFILM X-T30 III è la nuvoa fotocamera mirrorless pensata per chi si avvicina alla fotografia e ricerca una soluzione leggera e compatta, da avere sempre a disposizione ma che non porti a rinunce quanto a controllo dell'immagine.
Oracle AI World 2025: l'IA cambia tutto, a partire dai dati
Oracle AI World 2025: l'IA cambia tutto, a partire dai dati
Da Las Vegas, la visione di Larry Ellison e la concretezza di Clay Magouyrk definiscono la nuova traiettoria di Oracle: portare l’intelligenza artificiale ai dati, non i dati all’intelligenza, costruendo un’infrastruttura cloud e applicativa in cui gli agenti IA diventano parte integrante dei processi aziendali, fino al cuore delle imprese europee
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 06-08-2006, 17:01   #1
DarkSiDE
Senior Member
 
L'Avatar di DarkSiDE
 
Iscritto dal: Dec 2001
Città: Lecce
Messaggi: 3936
[JAVA] Modifica file di testo

Salve,
ho un quesito relativamente semplice da porvi. Ho in input un file, solitamente html, devo rimuovere determinate righe, delle quali non conosco il numero ma solo che contengono determinati tag. Mi spiego meglio: solitamente in una pagina html si trova ad es. html+javascript, devo rimuovere le righe contententi codice js tra tag <script></script>. Come posso fare?

grazie
__________________
Non farò mai più affari con khalhell, 4HwGenXX.
DarkSiDE è offline   Rispondi citando il messaggio o parte di esso
Old 06-08-2006, 17:11   #2
andbin
Senior Member
 
L'Avatar di andbin
 
Iscritto dal: Nov 2005
Città: TO
Messaggi: 5206
Quote:
Originariamente inviato da DarkSiDE
Salve,
ho un quesito relativamente semplice da porvi. Ho in input un file, solitamente html, devo rimuovere determinate righe, delle quali non conosco il numero ma solo che contengono determinati tag. Mi spiego meglio: solitamente in una pagina html si trova ad es. html+javascript, devo rimuovere le righe contententi codice js tra tag <script></script>. Come posso fare?
Una idea potrebbe essere questa: leggi il file riga x riga. Per ogni riga, cerchi la sottostringa "<script>". Se la trovi, attivi un flag. Se il flag è attivo, cerchi in ogni riga anche la sottostringa "</script>" e se la trovi azzeri il flag.
Tutto quello che trovi quando il flag è attivo, lo ignori. Il resto lo scrivi dove ti serve (es. su un altro file).
Spero di essermi spiegato a parole. Non dovrebbe essere difficile da codificare.
__________________
Andrea, SCJP 5 (91%) - SCWCD 5 (94%)
andbin è offline   Rispondi citando il messaggio o parte di esso
Old 06-08-2006, 18:05   #3
sottovento
Senior Member
 
L'Avatar di sottovento
 
Iscritto dal: Nov 2005
Città: Texas
Messaggi: 1722
Un'altra idea potrebbe essere quella di caricare tutto il file in una stringa, per esempio di nome testo e poi scrivere

testo = testo.replaceAll ("<script>.*<\\/script>", "");

In testo avrai il codice senza i tag in questione.

High Flying
Sottovento
__________________
In God we trust; all others bring data
sottovento è offline   Rispondi citando il messaggio o parte di esso
Old 09-08-2006, 16:27   #4
DarkSiDE
Senior Member
 
L'Avatar di DarkSiDE
 
Iscritto dal: Dec 2001
Città: Lecce
Messaggi: 3936
Quote:
Originariamente inviato da sottovento
Un'altra idea potrebbe essere quella di caricare tutto il file in una stringa, per esempio di nome testo e poi scrivere

testo = testo.replaceAll ("<script>.*<\\/script>", "");

In testo avrai il codice senza i tag in questione.

High Flying
Sottovento
grazie mille ad entrambi

ho parzialmente risolto usando replace, se non fosse che dà problemi..

es:

<SCRIPT>
<!--
function MM_swapImgRestore() { //v3.0
var i,x,a=document.MM_sr; for(i=0;a&&i<a.length&&(x=a[i])&&x.oSrc;i++) x.src=x.oSrc;
}
</SCRIPT>


testo = testo.replaceAll ("<SCRIPT>.*<\\/SCRIPT>", "");

non funziona..
__________________
Non farò mai più affari con khalhell, 4HwGenXX.

Ultima modifica di DarkSiDE : 09-08-2006 alle 20:48.
DarkSiDE è offline   Rispondi citando il messaggio o parte di esso
Old 10-08-2006, 05:06   #5
loris_p
Senior Member
 
L'Avatar di loris_p
 
Iscritto dal: Aug 2006
Messaggi: 365
io quoto al 100% la soluzione di andbin, molto C-style
loris_p è offline   Rispondi citando il messaggio o parte di esso
Old 10-08-2006, 22:17   #6
Mixmar
Senior Member
 
L'Avatar di Mixmar
 
Iscritto dal: Feb 2002
Città: Trento
Messaggi: 962
Mi permetto di suggerire una variante: se il file di testo è xhtml potresti semplicemente utilizzare un parser con un apposito file xsl per trasformare il sorgente con gli script in un nuovo file senza script.

Però non so se questo sia il tuo caso.
__________________
"Et Eärallo Endorenna utúlien. Sinome maruvan ar Hildinyar tenn' Ambar-metta!" -- Aragorn Elessar, Heir of Isildur
Mixmar -- OpenSuSE 11.1 on AMD 64 3000+ on DFI LanParty nF4-D | GeForce 6600 GT + Thermaltake Schooner on Samsung 710N
Storage -- ( 2 x Hitachi Deskstar 80 Gb + 1 x Hitachi 250 Gb ) = 1 RAID 5 + 1 Storage space LaCie Ethernet Disk Mini 250 Gb | HP - DV2150 EL MILAN CLAN
Mixmar è offline   Rispondi citando il messaggio o parte di esso
Old 10-08-2006, 22:22   #7
loris_p
Senior Member
 
L'Avatar di loris_p
 
Iscritto dal: Aug 2006
Messaggi: 365
bella anche questa soluzione..
però non dimentichiamo che XSL (eXtesible Style Language) sarebbe nato per applicare stili a pagine Xml o XHtml.. che poi sia un linguaggio potentissmo è vero, però ci si scosta un po' dalla natura del linguaggio..
un'altra cosetta..se lo conosce, benissimo, altrimenti forse non è proprio il linguaggio più facile da imparare così in quattro e qattr'otto
spero che almeno gli piaccia la ricorsione..
loris_p è offline   Rispondi citando il messaggio o parte di esso
Old 11-08-2006, 13:45   #8
DarkSiDE
Senior Member
 
L'Avatar di DarkSiDE
 
Iscritto dal: Dec 2001
Città: Lecce
Messaggi: 3936
Quote:
Originariamente inviato da DarkSiDE
grazie mille ad entrambi

ho parzialmente risolto usando replace, se non fosse che dà problemi..

es:

<SCRIPT>
<!--
function MM_swapImgRestore() { //v3.0
var i,x,a=document.MM_sr; for(i=0;a&&i<a.length&&(x=a[i])&&x.oSrc;i++) x.src=x.oSrc;
}
</SCRIPT>


testo = testo.replaceAll ("<SCRIPT>.*<\\/SCRIPT>", "");

non funziona..

nessuno?
grazie per i consigli ma se riuscissi a far funzionare replace all sarebbe sicuramente molto più comodo e sicuro
__________________
Non farò mai più affari con khalhell, 4HwGenXX.
DarkSiDE è offline   Rispondi citando il messaggio o parte di esso
Old 11-08-2006, 14:57   #9
andbin
Senior Member
 
L'Avatar di andbin
 
Iscritto dal: Nov 2005
Città: TO
Messaggi: 5206
Quote:
Originariamente inviato da DarkSiDE
se riuscissi a far funzionare replace all sarebbe sicuramente molto più comodo e sicuro
Questo è un esempio:
Codice:
import java.util.regex.*;

public class Prova
{
    public static void main (String[] args)
    {
        try
        {
            String page = "<html>\r\n" +
                          "<head>\r\n" +
                          "<title>Prova</title>\r\n" +
                          "<script type=\"text/javascript\">\r\n" +
                          "<!--\r\n" +
                          "alert (\"Ciao\");\r\n" +
                          "//-->\r\n" +
                          "</script>\r\n" +
                          "</head>\r\n" +
                          "<body>\r\n" +
                          "\r\n" +
                          "<h1>Ciao</h1>\r\n" +
                          "<SCRIPT TYPE=\"text/javascript\">\r\n" +
                          "</SCRIPT>\r\n" +
                          "\r\n" +
                          "</body>\r\n" +
                          "</html>";


            Pattern pattern = Pattern.compile ("<script.*?</script>(\r\n)?", Pattern.DOTALL | Pattern.CASE_INSENSITIVE);

            Matcher matcher = pattern.matcher (page);
            String output = matcher.replaceAll ("");

            System.out.println (output);
        }
        catch (Exception e)
        {
            e.printStackTrace ();
        }
    }
}
__________________
Andrea, SCJP 5 (91%) - SCWCD 5 (94%)
andbin è offline   Rispondi citando il messaggio o parte di esso
Old 11-08-2006, 16:52   #10
DarkSiDE
Senior Member
 
L'Avatar di DarkSiDE
 
Iscritto dal: Dec 2001
Città: Lecce
Messaggi: 3936
Quote:
Originariamente inviato da andbin
Questo è un esempio:
[cut]
Avevo pensato a mettere tutto su una riga e mettere un marcatore alla fine di ogni riga, rimuovere gli script e sostituire il marcatore con un a capo, poco elegante ma funzionale.

Sicuramente di gran lunga migliore la tua soluzione..perchè mi hai inizialmente consigliato di scrivere manualmente il codice? nondovrebbe essere più efficiente l'ultima soluzione proposta?

grazie mille, davvero.
__________________
Non farò mai più affari con khalhell, 4HwGenXX.
DarkSiDE è offline   Rispondi citando il messaggio o parte di esso
Old 11-08-2006, 17:49   #11
andbin
Senior Member
 
L'Avatar di andbin
 
Iscritto dal: Nov 2005
Città: TO
Messaggi: 5206
Quote:
Originariamente inviato da DarkSiDE
Avevo pensato a mettere tutto su una riga e mettere un marcatore alla fine di ogni riga, rimuovere gli script e sostituire il marcatore con un a capo, poco elegante ma funzionale.
Sì, ho capito quello che pensavi di fare. Prima togli i CR/LF (e li fai diventare, che so, <EOL>), poi fai le sostituzioni che vuoi e alla fine rimetti "a posto" i CR/LF. Sicuramente fattibile ma a mio avviso un pochino macchinoso.

Quote:
Originariamente inviato da DarkSiDE
Sicuramente di gran lunga migliore la tua soluzione..perchè mi hai inizialmente consigliato di scrivere manualmente il codice? nondovrebbe essere più efficiente l'ultima soluzione proposta?
Utilizzando il metodo come nel mio esempio, devi avere tutta la pagina caricata in una stringa. Quindi è esclusivamente una questione di occupazione di memoria e di gestione delle stringhe.
Facendo invece come avevo detto all'inizio, è vero che sarebbe stato un pochino più complesso analizzare ogni riga per trovare i vari delimitatori, ma così non occupavi troppa memoria.

Insomma ... è una cosa da valutare. Se ti piace l'esempio che ho appena fatto, in linea di massima dovrebbe andarti bene (se non devi gestire pagine molto grosse).
Dovresti solo leggere il file a blocchi di tot caratteri e metterli direttamente in uno StringBuffer (per motivi di prestazioni). Poi alla fine ottieni una String su cui operare.
__________________
Andrea, SCJP 5 (91%) - SCWCD 5 (94%)
andbin è offline   Rispondi citando il messaggio o parte di esso
Old 12-08-2006, 15:22   #12
DarkSiDE
Senior Member
 
L'Avatar di DarkSiDE
 
Iscritto dal: Dec 2001
Città: Lecce
Messaggi: 3936
Quote:
Originariamente inviato da andbin
[cut]
Dovresti solo leggere il file a blocchi di tot caratteri e metterli direttamente in uno StringBuffer (per motivi di prestazioni). Poi alla fine ottieni una String su cui operare.
Rimango dell'idea di utilizzare il tuo codice poichè credo che scrivere un algoritmo sia una soluzione 'meno affidabile'.
Per quanto riguarda la stringa che conterrà il codice, vale la pena utilizzare una StringBuffer sapendo che utilizzerò SOLO l'append per copiare le singole righe?
__________________
Non farò mai più affari con khalhell, 4HwGenXX.
DarkSiDE è offline   Rispondi citando il messaggio o parte di esso
Old 12-08-2006, 18:11   #13
andbin
Senior Member
 
L'Avatar di andbin
 
Iscritto dal: Nov 2005
Città: TO
Messaggi: 5206
Quote:
Originariamente inviato da DarkSiDE
vale la pena utilizzare una StringBuffer sapendo che utilizzerò SOLO l'append per copiare le singole righe?
Sì, perché facendo stringa = stringa + linea; viene creato un nuovo oggetto String ogni volta! Mentre invece utilizzando un StringBuffer, hai un solo oggetto (il cui buffer interno si espande in modo "intelligente").

Anzi, ti dico di più: non dovresti nemmeno leggere riga per riga (ad esempio con readLine() della classe BufferedReader) perché così perderesti i fine riga. È molto meglio leggere a blocchi di char che, tra l'altro, è anche più performante!!
Codice:
BufferedReader br = ......;

char[] cbuf = new char[1024];

....

int len = br.read (cbuf, 0, cbuf.length);   // ripetuto in loop, ovviamente
....
__________________
Andrea, SCJP 5 (91%) - SCWCD 5 (94%)
andbin è offline   Rispondi citando il messaggio o parte di esso
Old 12-08-2006, 20:49   #14
DarkSiDE
Senior Member
 
L'Avatar di DarkSiDE
 
Iscritto dal: Dec 2001
Città: Lecce
Messaggi: 3936
Quote:
Originariamente inviato da andbin
Sì, perché facendo stringa = stringa + linea; viene creato un nuovo oggetto String ogni volta! Mentre invece utilizzando un StringBuffer, hai un solo oggetto (il cui buffer interno si espande in modo "intelligente").

Anzi, ti dico di più: non dovresti nemmeno leggere riga per riga (ad esempio con readLine() della classe BufferedReader) perché così perderesti i fine riga. È molto meglio leggere a blocchi di char che, tra l'altro, è anche più performante!!
Codice:
BufferedReader br = ......;

char[] cbuf = new char[1024];

....

int len = br.read (cbuf, 0, cbuf.length);   // ripetuto in loop, ovviamente
....
Codice:
char[] cbuf = new char[1024];
StringBuffer testo=new StringBuffer();
			
while(br.read (cbuf, 0, cbuf.length)!=-1) {				
				br.read (cbuf, 0, cbuf.length);
				testo.append(cbuf);
			}
br.close();
avevo pensato a qualcosa del genere ma non ho idea di come posso utilizzare a mò di stringa l'array di caratteri
__________________
Non farò mai più affari con khalhell, 4HwGenXX.

Ultima modifica di DarkSiDE : 12-08-2006 alle 20:58.
DarkSiDE è offline   Rispondi citando il messaggio o parte di esso
Old 13-08-2006, 09:30   #15
andbin
Senior Member
 
L'Avatar di andbin
 
Iscritto dal: Nov 2005
Città: TO
Messaggi: 5206
Quote:
Originariamente inviato da DarkSiDE
avevo pensato a qualcosa del genere ma non ho idea di come posso utilizzare a mò di stringa l'array di caratteri
Molto semplice. Al posto di BufferedReader si può anche usare, ho visto adesso, un InputStreamReader.
Codice:
FileInputStream fis = new FileInputStream ("nomefile");
InputStreamReader isr = new InputStreamReader (fis);

int len;

char[] chbuf = new char[1024];
StringBuffer strbuf = new StringBuffer ();

do {
    len = isr.read (chbuf, 0, chbuf.length);

    if (len > 0) {
        strbuf.append (chbuf, 0, len);
    }
} while (len > 0);
__________________
Andrea, SCJP 5 (91%) - SCWCD 5 (94%)
andbin è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


DJI Osmo Nano: la piccola fotocamera alla prova sul campo DJI Osmo Nano: la piccola fotocamera alla prova ...
FUJIFILM X-T30 III, la nuova mirrorless compatta FUJIFILM X-T30 III, la nuova mirrorless compatta
Oracle AI World 2025: l'IA cambia tutto, a partire dai dati Oracle AI World 2025: l'IA cambia tutto, a parti...
Micron e millisecondi: la piattaforma ServiceNow guida l'infrastruttura IT di Aston Martin F1 Micron e millisecondi: la piattaforma ServiceNow...
ASUS GeForce RTX 5080 Noctua OC Edition: una custom fenomenale, ma anche enorme ASUS GeForce RTX 5080 Noctua OC Edition: una cus...
Halo è ufficialmente multipiattaf...
Windows 11 25H2 e 24H2: come attivare su...
Brembo Solutions e Microsoft danno vita ...
Migliaia di pacchi Amazon rubati ai legi...
Ex CEO di Stellantis: Musk lascerà...
Record storico per i giochi Windows su L...
GPU introvabili: Microsoft accusa i mine...
RedTiger prende di mira i gamer: furto d...
Microsoft sotto accusa: avrebbe nascosto...
Il computer quantistico senza errori di ...
Cybersecurity, intelligenza artificiale ...
Xiaomi avvia la distribuzione globale di...
Addio cavi in auto: 3 adattatori per Car...
OPPO e Google sempre più vicini s...
Sorpresa! Non è Tesla il marchio ...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 18:03.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Served by www3v