View Full Version : [JAVA] Eliminare "path/../" da URL
PuNkEtTaRo
04-03-2010, 09:51
Ciao a tutti ragazzi,
sto scrivendo un metodo statico che, passandogli come parametro la stringa di un link, la restituisca senza "path/../" ovvero:
http://www.hwupgrade.it/path/../index.html --> http://www.hwupgrade.it/index.html
Per farlo avevo pensato sia a tokenizzare la stringa (split("/")) e sia alle espressioni regolari.
Pensando di fare prima ho usate quest'ultime nel seguente modo:
public static String shrink(String link) {
while(link.matches("^.*/[^\\s]+/\\.\\./.*$"))
link.replaceAll("/[^\\s]+/\\.\\.", "");
return link;
Ma ahimè non funge la replaceAll, il matches invece funziona :doh:
Avete qualche idea?
Ciao
banryu79
04-03-2010, 12:07
Devi creare e restituire un nuovo oggetto String, dato che String è immutabile.
Ovvero il metodo replaceAll non modifica la stringa che gli passi come parametro, ma ne restituisce una nuova, che tu nel tuo metodo shrink non catturi e restituisci al chiamante; "link" non viene modificato.
A parte questo, ma fare così non era più semplice?
public static void main(String... argv)
{
String link = "http://www.hwupgrade.it/path/../index.html";
System.out.println("Prima:"+link);
String erase = "path/../";
String newLink = link.replace(erase, "");
System.out.println("Dopo:"+newLink);
}
ed elimina tutte le occorrenze trovate:
replace
public String replace(CharSequence target, CharSequence replacement)
Replaces each substring of this string that matches the literal target sequence with the specified literal replacement sequence. The replacement proceeds from the beginning of the string to the end, for example, replacing "aa" with "b" in the string "aaa" will result in "ba" rather than "ab".
Parameters:
target - The sequence of char values to be replaced
replacement - The replacement sequence of char values
Returns:
The resulting string
Throws:
NullPointerException - if target or replacement is null.
Since:
1.5
PuNkEtTaRo
04-03-2010, 21:12
Devi creare e restituire un nuovo oggetto String, dato che String è immutabile.
Ovvero il metodo replaceAll non modifica la stringa che gli passi come parametro, ma ne restituisce una nuova, che tu nel tuo metodo shrink non catturi e restituisci al chiamante; "link" non viene modificato.
Hai perfettamente ragione, non avevo letto la firma di replaceAll...
A parte questo, ma fare così non era più semplice?
public static void main(String... argv)
{
String link = "http://www.hwupgrade.it/path/../index.html";
System.out.println("Prima:"+link);
String erase = "path/";
String newLink = link.replace(erase, "");
System.out.println("Dopo:"+newLink);
}
ed elimina tutte le occorrenze trovate:
Sarebbe stato sicuramente più semplice, peccato che non sia quello che io voglio fare...io voglio eliminare qualunque occorrenza di "path/../", immagino che tu sappia che www.indirizzo.it/path/../index.html equivale a www.indirizzo.it/index.html, quello sto scrivendo io è un metodo che, passandogli un link come parametro, me lo restituisce "semplificato".
Ora, la mia espressione regolare è quasi giusta, ovvero, questa "/[\\w]+/\\.\\." fa quasi al caso mio, solamente che come path ammette solo caratteri alfanumerici, mentre un path può contenere caratteri come la tilde...
Intanto ti ringrazio e spero che qualcuno mi dia una dritta con l'espressione regolare...
Ciao
banryu79
05-03-2010, 07:58
Sarebbe stato sicuramente più semplice, peccato che non sia quello che io voglio fare...io voglio eliminare qualunque occorrenza di "path/../"
L'esempio che ti ho postato fa proprio quello. Cioè il metodo replace elimina qualunque occorrenza trovata nella stringa da modificare, non solo la prima che incontra. Le becca tutte.
Se il "token" da cercare è uno solo, e a me par di capire che nel tuo caso lo sia, cioè è solo la stringa "path/../", allora puoi pure invocare replace, e tutte le occorrenze di quel token verranno sostituite con un'altra stringa che specifichi tu (quella vuota, in questo caso).
Provare per credere ;)
P.S.:
immagino che tu sappia che www.indirizzo.it/path/../index.html equivale a www.indirizzo.it/index.html
No, non lo sapevo :)
Aspe, ma tu devi cancellare le occorrenze della stringa esatta "path/../" o mi stai dicendo che tra "path/" e "../" può esserci altra roba ed è per questo che stai usando le regex? :stordita:
PuNkEtTaRo
05-03-2010, 08:59
Aspe, ma tu devi cancellare le occorrenze della stringa esatta "path/../" o mi stai dicendo che tra "path/" e "../" può esserci altra roba ed è per questo che stai usando le regex? :stordita:
E' proprio questo il punto, non devo cancellare la sottostringa esatta "path/../" ma ad esempio "pippo/../" oppure "topolino/../", per questo uso le regex e la replaceAll. Ho usato poi il while perchè una URL potrebbe essere ad esempio www.indirizzo.it/pippo/pluto/../../index.html --> www.indirizzo.it/index.html.
Spero di essermi spiegato!
Ciao
Non puoi cercare la terza occorrenza di "/" ?
Supponendo che la stringa dell'url sia ben formata:
String iniziale = "http://www.test.com/a/b/../../index.html";
String finale = iniziale;
boolean cont;
do {
cont = false;
String intermedia = finale.replaceFirst("[A-z|0-9]*/\\.\\./", "");
if (!finale.equals(intermedia)) {
finale = intermedia;
cont = true;
}
}
while (cont);
System.out.println(finale); // http://www.test.com/index.html
In pratica elimini passo passo le stringhe tipo "nome/../", dalla più interna alla più esterna.
Questo perché nell'esempio che ho fatto "/a/b/../../" si vede che "b/../" rispetta la regular expression, quindi la successiva stringa dopo l'eliminazione viene:
"/a/../"
Ripetendo ancora ottieni "".
Ho supposto che l'URL sia ben formato e che in mezzo potessi avere solo lettere e numeri, quindi prendi il codice con le pinze, probabimente si può fare di meglio.
Edit:
Versione ricorsiva
public static String shrink(String s) {
return shrink(s, "");
}
private static String shrink(String s1, String s2) {
if (s1.equals(s2)) return s1;
return shrink(s1.replaceFirst("[A-z|0-9]*/\\.\\./", ""), s1);
}
PuNkEtTaRo
06-03-2010, 15:48
Grazie a tutti ragazzi,
io nel frattempo avevo risolto in questo modo:
public static String shrink(String link) {
while(link.matches("^.*/[^ \t\n\f\r/]+/\\.\\./.*$"))
link = link.replaceAll("/[^ \t\n\f\r/]+/\\.\\.", "");
return link;
}
Come hai detto giustamente tu WarDuck, nel tuo modo path del tipo "ab-d" non sarebbero stati validi...
Comunque grazie lo stesso
Ciao
Si ho fatto una piccola modifica:
public static String shrink(String s) {
return shrink(s, "");
}
private static String shrink(String s1, String s2) {
if (s1.equals(s2)) return s1;
return shrink(s1.replaceFirst("[^/]*/\\.\\./", ""), s1);
}
Così prende anche cose del tipo:
"http://www.test.com/a/b-c/d%20e/f..g/../../../../index.html";
Tuttavia non mi ricordo quali simboli sono vietati nell'url (oltre a quelli di escape presuppongo)...
vBulletin® v3.6.4, Copyright ©2000-2025, Jelsoft Enterprises Ltd.