Torna indietro   Hardware Upgrade Forum > Software > Programmazione

Un fulmine sulla scrivania, Corsair Sabre v2 Pro ridefinisce la velocità nel gaming
Un fulmine sulla scrivania, Corsair Sabre v2 Pro ridefinisce la velocità nel gaming
Questo mouse ultraleggero, con soli 36 grammi di peso, è stato concepito per offrire un'esperienza di gioco di alto livello ai professionisti degli FPS, grazie al polling rate a 8.000 Hz e a un sensore ottico da 33.000 DPI. La recensione esplora ogni dettaglio di questo dispositivo di gioco, dalla sua agilità estrema alle specifiche tecniche che lo pongono un passo avanti
Nokia Innovation Day 2025: l’Europa ha bisogno di campioni nelle telecomunicazioni
Nokia Innovation Day 2025: l’Europa ha bisogno di campioni nelle telecomunicazioni
Dal richiamo di Enrico Letta alla necessità di completare il mercato unico entro il 2028 alla visione di Nokia sul ruolo dell’IA e delle reti intelligenti, il Nokia Innovation Day 2025 ha intrecciato geopolitica e tecnologia, mostrando a Vimercate come la ricerca italiana contribuisca alle sfide globali delle telecomunicazioni
Sottile, leggero e dall'autonomia WOW: OPPO Reno14 F conquista con stile e sostanza
Sottile, leggero e dall'autonomia WOW: OPPO Reno14 F conquista con stile e sostanza
OPPO Reno14 F 5G si propone come smartphone di fascia media con caratteristiche equilibrate. Il device monta processore Qualcomm Snapdragon 6 Gen 1, display AMOLED da 6,57 pollici a 120Hz, tripla fotocamera posteriore con sensore principale da 50MP e generosa batteria da 6000mAh con ricarica rapida a 45W. Si posiziona come alternativa accessibile nella gamma Reno14, proponendo un design curato e tutto quello che serve per un uso senza troppe preoccupazioni.
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 17-09-2005, 17:42   #1
gik25
Senior Member
 
L'Avatar di gik25
 
Iscritto dal: Feb 2001
Messaggi: 1047
Software che compara più files e crea una RegExp che fa match con tutti

I’d like to ask you a question: there are a lot of web sites made in static HTML. Sooner or later HTML sites are to be converted in PHP/MySQL, but the operation is very expensive since it is to be done manually or with the usage of ad hoc written software.

I’ve an idea to make an universal software to convert html pages into templates and database…

It’s really easy: it’s enough to compare two HTML files and make one regular expression that matches them. Then you refine that regular expression to match a group of files.

Example.

First file
<html>1</html>

Second file
<html>2</html>

Reg exp = <html>\d</html>

Third file
<html></html>

Reg exp = <html>\d?</html>

Fourth file
<html>11</html>

Reg exp = <html>\d(0,2)</html>

Fifth file
<html>error</html>

Reg exp = <html>.*</html>
gik25 è offline   Rispondi citando il messaggio o parte di esso
Old 18-09-2005, 10:54   #2
Mixmar
Senior Member
 
L'Avatar di Mixmar
 
Iscritto dal: Feb 2002
Città: Trento
Messaggi: 962
Not sure I've actually understood your idea... could you please explain it once again (perhaps in italiano)?
__________________
"Et Eärallo Endorenna utúlien. Sinome maruvan ar Hildinyar tenn' Ambar-metta!" -- Aragorn Elessar, Heir of Isildur
Mixmar -- OpenSuSE 11.1 on AMD 64 3000+ on DFI LanParty nF4-D | GeForce 6600 GT + Thermaltake Schooner on Samsung 710N
Storage -- ( 2 x Hitachi Deskstar 80 Gb + 1 x Hitachi 250 Gb ) = 1 RAID 5 + 1 Storage space LaCie Ethernet Disk Mini 250 Gb | HP - DV2150 EL MILAN CLAN
Mixmar è offline   Rispondi citando il messaggio o parte di esso
Old 18-09-2005, 11:25   #3
gik25
Senior Member
 
L'Avatar di gik25
 
Iscritto dal: Feb 2001
Messaggi: 1047
Certo:

Ci sono un sacco di siti in HTML statico. Siti che prima o poi dovranno essere convertiti in tamplate (statici) e database contenenti i valori che cambiano da pagina a pagina.

Questa operazione è immensamente costosa perchè deve essere fatta manualmente per migliaia di pagine, o comunque attraverso l'uso di software scritti ad hoc.

Ho un idea per realizzare un convertitore universale, che potrebbe quindi essere commercializzato garantendo un discreto ritorno economico.

Si tratta di qualcosa di realmente molto semplice: è sufficiente confrontare due o più file HTML e creare la Regular Expression che fa match con entrambi.


Esempio
Primo file
<html>1</html>

Secondo file
<html>2</html>

Reg exp = <html>\d</html>

Terzo file
<html></html>

Reg exp = <html>\d?</html>

Quarto file
<html>11</html>

Reg exp = <html>\d(0,2)</html>

Quinto file
<html>error</html>

Reg exp = <html>.*</html>





In realtà non è necessario che il software arrivi a questi livelli di dettaglio, basterebbe che creasse la seguente Reg Exp: <html>.*?</html>

Un simile software può automatizzare la conversione di un set di pagine in html statico in template più database ed avrebbe quindi un utilità immensa.


PS: com'è il mio italiano?
gik25 è offline   Rispondi citando il messaggio o parte di esso
Old 18-09-2005, 13:03   #4
Mixmar
Senior Member
 
L'Avatar di Mixmar
 
Iscritto dal: Feb 2002
Città: Trento
Messaggi: 962
Quote:
Originariamente inviato da gik25
PS: com'è il mio italiano?
Sicuramente migliore del mio inglese...
__________________
"Et Eärallo Endorenna utúlien. Sinome maruvan ar Hildinyar tenn' Ambar-metta!" -- Aragorn Elessar, Heir of Isildur
Mixmar -- OpenSuSE 11.1 on AMD 64 3000+ on DFI LanParty nF4-D | GeForce 6600 GT + Thermaltake Schooner on Samsung 710N
Storage -- ( 2 x Hitachi Deskstar 80 Gb + 1 x Hitachi 250 Gb ) = 1 RAID 5 + 1 Storage space LaCie Ethernet Disk Mini 250 Gb | HP - DV2150 EL MILAN CLAN
Mixmar è offline   Rispondi citando il messaggio o parte di esso
Old 18-09-2005, 13:15   #5
gik25
Senior Member
 
L'Avatar di gik25
 
Iscritto dal: Feb 2001
Messaggi: 1047
Quote:
Originariamente inviato da Mixmar
Sicuramente migliore del mio inglese...
E che mi dici del programma?
gik25 è offline   Rispondi citando il messaggio o parte di esso
Old 18-09-2005, 15:30   #6
Mixmar
Senior Member
 
L'Avatar di Mixmar
 
Iscritto dal: Feb 2002
Città: Trento
Messaggi: 962
Quote:
Originariamente inviato da gik25
E che mi dici del programma?
Scusami, ma non riesco proprio a capire.

Tu vuoi creare delle regular expression che valgano per un certo numero di file... ma come dovrebbe aiutarti questo a creare un convertitore?

Una regola come "<html>.*</html>" dovrebbe matchare tutti i file html ma... a cosa serve?

Non capisco!
__________________
"Et Eärallo Endorenna utúlien. Sinome maruvan ar Hildinyar tenn' Ambar-metta!" -- Aragorn Elessar, Heir of Isildur
Mixmar -- OpenSuSE 11.1 on AMD 64 3000+ on DFI LanParty nF4-D | GeForce 6600 GT + Thermaltake Schooner on Samsung 710N
Storage -- ( 2 x Hitachi Deskstar 80 Gb + 1 x Hitachi 250 Gb ) = 1 RAID 5 + 1 Storage space LaCie Ethernet Disk Mini 250 Gb | HP - DV2150 EL MILAN CLAN
Mixmar è offline   Rispondi citando il messaggio o parte di esso
Old 18-09-2005, 15:51   #7
gik25
Senior Member
 
L'Avatar di gik25
 
Iscritto dal: Feb 2001
Messaggi: 1047
File 1
<root>
<film>
<titolo>Pinco</titolo>
<genere>azione</genere>
</film>
</root>


File 2
<root>
<film>
<titolo>Pinco 2</titolo>
<genere>thriller</genere>
</film>
</root>


Questo esempio è con i file XML, ma per file html sarebbe uguale: il software deve creare la regular expression che fa match con un gruppo di file similissimi (cambia solo qualche parola o frase)
gik25 è offline   Rispondi citando il messaggio o parte di esso
Old 18-09-2005, 16:16   #8
/\/\@®¢Ø
Bannato
 
L'Avatar di /\/\@®¢Ø
 
Iscritto dal: Jul 2000
Città: Malo (VI)
Messaggi: 1000
non e' cosi' banale raffinare una regex aggiungendo man mano esempi, visto che la regex risultante potrebbe variare in modo irregolare:

l'esempio che hai fatto tu ne e' la prova lampante... generalizzando e basta, ottieni alla fine una regex che accetta qualunque input, grazie tante :P.
Con

<html>1</html>
<html>2</html>
<html></html>
<html>11</html>
<html>error</html>

Qui ad esempio piu' che <html>.*</html> sarebbe desiderabile ottenere
<html>(\d*|error)</html>
Insomma devi decidere come generalizzare: esagerando in senso inverso otterresti invece una regex che accetta solo gli esempi che hai visto, come
<html>(1|2|11|error)?</html>

In ogni caso visto che stai cercando di capire la struttura delle pagine, potrebbe avere piu' senso cercare per prima cosa di ricostruire l'albero e poi da li partire a cercare le similitudini (approfittando del primo passo per "ripulire" l'html).
/\/\@®¢Ø è offline   Rispondi citando il messaggio o parte di esso
Old 18-09-2005, 16:28   #9
gik25
Senior Member
 
L'Avatar di gik25
 
Iscritto dal: Feb 2001
Messaggi: 1047
Quote:
Originariamente inviato da /\/\@®¢Ø
non e' cosi' banale raffinare una regex aggiungendo man mano esempi, visto che la regex risultante potrebbe variare in modo irregolare:

l'esempio che hai fatto tu ne e' la prova lampante... generalizzando e basta, ottieni alla fine una regex che accetta qualunque input, grazie tante :P.
Con

<html>1</html>
<html>2</html>
<html></html>
<html>11</html>
<html>error</html>

Qui ad esempio piu' che <html>.*</html> sarebbe desiderabile ottenere
<html>(\d*|error)</html>
Insomma devi decidere come generalizzare: esagerando in senso inverso otterresti invece una regex che accetta solo gli esempi che hai visto, come
<html>(1|2|11|error)?</html>

In ogni caso visto che stai cercando di capire la struttura delle pagine, potrebbe avere piu' senso cercare per prima cosa di ricostruire l'albero e poi da li partire a cercare le similitudini (approfittando del primo passo per "ripulire" l'html).
Dunque, a dire la verità il programma potrebbe essere usato in due modi diversi:
1) creare RegExp partendo da una serie di esempi (più probabilmente stringhe più o meno brevi)
2) automatizzare il retrieval di informazioni dai file

Nel secondo caso, quello che di fatto interessa più a me, basterebbe una .*? ogni volta che si trova una differenza. Tuttavia se un film si dovesse chiamare alfa e l'altro beta la a finale sarebbe presa come parte del template. Peggio ancora per oggetti tipo <br> o p e altri tag html.

Quindi effettivamente la tua non sarebbe una cattiva idea. Ma dove lo trovo un affare che mi crea un albero html? Fai conto poi che devo salvare non solo i tag, ma anche i loro attributi e contenuto e fatto tutto questo confrontare due alberi con una certa flessibilità... in più il tutto deve funzionare anche con documenti non well formed... e sarebbe funzionante solo per file html o xml (anche se sono proprio i file che mi interessano).

Secondo te è fattibile?
gik25 è offline   Rispondi citando il messaggio o parte di esso
Old 18-09-2005, 18:21   #10
/\/\@®¢Ø
Bannato
 
L'Avatar di /\/\@®¢Ø
 
Iscritto dal: Jul 2000
Città: Malo (VI)
Messaggi: 1000
Quote:
Originariamente inviato da gik25
Quindi effettivamente la tua non sarebbe una cattiva idea. Ma dove lo trovo un affare che mi crea un albero html?
Ci sono diversi parser html in giro, che linguaggio volevi usare ?
In linea di massima ti basta usare un parser che ti faccia chiamare una funzione/metodo ogniqualvolta trovi un tag, Se e' di apertura cominci un sottoramo, se e' di chiusura ne esci. Se il linguaggio poi supporta le continuazioni o qualcosa di simile, diventa ancora piu' facile, perche' non si tratta di far altro saltare dentro e fuori da una funzione ricorsiva.



Quote:
Fai conto poi che devo salvare non solo i tag, ma anche i loro attributi e contenuto e fatto tutto questo confrontare due alberi con una certa flessibilità... in più il tutto deve funzionare anche con documenti non well formed... e sarebbe funzionante solo per file html o xml (anche se sono proprio i file che mi interessano).
Non dovrebbero esserci problemi da questo lato, dipende pero' dalla specifica libreria.
/\/\@®¢Ø è offline   Rispondi citando il messaggio o parte di esso
Old 18-09-2005, 18:32   #11
gik25
Senior Member
 
L'Avatar di gik25
 
Iscritto dal: Feb 2001
Messaggi: 1047
Quote:
Originariamente inviato da /\/\@®¢Ø
Ci sono diversi parser html in giro, che linguaggio volevi usare ?
In linea di massima ti basta usare un parser che ti faccia chiamare una funzione/metodo ogniqualvolta trovi un tag, Se e' di apertura cominci un sottoramo, se e' di chiusura ne esci. Se il linguaggio poi supporta le continuazioni o qualcosa di simile, diventa ancora piu' facile, perche' non si tratta di far altro saltare dentro e fuori da una funzione ricorsiva.




Non dovrebbero esserci problemi da questo lato, dipende pero' dalla specifica libreria.
Non lo so...
io vorrei usare C# o PHP, ma conosco anche Java, C, C++, ecc.

Umh... comunque mi sembra abbastana tostarello.
gik25 è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


Un fulmine sulla scrivania, Corsair Sabre v2 Pro ridefinisce la velocità nel gaming Un fulmine sulla scrivania, Corsair Sabre v2 Pro...
Nokia Innovation Day 2025: l’Europa ha bisogno di campioni nelle telecomunicazioni Nokia Innovation Day 2025: l’Europa ha bisogno d...
Sottile, leggero e dall'autonomia WOW: OPPO Reno14 F conquista con stile e sostanza Sottile, leggero e dall'autonomia WOW: OPPO Reno...
Destiny Rising: quando un gioco mobile supera il gioco originale Destiny Rising: quando un gioco mobile supera il...
Plaud Note Pro convince per qualità e integrazione, ma l’abbonamento resta un ostacolo Plaud Note Pro convince per qualità e int...
ASUS sperimenta GPU senza connettori di ...
La Cina conquisterà lo spazio ent...
Samsung ha un nuovo entry level: debutta...
Caos nei cieli europei: attacco informat...
Volkswagen ferma la produzione di ID.Buz...
Super sconti del weekend Amazon: 5 novit...
Dreame non si ferma più: tra le n...
Samsung Galaxy Buds3 FE a meno di 95€ su...
Praticamente regalate: 135€ per le Squie...
Si rinnovano i coupon nascosti di settem...
Amazon sconta i componenti: occasioni d'...
Vibe coding: esplode la domanda di esper...
Ring Intercom su Amazon: citofono smart ...
Addio regie complicate: un'AI gestir&agr...
Xbox, nuovo aumento dei prezzi negli Sta...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 16:32.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Served by www3v