PDA

View Full Version : [HTML] copiare contenuti


[RenderMAN]
13-01-2009, 20:46
Ho un grosso file Html locale che ultimamente mi si è incasinato, per via dei copia ed incolla.
Il file contiene dati importanti e numerossissima voci, è molto semplice contiene solo tabelle e testo, con aggiunta di voci Css direttamente nell' Head del documento, adesso è un casino ci sono un sacco di tag css errati/incompleti e molto del testo è illeggibile tanto son piccoli i caratteri.

Ho deciso di rifarlo nuovo + pulito ad aggiornato, ma il casino e che se faccio copia/incolla assieme a tabelle e testo incollo anche il codice errato, e nn concludo nulla.

La domanda è, esiste la possibilità con un qualche sw particolare oppure con DreamwaverCs4 o FrontPage di copiare la sola struttura tabelle+dati, IGNORANDO i fattori di stile quali font, colori, grandezza, etc...???

Sto parlando di circa 1400 celle piene zeppe di dati, e l'unico modo che ho sperimentato con successo è quello di copiare una xc una il contenuto della cella, incollarlo in un semplice file Txt, copiarlo ed incollarlo nel nuovo file Html pulito, solo che così ci metto 25 anni....

Se copio tutto ed incollo in un Txt si attaccano tutti i dati delle celle, diventa un casino l'errore ci scappa di sicuro.

Help

Vincenzo1968
13-01-2009, 22:09
;25832891']
...
La domanda è, esiste la possibilità con un qualche sw particolare oppure con DreamwaverCs4 o FrontPage di copiare la sola struttura tabelle+dati, IGNORANDO i fattori di stile quali font, colori, grandezza, etc...???

Sto parlando di circa 1400 celle piene zeppe di dati, e l'unico modo che ho sperimentato con successo è quello di copiare una xc una il contenuto della cella, incollarlo in un semplice file Txt, copiarlo ed incollarlo nel nuovo file Html pulito, solo che così ci metto 25 anni....
...
Help

La cosa è agevolmente gestibile con un bell'automa a stati finiti(che legge il file html in ingresso e ne produce uno nuovo).

Puoi postare la prima parte del file? (se il testo contiene dati sensibili cambiali con dati inventati).

Torav
13-01-2009, 22:49
secondo me se sai quali sono i tag "incriminati" che vuoi eliminare ti basta qualche espressione regolare astuta... certo se devi eliminare 20 tag diversi è tosta.. ma se devi togliere solamente i vari <font> e/o <p>, <span> ecc non ci vuole poi molto

cionci
14-01-2009, 10:19
Se la pagina ha un foglio di stile esterno fai così:
- salva in locale con Firefox
- dalla pagina salvata elimina il foglio di stile
- seleziona, tenendo sempre premuto CTRL, dalla prima riga della tabella fino all'ultima, poi allarga la selezione a tutte le colonne
- tasto destro sulal selezione, copia
- incolla nel tuo editor, ad esempio dreamweaver

Ti dovrebbe mantenere la struttura delle tabelle. Se non te la mantiene incollalo su Word o su Excel (provali entrambi, Excel dovrebbe escludere molti più tag HTML) e poi di nuovo su Dreamweaver.

[RenderMAN]
14-01-2009, 23:30
Sto Span ancora non ho capito a cosa serva, ho fatto ricerca serve ad "enfatizzare" un carattere, ma non ho capito come, me lo spiegate per favore?

Setta il font e la famiglia? ma quello non lo fà il tag "p class=MsoNormal
confused....

Vi posto una delle celle che NON và, ossia presenta caratteri variabili:


<table class=MsoNormalTable border=0 cellpadding=0 width="88%"
style='width:88.0%;mso-cellspacing:1.5pt;mso-yfti-tbllook:1184;mso-padding-alt:
0cm 5.4pt 0cm 5.4pt' id=table5>
<tr style='mso-yfti-irow:0;mso-yfti-firstrow:yes'>
<td style='padding:.75pt; ; font-style:normal; font-variant:normal; font-weight:normal; font-size:8pt; font-family:verdana, geneva, lucida, lucida grande, arial, helvetica, sans-serif'>
<span style='font-family:"Calibri";mso-fareast-font-family:
"Times New Roman"'>
<a target="_blank" href="OMISSIS" style="text-decoration: none">
OMISSIS</a><br>
<span class=SpellE>OMISSIS</span>: xxxxx<br>
OMISSIS </span><font size="3">
<span style='font-family:"Times New Roman,serif";mso-fareast-font-family:
"Times New Roman"'>xxxxx</span></font><span style='font-family:"Calibri";mso-fareast-font-family:
"Times New Roman"'><br>
Mail: </span><a href="mailto:OMISSIS" style="text-decoration: none">
<span style="font-family: Calibri">xxxxxxx</span></a><span style='mso-fareast-font-family:"Times New Roman"'><o:p><br>
</o:p></span><strong style="FONT-SIZE: 14px">OMISSIS</strong>
<strong style="FONT-SIZE: 14px; COLOR: #0d89a7">OMISSIS</strong></td>
<td style='padding:.75pt; ; font-style:normal; font-variant:normal; font-weight:normal; font-size:8pt; font-family:verdana, geneva, lucida, lucida grande, arial, helvetica, sans-serif'>
<p class=MsoNormal>
<span style='font-family:"Calibri";mso-fareast-font-family:
"Times New Roman"'>


Cè un sacco di codice che è stato involontariamente incollato come ad esempio il Tag"<o : p>" che non ho la + pallida idea di cosa sia.

Cmq da quel codice sopra, riuscite ad individuare il problema??

Grazie.

cionci
14-01-2009, 23:46
Mi sa tanto di tabella generata da Word ;)

[RenderMAN]
15-01-2009, 00:44
Mi sa tanto di tabella generata da Word ;)

Probabile, lo usato subito dopo il format poichè nn avevo installato altro.:muro: :muro: :muro: :muro: :muro: :muro:

cionci
15-01-2009, 10:43
Fare quello che ti ho suggerito non funziona per esportare solo i dati ? Anche non avendo un CSS a parte.
Incolla la tabella su Excel invece che su word.

Vincenzo1968
15-01-2009, 19:23
Se la pagina ha un foglio di stile esterno fai così:
- salva in locale con Firefox
- dalla pagina salvata elimina il foglio di stile
- seleziona, tenendo sempre premuto CTRL, dalla prima riga della tabella fino all'ultima, poi allarga la selezione a tutte le colonne
- tasto destro sulal selezione, copia
- incolla nel tuo editor, ad esempio dreamweaver

Ti dovrebbe mantenere la struttura delle tabelle. Se non te la mantiene incollalo su Word o su Excel (provali entrambi, Excel dovrebbe escludere molti più tag HTML) e poi di nuovo su Dreamweaver.

Minnale lavoraccio!!! :D

Non fa prima con l'automa? Deve solo passare il nome del file html e l'automa produce, in output, un file html pulito.

:bimbo: