Torna indietro   Hardware Upgrade Forum > Software > Programmazione

Tastiera gaming MSI GK600 TKL: switch hot-swap, display LCD e tre modalità wireless
Tastiera gaming MSI GK600 TKL: switch hot-swap, display LCD e tre modalità wireless
MSI FORGE GK600 TKL WIRELESS: switch lineari hot-swap, tripla connettività, display LCD e 5 strati di fonoassorbimento. Ottima in gaming, a 79,99 euro
DJI Osmo Pocket 4: la gimbal camera tascabile cresce e ha nuovi controlli fisici
DJI Osmo Pocket 4: la gimbal camera tascabile cresce e ha nuovi controlli fisici
DJI porta un importante aggiornamento alla sua linea di gimbal camera tascabili con Osmo Pocket 4: sensore CMOS da 1 pollice rinnovato, gamma dinamica a 14 stop, profilo colore D-Log a 10 bit, slow motion a 4K/240fps e 107 GB di archiviazione integrata. Un prodotto pensato per i creator avanzati, ma che convince anche per l'uso quotidiano
Sony INZONE H6 Air: il primo headset open-back di Sony per giocatori
Sony INZONE H6 Air: il primo headset open-back di Sony per giocatori
Il primo headset open-back della linea INZONE arriva a 200 euro con driver derivati dalle cuffie da studio MDR-MV1 e un peso record di soli 199 grammi
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 09-06-2007, 14:32   #1
spk
Senior Member
 
L'Avatar di spk
 
Iscritto dal: Jul 2002
Città: Hampstead, London
Messaggi: 2449
[PHP] Efficienza algoritmo

ciao,

ho una pagina php il cui compito è prelevare testi da un database mysql, filtrare tutte le parole in base a determinati criteri, e restituire ciò che rimane

in poche parole estraggo le keyword da un documento

come potete immaginare utilizzo dei file di testo contenenti dizionari di parole italiane e inglesi (attualmente il file è di 64000 righe) ed esegui operazioni su queste per poi decidere in base ad altri criteri la valenza della parola nel testo.

mi rivolgo a voi per una questione tecnica: l'algoritmo in questione è molto oneroso di processore, e richiede più di due minuti prima di completare tutti gli articoli....mi interessa chiedervi quali strumenti posso utilizzare per "scovare" quali porzioni di codice sono più onerose delle altre.

ho provato a dimezzare il dizionario: il tempo impiegato è diminuito ma non dimezzato. Ho altre funzioni all'apparenza veloci ma che probabilmente stanno eseguendo istruzioni superflue...non riesco a ottimizzare il codice

esiste qualcosa che mi può aiutare?
__________________
stabilmente instabile
spk è offline   Rispondi citando il messaggio o parte di esso
Old 09-06-2007, 14:57   #2
cionci
Senior Member
 
L'Avatar di cionci
 
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
Fammi capire meglio...devi cercare una o più parole all'interno di uno o più testi contenuti in un database MySQL ? In tal caso MySQL prevede un'indicizzazione particolare chiamata Full Text Index che permette in maniera notevolmente ottimizzata di cercare parole all'interno di campi di testo di grosse dimensioni.
Cerca Full Text Search nel manuale sul sito di MySQL...
cionci è offline   Rispondi citando il messaggio o parte di esso
Old 09-06-2007, 19:52   #3
spk
Senior Member
 
L'Avatar di spk
 
Iscritto dal: Jul 2002
Città: Hampstead, London
Messaggi: 2449
molto molto interessante

ho letto qualche pagine della documentazione.
se ho ben compreso sembra possibile sostituire l'intero script da me fatto in php con una "Boolean Full-Text Search" ben formata, facendo ampio uso delle wildcard, tuttavia non ritorna ciò che cerco!

spiego meglio come lavora il mio script, tralascio volontariamente tutti i passaggi che raffinano il lavoro:
1) faccio una query a un database di articoli e ne estraggo il corpo.
2) trasformo un grosso file dizionario di parole in un array. Questo dizionario non tiene parole intere, ma solo la parte iniziale della parola, cercando di evitare i suffissi più comuni.
es.: ABBANDON , che uso per filtrare "abbandon-are" , "abbandon-ato" , ecc..
3) restituisco le parole sopravvissute come keywords, o comunque parole di interesse - come nomi propri e cose simili.

sembra che scaricare il lavoro a mysql sia possibile, ma servirebbe che retituisse un elenco di parole invece di un intero articolo
__________________
stabilmente instabile
spk è offline   Rispondi citando il messaggio o parte di esso
Old 09-06-2007, 20:37   #4
cionci
Senior Member
 
L'Avatar di cionci
 
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
Quindi te cerchi abbandon* e quindi vorresti che ritornasse l'id dell'articolo e la lista di parole che matchano ?

Comunque già il solo fatto che ti ritorni l'articolo che matcha, se hai tanti articoli, potrebbe essere un notevole miglioramento. Dopo ti resterebbe solo da individuare le parole che matchano tramite codice.

PS: che brutto "matchare"
cionci è offline   Rispondi citando il messaggio o parte di esso
Old 10-06-2007, 10:17   #5
spk
Senior Member
 
L'Avatar di spk
 
Iscritto dal: Jul 2002
Città: Hampstead, London
Messaggi: 2449
matchare è veramente orrendo

quasi: io cerco abbandon* e mi deve restituire le parole che NON matchano

es.: in "il prodotto XYZ è il migliore"
il mio algoritmo filtra "il" "prodotto" "è" "il" "migliore" e restituisce "XYZ"

PS: penso che sarebbe utilile modificare il titolo del thread, siamo entrati nello specifico ora, si può scegliere di meglio
__________________
stabilmente instabile
spk è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


Tastiera gaming MSI GK600 TKL: switch hot-swap, display LCD e tre modalità wireless Tastiera gaming MSI GK600 TKL: switch hot-swap, ...
DJI Osmo Pocket 4: la gimbal camera tascabile cresce e ha nuovi controlli fisici DJI Osmo Pocket 4: la gimbal camera tascabile cr...
Sony INZONE H6 Air: il primo headset open-back di Sony per giocatori Sony INZONE H6 Air: il primo headset open-back d...
Nutanix cambia pelle: dall’iperconvergenza alla piattaforma full stack per cloud ibrido e IA Nutanix cambia pelle: dall’iperconvergenza alla ...
Recensione Xiaomi Pad 8 Pro: potenza bruta e HyperOS 3 per sfidare la fascia alta Recensione Xiaomi Pad 8 Pro: potenza bruta e Hyp...
Spento lo strumento LECP della sonda spa...
Voyager Technologies ha siglato un accor...
GoPro annuncia la linea MISSION 1 con tr...
Alcune varianti dei futuri Samsung Galax...
Il ridimensionamento di OnePlus in Europ...
Il cofondatore di Netflix ha lasciato l'...
ASUS porta in Italia il nuovo Zenbook Du...
Assassin's Creed: Black Flag Resynced, s...
Xbox Game Pass cambierà: tra le n...
I nuovi Surface Pro e Laptop sono vicini...
OnePlus ci riprova con la fascia bassa: ...
La Top 10 delle offerte Amazon del weeke...
XGIMI MoGo 2 Pro a 339€: Google TV con N...
Forum IT & Intelligence 2026: dall'A...
iPhone 16e per la prima volta a meno di ...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 04:28.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2026, Jelsoft Enterprises Ltd.
Served by www3v