Torna indietro   Hardware Upgrade Forum > Software > Programmazione

GIGABYTE GAMING A16, Raptor Lake e RTX 5060 Laptop insieme per giocare al giusto prezzo
GIGABYTE GAMING A16, Raptor Lake e RTX 5060 Laptop insieme per giocare al giusto prezzo
Il Gigabyte Gaming A16 offre un buon equilibrio tra prestazioni e prezzo: con Core i7-13620H e RTX 5060 Laptop garantisce gaming fluido in Full HD/1440p e supporto DLSS 4. Display 165 Hz reattivo, buona autonomia e raffreddamento efficace; peccano però le USB e la qualità cromatica del pannello. Prezzo: circa 1200€.
iPhone 17 Pro: più di uno smartphone. È uno studio di produzione in formato tascabile
iPhone 17 Pro: più di uno smartphone. È uno studio di produzione in formato tascabile
C'è tanta sostanza nel nuovo smartphone della Mela dedicato ai creator digitali. Nuovo telaio in alluminio, sistema di raffreddamento vapor chamber e tre fotocamere da 48 megapixel: non è un semplice smartphone, ma uno studio di produzione digitale on-the-go
Intel Panther Lake: i processori per i notebook del 2026
Intel Panther Lake: i processori per i notebook del 2026
Panther Lake è il nome in codice della prossima generazione di processori Intel Core Ultra, che vedremo al debutto da inizio 2026 nei notebook e nei sistemi desktop più compatti. Nuovi core, nuove GPU e soprattutto una struttura a tile che vede per la prima volta l'utilizzo della tecnologia produttiva Intel 18A: tanta potenza in più, ma senza perdere in efficienza
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 21-09-2007, 14:35   #1
m0n4c0
Senior Member
 
L'Avatar di m0n4c0
 
Iscritto dal: Sep 2006
Città: Viareggio
Messaggi: 507
[C] Trovare gli elementi comuni ad una serie di array (in meno di O(n^2)...)

Salve a tutti, è il mio primo post in questa sezione.
Il mio problema è il seguente. Ho una serie di array di interi, non necessariamente ordinati e non necessariamente della stessa lunghezza. Avrei bisogno di ricavare i numeri che compaiono in tutti gli array. Ad esempio, dati 3 array:

A = { 2, 6, 3, 12, 7 }
B = { 11, 5, 3, 2, 8, 34 }
C = { 7, 2, 3 }

devo ottenere la sequenza {3, 2} (non importa in che ordine). Gli array in questione sono allocati dinamicamente.

Sapreste consigliarmi un metodo efficiente? Grazie a tutti in anticipo.
__________________
Ho venduto a: Sinclair63, Kusiman, The Plex, McDick, LeEloO.gio, Bembotto, Calex81, elfebo1, juky, Marcello979, masterGR, ste_ita

Ultima modifica di m0n4c0 : 21-09-2007 alle 14:41.
m0n4c0 è offline   Rispondi citando il messaggio o parte di esso
Old 21-09-2007, 14:55   #2
cionci
Senior Member
 
L'Avatar di cionci
 
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
C'è un modo, ma l'applicabilità o meno dipende da quanto è grande il numero maggiore fra quelli presenti nei tre vettori.

I primo passo da fare è trovare il massimo.
A questo punto ti allochi un vettore di interi di dimensione pari al massimo (ecco qui a cosa è dovuto il limite di applicabilità) e ne azzeri il contenuto (o usi la calloc).

Scorrendo ogni vettore vai ad incrementare di 1 l'elemento della posizione corrispondente all'elemento corrente...quando arrivi al terzo vettore se trovi già il contatore a 2 ti metti da parte l'elemento in un altro vettore dei risultati.

Questo è O(n), anche se per dimensioni del vettore troppo grandi diventa inefficiente. Comunque suppongo che si possa fare anche in O(n*log n), anche perché mi sembra equivalente al problema dell'ordinamento.
cionci è offline   Rispondi citando il messaggio o parte di esso
Old 21-09-2007, 15:27   #3
m0n4c0
Senior Member
 
L'Avatar di m0n4c0
 
Iscritto dal: Sep 2006
Città: Viareggio
Messaggi: 507
Intanto grazie per la risposta.

Mi sono dimenticato di aggiungere una cosa. Come ho detto i vettori sono allocati dinamicamente, tuttavia tramite un altra variabile che mi porto dietro posso sapere la dimensione di ciascuno di essi. Non so se questo puo rendere le cose piu semplici...

Spiego anche da dove nasce questo problema. Sto realizzando un semplice indicizzatore di file di testo. In risposta ad una certa query, ad esempio "pippo paperino", ottengo un array di interi per ogni parola che contiene gli indici dei file in cui la parola si trova.
Ad esempio:

pippo: 2, 4, 6 (la parola "pippo" si trova nei file 2, 4, 6)
paperino: 7, 2, 5, 9 (la parola "pippo si trova nei file 7, 2, 5, 9)

In riposta alla query devo ottenere il file che contiene entrambe le parole, in questo caso il file 2 soltanto.

In linea di massima la dimensione massima di questi array di interi, che corrsiponde al numero totale dei file indicizzati, è dell'ordine di qualche migliaio.
Di conseguenza ognuno di questi interi è < numero file indicizzati.

Visto che i numeri da esaminare non sono poi così tanti, preferire non dover allocare altra memoria per l'operazione di ricerca, anche a costo di una complessità n(log n) piuttosto che n.
__________________
Ho venduto a: Sinclair63, Kusiman, The Plex, McDick, LeEloO.gio, Bembotto, Calex81, elfebo1, juky, Marcello979, masterGR, ste_ita
m0n4c0 è offline   Rispondi citando il messaggio o parte di esso
Old 21-09-2007, 16:31   #4
k0nt3
Senior Member
 
Iscritto dal: Dec 2005
Messaggi: 7258
mmm non sono sicuro che sia l'argoritmo più efficiente, comunque i tuoi array sono:
A = { 2, 6, 3, 12, 7 }
B = { 11, 5, 3, 2, 8, 34 }
C = { 7, 2, 3 }

se sai quanto sono lunghi gli array in partenza ti conviene ordinarli dal meno lungo al più lungo.. quindi nell'esempio sarebbe:
A = { 7, 2, 3 }
B = { 2, 6, 3, 12, 7 }
C = { 11, 5, 3, 2, 8, 34 }

provi a confrontare A[0] con gli elementi dell'array B, finchè non trovi un valore uguale a A[0]. in questo caso ti fermerai a B[4]. ora fai la stessa cosa tra B[4] e l'array C, e in questo caso non troverai l'elemento e passerai a esaminare A[1] e così via.. quando trovi l'elemento nell'array C sai che hai trovato una terna di valori uguali.
una piccola ottimizzazione potrebbe essere quella di eliminare gli elementi che fanno già parte di una terna dagli array, ma nel caso in cui le terne sono rare non conviene un granchè

certo se non ti costa molto ordinare l'array in fase di costruzione magari si può pensare a qualcosa di ancora meglio
k0nt3 è offline   Rispondi citando il messaggio o parte di esso
Old 21-09-2007, 16:37   #5
fabianoda
Senior Member
 
Iscritto dal: Oct 2002
Messaggi: 305
Beh...

(1) Con un costo O(n log n) [in-place mergesort, senza altre strutture dati] ti ordini i tuoi vettori, ognuno per ogni parola.

(2) Poi inizi a scorrere i tuoi m vettori dall'inizio alla fine, usando m cursori e confrontando i valori. Ad ogni step aumenti il cursore del vettore il cui elemento è il minore degli m.

(3) Quando tutti gli m cursori sono su valori uguali, allora inserisci in un nuovo array il risultato.

Esempio
ORIGINALE:
pippo: 3 5 1 4
paperino: 4 1
pluto: 4 3 5

DOPO L'ORDINAMENTO:
pippo: 1 3 4 5
paperino: 1 3
pluto: 3 4 5

PASSO 1:
pippo: 1 3 4 5
paperino: 1 3
pluto: 3 4 5
uguali: -
PASSO 2:
pippo: 1 3 4 5
paperino: 1 3
pluto: 3 4 5
uguali: -

PASSO 3:
pippo: 1 3 4 5
paperino: 1 3
pluto: 3 4 5
uguali: 3
Qui addirittura puoi alzare tutti e tre i cursori, dato che l'uguaglianza già c'è

Spero di essermi spiegato, e di avere capito il problema.
Costo dell'approccio: O(n log n) + O(n) = O(n log n)
fabianoda è offline   Rispondi citando il messaggio o parte di esso
Old 21-09-2007, 17:19   #6
m0n4c0
Senior Member
 
L'Avatar di m0n4c0
 
Iscritto dal: Sep 2006
Città: Viareggio
Messaggi: 507
Grazie a tutti per la vostra disponibilità. E' la prima volta che chiedo aiuto nella sezione di programmazione, e sono rimasto impressionato dalla rapidità e dalla completezza delle vostre risposte.

Adesso provo le soluzioni che mi avete proposto, grazie di nuovo.
__________________
Ho venduto a: Sinclair63, Kusiman, The Plex, McDick, LeEloO.gio, Bembotto, Calex81, elfebo1, juky, Marcello979, masterGR, ste_ita
m0n4c0 è offline   Rispondi citando il messaggio o parte di esso
Old 21-09-2007, 18:43   #7
cionci
Senior Member
 
L'Avatar di cionci
 
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
Quote:
Originariamente inviato da m0n4c0 Guarda i messaggi
In linea di massima la dimensione massima di questi array di interi, che corrsiponde al numero totale dei file indicizzati, è dell'ordine di qualche migliaio.
Di conseguenza ognuno di questi interi è < numero file indicizzati.

Visto che i numeri da esaminare non sono poi così tanti, preferire non dover allocare altra memoria per l'operazione di ricerca, anche a costo di una complessità n(log n) piuttosto che n.
Mi sembra che tu sia nella condizione migliore per adottare la soluzione che ti ho proposto in quanto mi immagino che tu conosca a priori il numero di file.
Non credo che allocare 1 byte di RAM per ogni file possa essere una soluzione inaccettabile. Fossero stati qualche milione i byte da allocare allora un pensierino ce l'avrei fatto, ma si tratta di pochi KB
Ram che poi tra l'atro ti si libererebbe appena hai finito di fare il conteggio...
cionci è offline   Rispondi citando il messaggio o parte di esso
Old 22-09-2007, 01:46   #8
m0n4c0
Senior Member
 
L'Avatar di m0n4c0
 
Iscritto dal: Sep 2006
Città: Viareggio
Messaggi: 507
Dici che si tratta di allocare 1 byte.. ma allora forse non ho capito il tuo metodo.. scusa ma sono un po' "duro"...
Quando dici trovare il massimo intendi il massimo fra tutti gli array o il massimo di ogni array?
Poi se non ho capito male devo allocare un array di dimensione pari al massimo... ma questo non mi occupa n*sizeof(int) bytes? Poi scusa se io ad esempio ho questi 4 array:

(2, 4, 189)
(2, 1)
(4, 8, 2, 1)
(1, 2)

dovrei allocare un array di 189 elementi? Mi sa che non c'ho capito una mazza eh... Ma forse intendi il massimo nel senso della dimensione dell'array... non il massimo elemento... cioè in questo caso un array di 4 elementi?

Grazie ancora per l'aiuto...

Un altra cosa che forse non ho spiegato bene... gli array non è che sono per forza esattamente tre... può darsi che una volta ne venga fuori uno solo come un'altra volta ne vengano fuori 50, dipende dalla query. Certo non saranno 2.000... anche perchè la query viene passata da linea di comando.
__________________
Ho venduto a: Sinclair63, Kusiman, The Plex, McDick, LeEloO.gio, Bembotto, Calex81, elfebo1, juky, Marcello979, masterGR, ste_ita
m0n4c0 è offline   Rispondi citando il messaggio o parte di esso
Old 22-09-2007, 07:54   #9
cionci
Senior Member
 
L'Avatar di cionci
 
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
Sì, il numero di elementi da allocare è 189.

Mi hai detto che quei numeri variano fra 0 (oppure 1 ?) ed il numero di file indicizzati, giusto ? Quindi non importa trovare il massimo, visto che il massimo numero possibile che ti può ritornare lo conosci già.
Puoi anche allocare dei char, quindi 1 byte, visto che ti servono solo per contare da 0 a 2

Ti faccio l'esempio del caso che hai postato prima...

char *v = (char *) calloc(number_of_indexed_files, sizeof(char)); /* quindi 1 byte per ogni file indicizzato*/

v[v1[0]]++;
v[v1[1]]++;
v[v1[2]]++;

v[v2[0]]++;
v[v2[1]]++;

v[v3[0]]++;
v[v3[1]]++;
v[v3[2]]++;
v[v3[3]]++;

Per l'ultimo vettore:
se v[v4[0]] == 3 allora metto da parte v4[0]
se v[v4[1]] == 3 allora metto da parte v4[1]

free(v);

Quindi il numero di byte da allocare è uguale al numero di file indicizzati, se sono qualche migliaio allochi qualche KByte...mi sembra una quantità decente.
Se i file fossero diversi milioni mi verrebbe da pensare che la complessità di spazio è troppo superiore a quella computazionale, allora non varrebbe la pena utilizzare questo metodo
Ma qualche KB, se non hai vincoli di memoria, mi sembra un compromesso più che accettabile
cionci è offline   Rispondi citando il messaggio o parte di esso
Old 22-09-2007, 10:07   #10
Furla
Senior Member
 
Iscritto dal: Feb 2004
Messaggi: 1454
per allocare meno spazio puoi usare, con il metodo di cionci, il minimo tra i massimi di ogni vettore. in questo modo si riduce la dimensione dell'array di contatori, ma bisogna inserire un controllo per evitare che si tenti di incrementare il contatore di un file di indice maggiore del "minimo dei massimi".
la complessità resta O(n).

(2, 4, 189)
(2, 1)
(4, 8, 2, 1)
(1, 2)

in questo caso il massimo è 2, quindi ti basta un array di due elementi.

comunque se il massimo è noto senza doverlo cercare ed è un numero ragionevole, forse non conviene introdurre la ricerca (che comunque potrebbe non essere efficace, se tutti gli array hanno un massimo alto, ad esempio quando uno dei file contenente tutte le parole ha un indice alto), perché il tempo di esecuzione dell'algoritmo è breve e il tempo di vita dell'array di contatori lo è altrettanto

Ultima modifica di Furla : 22-09-2007 alle 10:13.
Furla è offline   Rispondi citando il messaggio o parte di esso
Old 22-09-2007, 10:14   #11
cionci
Senior Member
 
L'Avatar di cionci
 
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
Quote:
Originariamente inviato da Furla Guarda i messaggi
per allocare meno spazio puoi usare, con il metodo di cionci, il minimo tra i massimi di ogni vettore. in questo modo si riduce la dimensione dell'array di contatori, ma bisogna inserire un controllo per evitare che si tenti di incrementare il contatore di un file di indice maggiore del "minimo dei massimi".
Vero
Ed in teoria si potrebbe anche trovare il "massimo dei minimi" e sottrarlo come offset per indicizzare il vettore dei contatori
cionci è offline   Rispondi citando il messaggio o parte di esso
Old 22-09-2007, 11:31   #12
m0n4c0
Senior Member
 
L'Avatar di m0n4c0
 
Iscritto dal: Sep 2006
Città: Viareggio
Messaggi: 507
Grazie ancora...

Certo che casino.... io all'inizio invece di una lista di interi per ogni parola avevo fatto in questo modo: ad ogni parola anchè una lista di interi associavo una maschera di bit (un array di char) dove il bit corrispondente ad ogni indice di file veniva messo a uno... Alla fine era molto piu semplice perchè a quel punto bastava mettere in AND le maschere di bit delle varie parole, e la maschera risultante mi dava gli indici di file dove si trovano tutte le parole... il professore però mi ha detto che in questo modo c'era un eccessivo spreco di bit a 0...
Citando dalla sua mail:

La soluzione e' fattibile, e il trucco standard consiste nell'usare un array
di char. Il bit x sara' l'x%8 bit dell'x/8 elemento nell'array. Ovviamente,
stiamo parlando di una codifica di K parole per N file, e la
rappresentazione esplicita a bit NON conviene se la matrice e' sparsa
(cioe', se la grande maggioranza dei bit e' 0). In effetti, si guadagna un
fattore (costante) 8 rispetto a una matrice di "booleani", che puo' non
controbilanciare lo spreco dei bit a 0.
Si puo' assumere che il numero dei file sia dell'ordine 100-1000, e che ogni
file contenga forse 15000 parole distinte (il 10% dell'intero dizionario),
seguendo l'idea che un documento, per quanto lungo, difficilmente parlera'
di tutto: se e' un trattato di storia, non compariranno i nomi di tutte le
specie di marsupiali, e cosi' via.


... secondo me è un po' esagerato... però se me lo dice lui che devo fare
__________________
Ho venduto a: Sinclair63, Kusiman, The Plex, McDick, LeEloO.gio, Bembotto, Calex81, elfebo1, juky, Marcello979, masterGR, ste_ita
m0n4c0 è offline   Rispondi citando il messaggio o parte di esso
Old 22-09-2007, 11:38   #13
cionci
Senior Member
 
L'Avatar di cionci
 
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
Quote:
Originariamente inviato da m0n4c0 Guarda i messaggi
... secondo me è un po' esagerato... però se me lo dice lui che devo fare
Eh sì...è sicuramente esagerato
A quel punto ne usi un algoritmo di ordinamento con complessità O(n * log n) e scorri il risultato contando quanto ci sono N (con N pari al numero di parole) numeri uguali.

Comunque magari proponi al professore questo algoritmo, magari potrebbe raggiungere un trade off fra prestazioni e memoria occupata che gli può andare a genio. Ovviamente digli anche la soluzione O(n * log n).
cionci è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


GIGABYTE GAMING A16, Raptor Lake e RTX 5060 Laptop insieme per giocare al giusto prezzo GIGABYTE GAMING A16, Raptor Lake e RTX 5060 Lapt...
iPhone 17 Pro: più di uno smartphone. È uno studio di produzione in formato tascabile iPhone 17 Pro: più di uno smartphone. &Eg...
Intel Panther Lake: i processori per i notebook del 2026 Intel Panther Lake: i processori per i notebook ...
Intel Xeon 6+: è tempo di Clearwater Forest Intel Xeon 6+: è tempo di Clearwater Fore...
4K a 160Hz o Full HD a 320Hz? Titan Army P2712V, a un prezzo molto basso 4K a 160Hz o Full HD a 320Hz? Titan Army P2712V,...
Start Cup Puglia 2025: il 16 ottobre la ...
Incentivi auto elettriche, falsa partenz...
Silence crea anche in Francia una rete d...
La realtà mista al servizio degli...
Nothing ha un altro smartphone in progra...
Decisione storica ad Amburgo: i cittadin...
Questo è il nuovo motore elettric...
HUAWEI WATCH GT 6: lo smartwatch 'infini...
Fotografia con AI: ecco Caira, la macchi...
PlayStation 6 vs Xbox Magnus: il rumor s...
DJI Osmo Action 4 a soli 208€ su Amazon:...
Irion, la data governance diventa strate...
EHang VT35: debutta in Cina il nuovo aer...
Cooler Master MasterLiquid Atmos II 360:...
Trapela in rete la roadmap dei nuovi gio...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 19:54.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Served by www3v