Torna indietro   Hardware Upgrade Forum > Software > Programmazione

Un fulmine sulla scrivania, Corsair Sabre v2 Pro ridefinisce la velocità nel gaming
Un fulmine sulla scrivania, Corsair Sabre v2 Pro ridefinisce la velocità nel gaming
Questo mouse ultraleggero, con soli 36 grammi di peso, è stato concepito per offrire un'esperienza di gioco di alto livello ai professionisti degli FPS, grazie al polling rate a 8.000 Hz e a un sensore ottico da 33.000 DPI. La recensione esplora ogni dettaglio di questo dispositivo di gioco, dalla sua agilità estrema alle specifiche tecniche che lo pongono un passo avanti
Nokia Innovation Day 2025: l’Europa ha bisogno di campioni nelle telecomunicazioni
Nokia Innovation Day 2025: l’Europa ha bisogno di campioni nelle telecomunicazioni
Dal richiamo di Enrico Letta alla necessità di completare il mercato unico entro il 2028 alla visione di Nokia sul ruolo dell’IA e delle reti intelligenti, il Nokia Innovation Day 2025 ha intrecciato geopolitica e tecnologia, mostrando a Vimercate come la ricerca italiana contribuisca alle sfide globali delle telecomunicazioni
Sottile, leggero e dall'autonomia WOW: OPPO Reno14 F conquista con stile e sostanza
Sottile, leggero e dall'autonomia WOW: OPPO Reno14 F conquista con stile e sostanza
OPPO Reno14 F 5G si propone come smartphone di fascia media con caratteristiche equilibrate. Il device monta processore Qualcomm Snapdragon 6 Gen 1, display AMOLED da 6,57 pollici a 120Hz, tripla fotocamera posteriore con sensore principale da 50MP e generosa batteria da 6000mAh con ricarica rapida a 45W. Si posiziona come alternativa accessibile nella gamma Reno14, proponendo un design curato e tutto quello che serve per un uso senza troppe preoccupazioni.
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 11-07-2011, 22:29   #1
RaouL_BennetH
Senior Member
 
L'Avatar di RaouL_BennetH
 
Iscritto dal: Sep 2004
Messaggi: 3967
[Sql Server 2008 /C#/EF 4]Memorizzare files e ricerche full text

Buonasera a tutti

C'è qualcuno di voi che ha esperienza e che potrebbe suggerirmi qualcosa in merito a:

1) memorizzare files diversi su un db sql server (possono essere .doc, xls, pdf, email)

2) come funziona una ricerca di tipo full text sui documenti che verranno memorizzati sul db in un'apposita tabella ?


Il linguaggio e le tecnologie che devo usare sono C# ed Entity Framework.

Grazie mille a tutti

RaouL.
__________________
Dai wafer di silicio nasce: LoHacker... il primo biscotto Geek
RaouL_BennetH è offline   Rispondi citando il messaggio o parte di esso
Old 12-07-2011, 00:23   #2
DioBrando
Senior Member
 
Iscritto dal: Jan 2003
Città: Milano - Udine
Messaggi: 9418
Quote:
Originariamente inviato da RaouL_BennetH Guarda i messaggi
Buonasera a tutti

C'è qualcuno di voi che ha esperienza e che potrebbe suggerirmi qualcosa in merito a:

1) memorizzare files diversi su un db sql server (possono essere .doc, xls, pdf, email)

2) come funziona una ricerca di tipo full text sui documenti che verranno memorizzati sul db in un'apposita tabella ?


Il linguaggio e le tecnologie che devo usare sono C# ed Entity Framework.

Grazie mille a tutti

RaouL.
mai usato onestamente, però di materiale ne trovi parecchio.

Per esempio:
http://msdn.microsoft.com/en-us/vcsharp/Video/dd565857


Ma è un'applicazione...usi dei servizi, LINQ...?
DioBrando è offline   Rispondi citando il messaggio o parte di esso
Old 12-07-2011, 22:18   #3
RaouL_BennetH
Senior Member
 
L'Avatar di RaouL_BennetH
 
Iscritto dal: Sep 2004
Messaggi: 3967
Quote:
Originariamente inviato da DioBrando Guarda i messaggi
mai usato onestamente, però di materiale ne trovi parecchio.

Per esempio:
http://msdn.microsoft.com/en-us/vcsharp/Video/dd565857


Ma è un'applicazione...usi dei servizi, LINQ...?
Ciao e grazie per la risposta ed il link segnalato

Per rispondere alla tua domanda:

Si, è un'applicazione. Si tratta di fare "in piccolo" una gestione documentale.

Io sono riuscito a fare in modo che qualsiasi documento venga memorizzato (memorizzo soltanto il path del documento), sia poi facilmente recuperabile mediante l'uso di tags preventivamente inseriti o di barcode (utilizzando itextsharp).

Ora dovrei fare in modo di creare un repository unico per qualsiasi tipo di documento: pdf, xls, immagini varie, email, etc... e mediante una ricerca, ad esempio: "pippo", mi trovi tutti i documenti che contengono tale termine.

Io, seguendo il modello dei veri programmi di gestione documentale, ho disegnato anche le varie classi documentali di appartenenza.

Ma questo tipo di ricerca mi è stato richiesto ed ho le idee alquanto confuse.

Grazie

RaouL.
__________________
Dai wafer di silicio nasce: LoHacker... il primo biscotto Geek
RaouL_BennetH è offline   Rispondi citando il messaggio o parte di esso
Old 13-07-2011, 00:13   #4
DioBrando
Senior Member
 
Iscritto dal: Jan 2003
Città: Milano - Udine
Messaggi: 9418
Quote:
Originariamente inviato da RaouL_BennetH Guarda i messaggi
Ciao e grazie per la risposta ed il link segnalato

Per rispondere alla tua domanda:

Si, è un'applicazione. Si tratta di fare "in piccolo" una gestione documentale.

Io sono riuscito a fare in modo che qualsiasi documento venga memorizzato (memorizzo soltanto il path del documento), sia poi facilmente recuperabile mediante l'uso di tags preventivamente inseriti o di barcode (utilizzando itextsharp).

Ora dovrei fare in modo di creare un repository unico per qualsiasi tipo di documento: pdf, xls, immagini varie, email, etc... e mediante una ricerca, ad esempio: "pippo", mi trovi tutti i documenti che contengono tale termine.

Io, seguendo il modello dei veri programmi di gestione documentale, ho disegnato anche le varie classi documentali di appartenenza.

Ma questo tipo di ricerca mi è stato richiesto ed ho le idee alquanto confuse.

Grazie

RaouL.
Prego, figurati

Come repository mi viene in mente DDD ed il repository pattern, con una separazione netta tra domain model e la parte di persistenza dei dati (la presentazione scegli tu come ti verrebbe meglio, se applicazione web, Winform ecc.).

Però se mi parli di gestione documentale pur non avendolo mai utilizzato sul lavoro, hai pensato all'adozione di Sharepoint eventualmente?
E' pensato proprio per quello scopo in fin dei conti
Reportistica ecc. ecc.
E puoi usare MVC...
DioBrando è offline   Rispondi citando il messaggio o parte di esso
Old 13-07-2011, 08:25   #5
RaouL_BennetH
Senior Member
 
L'Avatar di RaouL_BennetH
 
Iscritto dal: Sep 2004
Messaggi: 3967
Buondì

Per Sharepoint non ci è stata fatta menzione, credo quindi che, almeno in questa fase non sia per nulla previsto.

Altro piccolo problema, i nostri client sono tutti con Windows 7 64 Bit mentre la versione di Sql Server 2008 alla quale accediamo è una versione 32 bit e non può essere abilitato il nuovo meccanismo di gestione dei files FILESTREAM.

Pensavo quindi di fare una tabella così composta:

Codice:
ID
FileName varchar
FileExtension varchar
FileContent - ?????
UploadDate datetime
Non ho idea di che tipo di dato usare per memorizzare il contenuto del file e dalle documentazioni che sto leggendo ognuno dice una cosa diversa:

varbinary, blob, image, etc..

Vabbè... diciamo che potrei "iniziare" con uno qualsiasi.

Mi resta comunque il buio totale su come effettuare una ricerca all'interno di essi; per spiegarmi meglio:

Supposto che l'utente che ha precedentemente ha memorizzato il file non si ricordi:

il nome del file
l'estensione
non ha assegnato nessun tag (questo tipo di funzione l'ho già implementata e funziona)

deve quindi fare una ricerca sul contenuto del file, ad esempio con: "banca Thief & Gangsta Inc" .

Vorrei ragionare solo lato DB e crearmi una stored (casomai cambia linguaggio e framework almeno ....) ma non ho idea di come fare appunto la ricerca all'interno dei contenuti .

RaouL.
__________________
Dai wafer di silicio nasce: LoHacker... il primo biscotto Geek
RaouL_BennetH è offline   Rispondi citando il messaggio o parte di esso
Old 13-07-2011, 08:47   #6
RaouL_BennetH
Senior Member
 
L'Avatar di RaouL_BennetH
 
Iscritto dal: Sep 2004
Messaggi: 3967
mmm.. con questo link mi si è tolta almeno qualche nuvoletta nebbiosa:

http://www.simple-talk.com/sql/learn...in-sql-server/
__________________
Dai wafer di silicio nasce: LoHacker... il primo biscotto Geek
RaouL_BennetH è offline   Rispondi citando il messaggio o parte di esso
Old 13-07-2011, 11:51   #7
DioBrando
Senior Member
 
Iscritto dal: Jan 2003
Città: Milano - Udine
Messaggi: 9418
Quote:
Originariamente inviato da RaouL_BennetH Guarda i messaggi
mmm.. con questo link mi si è tolta almeno qualche nuvoletta nebbiosa:

http://www.simple-talk.com/sql/learn...in-sql-server/
Se devi cercare nel contenuto allora sì la soluzione migliore è usare l'FTS (FUll Text Search) di SQL Server che tra parentesi credo sia una funzionalità specifica proprio del DBMS Microsoft (magari è implementata anche su Oracle ma non ricordo come funziona ) e differente dal classico "like"


Il problema è l'interazione però con LINQ perché, a quanto ne so, non la supporta ancora.
Magari non ne avete bisogno (usando Entity Framework però mi viene difficile pensarlo dato che uno dei punti forti di quell'ORM è proprio il provider LINQ) ma ci sono comunque un paio di soluzioni "caserecce".

http://stackoverflow.com/questions/5...search-in-linq
http://sqlblogcasts.com/blogs/simons...searching.aspx
DioBrando è offline   Rispondi citando il messaggio o parte di esso
Old 18-07-2011, 22:52   #8
RaouL_BennetH
Senior Member
 
L'Avatar di RaouL_BennetH
 
Iscritto dal: Sep 2004
Messaggi: 3967
Quote:
Originariamente inviato da DioBrando Guarda i messaggi
Se devi cercare nel contenuto allora sì la soluzione migliore è usare l'FTS (FUll Text Search) di SQL Server che tra parentesi credo sia una funzionalità specifica proprio del DBMS Microsoft (magari è implementata anche su Oracle ma non ricordo come funziona ) e differente dal classico "like"


Il problema è l'interazione però con LINQ perché, a quanto ne so, non la supporta ancora.
Magari non ne avete bisogno (usando Entity Framework però mi viene difficile pensarlo dato che uno dei punti forti di quell'ORM è proprio il provider LINQ) ma ci sono comunque un paio di soluzioni "caserecce".

http://stackoverflow.com/questions/5...search-in-linq
http://sqlblogcasts.com/blogs/simons...searching.aspx
Ho visto che non è integrato però ho pensato che potrei passargli una stored (a EF intendo.... )
__________________
Dai wafer di silicio nasce: LoHacker... il primo biscotto Geek
RaouL_BennetH è offline   Rispondi citando il messaggio o parte di esso
Old 18-07-2011, 23:02   #9
DioBrando
Senior Member
 
Iscritto dal: Jan 2003
Città: Milano - Udine
Messaggi: 9418
Quote:
Originariamente inviato da RaouL_BennetH Guarda i messaggi
Ho visto che non è integrato però ho pensato che potrei passargli una stored (a EF intendo.... )
mi pare sia una delle soluzioni prospettate nei link
DioBrando è offline   Rispondi citando il messaggio o parte di esso
Old 19-07-2011, 06:27   #10
VICIUS
Senior Member
 
L'Avatar di VICIUS
 
Iscritto dal: Oct 2001
Messaggi: 11471
Non so quale sia la qualità del port su .net ma prova comunque a dare un occhiata a Lucene. http://incubator.apache.org/lucene.net/
Noi lo usiamo con Java e abbiamo su un indice con milioni di documenti su un db mysql.
VICIUS è offline   Rispondi citando il messaggio o parte di esso
Old 19-07-2011, 08:42   #11
Kralizek
Senior Member
 
L'Avatar di Kralizek
 
Iscritto dal: Feb 2003
Città: Stockholm (SE)
Messaggi: 1343
Quote:
Originariamente inviato da VICIUS Guarda i messaggi
Non so quale sia la qualità del port su .net ma prova comunque a dare un occhiata a Lucene. http://incubator.apache.org/lucene.net/
Noi lo usiamo con Java e abbiamo su un indice con milioni di documenti su un db mysql.
il port é tecnicamente ineccepibile perché é fatto line-by-line.

anche se nella community di sviluppatori c'é stato molto disappunto su questa linea perché avrebbero preferito mantenere una compatibilitá dal punto di vista funzionale ma usare tutte le capacitá di .net.

in pratica lucene.net é scritto in .net 2.0... preistoria
Kralizek è offline   Rispondi citando il messaggio o parte di esso
Old 19-07-2011, 09:39   #12
RaouL_BennetH
Senior Member
 
L'Avatar di RaouL_BennetH
 
Iscritto dal: Sep 2004
Messaggi: 3967
Interessante lucene ! grazie per la segnalazione !

Ma che tipo di documenti posso gestire ?
__________________
Dai wafer di silicio nasce: LoHacker... il primo biscotto Geek
RaouL_BennetH è offline   Rispondi citando il messaggio o parte di esso
Old 19-07-2011, 10:54   #13
VICIUS
Senior Member
 
L'Avatar di VICIUS
 
Iscritto dal: Oct 2001
Messaggi: 11471
Quote:
Originariamente inviato da RaouL_BennetH Guarda i messaggi
Interessante lucene ! grazie per la segnalazione !

Ma che tipo di documenti posso gestire ?
Sostanzialmente puoi gestire qualsiasi cosa da cui sia possibile estrarre del testo.
VICIUS è offline   Rispondi citando il messaggio o parte di esso
Old 19-07-2011, 17:37   #14
RaouL_BennetH
Senior Member
 
L'Avatar di RaouL_BennetH
 
Iscritto dal: Sep 2004
Messaggi: 3967
Quote:
Originariamente inviato da VICIUS Guarda i messaggi
Sostanzialmente puoi gestire qualsiasi cosa da cui sia possibile estrarre del testo.
Mmm... perdonatemi ma c'è qualcosa che ancora non mi torna...

Non riesco a trovare nulla con cui indicizzare documenti esistenti, tipo .doc, .xls, email, pdf etc..

In ogni tutorial vedo che i documenti sono creati da codice, inserendo descrizioni.

Avreste qualche esempio da linkare ?

Grazie a tutti

RaouL.
__________________
Dai wafer di silicio nasce: LoHacker... il primo biscotto Geek
RaouL_BennetH è offline   Rispondi citando il messaggio o parte di esso
Old 19-07-2011, 18:49   #15
VICIUS
Senior Member
 
L'Avatar di VICIUS
 
Iscritto dal: Oct 2001
Messaggi: 11471
Quote:
Originariamente inviato da RaouL_BennetH Guarda i messaggi
Mmm... perdonatemi ma c'è qualcosa che ancora non mi torna...

Non riesco a trovare nulla con cui indicizzare documenti esistenti, tipo .doc, .xls, email, pdf etc..

In ogni tutorial vedo che i documenti sono creati da codice, inserendo descrizioni.

Avreste qualche esempio da linkare ?

Grazie a tutti

RaouL.
No lucene non fa estrazione di testo. A quello ci devi pensare tu. Una volta che hai il testo da indicizzare puoi usare gli esempi che si trovano anche per la versione java e provare ad adattarli per .net.
VICIUS è offline   Rispondi citando il messaggio o parte di esso
Old 21-07-2011, 08:06   #16
Kralizek
Senior Member
 
L'Avatar di Kralizek
 
Iscritto dal: Feb 2003
Città: Stockholm (SE)
Messaggi: 1343
Quote:
Originariamente inviato da Kralizek Guarda i messaggi
il port é tecnicamente ineccepibile perché é fatto line-by-line.

anche se nella community di sviluppatori c'é stato molto disappunto su questa linea perché avrebbero preferito mantenere una compatibilitá dal punto di vista funzionale ma usare tutte le capacitá di .net.

in pratica lucene.net é scritto in .net 2.0... preistoria
mi correggo dicendo che lucene non supportava i generics, quindi allo stato attuale era come se fosse stato scritto in .net 1.x

ora c'é un nuovo team e stanno .net-ifizzando (tradotto da ".net-fy") inserendo il supporto ai generics.

figo... .net 2.0 nel 2011

http://codeclimber.net.nz/archive/20...-on-track.aspx
Kralizek è offline   Rispondi citando il messaggio o parte di esso
Old 22-07-2011, 10:53   #17
RaouL_BennetH
Senior Member
 
L'Avatar di RaouL_BennetH
 
Iscritto dal: Sep 2004
Messaggi: 3967
Quote:
Originariamente inviato da VICIUS Guarda i messaggi
No lucene non fa estrazione di testo. A quello ci devi pensare tu. Una volta che hai il testo da indicizzare puoi usare gli esempi che si trovano anche per la versione java e provare ad adattarli per .net.
Allora mi sa che è più semplice (dato anche il volume da gestire) utilizzare ciò che offre Sql Server 2008. In questo progetto purtroppo sono solo e i tempi desiderati dai mega direttori galattici sono di pronta consegna per "ieri". Io investirei volentieri del tempo per apprendere altro.

Dico questo anche perchè ho visto che non è affatto banale estrarre del testo da files di diversa natura (jpg, pdf, doc, xls, etc..)
__________________
Dai wafer di silicio nasce: LoHacker... il primo biscotto Geek
RaouL_BennetH è offline   Rispondi citando il messaggio o parte di esso
Old 22-07-2011, 11:10   #18
VICIUS
Senior Member
 
L'Avatar di VICIUS
 
Iscritto dal: Oct 2001
Messaggi: 11471
Quote:
Originariamente inviato da RaouL_BennetH Guarda i messaggi
Allora mi sa che è più semplice (dato anche il volume da gestire) utilizzare ciò che offre Sql Server 2008. In questo progetto purtroppo sono solo e i tempi desiderati dai mega direttori galattici sono di pronta consegna per "ieri". Io investirei volentieri del tempo per apprendere altro.

Dico questo anche perchè ho visto che non è affatto banale estrarre del testo da files di diversa natura (jpg, pdf, doc, xls, etc..)
L'estrazione del testo non credo tu possa saltarla. Non conosco sqlserver ma secondo me non basta caricare sul file nel db dentro ad un blob binario per riuscire a fare ricerche dentro ad esso.
VICIUS è offline   Rispondi citando il messaggio o parte di esso
Old 22-07-2011, 11:34   #19
RaouL_BennetH
Senior Member
 
L'Avatar di RaouL_BennetH
 
Iscritto dal: Sep 2004
Messaggi: 3967
Quote:
Originariamente inviato da VICIUS Guarda i messaggi
L'estrazione del testo non credo tu possa saltarla. Non conosco sqlserver ma secondo me non basta caricare sul file nel db dentro ad un blob binario per riuscire a fare ricerche dentro ad esso.
Hai ragione

Al momento ho individuato questa strategia:

1) Qualsiasi tipo di file lo converto in .pdf
2) Mediante PDFBox estraggo il testo
3) Il testo estratto lo do in pasto a lucene (e questo mi svincolerebbe anche
dall'utilizzo di un database)

Può andare ?

grazie

RaouL.
__________________
Dai wafer di silicio nasce: LoHacker... il primo biscotto Geek
RaouL_BennetH è offline   Rispondi citando il messaggio o parte di esso
Old 22-07-2011, 15:35   #20
VICIUS
Senior Member
 
L'Avatar di VICIUS
 
Iscritto dal: Oct 2001
Messaggi: 11471
Quote:
Originariamente inviato da RaouL_BennetH Guarda i messaggi
Hai ragione

Al momento ho individuato questa strategia:

1) Qualsiasi tipo di file lo converto in .pdf
2) Mediante PDFBox estraggo il testo
3) Il testo estratto lo do in pasto a lucene (e questo mi svincolerebbe anche
dall'utilizzo di un database)

Può andare ?

grazie

RaouL.
Se riesci ad automatizzare il tutto non dovrebbero esserci problemi. Al posto di pdfbox io però userei itextsharp per l'estrazione del testo dai pdf.
VICIUS è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


Un fulmine sulla scrivania, Corsair Sabre v2 Pro ridefinisce la velocità nel gaming Un fulmine sulla scrivania, Corsair Sabre v2 Pro...
Nokia Innovation Day 2025: l’Europa ha bisogno di campioni nelle telecomunicazioni Nokia Innovation Day 2025: l’Europa ha bisogno d...
Sottile, leggero e dall'autonomia WOW: OPPO Reno14 F conquista con stile e sostanza Sottile, leggero e dall'autonomia WOW: OPPO Reno...
Destiny Rising: quando un gioco mobile supera il gioco originale Destiny Rising: quando un gioco mobile supera il...
Plaud Note Pro convince per qualità e integrazione, ma l’abbonamento resta un ostacolo Plaud Note Pro convince per qualità e int...
ASUS sperimenta GPU senza connettori di ...
La Cina conquisterà lo spazio ent...
Samsung ha un nuovo entry level: debutta...
Caos nei cieli europei: attacco informat...
Volkswagen ferma la produzione di ID.Buz...
Super sconti del weekend Amazon: 5 novit...
Dreame non si ferma più: tra le n...
Samsung Galaxy Buds3 FE a meno di 95€ su...
Praticamente regalate: 135€ per le Squie...
Si rinnovano i coupon nascosti di settem...
Amazon sconta i componenti: occasioni d'...
Vibe coding: esplode la domanda di esper...
Ring Intercom su Amazon: citofono smart ...
Addio regie complicate: un'AI gestir&agr...
Xbox, nuovo aumento dei prezzi negli Sta...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 15:02.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Served by www3v