Torna indietro   Hardware Upgrade Forum > Software > Programmazione

Le soluzioni FSP per il 2026: potenza e IA al centro
Le soluzioni FSP per il 2026: potenza e IA al centro
In occasione del Tech Tour 2025 della European Hardware Association abbiamo incontrato a Taiwan FSP, azienda impegnata nella produzione di alimentatori, chassis e soluzioni di raffreddamento tanto per clienti OEM come a proprio marchio. Potenze sempre più elevate negli alimentatori per far fronte alle necessità delle elaborazioni di intelligenza artificiale.
AWS annuncia European Sovereign Cloud, il cloud sovrano per convincere l'Europa
AWS annuncia European Sovereign Cloud, il cloud sovrano per convincere l'Europa
AWS è il principale operatore di servizi cloud al mondo e da tempo parla delle misure che mette in atto per garantire una maggiore sovranità alle organizzazioni europee. L'azienda ha ora lanciato AWS European Sovereign Cloud, una soluzione specificamente progettata per essere separata e distinta dal cloud "normale" e offrire maggiori tutele e garanzie di sovranità
Redmi Note 15 Pro+ 5G: autonomia monstre e display luminoso, ma il prezzo è alto
Redmi Note 15 Pro+ 5G: autonomia monstre e display luminoso, ma il prezzo è alto
Xiaomi ha portato sul mercato internazionale la nuova serie Redmi Note, che rappresenta spesso una delle migliori scelte per chi non vuole spendere molto. Il modello 15 Pro+ punta tutto su una batteria capiente e su un ampio display luminoso, sacrificando qualcosa in termini di potenza bruta e velocità di ricarica
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 07-03-2011, 10:24   #1
RaouL_BennetH
Senior Member
 
L'Avatar di RaouL_BennetH
 
Iscritto dal: Sep 2004
Messaggi: 3967
[Generico] Gestione Documentale

Ciao a tutti

Mi sto cimentando nello sviluppo di un software che permetta la gestione e l'archiviazione dei documenti. In rete ho trovato moltissimi riferimenti, anche progetti professionali open source (OpenMK, Alfresco).

Ho le idee molto chiare su ciò che vorrei e qualche dubbio sul 'come' dovrei.

I dubbi che ho, per mancanza di esperienza, riguardano la gestione post-scansione dei documenti:

Un documento scansionato, su quasi tutti i dispositivi che ho maneggiato (scanner, multifunzione etc..), viene convertito principalmente in:

tiff, jpg, pdf ;

Fin qui, nei limiti delle mie conoscenze, riesco anche ad immaginare una struttura che contenga: il file, dei tags per le ricerche, la tipologia del documento (fattura, lettera, fax et similia), etc..

Ciò che non riesco ad immaginare invece è come fare una ricerca direttamente sul file, cioè:

Supponendo che voglia fare una ricerca su tutti i files che contengono una determinata parola, che questa parola non sia stata gestita come tag, trattandosi di immagini o pdf , in che modo dovrei ragionare sulla ricerca ?

Per il momento mi basterebbero dei chiarimenti su questo primo dubbio

Grazie mille

RaouL.
__________________
Dai wafer di silicio nasce: LoHacker... il primo biscotto Geek
RaouL_BennetH è offline   Rispondi citando il messaggio o parte di esso
Old 07-03-2011, 12:50   #2
PGI-Bis
Senior Member
 
L'Avatar di PGI-Bis
 
Iscritto dal: Nov 2004
Città: Tra Verona e Mantova
Messaggi: 4553
Non fai una ricerca sul file ma una ricerca sull'indice che il programma crea quando acquisisce il file.

Carichi il file nel programma, il programma lo esamina e per ogni parola che contiene genera un'associazione nell'indice generale. L'indice può essere semplicemente un insieme di parole per ognuna delle quali esiste una lista di file che la contengono - probabilmente organizzato in una struttura idonea anche se il numero di chiavi è al più qualche centinaio di migliaia.

Usi un indice di questo genere perchè l'insieme delle parole esistenti in una o più lingue è storicamente finito mentre l'insieme dei testi che puoi generare combinando quelle parole è infinito.

Nota che esistono sesquilioni di programmi di indicizzazione già pronti, l'unica cosa che forse manca in quelli free è il collegamento con delle api OCR ma anche di queste ne trovi a carrettate.
__________________
Uilliam Scecspir ti fa un baffo? Gioffri Cioser era uno straccione? E allora blogga anche tu, in inglese come me!
PGI-Bis è offline   Rispondi citando il messaggio o parte di esso
Old 09-03-2011, 09:55   #3
RaouL_BennetH
Senior Member
 
L'Avatar di RaouL_BennetH
 
Iscritto dal: Sep 2004
Messaggi: 3967
Grazie per il chiarimento

Per quanto riguarda l'ocr, in fase iniziale forse potrei farne a meno. Pensavo di "simulare" il tutto in questo modo :

L'acquisizione del file la simulo inserendolo in un db, in una tabella dove prevedo anche l'inserimento di tags, più o meno una cosa del genere:


Codice:
--documents--
ID_Documento
tipoDocumento
dataArchiviazione
fileName

--documentTags
documentoID (fk ID_Documento)
tag

//o anche una tabella che mi funga da 'dizionario'
etc..
Successivamente potrei poi concentrarmi sull'utilizzo di qualche libreria per l'ocr.

In linea di massima, può andar bene una cosa del genere ?

Grazie

RaouL.
__________________
Dai wafer di silicio nasce: LoHacker... il primo biscotto Geek
RaouL_BennetH è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


Le soluzioni FSP per il 2026: potenza e IA al centro Le soluzioni FSP per il 2026: potenza e IA al ce...
AWS annuncia European Sovereign Cloud, il cloud sovrano per convincere l'Europa AWS annuncia European Sovereign Cloud, il cloud ...
Redmi Note 15 Pro+ 5G: autonomia monstre e display luminoso, ma il prezzo è alto Redmi Note 15 Pro+ 5G: autonomia monstre e displ...
HONOR Magic 8 Pro: ecco il primo TOP del 2026! La recensione HONOR Magic 8 Pro: ecco il primo TOP del 2026! L...
Insta360 Link 2 Pro e 2C Pro: le webcam 4K che ti seguono, anche con gimbal integrata Insta360 Link 2 Pro e 2C Pro: le webcam 4K che t...
HUAWEI Mate X7 arriva in Italia con uno ...
Cina, salpata la nave da trasporto pi&ug...
OpenAI triplica i ricavi nel 2025, 20 mi...
2 schede video a prezzi da non perdere: ...
iPhone 17 Pro Max in super sconto su Ama...
Un 'fiore di compagnia', l'ultimo curios...
The Witcher 4: per sviluppo e marketing ...
Samsung smentisce l'ipotesi di un aument...
Under Armour: dati di 72 milioni di uten...
Scuderia Ferrari HP svela la SF-26: bell...
Beats Studio Pro in forte sconto su Amaz...
Il 'Windows open-source' compie 30 anni:...
Forza Horizon 6: ulteriori dettagli emer...
Nuovi limiti ai biocarburanti: quelli a ...
HONOR Magic8 Pro: lo smartphone che vede...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 14:34.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2026, Jelsoft Enterprises Ltd.
Served by www3v