Torna indietro   Hardware Upgrade Forum > Software > Programmazione

Le soluzioni FSP per il 2026: potenza e IA al centro
Le soluzioni FSP per il 2026: potenza e IA al centro
In occasione del Tech Tour 2025 della European Hardware Association abbiamo incontrato a Taiwan FSP, azienda impegnata nella produzione di alimentatori, chassis e soluzioni di raffreddamento tanto per clienti OEM come a proprio marchio. Potenze sempre più elevate negli alimentatori per far fronte alle necessità delle elaborazioni di intelligenza artificiale.
AWS annuncia European Sovereign Cloud, il cloud sovrano per convincere l'Europa
AWS annuncia European Sovereign Cloud, il cloud sovrano per convincere l'Europa
AWS è il principale operatore di servizi cloud al mondo e da tempo parla delle misure che mette in atto per garantire una maggiore sovranità alle organizzazioni europee. L'azienda ha ora lanciato AWS European Sovereign Cloud, una soluzione specificamente progettata per essere separata e distinta dal cloud "normale" e offrire maggiori tutele e garanzie di sovranità
Redmi Note 15 Pro+ 5G: autonomia monstre e display luminoso, ma il prezzo è alto
Redmi Note 15 Pro+ 5G: autonomia monstre e display luminoso, ma il prezzo è alto
Xiaomi ha portato sul mercato internazionale la nuova serie Redmi Note, che rappresenta spesso una delle migliori scelte per chi non vuole spendere molto. Il modello 15 Pro+ punta tutto su una batteria capiente e su un ampio display luminoso, sacrificando qualcosa in termini di potenza bruta e velocità di ricarica
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 07-03-2011, 10:24   #1
RaouL_BennetH
Senior Member
 
L'Avatar di RaouL_BennetH
 
Iscritto dal: Sep 2004
Messaggi: 3967
[Generico] Gestione Documentale

Ciao a tutti

Mi sto cimentando nello sviluppo di un software che permetta la gestione e l'archiviazione dei documenti. In rete ho trovato moltissimi riferimenti, anche progetti professionali open source (OpenMK, Alfresco).

Ho le idee molto chiare su ciò che vorrei e qualche dubbio sul 'come' dovrei.

I dubbi che ho, per mancanza di esperienza, riguardano la gestione post-scansione dei documenti:

Un documento scansionato, su quasi tutti i dispositivi che ho maneggiato (scanner, multifunzione etc..), viene convertito principalmente in:

tiff, jpg, pdf ;

Fin qui, nei limiti delle mie conoscenze, riesco anche ad immaginare una struttura che contenga: il file, dei tags per le ricerche, la tipologia del documento (fattura, lettera, fax et similia), etc..

Ciò che non riesco ad immaginare invece è come fare una ricerca direttamente sul file, cioè:

Supponendo che voglia fare una ricerca su tutti i files che contengono una determinata parola, che questa parola non sia stata gestita come tag, trattandosi di immagini o pdf , in che modo dovrei ragionare sulla ricerca ?

Per il momento mi basterebbero dei chiarimenti su questo primo dubbio

Grazie mille

RaouL.
__________________
Dai wafer di silicio nasce: LoHacker... il primo biscotto Geek
RaouL_BennetH è offline   Rispondi citando il messaggio o parte di esso
Old 07-03-2011, 12:50   #2
PGI-Bis
Senior Member
 
L'Avatar di PGI-Bis
 
Iscritto dal: Nov 2004
Città: Tra Verona e Mantova
Messaggi: 4553
Non fai una ricerca sul file ma una ricerca sull'indice che il programma crea quando acquisisce il file.

Carichi il file nel programma, il programma lo esamina e per ogni parola che contiene genera un'associazione nell'indice generale. L'indice può essere semplicemente un insieme di parole per ognuna delle quali esiste una lista di file che la contengono - probabilmente organizzato in una struttura idonea anche se il numero di chiavi è al più qualche centinaio di migliaia.

Usi un indice di questo genere perchè l'insieme delle parole esistenti in una o più lingue è storicamente finito mentre l'insieme dei testi che puoi generare combinando quelle parole è infinito.

Nota che esistono sesquilioni di programmi di indicizzazione già pronti, l'unica cosa che forse manca in quelli free è il collegamento con delle api OCR ma anche di queste ne trovi a carrettate.
__________________
Uilliam Scecspir ti fa un baffo? Gioffri Cioser era uno straccione? E allora blogga anche tu, in inglese come me!
PGI-Bis è offline   Rispondi citando il messaggio o parte di esso
Old 09-03-2011, 09:55   #3
RaouL_BennetH
Senior Member
 
L'Avatar di RaouL_BennetH
 
Iscritto dal: Sep 2004
Messaggi: 3967
Grazie per il chiarimento

Per quanto riguarda l'ocr, in fase iniziale forse potrei farne a meno. Pensavo di "simulare" il tutto in questo modo :

L'acquisizione del file la simulo inserendolo in un db, in una tabella dove prevedo anche l'inserimento di tags, più o meno una cosa del genere:


Codice:
--documents--
ID_Documento
tipoDocumento
dataArchiviazione
fileName

--documentTags
documentoID (fk ID_Documento)
tag

//o anche una tabella che mi funga da 'dizionario'
etc..
Successivamente potrei poi concentrarmi sull'utilizzo di qualche libreria per l'ocr.

In linea di massima, può andar bene una cosa del genere ?

Grazie

RaouL.
__________________
Dai wafer di silicio nasce: LoHacker... il primo biscotto Geek
RaouL_BennetH è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


Le soluzioni FSP per il 2026: potenza e IA al centro Le soluzioni FSP per il 2026: potenza e IA al ce...
AWS annuncia European Sovereign Cloud, il cloud sovrano per convincere l'Europa AWS annuncia European Sovereign Cloud, il cloud ...
Redmi Note 15 Pro+ 5G: autonomia monstre e display luminoso, ma il prezzo è alto Redmi Note 15 Pro+ 5G: autonomia monstre e displ...
HONOR Magic 8 Pro: ecco il primo TOP del 2026! La recensione HONOR Magic 8 Pro: ecco il primo TOP del 2026! L...
Insta360 Link 2 Pro e 2C Pro: le webcam 4K che ti seguono, anche con gimbal integrata Insta360 Link 2 Pro e 2C Pro: le webcam 4K che t...
iPad Pro 13'' con chip M4 e 512GB costa ...
La BMW M3 elettrica emetterà i so...
Nuova Opel Astra Electric, primo contatt...
Tornano in sconto 2 caricatori multipli ...
La Ferrari SF-26 di F1 verrà pres...
HONOR Magic V6 sarà il pieghevole...
Signorini denuncia Google e diffida YouT...
OnePlus 15T non ha (quasi) più se...
Roborock Qrevo Curv 2 Pro a un super pre...
Da Sony la serie Crystal LED S, display ...
Gemini non segue ChatGPT: la pubblicit&a...
Google Chrome per iOS avrà un'opz...
Blocco note e Paint si aggiornano con nu...
La poca trasparenza delle offerte luce e...
AMD Ryzen 7 9850X3D ufficiale: debutto i...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 09:51.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2026, Jelsoft Enterprises Ltd.
Served by www3v