PDA

View Full Version : Testi antichi e char recognization


LUVІ
19-08-2008, 16:21
Leggevo questa notizia:

http://www.repubblica.it/2007/10/sezioni/scienza_e_tecnologia/libri-web/testi-antichi/testi-antichi.html

http://www.repubblica.it/2006/05/gallerie/scienzaetecnologia/testi-antichi-foto/1.html

Ma, ragionandoci, mi sembra una cazzata.
Se una parola che non è stata compresa da un OCR viene utilizzata come captcha, come fa il sw a dirti se quello che hai scritto è corretto o meno?
Insomma, le due cose non sono correlabili IMHO, se è una parola di controllo allora se ne conosce il typo, se non lo è non è utilizzabile a fini scientifici.

LuVi

akfhalfhadsòkadjasdasd
19-08-2008, 18:24
Leggevo questa notizia:

http://www.repubblica.it/2007/10/sezioni/scienza_e_tecnologia/libri-web/testi-antichi/testi-antichi.html

http://www.repubblica.it/2006/05/gallerie/scienzaetecnologia/testi-antichi-foto/1.html

Ma, ragionandoci, mi sembra una cazzata.
Se una parola che non è stata compresa da un OCR viene utilizzata come captcha, come fa il sw a dirti se quello che hai scritto è corretto o meno?
Insomma, le due cose non sono correlabili IMHO, se è una parola di controllo allora se ne conosce il typo, se non lo è non è utilizzabile a fini scientifici.

LuVi
Non capisco cosa c'è che non va.. @_@ .. loro dicono che se tre utenti danno la stessa risposta circa la parola indecifrabile da un ocr allora il vocabolo è quello che scrivono quei tre. Il sw tiene traccia delle interpretazioni della parola dubbia e appena ne ha tre che combaciano userà quella.

Una delle due parole invece è conosciuta dal sistema e questa verrà usata per filtrare gli utenti.

LUVІ
19-08-2008, 18:58
Non capisco cosa c'è che non va.. @_@ .. loro dicono che se tre utenti danno la stessa risposta circa la parola indecifrabile da un ocr allora il vocabolo è quello che scrivono quei tre. Il sw tiene traccia delle interpretazioni della parola dubbia e appena ne ha tre che combaciano userà quella.

Una delle due parole invece è conosciuta dal sistema e questa verrà usata per filtrare gli utenti.

Cosa c'è che non va? Se i tre utenti digitano la parola, assieme ad altri mille, ovviamente, come fa il captcha a dargli l'ok? :confused:

LuVi

akfhalfhadsòkadjasdasd
19-08-2008, 20:29
Cosa c'è che non va? Se i tre utenti digitano la parola, assieme ad altri mille, ovviamente, come fa il captcha a dargli l'ok? :confused:

LuVi

a quanto ho capito io scorrendo l'articolo la cosa è questa:

c'è una immagine con due parole storpiate: una di queste è ben nota al sistema, l'altra invece è una di quelle che l'ocr non ha capito.
La logica del filtro dà in ogni caso l'ok se un utente decifra esattamente la parola nota e poi si limita a registrare l'interpretazione di quella ignota qualsiasi essa sia (suppongo.. evitando magari di registrare quelle palesemente false).

Per poter postare un commento sul blog basta interpretare correttamente la solo parola nota.

LUVІ
19-08-2008, 22:23
a quanto ho capito io scorrendo l'articolo la cosa è questa:

c'è una immagine con due parole storpiate: una di queste è ben nota al sistema, l'altra invece è una di quelle che l'ocr non ha capito.
La logica del filtro dà in ogni caso l'ok se un utente decifra esattamente la parola nota e poi si limita a registrare l'interpretazione di quella ignota qualsiasi essa sia (suppongo.. evitando magari di registrare quelle palesemente false).

Per poter postare un commento sul blog basta interpretare correttamente la solo parola nota.

Ah, non avevo capito questa cosa.... comunque mi sembra piuttosto assurdo che possa funzionare..... a meno che non lo si sappia prima.

LuVi

bjt2
21-08-2008, 17:09
Ah, non avevo capito questa cosa.... comunque mi sembra piuttosto assurdo che possa funzionare..... a meno che non lo si sappia prima.

LuVi

Anche io ho letto quell'articolo. Mi sembra di capire che funzioni così:

Normalmente i captcha sono quelli standard di cui è nota la "traduzione".
Occasionalmente il captcha dato ad un ignaro utente è una parola tra quelle che l'OCR non è stato in grado di riconoscere. In buona fede l'ignaro utente penserà che il captcha è autentico e darà la traduzione corretta (si spera), anche se in realtà il sito accetterebbe due o tre parole diverse come vere (quelle tra cui l'OCR è indeciso). Il software prima di validare la traduzione della parola aspetta di darla in pasto ad almeno 3 utenti. La traduzione accettata è quella data da almeno 3 persone.