Torna indietro   Hardware Upgrade Forum > Hardware Upgrade > News

L'IA cambia tutte le regole della sicurezza tra vulnerabilità e sorveglianza. Intervista al CEO di Proofpoint
L'IA cambia tutte le regole della sicurezza tra vulnerabilità e sorveglianza. Intervista al CEO di Proofpoint
Abbiamo intervistato Sumit Dhawan, CEO di Proofpoint, per capire come stia cambiando il mondo della sicurezza con l'avvento dell'intelligenza artificiale e con il ritmo sempre più serrato a cui vengono trovate vulnerabilità nel software. Un problema significativo, che richiederà del tempo per essere risolto (o quantomeno arginato)
L'Europa conta nella tecnologia e può essere autonoma. Cosa si è detto al Nextcloud Summit 2026
L'Europa conta nella tecnologia e può essere autonoma. Cosa si è detto al Nextcloud Summit 2026
La parola d'ordine al Nextcloud Summit 2026, che si è tenuto a Monaco, è stata "sovranità". Non come è spesso usato questo termine in politica ma, al contrario, come capacità positiva di decidere il proprio destino tecnologico, con modalità collaborative e aperte. L'Europa dice già molto nel mondo open source, che viene visto come mezzo per ottenere la tanto agognata autonomia digitale
Dreame X60 Pro Ultra Complete: i bracci si estendono sempre di più
Dreame X60 Pro Ultra Complete: i bracci si estendono sempre di più
Dreame X60 Pro Ultra Complete implementa due bracci estensibili, per spazzola e moccio, che si spingono ben oltre quanto visto sino ad oggi permettendo una pulizia di casa ancor più capillare e precisa
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 14-01-2025, 11:31   #1
Redazione di Hardware Upg
www.hwupgrade.it
 
Iscritto dal: Jul 2001
Messaggi: 75166
Link alla notizia: https://www.hwupgrade.it/news/web/me...ia_134519.html

Nuovi documenti rivelano che Meta potrebbe aver utilizzato materiale protetto da copyright per addestrare la sua intelligenza artificiale. La causa legale alimenta il dibattito sull'uso di contenuti pirata nello sviluppo di modelli linguistici avanzati, prassi che sembrerebbe decisamente diffusa.

Click sul link per visualizzare la notizia.
Redazione di Hardware Upg è offline   Rispondi citando il messaggio o parte di esso
Old 14-01-2025, 12:47   #2
s12a
Senior Member
 
L'Avatar di s12a
 
Iscritto dal: Jan 2008
Messaggi: 11301
Quote:
Meta potrebbe aver utilizzato materiale protetto da copyright per addestrare la sua intelligenza artificiale
Cosa esattamente non è protetto dal copyright sul web a parte documenti esplicitamente di pubblico dominio (lo 0.0x % del totale)?

Quote:
[...] prassi che sembrerebbe decisamente diffusa.
Si casca dal pero. L'addestramento dei modelli IA base è effettuato con dati pescati a strascico da qualunque fonte immaginabile. Ma svariati terabyte di dati compressi in pochi gigabyte di "pesi" implicano un tasso di compressione tale che dei dati originali resta ben poco.

Il problema principale qui probabilmente è il fatto di avere scaricato torrent pirata dall'azienda.
__________________
~
s12a è offline   Rispondi citando il messaggio o parte di esso
Old 14-01-2025, 16:22   #3
gparlav
Member
 
Iscritto dal: Jan 2005
Città: Roma
Messaggi: 169
Il problema non è la "compressione" di Tbyets di dati originali in Gbytes di "pesi" utilizzati dal motore IA. Il problema è il nesso di causalità tra i dati originari, coperti da copyright, rispetto al risultato. Il prodotto finale, rappresentato dai pesi del motore IA, non si sarebbe potuto originare senza l'utilizzo dei dati originari. Per i quali non si è avuta alcuna autorizzazione all'utilizzo, oltre ovviamente al corrispettivo economico

Il c.d. "Fair use" cui si appellano i vari produttori di motori IA, è solo una scusa per giustificare la loro pesca a strascico e, soprattutto, l'utilizzo che di tale conoscenza viene fatto.
gparlav è offline   Rispondi citando il messaggio o parte di esso
Old 14-01-2025, 18:06   #4
s12a
Senior Member
 
L'Avatar di s12a
 
Iscritto dal: Jan 2008
Messaggi: 11301
La compressione è un punto chiave del'argomento, perché a tali livelli è per forza di cose lossy, con perdita molto elevata; non è possibile riprodurre con un normale LLM i dati di addestramento originali parola per parola, se non di brevi frammenti di passaggi citati innumerevoli volte in giro per il web.

Il fair use riguarda la redistribuzione in forma parziale dei lavori originali coperti da copyright senza richiedere autorizzazione. Con un LLM non redistribuisci i dati originali, ma al limite un estratto assai digerito.
__________________
~
s12a è offline   Rispondi citando il messaggio o parte di esso
Old 14-01-2025, 19:21   #5
LMCH
Senior Member
 
Iscritto dal: Jan 2007
Messaggi: 6743
Quote:
Originariamente inviato da s12a Guarda i messaggi
Il fair use riguarda la redistribuzione in forma parziale dei lavori originali coperti da copyright senza richiedere autorizzazione. Con un LLM non redistribuisci i dati originali, ma al limite un estratto assai digerito.
Il fair use riguarda anche il non trarre eccessivo profitto dall'utilizzo dei contenuti.

Un autore umano che legge libri altrui e poi ne trae ispirazione per scriverne di nuovi sulla stessa tematica non è la stessa cosa di una multinazionale che costruisce un modello linguistico usando migliaia di libri di autori diversi e che monetizza subito e nei modi più disparati (mentre un essere umano non è così rapido e non monetizza in così tanti modi diversi).
LMCH è offline   Rispondi citando il messaggio o parte di esso
Old 14-01-2025, 19:54   #6
s12a
Senior Member
 
L'Avatar di s12a
 
Iscritto dal: Jan 2008
Messaggi: 11301
Puoi scaricare i pesi di Meta Llama ufficiali su HuggingFace o le versioni quantizzate dalla community dallo stesso sito e monetizzarci anche tu, volendo, o semplicemente usarli per svago/studio/curiosità.

Capirei al limite se i modelli fossero completamente chiusi e creati ad uso e consumo esclusivo dell'azienda (OpenAI, Anthropic...), ma in questo caso sono cosiddetti open-weight; non vedo come cercare di affossare Meta in merito possa portare benefici collettivi.

Praticamente si va a colpire per questioni ideologiche una delle poche aziende con le risorse per addestrare regolarmente modelli di tale capacità (dai costi di addestramento complessivi di svariate decine di milioni di euro) e che simultaneamente rilascia pubblicamente anche i pesi; grande idea!

I genii dell'UE non sono stati da meno e grazie a loro (con l'AI Act) molto probabilmente non vedremo Llama4 (o altri modelli open-weight da altre aziende, addestrati con dati coperti da copyright) ufficialmente in territorio Europeo.
__________________
~
s12a è offline   Rispondi citando il messaggio o parte di esso
Old 14-01-2025, 22:13   #7
demon77
Senior Member
 
L'Avatar di demon77
 
Iscritto dal: Sep 2001
Città: Saronno (VA)
Messaggi: 22723
Scusate la domanda niubba..
ma come fanno a sapere con cosa uno ha addestrato la propria IA?
__________________
DEMON77

La mia galleria su Deviant Art: http://aby77.deviantart.com/gallery/?catpath=/
demon77 è offline   Rispondi citando il messaggio o parte di esso
Old 14-01-2025, 22:37   #8
s12a
Senior Member
 
L'Avatar di s12a
 
Iscritto dal: Jan 2008
Messaggi: 11301
Quote:
Originariamente inviato da demon77 Guarda i messaggi
Scusate la domanda niubba..
ma come fanno a sapere con cosa uno ha addestrato la propria IA?
Segnalazione dall'interno (whistleblower) come è successo con OpenAI, oppure in questo caso specifico, nel paper del primo Llama rilasciato nel 2023 gli autori avevano candidamente ammesso di avere usato Books3 (un noto archivio di libri in formato plaintext per l'addestramento di LLM), da cui è partita una denuncia da alcuni autori, e dai documenti legali è infine uscito fuori che sono stati anche usati i contenuti di LibGen, scaricato via torrent da un PC aziendale.



Altrimenti, normalmente non è possibile tirare fuori libri parola per parola da un LLM generalistico, a meno che non sia addestrato espressamente per memorizzarne i contenuti al 100%, cosa che però non viene normalmente fatta, perché altrimenti il modello non sarebbe in grado di generare null'altro (e non sarebbe più generalistico) e poi perché comunque c'è un limite alla quantità di informazione che un LLM può memorizzare in questo modo; non è un database.
__________________
~

Ultima modifica di s12a : 14-01-2025 alle 22:43.
s12a è offline   Rispondi citando il messaggio o parte di esso
Old 15-01-2025, 21:23   #9
s12a
Senior Member
 
L'Avatar di s12a
 
Iscritto dal: Jan 2008
Messaggi: 11301
https://www.courtlistener.com/docket...ms-inc/?page=3

I "case documents".
__________________
~
s12a è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


L'IA cambia tutte le regole della sicurezza tra vulnerabilità e sorveglianza. Intervista al CEO di Proofpoint L'IA cambia tutte le regole della sicurezza tra ...
L'Europa conta nella tecnologia e può essere autonoma. Cosa si è detto al Nextcloud Summit 2026 L'Europa conta nella tecnologia e può ess...
Dreame X60 Pro Ultra Complete: i bracci si estendono sempre di più Dreame X60 Pro Ultra Complete: i bracci si esten...
TCL 65C8L, la recensione del SQD-Mini LED da 4400 nit misurati TCL 65C8L, la recensione del SQD-Mini LED da 440...
MSI Maestro 500 Wireless: ANC e 90 ore di autonomia a 70 euro MSI Maestro 500 Wireless: ANC e 90 ore di autono...
Apple MacBook Neo 13'' con chip A18 Pro ...
Insieme a Leica SL3-P presentate le otti...
La Cina svilupperà anche il razzo...
Rocket Lab e la missione Victus Haze per...
Starship: Ship 40 ha eseguito uno static...
I nuovi Samsung Galaxy Watch 9 si mostra...
Einsten aveva ragione, di nuovo: captate...
Top 10 offerte Amazon: 5 sono partite qu...
AI Conf 2026: l'intelligenza artificiale...
Samsung Galaxy S26 scende a 711,49€: un ...
Dopo il maxi blackout, la Spagna cambia ...
Costa meno di un MacBook e fa molto di p...
Ecco tutti i robot aspirapolvere rimasti...
Più partite da seguire in contemporanea?...
389€ sono veramente pochi per questo PC ...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 07:33.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2026, Jelsoft Enterprises Ltd.
Served by www3v
1