|
|
|
![]() |
|
Strumenti |
![]() |
#1 |
www.hwupgrade.it
Iscritto dal: Jul 2001
Messaggi: 75173
|
Link alla notizia: https://www.hwupgrade.it/news/web/me...ia_134519.html
Nuovi documenti rivelano che Meta potrebbe aver utilizzato materiale protetto da copyright per addestrare la sua intelligenza artificiale. La causa legale alimenta il dibattito sull'uso di contenuti pirata nello sviluppo di modelli linguistici avanzati, prassi che sembrerebbe decisamente diffusa. Click sul link per visualizzare la notizia. |
![]() |
![]() |
![]() |
#2 | ||
Senior Member
Iscritto dal: Jan 2008
Messaggi: 11122
|
Quote:
Quote:
Il problema principale qui probabilmente è il fatto di avere scaricato torrent pirata dall'azienda.
__________________
CPU Intel i7-12700K ~ Cooler Noctua NH-D15S ~ Motherboard MSI PRO Z690-A WIFI DDR4 ~ RAM Corsair Vengeance LPX 64 GB DDR4-3600
GPU MSI GeForce RTX 3090 GAMING X TRIO 24G ~ SSD SK hynix Platinum P41 2TB + Samsung 990 Pro 4TB PSU Corsair RM850x ~ Case Fractal Design Define C ~ Display Dell U2412M (A00) + NEC EA231WMi ~ OS ∞ |
||
![]() |
![]() |
![]() |
#3 |
Member
Iscritto dal: Jan 2005
Città: Roma
Messaggi: 85
|
Il problema non è la "compressione" di Tbyets di dati originali in Gbytes di "pesi" utilizzati dal motore IA. Il problema è il nesso di causalità tra i dati originari, coperti da copyright, rispetto al risultato. Il prodotto finale, rappresentato dai pesi del motore IA, non si sarebbe potuto originare senza l'utilizzo dei dati originari. Per i quali non si è avuta alcuna autorizzazione all'utilizzo, oltre ovviamente al corrispettivo economico
Il c.d. "Fair use" cui si appellano i vari produttori di motori IA, è solo una scusa per giustificare la loro pesca a strascico e, soprattutto, l'utilizzo che di tale conoscenza viene fatto. |
![]() |
![]() |
![]() |
#4 |
Senior Member
Iscritto dal: Jan 2008
Messaggi: 11122
|
La compressione è un punto chiave del'argomento, perché a tali livelli è per forza di cose lossy, con perdita molto elevata; non è possibile riprodurre con un normale LLM i dati di addestramento originali parola per parola, se non di brevi frammenti di passaggi citati innumerevoli volte in giro per il web.
Il fair use riguarda la redistribuzione in forma parziale dei lavori originali coperti da copyright senza richiedere autorizzazione. Con un LLM non redistribuisci i dati originali, ma al limite un estratto assai digerito.
__________________
CPU Intel i7-12700K ~ Cooler Noctua NH-D15S ~ Motherboard MSI PRO Z690-A WIFI DDR4 ~ RAM Corsair Vengeance LPX 64 GB DDR4-3600
GPU MSI GeForce RTX 3090 GAMING X TRIO 24G ~ SSD SK hynix Platinum P41 2TB + Samsung 990 Pro 4TB PSU Corsair RM850x ~ Case Fractal Design Define C ~ Display Dell U2412M (A00) + NEC EA231WMi ~ OS ∞ |
![]() |
![]() |
![]() |
#5 | |
Senior Member
Iscritto dal: Jan 2007
Messaggi: 5943
|
Quote:
Un autore umano che legge libri altrui e poi ne trae ispirazione per scriverne di nuovi sulla stessa tematica non è la stessa cosa di una multinazionale che costruisce un modello linguistico usando migliaia di libri di autori diversi e che monetizza subito e nei modi più disparati (mentre un essere umano non è così rapido e non monetizza in così tanti modi diversi). |
|
![]() |
![]() |
![]() |
#6 |
Senior Member
Iscritto dal: Jan 2008
Messaggi: 11122
|
Puoi scaricare i pesi di Meta Llama ufficiali su HuggingFace o le versioni quantizzate dalla community dallo stesso sito e monetizzarci anche tu, volendo, o semplicemente usarli per svago/studio/curiosità.
Capirei al limite se i modelli fossero completamente chiusi e creati ad uso e consumo esclusivo dell'azienda (OpenAI, Anthropic...), ma in questo caso sono cosiddetti open-weight; non vedo come cercare di affossare Meta in merito possa portare benefici collettivi. Praticamente si va a colpire per questioni ideologiche una delle poche aziende con le risorse per addestrare regolarmente modelli di tale capacità (dai costi di addestramento complessivi di svariate decine di milioni di euro) e che simultaneamente rilascia pubblicamente anche i pesi; grande idea! I genii dell'UE non sono stati da meno e grazie a loro (con l'AI Act) molto probabilmente non vedremo Llama4 (o altri modelli open-weight da altre aziende, addestrati con dati coperti da copyright) ufficialmente in territorio Europeo.
__________________
CPU Intel i7-12700K ~ Cooler Noctua NH-D15S ~ Motherboard MSI PRO Z690-A WIFI DDR4 ~ RAM Corsair Vengeance LPX 64 GB DDR4-3600
GPU MSI GeForce RTX 3090 GAMING X TRIO 24G ~ SSD SK hynix Platinum P41 2TB + Samsung 990 Pro 4TB PSU Corsair RM850x ~ Case Fractal Design Define C ~ Display Dell U2412M (A00) + NEC EA231WMi ~ OS ∞ |
![]() |
![]() |
![]() |
#7 |
Senior Member
Iscritto dal: Sep 2001
Città: Saronno (VA)
Messaggi: 21538
|
Scusate la domanda niubba..
ma come fanno a sapere con cosa uno ha addestrato la propria IA? ![]()
__________________
DEMON77 La mia galleria su Deviant Art: http://aby77.deviantart.com/gallery/?catpath=/ |
![]() |
![]() |
![]() |
#8 | |
Senior Member
Iscritto dal: Jan 2008
Messaggi: 11122
|
Quote:
![]() Altrimenti, normalmente non è possibile tirare fuori libri parola per parola da un LLM generalistico, a meno che non sia addestrato espressamente per memorizzarne i contenuti al 100%, cosa che però non viene normalmente fatta, perché altrimenti il modello non sarebbe in grado di generare null'altro (e non sarebbe più generalistico) e poi perché comunque c'è un limite alla quantità di informazione che un LLM può memorizzare in questo modo; non è un database.
__________________
CPU Intel i7-12700K ~ Cooler Noctua NH-D15S ~ Motherboard MSI PRO Z690-A WIFI DDR4 ~ RAM Corsair Vengeance LPX 64 GB DDR4-3600
GPU MSI GeForce RTX 3090 GAMING X TRIO 24G ~ SSD SK hynix Platinum P41 2TB + Samsung 990 Pro 4TB PSU Corsair RM850x ~ Case Fractal Design Define C ~ Display Dell U2412M (A00) + NEC EA231WMi ~ OS ∞ Ultima modifica di s12a : 14-01-2025 alle 22:43. |
|
![]() |
![]() |
![]() |
#9 |
Senior Member
Iscritto dal: Jan 2008
Messaggi: 11122
|
__________________
CPU Intel i7-12700K ~ Cooler Noctua NH-D15S ~ Motherboard MSI PRO Z690-A WIFI DDR4 ~ RAM Corsair Vengeance LPX 64 GB DDR4-3600
GPU MSI GeForce RTX 3090 GAMING X TRIO 24G ~ SSD SK hynix Platinum P41 2TB + Samsung 990 Pro 4TB PSU Corsair RM850x ~ Case Fractal Design Define C ~ Display Dell U2412M (A00) + NEC EA231WMi ~ OS ∞ |
![]() |
![]() |
![]() |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 23:22.