Caro Stefano,

On Mon, 9 Sep 2024 11:33:44 +0200 Stefano Maffulli wrote:

> A me personalmente piacerebbe capire *perché*, prima di pensare a
> *se*, un LLM dovrebbe essere un'opera derivata dal dataset di
> addestramento. 

La realtà può non piacerci, ma rimane pur sempre reale.

Un LLM è un'opera derivata dai dataset utilizzati durante la sua
programmazione.

Una volta compreso questo (piuttosto ovvio) concetto, possiamo
ragionare se le normative vigenti vadano modificate a vantaggio
delle grandi aziende che vogliono sfruttare gratuitamente tali 
opere per produrre software opachi che ne riproducono gli interessi
ovunque vengono eseguiti, o meno.

> Ovvero, avendo come obiettivo la diffusione della
> conoscenza, è collettivamente positivo per la società  pensare che
> opere di creatività debbano essere coperte da diritti esclusivi nuovi
> (o estensione di quelli vecchi --diritto d'autore, marchi, ecc) 
> prima di poter essere trasformate in token e passati in pasto
> all'addestramento automatico?

Non sono certo di comprendere cosa tu intenda con questa frase.

Esimere dal rispetto della Legge chi usa proxy software per violare
i diritti altrui è deleterio sia per le vittime che per la società.

D'altro canto, nessuno vuole impedire, ad esempio, la creazione di
software come GitHub CopyALot: l'importante è che tali software e i
software che includono i loro output rispettino i diritti degli autori
che hanno contribuito alla loro creazione e le licenze che li veicolano.


Ad esempio, Microsoft potrebbe riprogrammare un servizio come GitHub
Copilot utilizzando esclusivamente i sorgenti di cui detiene il
copyright (e quelli in pubblico dominio). In questo modo nessuno
(eccetto Microsoft) avrebbe diritto di lamentarsi per l'inclusione
di tali sorgenti in altri software, proprietari o meno.

Microsoft invece vuole violare liberamente il copyright altrui, 
ma si guarda bene dall'automatizzare la violazione del proprio!

Cui prodest?
(questa volta rispondere è proprio facile... ;-)


In qualunque caso non serve né estendere ne comprimere il diritto
d'autore, basta applicarlo come viene applicato a qualsiasi altro
software compilato a partire da testi.


Giacomo

Reply via email to