On 4/13/23 12:49, Giacomo Tesio wrote:
Basta imporre che tutti i dataset utilizzati durante la programmazione
statistica
("training" nella vulgata), inclusi quelli usati per la cross validation e il
test, nonché tutti gli
altri dati necessari a riprodurre esattamente il processo ed ottenere
esattamente il modello
in produzione (e le sue alternative scartate), siano preservati per tutta la
durata della sua permanenza in produzione e diciamo 20 anni dopo (in caso di
aggiornamento). [1]
Rendendo verficabilmente e completamente riproducibile il processo di
programmazione
statistica, Open AI (come chiunque altro) potrà facilmente dimostrare di non
aver utilizzato dati
ottenuti in violazione di qualsisi Legge.
Ciao Giacomo,
una cosa così?
<https://venturebeat.com/ai/databricks-releases-dolly-2-0-the-first-open-instruction-following-llm-for-commercial-use/>.
<https://github.com/databrickslabs/dolly/tree/master/data>.
D.
(null)
_______________________________________________
nexa mailing list
[email protected]
https://server-nexa.polito.it/cgi-bin/mailman/listinfo/nexa