Le direttive specificate nel robots.txt non sono legge, sono un invito e sta al crawler decidere se rispettarle o meno (spoiler: non le rispettano). Il NYT può chiedere per favore ai crawler di OpenAI di non sifonare contenuti, ma se ne sbattono e possono farlo comunque. Oltretutto, le vacche sono scappate dal recinto sin dal 2021: il corpus è già stato formato ed utilizzato.
__________________
CPU Intel Core i5-13600K GPU NVIDIA RTX 4080 FE 16GB MOBO MSI MAG Z690 Tomahawk COOLER Noctua NH-D15 chromax.black RAM Corsair Vengeance LPX 32GB DDR4-3200 CL16 NVMe Samsung 970 Evo Plus 1TB PSU Corsair RM1000x CASE Fractal North Charcoal NOTE gYwLW3ZvOkk
|