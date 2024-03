Ono što predstavlja srž problema prvenstveno se odnosi na baze podataka koje se koriste za strojno učenje. Kada je prije otprilike 20-ak godina Google počeo digitalizirati knjige, čitavo vrijeme inzistiralo se na tome kako se digitalizacija provodi da bi se bogata knjižna građa učinila dostupna u svim dijelovima svijeta. anas, desetljećima kasnije, gotovo pa ispada kako je osnovni cilj tog projekta bilo građenje bogate LLM (large language model) baze koja će poslužiti za treniranje Google Barda, izravne konkurencije ChatGPT alatu. U različitim zemljama i dalje se vode brojne parnice na temu povrede autorskog prava i prava izdavača u vezi onoga što Google (i brojne druge kompanije) svakodnevno i bez prekida rade. Brojni autori i izdavači tvrde da se i dalje radi o čistoj krađi.

Američki Vrhovni sud u jednom je sada već starijem predmetu utvrdio kako to što Google radi predstavlja fair use korištenje tuđih autorskih djela bez dopuštenja autora. No, kako se LLM baze, baš kao i njemačka LAION baza, sve više počinju komercijalno eksploatirati, postavlja se opravdano pitanje može li navedeni sudski presedan opstati u realnosti kojoj svjedočimo posljednjih nekoliko godina. Bug