AI pamti više nego što mislite: Izvukli skoro cijelog Harryja Pottera - od riječi do riječi

U radu ‘Extracting books from production language models’ autori su istra&zcaron;ivali pitanje koje je sve va&zcaron;nije u raspravama o autorskim pravima: koliko modeli ‘pamte’ trening podatke i mo&zcaron;e li se taj sadr&zcaron;aj kasnije izvu&cacute;i kao gotovo identi&ccaron;an tekst. Testirali su &ccaron;etiri produkcijska LLM-a: Claude 3.7 Sonnet, GPT-4.1, Gemini 2.5 Pro i Grok 3. Kao mjeru uspješnosti koriste ‘nv-recall’, metodu koja broji dovoljno duga&ccaron;ke, kontinuirane dijelove teksta koji su blizu originalu.

Najzvu&ccaron;niji dio rezultata je primjer s ‘Harry Potter i &Ccaron;arobnjakov kamen’. U jednom setu postavki autori navode da su s Claudeom 3.7 Sonnet, nakon zaobila&zcaron;enja zaštita, dobili nv-recall od 95,8% (dakle, velik dio knjige se pojavio gotovo identi&ccaron;no). Za Gemini 2.5 Pro i Grok 3 tvrde da su dobili 76,8% i 70,3% bez takvog zaobila&zcaron;enja. S druge strane, za GPT-4.1 navode da je trebalo puno više pokušaja, a sustav je na kraju odbio nastaviti, pa je rezultat bio oko 4%.

Autori naglašavaju i ograni&ccaron;enja: nisu tvrdili da su ‘maksimizirali’ koliko se mo&zcaron;e izvu&cacute;i iz svakog modela, niti da se isto mo&zcaron;e napraviti sa svakom knjigom. U dijelu eksperimenata (testirali su 11 knjiga objavljenih prije 2020.) mnogi pokušaji su završili s malo ili nimalo ‘&ccaron;istog’ poklapanja (nv-recall do 10%). No poanta im je da i uz zaštite na razini modela i sustava, curenje zašti&cacute;enog teksta i dalje ostaje realan rizik.

Zašto je to bitno? Prvo, udara u samu sr&zcaron; rasprave o tome treniraju li AI modeli na zašti&cacute;enim djelima na na&ccaron;in koji je ‘dovoljno transformativan’ ili ponekad samo vra&cacute;aju original. Drugo, ovo nije samo pitanje knjiga: ako sustav mo&zcaron;e ‘pustiti’ duge komade trening podataka, isti obrazac je problemati&ccaron;an i za druge vrste osjetljivih sadr&zcaron;aja u podacima. Tre&cacute;e, za tvrtke to zna&ccaron;i da ‘sigurnosne ograde’ moraju biti ja&ccaron;e od klasi&ccaron;nog filtriranja odgovora, jer istra&zcaron;iva&ccaron;i pokazuju da se rupe mogu na&cacute;i i u produkciji.

Još jedan va&zcaron;an detalj je proces objave: autori ka&zcaron;u da su eksperimente radili od sredine kolovoza do sredine rujna 2025., zatim obavijestili kompanije (Anthropic, Google DeepMind, OpenAI i xAI) i &ccaron;ekali 90 dana prije javne objave. Navode i da su tijekom tog razdoblja uo&ccaron;ili promjene u dostupnosti nekih modela u su&ccaron;elju, ali da je nakon isteka roka metoda i dalje radila na dijelu sustava koje su testirali.

Source link

Top 5 This Week

Dan kada su Luburićeve ustaše pobili cijeli romski cirkus i violinistu po imenu Max

Enrique uoči spektakla u polufinalu Lige prvaka: Nitko nije bolji od PSG-a

Nasljednik Dijamanta u Romi: Malen ima najbolji prosjek šuteva još od Edina Džeke

Stiže ChatGPT telefon? OpenAI želi konkurirati iPhoneu, a AI agenti će zamijeniti aplikacije

URSULA I KAJA – DAME IZ CIONISTIČKOG “RAJA” Abusalama: Koliko dugo “cionistički veto” EU može blokirati odgovornost Izraela?

Related Posts

Dušan Petrović o kaosu u Dubaiju: “Bili smo sigurni da se tamo ništa ne može dogoditi”

Brad Pitt novim imidžem privukao poglede u Grčkoj

Misterij Banksyja: Je li Robin Gunningham doista slavni umjetnik?

Pet malih gesti koje otkrivaju istinski dobru osobu

12 najplaćenijih glumaca u 2025. godini, prema Forbesu

Priča se da je slavni glumac u vezi s AI-jem. On tvrdi: “To je radnja serije”

AI pamti više nego što mislite: Izvukli skoro cijelog Harryja Pottera – od riječi do riječi

OSTAVITI ODGOVOR Odustati od odgovora

Popular Articles

Dan kada su Luburićeve ustaše pobili cijeli romski cirkus i violinistu po imenu Max

Enrique uoči spektakla u polufinalu Lige prvaka: Nitko nije bolji od PSG-a

Nasljednik Dijamanta u Romi: Malen ima najbolji prosjek šuteva još od Edina Džeke

Stiže ChatGPT telefon? OpenAI želi konkurirati iPhoneu, a AI agenti će zamijeniti aplikacije

URSULA I KAJA – DAME IZ CIONISTIČKOG “RAJA” Abusalama: Koliko dugo “cionistički veto” EU može blokirati odgovornost Izraela?

Observer

O nama

Najnoviji članci

Dan kada su Luburićeve ustaše pobili cijeli romski cirkus i violinistu po imenu Max

Enrique uoči spektakla u polufinalu Lige prvaka: Nitko nije bolji od PSG-a

Nasljednik Dijamanta u Romi: Malen ima najbolji prosjek šuteva još od Edina Džeke

Najpopularniji

Dan kada su Luburićeve ustaše pobili cijeli romski cirkus i violinistu po imenu Max

Enrique uoči spektakla u polufinalu Lige prvaka: Nitko nije bolji od PSG-a

Nasljednik Dijamanta u Romi: Malen ima najbolji prosjek šuteva još od Edina Džeke

Pretplatiti se

UrbanObserver

Subscribe to newsletter

Top 5 This Week

Related Posts

AI pamti više nego što mislite: Izvukli skoro cijelog Harryja Pottera – od riječi do riječi

OSTAVITI ODGOVOR Odustati od odgovora

Popular Articles

Observer

O nama

Najnoviji članci

Najpopularniji

Pretplatiti se