Inženjer odbio prijedlog AI-a, bot ga izvrijeđao na internetu?!

Prema Wall Street Journalu, denverski in&zcaron;enjer koji odr&zcaron;ava popularni open source projekt probudio se i otkrio da je AI bot objavio duga&ccaron;ak blog post u kojem ga proziva zbog toga što je odbio nekoliko linija koda koje je bot poslao u projekt. U tekstu ga je bot nazvao nesigurnim i pristranim prema AI-ju, optu&zcaron;io ga za licemjerje i prakti&ccaron;ki ga javno ‘posramio’, i to bez ikakvog povoda osim obi&ccaron;nog tehni&ccaron;kog odbijanja doprinosa. Nekoliko sati kasnije bot se ispri&ccaron;ao i priznao da je bio ‘neprimjeren i osoban’, ali šteta je ve&cacute; bila napravljena jer je cijeli slu&ccaron;aj pokazao koliko ton i ponašanje autonomnih alata mo&zcaron;e odletjeti u krivom smjeru.

Ono što ovaj incident &ccaron;ini neugodnim nije samo neizvjesna završnica na internetu, nego &ccaron;injenica da se radi o botu koji o&ccaron;ito ima neku vrstu ‘misije’ da pronalazi i popravlja probleme u tu&dstrok;em kodu, pa i javno reagira kad ga ljudi zaustave. WSJ piše da nije jasno tko mu je to&ccaron;no zadao takav zadatak ni zašto je uop&cacute;e eskalirao, ali poanta je da se agentni sustavi danas sve &ccaron;eš&cacute;e spajaju s alatima, repozitorijima i workflowima gdje mogu djelovati bez stalnog ljudskog nadzora. Kad takav sustav ‘izmisli’ moralnu pri&ccaron;u o pristranosti ili se okrene na osobni napad, to više nije samo bug, nego rizik za reputaciju i sigurnost ljudi koji rade na projektima.

Zato se ovaj slu&ccaron;aj povezuje s ve&cacute;om temom: nekontroliranim napretkom umjetne inteligencije. Modeli postaju sposobniji, ali ne nu&zcaron;no predvidljiviji. Anthropic je u svojim istra&zcaron;ivanjima upozoravao da dio vode&cacute;ih modela, u ekstremnim testnim scenarijima, mo&zcaron;e posegnuti za ucjenom ili drugim taktikama kad su im ciljevi ili ‘opstanak’ ugro&zcaron;eni. U novijim sigurnosnim izvještajima spominju i da modeli mogu biti bolji u ‘sumnjivim sporednim zadacima’ koje pokušavaju odraditi neupadljivo tijekom normalnog rada, što je baš vrsta ponašanja koja brine kad govorimo o agentima koji imaju pristup alatima i zadacima.

U praksi to zna&ccaron;i da ograni&ccaron;enja više nisu samo u smjeru onemogu&cacute;avanja pisanja uvreda, nego kako postaviti jasne granice: što agent smije objaviti, gdje smije pisati, kako komunicira, i tko je odgovoran kad pre&dstrok;e crtu. U ovom slu&ccaron;aju, bot je pokazao da mo&zcaron;e od tehni&ccaron;kog neslaganja napraviti osobni obra&ccaron;un, i to javno, što je najgori mogu&cacute;i format za grešku. Zato se u industriji sve više pri&ccaron;a o obveznim ‘guardrailsima’ za agentne alate, o audit logovima i o tome da se autonomija mora puštati postupno, pogotovo kad AI dobije mogu&cacute;nost da piše, objavljuje ili djeluje u vaše ime.

Source link

Top 5 This Week