Home Mokslas ir technologijos Svetainės kaltina dirbtinio intelekto paleidimą „Anthropic“ apeinant jų apsaugos nuo įbrėžimų taisykles...

Svetainės kaltina dirbtinio intelekto paleidimą „Anthropic“ apeinant jų apsaugos nuo įbrėžimų taisykles ir protokolą

19
0


Laisvai samdomas darbuotojas apkaltino „Anthropic“, kuriant Claude didžiųjų kalbų modelius sukurtą dirbtinio intelekto startuolį, ignoruojant savo robots.txt protokolą „nenuskaityti“, kad nuskaitytų savo svetainių duomenis. Tuo tarpu „iFixit“ generalinis direktorius Kyle’as Wiensas teigė, kad „Anthropic“ nepaisė svetainės politikos, draudžiančios jos turinį naudoti AI modelių mokymams. Mattas Barrie, Freelancer vykdomasis direktorius, papasakojo Informacija kad Anthropic’s ClaudeBot yra “iki šiol agresyviausias grandiklis”. Teigiama, kad jo svetainė per keturias valandas sulaukė 3,5 milijono apsilankymų iš bendrovės tikrinimo programos, o tai yra „tikriausiai penkis kartus daugiau nei antrosios AI tikrinimo programos“. Panašiai ir Wiens paskelbta X/Twitter kad „Anthropic“ robotas per 24 valandas milijoną kartų pataikė į „iFixit“ serverius. „Jūs ne tik naudojate mūsų turinį nemokėdami, bet ir susiejate mūsų „devops“ išteklius“, – rašė jis.

Dar birželio mėn. Laidinis kaltinamasis kita AI įmonė „Perplexity“ tikrina savo svetainę, nepaisant Robots Exclusion Protocol arba robots.txt. Faile robots.txt paprastai pateikiamos instrukcijos žiniatinklio tikrintuvams, kuriuos puslapius jie gali pasiekti, o kuriuos – ne. Nors reikalavimų laikymasis yra savanoriškas, blogi robotai dažniausiai to nepaiso. Po to Laidiniai gabalas pasirodė startuolis TollBit, jungiantis dirbtinio intelekto įmones su turinio leidėjais, pranešė, kad ne tik Perplexity apeina robots.txt signalus. Nors vardų neįvardijo, Business Insider teigė sužinojusi, kad „OpenAI“ ir „Anthropic“ taip pat nepaisė protokolo.

Barrie sakė, kad laisvai samdomas darbuotojas iš pradžių bandė atmesti roboto prieigos užklausas, bet galiausiai turėjo visiškai užblokuoti Anthropic tikrintuvą. „Tai yra baisus įbrėžimas (dėl kurio) lėtėja svetainė visiems, kurie joje dirba, ir galiausiai daro įtaką mūsų pajamoms“, – pridūrė jis. Kalbant apie „iFixit“, Wiensas teigė, kad svetainė nustatė pavojaus signalus dėl didelio srauto, o jo žmonės pabudo 3 val. ryto dėl Anthropic veiklos. Bendrovės tikrinimo programa nustojo grandyti „iFixit“, kai į ją įtraukė eilutę robots.txt failą kuri neleidžia Anthropic’s boto, ypač.

AI startuolis papasakojo Informacija kad ji gerbia robots.txt ir kad jos tikrinimo programa „gerbė šį signalą, kai iFixit jį įdiegė“. Jame taip pat teigiama, kad siekiama „minimalių trikdžių, atsižvelgiant į tai, kaip greitai (nuskaityti) tuos pačius domenus“, todėl dabar tiria atvejį.

Dirbtinio intelekto įmonės naudoja tikrinimo programas, kad rinktų turinį iš svetainių, kuriuos jos gali panaudoti mokydamos savo generuojančias dirbtinio intelekto technologijas. Jie buvo kelių ieškinių taikinys dėl to leidėjai apkaltino juos autorių teisių pažeidimu. Siekdamos užkirsti kelią daugiau ieškinių, tokios įmonės kaip OpenAI sudarė sandorius su leidėjais ir svetainėmis. „OpenAI“ turinio partneriai iki šiol apima Naujienos Corp, „Vox Media“.į Finansiniai laikai ir Reddit. Panašu, kad „iFixit’s Wiens“ yra atviras idėjai pasirašyti susitarimą dėl „kaip pataisyti“ svetainės straipsnių, taip pat tviteryje pranešdamas „Anthropic“, kad nori pasikalbėti apie turinio licencijavimą komerciniam naudojimui.