Home Mokslas ir technologijos Tinklalapiai kaltina dirbtinio intelekto paleidiklį „Anthropic“, kad jis nepaisė savo taisyklių ir...

Tinklalapiai kaltina dirbtinio intelekto paleidiklį „Anthropic“, kad jis nepaisė savo taisyklių ir protokolo, apsaugančių nuo įbrėžimų

37
0


Laisvai samdomas vertėjas apkaltino Anthropic, AI startuolį, sukurtą puikių Klodo kalbos modelių, ignoruojant savo robots.txt „nesekimo“ protokolą, kad būtų galima nuskaityti duomenis iš savo svetainių. Tuo tarpu „iFixit“ generalinis direktorius Kyle’as Wiensas teigė, kad „Anthropic“ nepaisė svetainės politikos, draudžiančios jos turinį naudoti mokant dirbtinio intelekto modelius. Mattas Barrie, Freelancer vykdomasis direktorius, sakė Informacija kad Anthropic’s ClaudeBot yra „agresyviausias grandiklis“. Pranešama, kad jos svetainė per keturias valandas sulaukė 3,5 milijono apsilankymų iš bendrovės tikrinimo programos, o tai „tikriausiai penkis kartus viršija antrojo AI tikrinimo programos apimtį“. Panašiai ir Viena paskelbta X/Twitter kad „Anthropic“ robotas per 24 valandas milijoną kartų pataikė į „iFixit“ serverius. „Jūs ne tik naudojate mūsų turinį nemokėdami, bet ir naudojate mūsų „Devops“ išteklius“, – rašė jis.

Birželį, Kaltinamasis prisijungė kitai dirbtinio intelekto įmonei „Perplexity“ neleidžiama tikrinti jūsų svetainės, nepaisant Robots Exclusion Protocol arba robots.txt. Robots.txt faile paprastai pateikiamos instrukcijos žiniatinklio tikrintuvams apie tai, kuriuos puslapius jie gali pasiekti ir kurių negali pasiekti. Nors reikalavimų laikymasis yra savanoriškas, kenkėjiški robotai į tai dažniausiai nepaiso. Po to Laidinis gabalas buvo išleistas, startuolis TollBit, jungiantis dirbtinio intelekto įmones su turinio leidėjais, pranešė, kad ne tik Perplexity ignoruoja robots.txt signalus. Nors vardų neįvardijo, Business Insider sakė atradęs, kad „OpenAI“ ir „Anthropic“ taip pat nepaisė protokolo.

Barrie sakė, kad laisvai samdomas darbuotojas iš pradžių bandė atmesti roboto prieigos užklausas, bet galiausiai turėjo visiškai užblokuoti Anthropic tikrintuvą. „Tai akivaizdus iškrapštymas (kuris) sulėtina svetainės veikimą kiekvienam joje dirbančiam asmeniui ir galiausiai daro įtaką mūsų pajamoms“, – pridūrė jis. Kalbant apie „iFixit“, Wiensas teigė, kad svetainė nustatė pavojaus signalus esant dideliam srautui ir kad jos darbuotojai buvo pažadinti 3 val. ryto dėl Anthropic veiklos. Bendrovės tikrinimo programa nustojo grandyti „iFixit“, kai prie jos pridėjo eilutę Arquivo robots.txt kuri ypač draudžia antropinį robotą.

AI paleidėjas sakė Informacija kad ji gerbia robots.txt ir kad jo tikrinimo programa „gerbė šį signalą, kai „iFixit“ jį įdiegė. Ji taip pat teigė, kad siekiama „minimalių trikdžių, nes yra atsargūs, kaip greitai tikrina tuos pačius domenus“, todėl dabar tiria atvejį.

AI įmonės naudoja tikrinimo programas, kad rinktų turinį iš svetainių, kuriuos jos gali naudoti mokydamos savo generuojančias dirbtinio intelekto technologijas. Dėl to jie buvo kelių ieškinių taikiniu, leidėjai juos apkaltino autorių teisių pažeidimu. Siekdamos išvengti tolesnių ieškinių, tokios įmonės kaip OpenAI sudarė sandorius su leidėjais ir svetainėmis. „OpenAI“ turinio partneriai iki šiol yra „News Corp“, „Vox Media“, Finansiniai laikai ir Reddit. iFixit’s Wiens taip pat atrodo atviras idėjai pasirašyti susitarimą dėl svetainės straipsnių, kaip taisyti, straipsnių, tviteryje pranešdamas Anthropic, kad yra pasirengęs kalbėti apie turinio licencijavimą komerciniam naudojimui.