Penktadienio ataskaitoje teigiama, kad „Amazon“ tiria triukšmingą AI startuolį „Perplexity“, kuris tariamai pažeidė savo „Cloud“ skyriaus taisykles, netinkamai „išgrynindamas“ turinį iš kitų svetainių be leidimo.
„Perplexity“, kuri neseniai įvertino 3 milijardus dolerių, tariamai nepaiso gerai žinomo žiniatinklio standarto, vadinamo Robots Exclusion Protocol, paprastai vadinamu robots.txt, kurį naujienų leidėjai ir kitos svetainės naudoja norėdami parodyti automatiniams robotams, kuriuose puslapiuose jie nėra. leista grandyti, tech outlet Pranešta laidiniu būdu.
Nors įstatymai nereikalauja laikytis standarto, dauguma interneto įmonių pasirenka laikytis protokolo. Atitiktis taip pat privaloma svetainėms, kurios remiasi „Amazon Web Services“, pvz., „Perplexity“.
„AWS paslaugų teikimo sąlygos draudžia klientams naudotis mūsų paslaugomis bet kokiai neteisėtai veiklai, o mūsų klientai yra atsakingi už mūsų sąlygų ir visų taikomų įstatymų laikymąsi“, – sakoma „Amazon“ atstovo pranešime.
„Perplexity“ praktikos tikrinimas suaktyvėjo po to, kai „Forbes“ anksčiau šį mėnesį apkaltino bendrovę „tiesiogiai nuplėšiančių“ straipsnių parašė jos žurnalistai ir kiti CNBC ir Bloomberg, įskaitant tuos, kurie buvo už mokamų sienų.
„Wired“ kreipėsi į „Amazon“ po to, kai atliktas tyrimas nustatė, kad „Perplexity“ tariamai naudojo „neskelbtą IP adresą“, kad išgrynintų savo patronuojančios bendrovės „Condé Nast“ valdomas svetaines, nors ji bandė blokuoti prieigą.
Išparduotuvė teigė, kad kitų prekybos vietų atstovai, įskaitant „Forbes“, „New York Times“ ir „Guardian“, aptiko tą patį IP adresą, kuris lankosi jų serveriuose.
„The Post“ susisiekė su „Amazon“ dėl komentaro.
„Perplexity“ atstovė Sara Platnick atmetė „Wired“ ataskaitą ir pavadino ją „netiksliu“.
„Mūsų „PerplexityBot“, kuris veikia AWS, gerbia robots.txt, ir mes patvirtinome, kad „Perplexity“ valdomos paslaugos nenuskaito jokiu būdu, kuris pažeidžia AWS paslaugų teikimo sąlygas“, – sakoma Platnicko pranešime.
„AWS nagrinėjo WIRED žiniasklaidos užklausą kaip standartinio protokolo, skirto pranešimų apie piktnaudžiavimą AWS ištekliais, tyrimo dalį“, – pridūrė Platnickas. „Mes nieko negirdėjome iš AWS, kol WIRED reporteris susisiekė su jais. Teigti, kad AWS „tiria“ painiavą už šios konkrečios LAIDINĖS užklausos ribų, yra neteisinga. AWS yra vertingas „Perplexity“ partneris ir esame dėkingi už nuolatinį bendradarbiavimą.
Platnickas sakė „Wired“, kad „PerplexityBot“ apeitų robots.txt protokolą „labai retais atvejais“, kai vartotojas į savo užklausą įtrauks konkretų URL.
„Perplexity“ generalinis direktorius Aravindas Srinivasas anksčiau kritikavo „Wired“ išvadas ir tvirtino, kad jos „atspindi gilų ir esminį nesusipratimą, kaip veikia Perplexity ir internetas“.
„Forbes“ ėmėsi problemų dėl funkcijos, vadinamos „Perplexity Pages“ – produktu, kuriame rodomi „kuruojami“ straipsniai, kuriuose pateikiama informacija iš straipsnių, parašytų trečiųjų šalių naujienų leidinių.
Pradiniai autoriai nebuvo nurodyti vardais, net jei „Perplexity“ pranešimų formuluotė labai sutapo su šaltinio teksto formuluote.
Vietoj to, „Perplexity“ naudojo tai, ką „Forbes“ apibūdino kaip „mažus, lengvai nepastebimus logotipus“, susiejančius su pirminiais šaltiniais.
Viename baisiame pavyzdyje „Perplexity“ pokalbių robotas išleido versiją išskirtinis, mokamas „Forbes“ pranešimas apie buvusio „Google“ vadovo Erico Schmidto karinio drono projektą.
„Mūsų pranešimą apie Erico Schmidto slapto drono projektą šį rytą paskelbė @perplexity_ai“, Forbes vykdomasis redaktorius Johnas Paczkowskis rašė apie X tuo metu. „Tai atima didžiąją dalį mūsų pranešimų. Jame minimi mus ir kai kurie, kurie mus perrašė iš naujo, kaip šaltiniai, į kuriuos lengviausia nepaisyti.
Srinivasas sakė, kad įrankis „turi šiurkščius kraštus“, bet kitaip neigė padaręs nusikaltimą.