A világ népességének arcképe egyetlen cégnél
A képek ura
Kevesen tudják, ha bárki valaha is megosztott magáról, családjáról, barátairól, munkatársairól fotót a közösségi médiában, vagy egyszerűen tudtán kívül készült róla kép és felkerült a világhálóra, már benn is van az amerikai vállalat, a Clearview AI Inc. adatbázisában. A tömeges arcfelismerő technológia a világ szinte teljes népességének az arcát kezeli, jelenleg 60 milliárd képpel dolgozik az algoritmusa. Belebukunk-e a hiúság vásárába, abba, hogy szeretnénk minél jobb képet mutatni magunkról a közösségi médiában? Segíthet-e az önkorlátozás, az adatvédelmi beállítás?
A Clearview AI Inc. egy amerikai vállalat, amely 2017-ben alakult, még a nagy MI-boom előtt, és tömeges arcfelismerő technológia kifejlesztését tűzte ki céljául. A cég szoftvere lehetővé teszi, hogy egy feltöltött arcképet összehasonlítsanak egy hatalmas, interneten gyűjtött adatbázissal, amelyben most, 2025 júniusában már több mint 60 milliárd fénykép található – mondta a Demokratának a Jaczkovics Ügyvédi Iroda MI-szakértője.
Krámli Gergely szerint a Clearview AI a képeket olyan népszerű közösségi oldalakról gyűjti, mint a Facebook, Instagram, Twitter, YouTube és LinkedIn, ezen kívül más nyilvános weboldalakról, beleértve híroldalakat, oktatási intézmények honlapjait, munkahelyi honlapokat, kereshető bűnügyi adatbázisokat. Ezek nem profilképek, bárki, aki rajta van, bekerül a rendszerbe.
A The Washington Post szerint a Clearview AI adatbázisával az a legnagyobb gond, hogy a közösségi hálózatokról és más online forrásokból a weboldalak vagy a lefényképezett személyek beleegyezése nélkül szedi le a képeket. A Facebook, a Google, a Twitter és a YouTube több ízben követelte a cégtől, hogy hagyja abba a fotók letöltését, és törölje a korábban készülteket. A Clearview azzal érvelt, hogy adatgyűjtését az amerikai alkotmány első alkotmánymódosítása védi.
Az első alkotmánymódosítása a szólás-, vallás-, sajtó- és gyülekezési szabadságot, valamint a petíciós jogot biztosítja. A módosítás szövege a következő: „A kongresszus nem hozhat törvényt, amely vallásalapítást szorgalmaz; vagy amely megtiltja a szabad vallásgyakorlást; vagy amely korlátozza a szólásszabadságot vagy a sajtószabadságot; vagy a nép jogát a békés gyülekezésre és a kormányhoz intézett panaszok orvoslása végett petíció benyújtására.”
A Washington Post megkereste a céget, de csak egy rövid nyilatkozatot kaptak a Clearview alapító-vezérigazgatójától, Hoan Ton-Thattól, miszerint a Clearview AI nyilvános képeket tartalmazó adatbázisát jogszerűen gyűjtik, akárcsak bármely más keresőmotorét, beleértve a Google-t is. Adatbázisukat bűnüldöző szervek használják a bűncselekmények elkövetőinek azonosításában.
Problémás kivitelezés
Krámli Gergely szerint eredetileg valóban az volt a magasztos cél, legalábbis így állították be, hogy a bűnüldözési hatóságok munkáját segítsék olyan emberek megtalálásában, ahol már például a rendőrségi adatbázisok nem segítenek. Itt nem arra kell gondolni, hogy kifejezetten portréfotókat keresne az algoritmus, hanem olyan képeket, amelyen emberi arcok találhatók. Tehát ha valaki nem is akar fenn lenni a közösségi médiában, akkor is bekerülhet az adatbázisba, ha az ismerősei róla is osztanak meg képet.
Ám kardinális gond az egészben, ha az adatbázis vélhetően jogszerűtlenül van felépítve és ekként is bővül folyamatosan és gyakorlatilag külön ellenőrzés nélkül bárki bármilyen célra használhatja. Nem kérnek hozzájárulást, nem adnak semmiféle tájékoztatást. És lényegében bárki használhatja, csupán regisztrálnia kell. Használhatják azok is, akik céljai éppen szöges ellentétben állnak a bűnüldözési hatóságokéival. Használhatják diktatórikus rezsimek politikai ellenfeleik, az ellenzék felkutatása végett. Sőt, Kanadában megtörtént, hogy a rendőrség úgy használta az algoritmust, hogy még saját vezetőik sem tudtak róla. A Clearview AI-t az orosz–ukrán háborúban is aktívan felhasználják, elsősorban az orosz beszivárgó ügynökök és katonák, valamint holttestek azonosítására. A cég kétmilliárd fényképet gyűjtött össze orosz közösségi oldalakról.
Így működik
Az algoritmus nemcsak az emberi arcot azonosítja, hanem metaadatokat is társít hozzájuk (például a kép eredeti URL-jét vagy geolokációs információkat), amelyek segíthetnek az egyén azonosításában. Így meg lehet találni a keresett személy, rögzíteni lehet, hogy például Colorado államban, ilyen és ilyen szórakozóhelyen járt.
A folyamat a következőképpen néz ki. Az adatokat automatizált eszközökkel, tömegesen szerzik meg úgynevezett „scraping” módszerrel, ami magyarul lekaparásnak fordítható. Az algoritmus matematikai szempontból értelmezhető vektorokká alakítja az emberi arcokat is tartalmazó képeket, majd keresést folytat a saját rendszerében, hogy megtalálja az adott személyt más fotókon is, utána eszerint csoportosít.

Az arcfelismerés a mesterséges intelligencia egy formája, amely az emberi arcok felismerésére képes emberi képességet utánozza. Akár az ember, a szoftver is arcvonásokat rögzít és arcfelismerési mintákat hoz létre, amelyeket az illető személy azonosítására vagy csoportosítására használ. Hétköznapi nyelven az arc részeinek összességéből készít kivonatot, hiszen a szem, az orr, a fül mérete külön-külön százezrek esetében lehet hasonló, ám olyan nincs, hogy minden terület egyezzen. Az egésznek pedig a rengeteg adat az alapja, akár a mesterséges intelligencia esetében. Természetesen a tévedés nincs kizárva, hiszen például a biztonsági kamerák nagyon rossz felvételeket készíthetnek – magyarázta a szakértő.
Felmerül a kérdés, miért nem épít hasonló rendszer például az FBI, a DEA. Ennek magyarázata, hogy a szolgáltatás évi 18 ezer dollár, és ezt sokkal könnyebb kifizetni. És bár az GDPR, az európai általános adatvédelmi rendelet alapján eddig összesen mintegy 40 milliárd forintnyi bírságot szabott többek közt a brit, az olasz, a francia, a holland adatvédelmi hatóság, a Clearview AI számára ez nem visszatartó erő.
A világ arca és az önkorlátozás
A cég azzal is érvel, hogy hozzájuk hasonlóan működik a Facebook, a Google, a Messenger, személyre szabott üzeneteket, reklámokat küldenek internetes kutakodásunk, szörfölésünk alapján, és ehhez sem kérik senki hozzájárulását. Mit lehet tenni, vagyunk nyolcmilliárdnyian a Földön, a Clearview AI birtokában van 60 milliárd fénykép, amihez havonta másfél milliárd újabbat gyűjt. Vagyis, kis túlzással, a világ népességének arca felett diszponálnak. Belebukunk-e a hiúság vásárába, abba, hogy szeretnénk minél jobb képet mutatni magunkról a közösségi médiában, és nyakló nélkül posztolunk? Mi lehet a megoldás?

Krámli Gergely szerint segíthet az önkorlátozás, ez tűnik a legbiztosabb módszernek, igenis gondoljuk meg, hogy mit miért rakunk ki. Léteznek adatvédelmi beállítások, például a Facebookon is, hogy a képeket csak egy szűk kör láthassa, idegenek pedig ne. A Clearview AI a teljesen nyilvános profilokat keresi, ezeknél nagyobb a merítési lehetőség, a kontroll nélküli képszerzés, és egy kis odafigyeléssel egyfajta falat tudunk felhúzni; nem biztos, hogy ezen át tudják „kaparni” magukat. És visszaköszön egy régi probléma, amely már számos területen előfordult: olyan gyors a technikai fejlődés, hogy a jogalkotás nem tudja kezelni; ahol egy problémát megold, két újabb üti föl a fejét – mondta végezetül a szakember.
A Proton AG arra hívja fel a felhasználók figyelmét hogy minden egyes feltöltött képpel a következőket kockáztatjuk: A megosztott fotók felett elveszítjük az irányítást. A mesterségesintelligencia-modellek beleegyezés nélkül is tanulhatnak a képekből. Például algoritmusok használhatják a belőlük leszűrt információkat, az emberek ruhájából, hajszínéből, abból, hogy hol készült a kép. Kicsit félelmetesnek tűnik: az adatok eladhatók vagy célzott reklámokhoz használhatók fel.
Az internet csapdájában című összeállításunk további cikkei ide kattintva olvashatók.
