AI adatvédelem: hová kerül valójában a céged adata?
Az első kérdés, amit egy magyar cég jogi vagy IT-biztonsági csapata feltesz egy AI projektnél: 'hová kerül az adatunk?' Jogos kérdés, és a válasz nem 'sehova' és nem is 'mindenhova' — hanem egy konkrét, megtervezhető adatfolyam. Ez a cikk lebontja, mi történik valójában a céges adattal egy jól megépített AI rendszerben.
Hová kerül az adat egy LLM-hívásnál?
Amikor a rendszer egy LLM-et hív (zárt API esetén), a prompt — beleértve a kontextusba tett adatot — elmegy a modell-szolgáltatóhoz (OpenAI, Anthropic, Google), lefut az inference, és visszajön a válasz. A kérdés nem az, hogy 'elmegy-e' — hanem hogy a szolgáltató mit csinál vele: eltárolja-e, tanít-e rajta, melyik régióban dolgozza fel.
Zero-retention: a kulcs-szerződéses feltétel
Az enterprise szerződések (OpenAI Enterprise, Anthropic Enterprise) zero data retention feltételt kínálnak: a szolgáltató nem tárolja el a promptot a feldolgozás után, és nem tanít rajta. Ez szerződésben rögzített — nem ígéret, hanem DPA-záradék. Egy GDPR-tudatos AI rendszer mindig zero-retention enterprise szerződésre épül, soha nem a fogyasztói API ingyenes szintjére.
EU-régió hosting és adat-rezidencia
A nagy szolgáltatók kínálnak EU-régió feldolgozást, így az adat fizikailag az EU-n belül marad. Ahol ez nem elég — szigorúan szabályozott szektor, vagy belső politika —, ott a self-hostolt open-source modell a válasz: a modell a te EU-régió GPU-don vagy on-prem fut, az adat fizikailag nem hagyja el a környezeted.
PII redaction: ami el sem jut a modellhez
A legjobb védelem, ha az érzékeny adat el sem jut az LLM-ig. A PII redaction réteg a prompt ELŐTT eltávolítja vagy tokenizálja a személyes adatot (név, e-mail, TAJ, számlaszám). A modell így a feladatot a személyes adat nélkül oldja meg, a redaktált mezők a válaszban visszahelyeződnek. Amit nem küldesz el, azt nem is kell védeni.
A teljes adatvédelmi kép egy jól megépített rendszerben
- Zero-retention enterprise szerződés minden zárt API-ra — szerződésben, nem ígéretként.
- EU-régió feldolgozás, vagy self-hostolt modell, ahol az adat-rezidencia kemény követelmény.
- PII redaction a prompt előtt — a személyes adat minimalizálása a kontextusban.
- RBAC: melyik felhasználói szerep milyen adatot láthat a rendszeren keresztül.
- Teljes audit log: minden prompt, tool-hívás és kimenet rögzítve, a compliance review-hoz.
- GDPR-dokumentáció: adatfeldolgozási nyilvántartás, DPA-k, adatfolyam-diagram.
“A 'hová kerül az adatunk' nem akadály, hanem tervezési kérdés. Egy jól megépített AI rendszerben az adatfolyam minden lépése dokumentált, szerződésben rögzített, és átmegy a jogi review-n.”
A lényeg
A céges adat egy AI rendszerben nem 'eltűnik a felhőben' — egy megtervezett, dokumentált útvonalon halad. Kérd zero-retention enterprise szerződéssel, EU-régió feldolgozással vagy self-hosted modellel, PII redaction réteggel és teljes audit trail-lel. Ha egy szállító nem tud pontos választ adni arra, hová kerül az adatod minden lépésnél — az a piros zászló, nem maga az AI.