AI adatvédelem: hová kerül valójában a céged adata?

AI architekt, UseAIEasily alapító

2026. május 21. · 9 perc olvasás

Az első kérdés, amit egy magyar cég jogi vagy IT-biztonsági csapata feltesz egy AI projektnél: 'hová kerül az adatunk?' Jogos kérdés, és a válasz nem 'sehova' és nem is 'mindenhova' — hanem egy konkrét, megtervezhető adatfolyam. Ez a cikk lebontja, mi történik valójában a céges adattal egy jól megépített AI rendszerben.

Hová kerül az adat egy LLM-hívásnál?

Amikor a rendszer egy LLM-et hív (zárt API esetén), a prompt — beleértve a kontextusba tett adatot — elmegy a modell-szolgáltatóhoz (OpenAI, Anthropic, Google), lefut az inference, és visszajön a válasz. A kérdés nem az, hogy 'elmegy-e' — hanem hogy a szolgáltató mit csinál vele: eltárolja-e, tanít-e rajta, melyik régióban dolgozza fel.

Zero-retention: a kulcs-szerződéses feltétel

Az enterprise szerződések (OpenAI Enterprise, Anthropic Enterprise) zero data retention feltételt kínálnak: a szolgáltató nem tárolja el a promptot a feldolgozás után, és nem tanít rajta. Ez szerződésben rögzített — nem ígéret, hanem DPA-záradék. Egy GDPR-tudatos AI rendszer mindig zero-retention enterprise szerződésre épül, soha nem a fogyasztói API ingyenes szintjére.

EU-régió hosting és adat-rezidencia

A nagy szolgáltatók kínálnak EU-régió feldolgozást, így az adat fizikailag az EU-n belül marad. Ahol ez nem elég — szigorúan szabályozott szektor, vagy belső politika —, ott a self-hostolt open-source modell a válasz: a modell a te EU-régió GPU-don vagy on-prem fut, az adat fizikailag nem hagyja el a környezeted.

PII redaction: ami el sem jut a modellhez

A legjobb védelem, ha az érzékeny adat el sem jut az LLM-ig. A PII redaction réteg a prompt ELŐTT eltávolítja vagy tokenizálja a személyes adatot (név, e-mail, TAJ, számlaszám). A modell így a feladatot a személyes adat nélkül oldja meg, a redaktált mezők a válaszban visszahelyeződnek. Amit nem küldesz el, azt nem is kell védeni.

A teljes adatvédelmi kép egy jól megépített rendszerben

Zero-retention enterprise szerződés minden zárt API-ra — szerződésben, nem ígéretként.
EU-régió feldolgozás, vagy self-hostolt modell, ahol az adat-rezidencia kemény követelmény.
PII redaction a prompt előtt — a személyes adat minimalizálása a kontextusban.
RBAC: melyik felhasználói szerep milyen adatot láthat a rendszeren keresztül.
Teljes audit log: minden prompt, tool-hívás és kimenet rögzítve, a compliance review-hoz.
GDPR-dokumentáció: adatfeldolgozási nyilvántartás, DPA-k, adatfolyam-diagram.

“A 'hová kerül az adatunk' nem akadály, hanem tervezési kérdés. Egy jól megépített AI rendszerben az adatfolyam minden lépése dokumentált, szerződésben rögzített, és átmegy a jogi review-n.”
— Mező Dezső, UseAIEasily

A lényeg

A céges adat egy AI rendszerben nem 'eltűnik a felhőben' — egy megtervezett, dokumentált útvonalon halad. Kérd zero-retention enterprise szerződéssel, EU-régió feldolgozással vagy self-hosted modellel, PII redaction réteggel és teljes audit trail-lel. Ha egy szállító nem tud pontos választ adni arra, hová kerül az adatod minden lépésnél — az a piros zászló, nem maga az AI.

AI adatvédelem: hová kerül valójában a céged adata?

Hová kerül az adat egy LLM-hívásnál?

Zero-retention: a kulcs-szerződéses feltétel

EU-régió hosting és adat-rezidencia

PII redaction: ami el sem jut a modellhez

A teljes adatvédelmi kép egy jól megépített rendszerben

A lényeg

Az EU AI Act gyakorlati útmutató magyar cégeknek (2026)

Open-source vs zárt LLM: melyiket válaszd a cégednek?

Hogyan számold ki egy AI projekt megtérülését? (ROI keretrendszer példával)

AI biztonsági audit