Nyílt Kutatás
Gyakorlati, rendszer-szintű MI kutatást publikálunk: teljesítmény, megbízhatóság és éles eredmények — az architektúrától a produkciós viselkedésig.
Hardened Shell: LLM Agentek védelme OpenClaw sérülékenységekkel szemben
Szerzők: Mező Dezső, Joran Bjarne van Beek
A tanulmány a tool-hívásos agent architektúrák kritikus biztonsági hibáit vizsgálja. Egy defense-in-depth keretrendszert mutatunk be, amely kiszámítható végrehajtást, tool-injection elleni védelmet és erős governance kontrollt ad valós korlátok mellett.
“A kutatás akkor ér valamit, ha deployolható: mérhető, ismételhető és valódi korlátokra épül.”
Mit vizsgálunk
Gyakorlati MI rendszertervezés: valós adatok, valós késleltetés, valós költséglimit és valós felhasználói elvárások mellett — majd ebből éles működésre optimalizált mintákat építünk.
Input szűrés és tisztítás
A rosszindulatú vagy hibás inputok ne jussanak be a modell kontextusába. Filtereket, parser-eket és schema guardokat tesztelünk a stabilabb outputokért.
Szigorú QA védőkorlátok
Minden lépés ellenőrzése: állítások, tool output validáció és determinisztikus checkek — hogy a nem biztonságos végrehajtás megálljon, mielőtt továbbterjed.
Output sandboxing
A modell válaszait elszigeteljük a kritikus rendszerektől, permission kontrollt és futtatási korlátokat adunk, hogy egy rossz output ne eszkalálódhasson.
Éles értékelés
Azt mérjük, ami számít: hibamódok, drift, késleltetés, költség. Ezután úgy hangoljuk a pipeline-t, hogy a rendszer deploy után is megbízható maradjon.
Globális hatás
Frameworköket és megállapításokat osztunk meg, amelyek segítenek jobb MI-t szállítani: gyorsabb iteráció, tisztább értékelés, kiszámíthatóbb produkciós teljesítmény.
Ha együttműködnél alkalmazott MI kutatásban, írj nekünk.