Question 1

AI (mesterséges intelligencia)

Accepted Answer

Az AI (mesterséges intelligencia) gyűjtőfogalom: minden olyan szoftverrendszer, amely emberi kognitív képességeket próbál reprodukálni. Ma a gyakorlatban legtöbbször LLM-alapú rendszerekre utalunk — ChatGPT, Claude, Gemini. A magyar vállalati környezetben az AI elsősorban automatizáció, ügyféltámogatás és döntéstámogatás területén hasznos.

Question 2

LLM (nagy nyelvi modell)

Accepted Answer

Az LLM (Large Language Model) több milliárd paraméteres neurális háló, amelyet trillió nagyságrendű szöveges tokenen tanítanak. Példák: GPT-4, Claude, Llama. A modell nem tudás-adatbázis, hanem mintázat-generátor — ezért kell RAG-gal vagy fine-tuninggal kombinálni vállalati használatra.

Question 3

RAG (Retrieval-Augmented Generation)

Accepted Answer

A RAG (Retrieval-Augmented Generation) a szabvány módszer arra, hogy az LLM-et a saját vállalati adatodhoz kösd. Lépések: 1) dokumentumok embedding-vektorrá alakítása, 2) vektor-adatbázisba mentés, 3) minden kérdésnél a leghasonlóbb részletek kikeresése, 4) ezeket az LLM-nek küldése a prompt részeként. A RAG pontosabb és naprakészebb választ eredményez, mint puszta prompt engineering.

Question 4

AI ügynök (AI agent)

Accepted Answer

Az AI ügynök a chatbottól abban különbözik, hogy nemcsak szöveget generál, hanem cselekszik: API-kat hív, adatbázist olvas, emailt küld, dokumentumot készít. Orchestráció jellemzően LangGraph, CrewAI vagy OpenAI Assistants alapokon történik. Production ügynököknél mindig tool-permission model, cost-limit és human-in-the-loop kontroll szükséges.

Question 5

Multi-agent rendszer

Accepted Answer

A multi-agent rendszerekben különböző szerepkörű ügynökök osztoznak a munkán — pl. tervező, végrehajtó, ellenőrző. A supervisor-pattern és a planner-executor-pattern a leggyakoribb. Komplex, több lépéses feladatoknál jobban teljesítenek, mint egyetlen nagy ügynök, de jóval nehezebb őket debuggolni és kontrollálni.

Question 6

Prompt engineering

Accepted Answer

A prompt engineering magában foglalja a szerep meghatározását (system prompt), few-shot példákat, strukturált kimenet előírását (JSON schema), iterációt és tesztelést. Egy jó prompt 3–5x pontosabb kimenetet adhat, mint egy rossz. A prompt engineering a legolcsóbb első beavatkozás fine-tuning előtt.

Question 7

Fine-tuning (finomhangolás)

Accepted Answer

A fine-tuning során egy base modellt (pl. Llama 3.1, GPT-4o-mini) saját adataid alapján specializálsz. Módszerek: LoRA (könnyű, olcsó), full fine-tune (drágább, erősebb). Tipikus use-case: domain terminológia, márkahang, strukturált output stabilitása. Nem helyettesíti a RAG-ot — inkább kombinálódik vele.

Question 8

Vektor-adatbázis

Accepted Answer

A vektor-adatbázisok (Pinecone, Qdrant, Weaviate, pgvector) az embedding-vektorok milliárdjain végeznek gyors hasonlósági keresést. A RAG pipeline-ok alapköve. Választási szempontok: managed vs self-host, EU vs US régió, hybrid search támogatás, skálázhatóság.

Question 9

Embedding

Accepted Answer

Az embedding egy 768–3072 dimenziós vektor, amely egy szövegdarab jelentését reprezentálja. Hasonló jelentésű szövegek közel kerülnek egymáshoz a vektor-térben. Főbb szolgáltatók: OpenAI (text-embedding-3), Voyage, Cohere, open-source (BGE, E5). Az embedding-modell választása 5-15%-ot is számíthat a RAG pontosságában.

Question 10

Prompt injection

Accepted Answer

A prompt injection a leggyakoribb AI biztonsági sebezhetőség. Példa: a felhasználó beírja 'ignore previous instructions and...' — az LLM követheti. Védekezés: input validálás, instruction hierarchy, output guardrailok, limitált tool access, prompt-level sandboxing.

Question 11

Guardrail

Accepted Answer

A guardrail lehet szabályalapú (regex, block-lista), ML-alapú (toxicitás-, PII-detektor) vagy LLM-alapú (judge modell). Tipikus alkalmazások: PII redaction, toxicitás-szűrés, témán kívüli kérdések elutasítása, output formátum validálás.

Question 12

PII redaction

Accepted Answer

A PII redaction elengedhetetlen GDPR-kompatibilis AI rendszereknél. Megvalósítható regex-szel, ML alapú NER modellel, vagy dedikált szolgáltatásokkal (Presidio, Nightfall). A redaction a prompt ELŐTT történik, így semmi érzékeny adat nem jut el az LLM providerhez.

Question 13

RBAC (Role-Based Access Control)

Accepted Answer

Az AI-val kiegészített RBAC azt szabályozza, hogy melyik felhasználói szerep melyik tool-t hívhatja, és milyen adatokat láthat a RAG-ban. Kritikus multi-tenant és regulated környezetben. Implementáció: middleware a prompt előtt + post-filter az LLM kimenetén.

Question 14

Voice agent

Accepted Answer

A voice agent kombinálja a speech-to-text (Deepgram, Whisper), LLM és text-to-speech (ElevenLabs, Cartesia) rétegeket. Tipikus platformok: Vapi, LiveKit, Retell. Latencia kulcsfontosságú — <500ms alatt kell tartani a teljes ciklust ahhoz, hogy természetes legyen.

Question 15

Context window

Accepted Answer

A context window az input + output együttes mérete. GPT-4: 128k token. Claude Sonnet 4.6: 1M token. Gemini 2.5 Pro: 2M token. Nagyobb context = több dokumentum betehető a promptba, de drágább és lassabb. A context caching (Anthropic, OpenAI) 90%-kal csökkentheti az ismételt prompt költségét.

Question 16

Hallucinacio (hallucination)

Accepted Answer

A hallucináció abból fakad, hogy az LLM valószínűségi mintázat-generátor, nem tudás-tár. Csökkentése: RAG (forrás-kötött válaszok), citation tracking, fact-check layer, human review. A GPT-4 és Claude Sonnet 4.6 sokat javult, de nullára nem vihető le — ezért kritikus use-case-nél mindig human-in-the-loop kell.

Question 17

Token

Accepted Answer

Az LLM-ek tokenekben számolnak. 1000 token ≈ 700 szó (angol) vagy 500 szó (magyar, mert a magyar szavak ragozottabbak). Az árazás tokenenként történik: Claude Sonnet ~$3/millió input token, ~$15/millió output token 2026-ban.

Question 18

MCP (Model Context Protocol)

Accepted Answer

Az MCP (Model Context Protocol) lehetővé teszi, hogy egyszer megírt tool-szerver-t több LLM kliens (Claude Desktop, Claude Code, saját agent) használjon. 2025-ben vált iparági szabvánnyá. Alternatíva az egyedi function calling-nak.

Question 19

Context engineering

Accepted Answer

A context engineering a prompt engineering evolúciója: szisztematikusan építjük fel, mi kerüljön az LLM kontextusába (system prompt, few-shot, RAG chunk-ok, tool definíciók, prior conversation). Különösen fontos long-context modelleknél.

Question 20

AI biztonság (AI security)

Accepted Answer

Az AI biztonság 4 fő rétege: input validáció (prompt injection), output guardrailek (PII, toxicitás), hozzáférés-kontroll (RBAC, tool permission), és audit (logging, monitoring). Regulated szektorban kötelező compliance layer (DORA, MDR, GDPR).

Question 21

AI automatizáció

Accepted Answer

Az AI automatizáció túlmutat a klasszikus RPA-n: az LLM képes kontextusfüggő döntést hozni, nem csak scriptet futtatni. Tipikus use-case-ek: ügyféltámogatás magyar nyelven, termékleírás generálás, email triage, pénzügyi jelentés automatizálás.

Question 22

DORA (Digital Operational Resilience Act)

Accepted Answer

A DORA 2025-től kötelező EU-s szintű szabályozás: banki AI-rendszerek incidens-jelentési, kockázatkezelési és vendor management követelményei. Budapest központú AI fejlesztő cégek dolgozhatnak ilyen ügyfeleknek, feltéve hogy teljes dokumentációs és audit trail van.

Question 23

NAIH (Nemzeti Adatvédelmi és Információszabadság Hatóság)

Accepted Answer

A NAIH értesítési kötelezettség, adatkezelési nyilvántartás és adatvédelmi incidens-bejelentés szabályait felügyeli Magyarországon. AI rendszereknél különösen a közjogi érintettség, profilozás és automatizált döntéshozatal kérdései kerülnek a hatóság látókörébe.

Question 24

Generatív AI

Accepted Answer

A generatív AI (GenAI) az AI azon ága, amely új kimenetet generál, nem pedig meglévőt osztályoz vagy megjósol. Főbb családok: LLM (szöveg), diffúziós modellek (kép, videó), TTS (hang), kód-modellek. A magyar GenAI piac 2023 óta robbanásszerűen nő.

Question 25

Model distillation

Accepted Answer

A distillation során a nagy 'tanár' modell kimenetein tanítjuk a kisebb 'diák' modellt. Eredmény: 80-90%-os minőség 10%-os költségen és 5x gyorsabb válaszidővel. OpenAI, Anthropic és Google egyaránt kínálnak distilláció workflow-kat.

Question 26

AI évalúcio (evaluation)

Accepted Answer

Az AI evaluation kulcsa a custom eval suite: nem elég a loss vagy a 'gépileg mért pontosság', hanem a valós üzleti metrika kell. Eszközök: LangSmith, Langfuse, Promptfoo, Ragas. Production előtt mindig kell A/B teszt a base modellhez képest.

Question 27

Few-shot prompting

Accepted Answer

A few-shot prompting 1-5 konkrét input-output példát mutat be, és az LLM azt a stílust követi. Gyakran hatékonyabb, mint a fine-tuning, különösen ha stabil formátumot kell tartani (JSON, XML) vagy speciális hangvételt (magyar márkahang, jogi stílus).

Question 28

Vibe coding

Accepted Answer

A vibe coding népszerű megnevezés arra, amikor Cursor, Claude Code vagy hasonló AI-asszisztens a fejlesztési idő 30-70%-át teszi ki. Ma 2026-ban minden produktív AI mérnök használja; a kérdés nem az 'igen/nem', hanem hogy milyen workflow-val.

Question 29

AI compliance

Accepted Answer

EU-ban három fő réteg: GDPR (személyes adatok), DORA (pénzügyi rezisztencia), EU AI Act (2026-ra teljes hatályban — magas kockázatú AI rendszerekre vonatkozó követelmények). Magyar rétegek: NAIH szabályozás, MNB pénzügyi vendor management.

Question 30

Chunking

Accepted Answer

A chunking az a lépés, amikor a forrásdokumentumokat kezelhető darabokra (chunk) bontod embedding előtt. A darab mérete számít: túl kicsi és elveszik a kontextus, túl nagy és felhígul a relevancia. Magyar szövegnél a bekezdés-alapú chunking jobban teljesít, mint a fix token-határ, mert a magyar mondatok hosszabbak és erős a szemantikai kötés. Tipikus méret: 200–500 token, 10–20% átfedéssel.

Question 31

Reranking (újrarangsorolás)

Accepted Answer

A reranking a RAG második keresési lépése: a vektor-keresés top-20 találatát egy dedikált re-ranker modell (Cohere Rerank, BGE-reranker) újrarangsorolja relevancia szerint, és csak a legjobb 3–5 jut az LLM-hez. Átlagosan 3-4x javít a relevancián — az egyik legolcsóbb minőség-növelő lépés egy RAG rendszerben.

Question 32

Hibrid keresés (hybrid search)

Accepted Answer

A hibrid keresés egyesíti a szemantikus vektor-keresés (jelentés alapú) és a klasszikus BM25 full-text keresés (pontos kulcsszó-egyezés) erősségeit. A vektor-keresés jó a parafrázisokra, a BM25 jó a pontos kódokra, nevekre, számokra. Production RAG-ban szinte mindig hibrid keresést használunk, mert a kettő együtt lefedi egymás vakfoltjait.

Question 33

System prompt

Accepted Answer

A system prompt az LLM-hívás első, állandó rétege: megadja a modell szerepét, hangnemét, korlátait és a kimenet formátumát. Jól megírva csökkenti a hallucinációt és stabilizálja a kimenetet. Soha ne tegyél titkot vagy API-kulcsot a system promptba — feltételezd, hogy kinyerhető.

Question 34

Function calling (tool use)

Accepted Answer

A function calling az, ami a chatbotot ügynökké teszi: a modell nem szöveget generál, hanem eldönti, melyik tool-t hívja meg milyen paraméterekkel. A te kódod futtatja a függvényt, az eredmény visszakerül az LLM-hez. Ez az alapja minden AI ügynöknek. Az MCP a function calling szabványosított változata.

Question 35

Human-in-the-loop

Accepted Answer

A human-in-the-loop (HITL) azt jelenti, hogy egy AI rendszer megáll, és emberi jóváhagyást kér, mielőtt visszafordíthatatlan vagy nagy tétű műveletet hajt végre — e-mail küldés, fizetés, törlés. Production ügynököknél kötelező minden destruktív vagy ügyfél-érintő kimenetnél. Az autonómia és a biztonság közötti egyensúly kulcsa.

Question 36

Temperature

Accepted Answer

A temperature 0 és 1 (vagy 2) között állítható. Alacsony (0–0,3): determinisztikus, fókuszált válasz — extrakcióhoz, osztályozáshoz, strukturált kimenethez ideális. Magas (0,7–1): kreatívabb, változatosabb — marketing szöveghez, ötleteléshez. Regulated use-case-nél mindig alacsony temperature.

Question 37

LoRA / QLoRA

Accepted Answer

A LoRA (Low-Rank Adaptation) a teljes fine-tune helyett kis adapter-mátrixokat tanít — a memóriaigény és a költség töredékéért. A QLoRA még tovább megy: kvantált modellen fut, így egy 70B-s modell is fine-tune-olható egyetlen GPU-n. A legtöbb vállalati fine-tune ma LoRA-alapú, mert 500–2000 minta már elég hozzá.

Question 38

Inference

Accepted Answer

Az inference a modell 'futtatása' — szemben a tréninggel, ami a betanítás. Az inference-költség az, amit minden API-hívásnál fizetsz, és ez halmozódik production-ben. Az inference-költség csökkentésének módjai: kisebb vagy fine-tunolt modell, prompt caching, batch feldolgozás, és a megfelelő modell a megfelelő feladatra.

Question 39

Chain-of-thought

Accepted Answer

A chain-of-thought (CoT) prompting arra kéri a modellt, hogy a végső válasz előtt mutassa meg a gondolatmenetét. Komplex, többlépéses feladatoknál (matematika, logika, tervezés) érdemben javítja a pontosságot. A modern 'reasoning' modellek (o3, Claude reasoning mód) ezt beépítve csinálják.

Question 40

EU AI Act

Accepted Answer

Az EU AI Act az AI rendszereket kockázat szerint sorolja be: tiltott, magas kockázatú, korlátozott, minimális. A magas kockázatú rendszerekre (pl. munkaerő-felvétel, hitelbírálat, egészségügy) szigorú dokumentációs, átláthatósági és emberi felügyeleti követelmények vonatkoznak, 2026-ra teljes hatállyal. A GDPR és DORA mellett a harmadik fő EU compliance réteg.

Question 41

Jailbreak

Accepted Answer

A jailbreak olyan prompt-technika, amely ráveszi a modellt a beépített korlátai megsértésére — gyakran szerepjátékkal ('tegyél úgy, mintha…') vagy hipotetikus kerettel. A prompt injection rokona. Védekezés: guardrail réteg, amely a szándékot értékeli a fő modell előtt, plusz output-szűrés.

AI fogalomtár — magyarul

AI fejlesztés Budapest

RAG fejlesztés

AI blog magyarul