RAG költségei magyar adatbázisokon — részletes breakdown
"Mennyibe kerül?" — a leggyakoribb kérdés, amit RAG-projektek előtt kapunk. A válasz: az adat mérete, a forgalom és a compliance igény függvényében évi €2.000-tól €50.000-ig terjedhet a futóköltség. Itt a konkrét breakdown.
1. Embedding költség (egyszeri + inkrementális)
OpenAI text-embedding-3-large: $0,13 / 1M token. Egy 10.000 dokumentumos magyar archívum ~8M token = ~$1 egyszeri költség. Inkrementális (havi 200 új doc) ~$0,03/hó. Open-source BGE-m3 self-host: 0 API költség, de szerver €20-50/hó.
2. Vector DB
Pinecone managed: $70/hó Starter (10M vektor), $500/hó Standard multi-region. Qdrant self-host: €30-100/hó (Hetzner vagy Vercel worker). pgvector Postgres-ben: 0 extra költség, ha már van Postgres. Kisebb projekteknél pgvector a legolcsóbb; nagyoknál Pinecone managed SaaS.
3. LLM API
A legnagyobb változó költség. Claude Sonnet 4.6: ~$3/M input, $15/M output. Havi 10.000 lekérdezés (5k token input, 500 token output átlag) = €150/hó alapdíj + €75 output = ~€225/hó. Prompt caching 90%-ig csökkenti ezt. GPT-4o-mini ~10x olcsóbb ha a minőség elég.
4. Re-ranker (opcionális, de erősen ajánlott)
Cohere Rerank: $2 / 1000 kérés. Havi 10.000 kérésnél $20/hó. BGE-reranker self-host: 0 API költség, de GPU ~€30/hó (Hetzner CX32). Re-ranker 18-25%-kal javítja a RAG pontosságot, így mindig beéri.
5. Monitoring és audit
LangSmith: $39/hó Developer tier, $99+ Team. Langfuse self-host: ingyen, €20 szerver. Banki / egészségügyi projekteknél kötelező — nem ez az a pénz, amin spórolni kell.
Teljes havi költség, 3 méretkategóriára
- Kis RAG (5k dokumentum, havi 3k kérés): €150-250/hó (Pinecone + OpenAI API + LangSmith)
- Közepes RAG (50k dokumentum, havi 15k kérés): €600-1200/hó (+ re-ranker + többszörös API call)
- Enterprise RAG (500k dokumentum, havi 100k kérés): €3.000-8.000/hó (+ EU self-host + SLA + audit)