Ugrás a fő tartalomhoz
UseAIEasily Logó
UseAIEasily

RAG költségei magyar adatbázisokon — részletes breakdown

DM

Írta Dezső Mező

AI architekt, UseAIEasily alapító

· 7 perc olvasás

Frissítve:

"Mennyibe kerül?" — a leggyakoribb kérdés, amit RAG-projektek előtt kapunk. A válasz: az adat mérete, a forgalom és a compliance igény függvényében évi €2.000-tól €50.000-ig terjedhet a futóköltség. Itt a konkrét breakdown.

1. Embedding költség (egyszeri + inkrementális)

OpenAI text-embedding-3-large: $0,13 / 1M token. Egy 10.000 dokumentumos magyar archívum ~8M token = ~$1 egyszeri költség. Inkrementális (havi 200 új doc) ~$0,03/hó. Open-source BGE-m3 self-host: 0 API költség, de szerver €20-50/hó.

2. Vector DB

Pinecone managed: $70/hó Starter (10M vektor), $500/hó Standard multi-region. Qdrant self-host: €30-100/hó (Hetzner vagy Vercel worker). pgvector Postgres-ben: 0 extra költség, ha már van Postgres. Kisebb projekteknél pgvector a legolcsóbb; nagyoknál Pinecone managed SaaS.

3. LLM API

A legnagyobb változó költség. Claude Sonnet 4.6: ~$3/M input, $15/M output. Havi 10.000 lekérdezés (5k token input, 500 token output átlag) = €150/hó alapdíj + €75 output = ~€225/hó. Prompt caching 90%-ig csökkenti ezt. GPT-4o-mini ~10x olcsóbb ha a minőség elég.

4. Re-ranker (opcionális, de erősen ajánlott)

Cohere Rerank: $2 / 1000 kérés. Havi 10.000 kérésnél $20/hó. BGE-reranker self-host: 0 API költség, de GPU ~€30/hó (Hetzner CX32). Re-ranker 18-25%-kal javítja a RAG pontosságot, így mindig beéri.

5. Monitoring és audit

LangSmith: $39/hó Developer tier, $99+ Team. Langfuse self-host: ingyen, €20 szerver. Banki / egészségügyi projekteknél kötelező — nem ez az a pénz, amin spórolni kell.

Teljes havi költség, 3 méretkategóriára

  • Kis RAG (5k dokumentum, havi 3k kérés): €150-250/hó (Pinecone + OpenAI API + LangSmith)
  • Közepes RAG (50k dokumentum, havi 15k kérés): €600-1200/hó (+ re-ranker + többszörös API call)
  • Enterprise RAG (500k dokumentum, havi 100k kérés): €3.000-8.000/hó (+ EU self-host + SLA + audit)

Megosztás

Hasznos volt ez a cikk?

Kapcsolódó cikkek