GPU za lokalni AI — koliko košta pokretati LLaMA i Stable Diffusion kod kuće
7B model treba 6 GB VRAM. RTX 4060 s 8 GB: 220 €. RTX 3090 rabljeni: 450 €, pokreće 32B modele. Cloud vs. lokalno — kada se isplati kupiti hardver? Kompletna analiza.

ChatGPT vas pita 20 € mjesečno. Lokalni LLaMA model ništa ne pita — ali karta koja može pokrenuti nešto ozbiljno košta 300–800 €. Kada se break-even dogodi? Ovisno o tome koliko koristite AI.
Što zapravo treba lokalnom AI-u
Jedino što je bitno: VRAM — video memorija grafičke kartice.
Cijeli model mora stati u VRAM. Ako model ne stane — sporo se učitava s RAM-a ili diska što je 10–50× sporije.
Okvirni VRAM zahtjevi za popularnih modele (s Q4 kvantizacijom):
- 7B modeli (LLaMA 3 8B, Mistral 7B): 4–6 GB VRAM
- 13–14B modeli: 8–10 GB VRAM
- 32B modeli (DeepSeek R1 32B): 20–22 GB VRAM
- 70B modeli: 40+ GB VRAM
Za Stable Diffusion (slike):
- SDXL, Flux.1 Schnell: 8–12 GB VRAM
- Flux.1 Dev (visoka kvaliteta): 16–24 GB VRAM
- Standardni SD 1.5/2.1: 4–6 GB VRAM
Realne kartice i cijene za lokalni AI
Minimalni ulaz — RTX 4060 (8 GB): ~220 €
- Pokreće sve 7B modele na Q4_K_M kvantizaciji
- Brzina: 40–60 tokena u sekundi
- SDXL slike generira u 10–15 sekundi
- Preporuka za: povremene korisnike, eksperimentiranje
Solidna baza — RTX 4070 (12 GB): ~430–500 €
- 7B modeli brzi, 14B modeli pristojno
- 85–120 tok/s za 14B modele
- Flux.1 Dev s kompresijom u 12 GB
- Preporuka za: redovite korisnike koji žele brzinu
Best value za 2026. — RTX 3090 rabljeni (24 GB): ~400–550 €
- 24 GB VRAM je zlatni standard za lokalni AI
- Pokreće DeepSeek R1 32B bez problema
- Isplativost: vrhunski VRAM po najnižoj cijeni
- Rizik: rudarena, ali manji GDDR6 (ne X) na 3090 je manje problematičan
Ozbiljno rješenje — RTX 4090 (24 GB): ~1.600–2.000 €
- 70B modeli s kvantizacijom
- Flux.1 Dev u punoj kvaliteti
- Profesionalni workloadi
- Preporuka za: tko AI koristi kao primarni alat za rad
Cloud vs. lokalni hardver — break-even analiza
ChatGPT Plus: 20 €/mj = 240 €/god Claude Pro: 20 €/mj = 240 €/god Cursor AI (development): 20 €/mj = 240 €/god
Ako koristite više AI servisa istovremeno: 40–60 €/mj = 480–720 €/god.
RTX 4060 (8 GB, ~220 €): break-even s jednim pretplatom za 11 mjeseci, s dva — za 5–6 mjeseci.
RTX 3090 rabljeni (~480 €): break-even s dva AI servisna pretplata za ~12 mjeseci.
Ovo je računica bez struje (GPU troši 150–350W pod punuim opterećenjem) i bez faktora da lokalni AI nema ograničenja broja zahtjeva ni "rate limitova."
Što se zapravo preporučuje
Ako ste developer koji svakodnevno koristi AI za kod, generiranje slika ili RAG sustave — lokalni hardver se isplati za 6–18 mj., ovisno o korištenoj opremi.
Ako povremeno koristite AI (par puta tjedno) — cloud servis je racionalniiji, ne trebate investiciju.
Ako vas zanima eksperimentiranje i privatnost — RTX 4060 za 220 € je odlična ulazna točka. Pokreće sve što vam treba za početak.
Izvori i dodatno čitanje
Više članaka
- dark webcybersecurity
Što je zapravo dark web: mit vs. stvarnost
30. svibnja 2026.
- cybersecurityPMS
Kako hakiraju sustave za upravljanje hotelima: od recepcije do svake sobe
30. svibnja 2026.
- cybersecurityhoteli
Sezone i hakiranja: zašto hoteli u srpnju imaju tri puta više sigurnosnih incidenata
30. svibnja 2026.