Objavljeno 29. svibnja 2026.Aron Balog

GPU za lokalni AI — koliko košta pokretati LLaMA i Stable Diffusion kod kuće

7B model treba 6 GB VRAM. RTX 4060 s 8 GB: 220 €. RTX 3090 rabljeni: 450 €, pokreće 32B modele. Cloud vs. lokalno — kada se isplati kupiti hardver? Kompletna analiza.

Moderno računalo pored server rack-ova u podatkovnom centru

ChatGPT vas pita 20 € mjesečno. Lokalni LLaMA model ništa ne pita — ali karta koja može pokrenuti nešto ozbiljno košta 300–800 €. Kada se break-even dogodi? Ovisno o tome koliko koristite AI.

Što zapravo treba lokalnom AI-u

Jedino što je bitno: VRAM — video memorija grafičke kartice.

Cijeli model mora stati u VRAM. Ako model ne stane — sporo se učitava s RAM-a ili diska što je 10–50× sporije.

Okvirni VRAM zahtjevi za popularnih modele (s Q4 kvantizacijom):

7B modeli (LLaMA 3 8B, Mistral 7B): 4–6 GB VRAM
13–14B modeli: 8–10 GB VRAM
32B modeli (DeepSeek R1 32B): 20–22 GB VRAM
70B modeli: 40+ GB VRAM

Za Stable Diffusion (slike):

SDXL, Flux.1 Schnell: 8–12 GB VRAM
Flux.1 Dev (visoka kvaliteta): 16–24 GB VRAM
Standardni SD 1.5/2.1: 4–6 GB VRAM

Realne kartice i cijene za lokalni AI

Minimalni ulaz — RTX 4060 (8 GB): ~220 €

Pokreće sve 7B modele na Q4_K_M kvantizaciji
Brzina: 40–60 tokena u sekundi
SDXL slike generira u 10–15 sekundi
Preporuka za: povremene korisnike, eksperimentiranje

Solidna baza — RTX 4070 (12 GB): ~430–500 €

7B modeli brzi, 14B modeli pristojno
85–120 tok/s za 14B modele
Flux.1 Dev s kompresijom u 12 GB
Preporuka za: redovite korisnike koji žele brzinu

Best value za 2026. — RTX 3090 rabljeni (24 GB): ~400–550 €

24 GB VRAM je zlatni standard za lokalni AI
Pokreće DeepSeek R1 32B bez problema
Isplativost: vrhunski VRAM po najnižoj cijeni
Rizik: rudarena, ali manji GDDR6 (ne X) na 3090 je manje problematičan

Ozbiljno rješenje — RTX 4090 (24 GB): ~1.600–2.000 €

70B modeli s kvantizacijom
Flux.1 Dev u punoj kvaliteti
Profesionalni workloadi
Preporuka za: tko AI koristi kao primarni alat za rad

Cloud vs. lokalni hardver — break-even analiza

ChatGPT Plus: 20 €/mj = 240 €/god Claude Pro: 20 €/mj = 240 €/god Cursor AI (development): 20 €/mj = 240 €/god

Ako koristite više AI servisa istovremeno: 40–60 €/mj = 480–720 €/god.

RTX 4060 (8 GB, ~220 €): break-even s jednim pretplatom za 11 mjeseci, s dva — za 5–6 mjeseci.

RTX 3090 rabljeni (~480 €): break-even s dva AI servisna pretplata za ~12 mjeseci.

Ovo je računica bez struje (GPU troši 150–350W pod punuim opterećenjem) i bez faktora da lokalni AI nema ograničenja broja zahtjeva ni "rate limitova."

Što se zapravo preporučuje

Ako ste developer koji svakodnevno koristi AI za kod, generiranje slika ili RAG sustave — lokalni hardver se isplati za 6–18 mj., ovisno o korištenoj opremi.

Ako povremeno koristite AI (par puta tjedno) — cloud servis je racionalniiji, ne trebate investiciju.

Ako vas zanima eksperimentiranje i privatnost — RTX 4060 za 220 € je odlična ulazna točka. Pokreće sve što vam treba za početak.

Izvori i dodatno čitanje

Više članaka

← Nazad na blog