YourCloud · Sovereign AI

Jak funguje náš AI stack

Vlastní, suverénní AI infrastruktura na našem železe. Orchestrátor Hermes řídí specializované modely, spouští a ověřuje kód v izolovaném sandboxu, a když si neví rady, zeptá se silnějšího experta. Každý běh zlepšuje další.

Uživatel · úloha HERMES 4 · orchestrátor 14B (Qwen3) · rozhoduje, co je teď potřeba, a deleguje :8060 Coder-Next 80B uncensored · psaní kódu specialista na coding :8040 · karty 2+3 Qwen 3.6 35B · obecné reasoning / plán :8200 · karta 0 Sandbox Docker · izolovaný bez sítě · spouští kód --network none Consult expert Codex (gpt-5.5) když je model zaseknutý externí expert Ověřená odpověď prošla testy v sandboxu Trace → trénink (SFT) každý běh = data → model se učí ptát se míň flywheel

Komponenty

Hermes 4 — předák

Orchestrátor. Sám kód nepíše ani nespouští — rozhodne, který nástroj úloha potřebuje, a deleguje. Silný v tool-callingu.

14B · Qwen3 dense

Coder-Next

Specialista na psaní a opravu kódu. Uncensored, agentní. Když selže test, dostane chybu zpět a opraví se.

80B · uncensored

Qwen 3.6

Obecný model pro plánování a reasoning. Hybridní rychlý / hluboký režim.

35B · MoE

Sandbox

Jediné místo, kde kód reálně běží. Jednorázový Docker kontejner bez sítě — bezpečnost dělá izolace, ne důvěra v model.

Docker · network none

Consult expert

Když se model zasekne, zeptá se silnějšího experta (Codex). Odpověď ho posune dál — a stane se cenným trénovacím příkladem.

Codex · gpt-5.5

Flywheel

Každý ověřený běh se ukládá jako trénovací data. Postupně se model doučí a expert potřebuje míň často.

traces → SFT

Měřený dopad (HumanEval, pass@1)

88,4 %
Coder · single-shot
96,3 %
+ agent-loop (oprava)
98,8 %
+ consult experta (Codex)
0
úniků dat · vše na našem železe

Hardware

4× AMD Radeon AI PRO R9700 128 GB VRAM llama.cpp · ROCm karta 0: Qwen · karta 1: Hermes · karty 2–3: Coder