Är staik kompatibelt med OpenAI SDK?

Ja, staik erbjuder ett OpenAI-kompatibelt REST API. Byt bara base_url till api.staik.se i din befintliga kod.

Vilka modeller finns tillgängliga?

staik erbjuder qwen3.6:35b-a3b (262K kontext), qwen3.5:9b (262K kontext), gemma4:31b (96K kontext, vision) samt bge-m3:latest (embedding via /v1/embeddings). Alla körs på dedikerad GPU-hårdvara i Sverige. Vision: använd gemma4:31b.

All data behandlas och lagras på servrar i Sverige. Inga prompts eller svar lämnar landet. Fullt GDPR- och Schrems II-kompatibelt.

API-referensOpenClaw OpenCode Continue.dev Agenter Tool Calling Web Search Claude Code

API-dokumentation

staik erbjuder ett OpenAI-kompatibelt REST API. Byt bara base_url.

Autentisering

Authorization: Bearer sk-st-your-key-here

Base URL

https://api.staik.se/v1

Chat Completions

curl https://api.staik.se/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-st-your-key" \
  -d '{
    "model": "gemma4:31b",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Audio-transkribering

Transkribera ljud till text via KB-Whisper large — Kungliga bibliotekets svensk-tränade Whisper-modell (50 000 timmar svenskt tal). OpenAI-kompatibel — peka bara openai-SDK:n mot api.staik.se.

curl https://api.staik.se/v1/audio/transcriptions \
  -H "Authorization: Bearer sk-st-your-key" \
  -F file=@moten.mp3 \
  -F model=kb-whisper-large \
  -F language=sv

Python (OpenAI SDK drop-in):

from openai import OpenAI
client = OpenAI(api_key="sk-st-your-key", base_url="https://api.staik.se/v1")

with open("moten.mp3", "rb") as f:
    result = client.audio.transcriptions.create(
        model="kb-whisper-large",  # eller "whisper-1" — båda routar till KB-Whisper large
        file=f,
        language="sv",
    )
print(result.text)

Tokens-åtgång

Audio-transkribering debiteras 100 tokens per sekund ljud från samma tokenpool som chat-modellerna. Det betyder att 1 minut audio kostar 6 000 tokens och 1 timme ljud kostar 360 000 tokens.

Plan	Tokengräns	Motsvarar audio
Early Adopter	100 000 / dag	~16 min / dag
Hobby Mini	50 000 / dag	~8 min / dag
Hobby	250 000 / dag	~41 min / dag
Agent Mini	100 000 / timme	~16 min / timme
Agent	500 000 / timme	~83 min / timme
Agent Pro	1 000 000 / timme	~166 min / timme
Pay-as-you-go	köpta tokens	100K tokens = ~16 min

Varje respons innehåller headers X-Audio-Duration-Seconds och X-Audio-Tokens-Charged så du kan följa användningen per anrop. Max filstorlek: 25 MB (≈ 30–45 min audio). Stödda format: mp3, wav, m4a, ogg, flac, webm, mp4. response_format: json (default), text eller verbose_json (med segments).

Modeller

Välj modell via model-fältet i din request. Varje modell kör på dedikerad GPU-hårdvara i Sverige.

Modell	Tillverkare	Parametrar	Kontextfönster	Vision
qwen3.6:35b-a3b	Alibaba	35B MoE	262 144	—
qwen3.5:9b	Alibaba	9.7B	262 144	—
gemma4:31b	Google DeepMind	31B	98 304	✓
bge-m3:latest	BAAI	568M	8 192	embedding
kb-whisper-large	Kungliga biblioteket	1.5B	—	audio (sv)

Chat-modellerna stödjer streaming (SSE). Kontextfönster: gemma4:31b 96K, qwen3.6:35b-a3b 262K, qwen3.5:9b 262K. Endast gemma4:31b har inbyggd vision, skicka bilder via image_url i messages. bge-m3:latest är en embedding-modell som returnerar 1024-dimensionella vektorer (konfigurera t.ex. pgvector vector(1024)) och anropas via POST /v1/embeddings. kb-whisper-large är KB:s svensk-tränade Whisper-modell och anropas via POST /v1/audio/transcriptions.

Modellerna är öppna vikter som vi hostar på egen hårdvara i Sverige. Träningsdata och svar styrs av modelltillverkaren, inte av staik. Välj modell i model-fältet baserat på din användning. KB-Whisper är den enda modellen vi kör som är tränad i Sverige.

Kontext och max_tokens: din prompt plus max_tokens (utrymmet som reserveras för svaret) måste rymmas inom modellens kontextfönster. Överskrids det returneras 400 — korta prompten eller sänk max_tokens. Tänk särskilt på det med gemma4:31b (96K, mindre än de övriga). Anger du inte max_tokens sätter vi ett rimligt standardvärde per modell så att svaren alltid är avgränsade — sätt det explicit för längre eller kortare svar.

Planer

Plan	Pris	Tokengräns
Early Adopter	Gratis	100 000 / dag
Pay-as-you-go	100K gratis + köp extra	—
Hobby Mini	29 kr/mån	50 000 / dag
Hobby	59 kr/mån	250 000 / dag
Agent Mini	99 kr/mån	100 000 / timme
Agent	149 kr/mån	500 000 / timme
Agent Pro	219 kr/mån	1 000 000 / timme

Agent-tiers använder ett rullande 60-minutersfönster istället för daglig cap — kapacitet återvinns kontinuerligt. Behöver du mer än 1M/h? Se Agent Scale på prissidan.

Felkoder

Kod	Beskrivning
401	Ogiltig eller saknad API-nyckel
429	Daglig tokengräns överskriden eller alla slots upptagna
503	Modellen tillfälligt otillgänglig

Rate limit headers

Varje svar inkluderar headers som visar din aktuella tokenanvändning.

Header	Beskrivning
X-RateLimit-Limit-Tokens	Daglig tokengräns
X-RateLimit-Used-Tokens	Använda tokens idag
X-RateLimit-Remaining-Tokens	Kvarvarande tokens

Redo att integrera?

Multi-agent workflows OpenClaw-konfiguration