API-dokumentation
staik erbjuder ett OpenAI-kompatibelt REST API. Byt bara base_url.
Autentisering
Authorization: Bearer sk-st-your-key-hereBase URL
https://api.staik.se/v1Chat Completions
curl https://api.staik.se/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer sk-st-your-key" \
-d '{
"model": "gemma4:31b",
"messages": [{"role": "user", "content": "Hello!"}]
}'Audio-transkribering
Transkribera ljud till text via KB-Whisper large — Kungliga bibliotekets svensk-tränade Whisper-modell (50 000 timmar svenskt tal). OpenAI-kompatibel — peka bara openai-SDK:n mot api.staik.se.
curl https://api.staik.se/v1/audio/transcriptions \
-H "Authorization: Bearer sk-st-your-key" \
-F file=@moten.mp3 \
-F model=kb-whisper-large \
-F language=svPython (OpenAI SDK drop-in):
from openai import OpenAI
client = OpenAI(api_key="sk-st-your-key", base_url="https://api.staik.se/v1")
with open("moten.mp3", "rb") as f:
result = client.audio.transcriptions.create(
model="kb-whisper-large", # eller "whisper-1" — båda routar till KB-Whisper large
file=f,
language="sv",
)
print(result.text)Tokens-åtgång
Audio-transkribering debiteras 100 tokens per sekund ljud från samma tokenpool som chat-modellerna. Det betyder att 1 minut audio kostar 6 000 tokens och 1 timme ljud kostar 360 000 tokens.
| Plan | Tokengräns | Motsvarar audio |
|---|---|---|
| Early Adopter | 100 000 / dag | ~16 min / dag |
| Hobby Mini | 50 000 / dag | ~8 min / dag |
| Hobby | 250 000 / dag | ~41 min / dag |
| Agent Mini | 100 000 / timme | ~16 min / timme |
| Agent | 500 000 / timme | ~83 min / timme |
| Agent Pro | 1 000 000 / timme | ~166 min / timme |
| Pay-as-you-go | köpta tokens | 100K tokens = ~16 min |
Varje respons innehåller headers X-Audio-Duration-Seconds och X-Audio-Tokens-Charged så du kan följa användningen per anrop. Max filstorlek: 25 MB (≈ 30–45 min audio). Stödda format: mp3, wav, m4a, ogg, flac, webm, mp4. response_format: json (default), text eller verbose_json (med segments).
Modeller
Välj modell via model-fältet i din request. Varje modell kör på dedikerad GPU-hårdvara i Sverige.
| Modell | Parametrar | Kontextfönster | Vision |
|---|---|---|---|
| qwen3.6:35b-a3b | 35B MoE | 262 144 | ✓ |
| qwen3.5:9b | 9.7B | 32 768 | — |
| gemma4:31b | 31B | 262 144 | ✓ |
| bge-m3:latest | 568M | 8 192 | embedding |
| kb-whisper-large | 1.5B | — | audio (sv) |
Chat-modellerna använder Q4_K_M-kvantisering, stödjer streaming (SSE) och har 262K tokens kontextfönster (32K för qwen3.5:9b). qwen3.6:35b-a3b och gemma4:31b har inbyggd vision — skicka bilder via image_url i messages. bge-m3:latest är en embedding-modell som returnerar 1024-dimensionella vektorer (konfigurera t.ex. pgvector vector(1024)) och anropas via POST /v1/embeddings. kb-whisper-large är KB:s svensk-tränade Whisper-modell och anropas via POST /v1/audio/transcriptions.
Planer
| Plan | Pris | Tokengräns |
|---|---|---|
| Early Adopter | Gratis | 100 000 / dag |
| Pay-as-you-go | 100K gratis + köp extra | — |
| Hobby Mini | 29 kr/mån | 50 000 / dag |
| Hobby | 59 kr/mån | 250 000 / dag |
| Agent Mini | 99 kr/mån | 100 000 / timme |
| Agent | 299 kr/mån | 500 000 / timme |
| Agent Pro | 499 kr/mån | 1 000 000 / timme |
Agent-tiers använder ett rullande 60-minutersfönster istället för daglig cap — kapacitet återvinns kontinuerligt. Behöver du mer än 1M/h? Se Agent Scale på prissidan.
Felkoder
| Kod | Beskrivning |
|---|---|
| 401 | Ogiltig eller saknad API-nyckel |
| 429 | Daglig tokengräns överskriden eller alla slots upptagna |
| 503 | Modellen tillfälligt otillgänglig |
Rate limit headers
Varje svar inkluderar headers som visar din aktuella tokenanvändning.
| Header | Beskrivning |
|---|---|
| X-RateLimit-Limit-Tokens | Daglig tokengräns |
| X-RateLimit-Used-Tokens | Använda tokens idag |
| X-RateLimit-Remaining-Tokens | Kvarvarande tokens |