API-dokumentation

staik erbjuder ett OpenAI-kompatibelt REST API. Byt bara base_url.

Autentisering

Authorization: Bearer sk-st-your-key-here

Base URL

https://api.staik.se/v1

Chat Completions

curl https://api.staik.se/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-st-your-key" \
  -d '{
    "model": "gemma4:31b",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Audio-transkribering

Transkribera ljud till text via KB-Whisper large — Kungliga bibliotekets svensk-tränade Whisper-modell (50 000 timmar svenskt tal). OpenAI-kompatibel — peka bara openai-SDK:n mot api.staik.se.

curl https://api.staik.se/v1/audio/transcriptions \
  -H "Authorization: Bearer sk-st-your-key" \
  -F file=@moten.mp3 \
  -F model=kb-whisper-large \
  -F language=sv

Python (OpenAI SDK drop-in):

from openai import OpenAI
client = OpenAI(api_key="sk-st-your-key", base_url="https://api.staik.se/v1")

with open("moten.mp3", "rb") as f:
    result = client.audio.transcriptions.create(
        model="kb-whisper-large",  # eller "whisper-1" — båda routar till KB-Whisper large
        file=f,
        language="sv",
    )
print(result.text)

Tokens-åtgång

Audio-transkribering debiteras 100 tokens per sekund ljud från samma tokenpool som chat-modellerna. Det betyder att 1 minut audio kostar 6 000 tokens och 1 timme ljud kostar 360 000 tokens.

PlanTokengränsMotsvarar audio
Early Adopter100 000 / dag~16 min / dag
Hobby Mini50 000 / dag~8 min / dag
Hobby250 000 / dag~41 min / dag
Agent Mini100 000 / timme~16 min / timme
Agent500 000 / timme~83 min / timme
Agent Pro1 000 000 / timme~166 min / timme
Pay-as-you-goköpta tokens100K tokens = ~16 min

Varje respons innehåller headers X-Audio-Duration-Seconds och X-Audio-Tokens-Charged så du kan följa användningen per anrop. Max filstorlek: 25 MB (≈ 30–45 min audio). Stödda format: mp3, wav, m4a, ogg, flac, webm, mp4. response_format: json (default), text eller verbose_json (med segments).

Modeller

Välj modell via model-fältet i din request. Varje modell kör på dedikerad GPU-hårdvara i Sverige.

ModellParametrarKontextfönsterVision
qwen3.6:35b-a3b35B MoE262 144
qwen3.5:9b9.7B32 768
gemma4:31b31B262 144
bge-m3:latest568M8 192embedding
kb-whisper-large1.5Baudio (sv)

Chat-modellerna använder Q4_K_M-kvantisering, stödjer streaming (SSE) och har 262K tokens kontextfönster (32K för qwen3.5:9b). qwen3.6:35b-a3b och gemma4:31b har inbyggd vision — skicka bilder via image_url i messages. bge-m3:latest är en embedding-modell som returnerar 1024-dimensionella vektorer (konfigurera t.ex. pgvector vector(1024)) och anropas via POST /v1/embeddings. kb-whisper-large är KB:s svensk-tränade Whisper-modell och anropas via POST /v1/audio/transcriptions.

Planer

PlanPrisTokengräns
Early AdopterGratis100 000 / dag
Pay-as-you-go100K gratis + köp extra
Hobby Mini29 kr/mån50 000 / dag
Hobby59 kr/mån250 000 / dag
Agent Mini99 kr/mån100 000 / timme
Agent299 kr/mån500 000 / timme
Agent Pro499 kr/mån1 000 000 / timme

Agent-tiers använder ett rullande 60-minutersfönster istället för daglig cap — kapacitet återvinns kontinuerligt. Behöver du mer än 1M/h? Se Agent Scale på prissidan.

Felkoder

KodBeskrivning
401Ogiltig eller saknad API-nyckel
429Daglig tokengräns överskriden eller alla slots upptagna
503Modellen tillfälligt otillgänglig

Rate limit headers

Varje svar inkluderar headers som visar din aktuella tokenanvändning.

HeaderBeskrivning
X-RateLimit-Limit-TokensDaglig tokengräns
X-RateLimit-Used-TokensAnvända tokens idag
X-RateLimit-Remaining-TokensKvarvarande tokens

Redo att integrera?