Integritet · Lokal diktering
Diktering på Mac utan API-nyckel — lokal röst-till-text 2026
När du söker på dikteringsappar för Mac hittar du en kategori som kräver OpenAI-nyckel, en annan som kräver prenumeration på en molntjänst och en tredje som säger sig vara “lokal” men skickar ljudet till en server när du ber om AI-hjälp. Att hitta något som faktiskt körs på din Mac — utan API-nyckel, utan konto, utan att ditt ljud lämnar enheten — är svårare än det borde vara.
Det här inlägget reder ut skillnaderna. Vilka appar är faktiskt offline? Vad menar apptillverkare egentligen med “lokal”? Och hur bra är lokal diktering jämfört med moln, när det gäller svenska?
Varför API-nycklar är ett problem
En API-nyckel till OpenAI eller Anthropic är i sig ingen teknisk skäl att undvika molnbaserad transkribering. Men den för med sig tre praktiska konsekvenser som många missar när de väljer app:
Löpande kostnad. OpenAI debiterar per transkriberad minut. Fem minuters diktering om dagen ger knappt 2 timmar i månaden — vilket med nuvarande priser landar på ungefär 2–4 dollar per månad, eller 25–50 dollar per år. Ovanpå appkostnaden. Siffran låter liten men summeras snabbt: tre år av daglig diktering med OpenAI-beroende kan kosta mer än några engångslicenser sammanlagt.
Ditt ljud lämnar Mac. När transkriberingen sker via en API skickas din röstinspelning till en extern server. Det är inte nödvändigtvis ett problem för alla ändamål — men för advokatkontor, vårdpersonal, psykoterapeuter och alla som hanterar sekretessbelagd information är det ett regelkrav och en riskfråga, inte bara en preferens.
Inlåsning. Om OpenAI höjer priset, ändrar API-villkoren eller avbryter tjänsten slutar din dikteringsapp att fungera — eller kostar mer. Lokal exekvering är ovänlig för externa beslut du inte kontrollerar.
Exempel: 5 min diktering/dag × 22 arbetsdagar = 110 min/mån. OpenAI Whisper API kostar ca $0,006/min = $0,66/mån, $7,90/år. Lågt isolerat — men ovanpå en app som även kostar $144/år (Wispr Flow) summerar det. Lokal diktering har noll marginalägokostnad per minut.
“Lokal” betyder inte alltid det du tror
Det här är den del som kräver mest uppmärksamhet. Många appar marknadsför sig som “lokala” eller “körs på din enhet” — och det stämmer för transkriberingen. Men dikteringsappar gör ofta mer än att transkribera: de städar upp texten, reformaterar mejl, översätter eller anpassar tonen.
De funktionerna kräver typiskt en AI-modell — och de flesta appar hanterar det via ett molnanrop. Det innebär att en app kan vara “lokal för transkribering” men “molnbaserad för allt annat”. För den som bryr sig om integritet är distinktionen viktig.
Tre scenarion att känna igen:
- Lokal transkribering, moln för AI-lägen. SuperWhisper och sæga kör båda Whisper lokalt. Men när du använder deras AI-redigeringslägen skickas den transkriberade texten (inte ljudet) till en LLM. För sæga går det via en proxy eller din egen Anthropic-nyckel. För SuperWhisper väljer du själv vilken LLM och nyckel som används.
- Alltid moln. Wispr Flow och Spokenly skickar alltid ljud till externa servrar — både för transkribering och redigering. Det finns ingen lokal option.
- 100% lokalt. sægas Raw-läge och MacWhispers grundfunktion kör enbart lokalt. Inget ljud, ingen text, ingenting lämnar din Mac. Det är vad “lokal” bör innebära.
Hur lokal Whisper fungerar på Apple Silicon
Whisper-modellerna är stora neurala nätverk som behöver GPU-acceleration för att köra i realtid. På Intel-Mac är det här långsamt. På Apple Silicon är det en annan sak: M-chipsen har en inbyggd Neural Engine och stödjer Metal-acceleration för ML-modeller. I praktiken innebär det att Whisper Small kör på en M1 MacBook Air i realtid utan att värma upp datorn nämnvärt.
Det är också skälet till att lokal diktering inte automatiskt är långsammare än molnbaserad: latensen för ett molnanrop (nätverk + kö + processning + svar) kan faktiskt överskrida lokal inferens på bra hårdvara. Med KB-Whisper Small på en M2-chip är transkriberingen klar på få sekunder efter att du slutat tala.
Vilka appar är faktiskt offline?
| App | Transkribering | AI-redigering | API-krav | Pris |
|---|---|---|---|---|
| sæga Raw | Lokalt | Ingen (Raw) | Nej | Gratis |
| sæga Pro | Lokalt | Proxy / BYOK | Valfritt | $39 |
| MacWhisper | Lokalt | Ingen | Nej | €59–69 |
| SuperWhisper | Lokalt | Valfri LLM | För AI | $99/år |
| Apple Diktering | Delvis lokalt | Ingen | Nej | Gratis |
| Wispr Flow | Alltid moln | Alltid moln | OpenAI | $144/år |
Lokal vs moln — hur stor är precisionsskillnaden på svenska?
För engelska är molnbaserad Whisper via OpenAI API marginellt bättre än lokal Whisper Large — OpenAI använder sannolikt en finare modell än den allmänt tillgängliga. Men för svenska gäller det omvända.
OpenAIs API använder generisk Whisper, tränad på 680 000 timmar ljud från internet med tyngdpunkt på engelska. KB-Whisper är fine-tunad på över 50 000 timmar specifikt svensk taldata: SVT, Sveriges Radio, riksdagsdebatter och arkivmaterial. Resultatet är i genomsnitt 47% lägre Word Error Rate på svenska tal jämfört med generisk Whisper av samma storlek.
Det innebär att lokal KB-Whisper faktiskt slår molnbaserad generisk Whisper på svenska — inte tack vare någon fiffig teknik utan för att den är tränad på rätt data. Läs mer om hur KB-Whisper fungerar →
Så här börjar du diktera lokalt med sæga
Steg för steg, utan API-nyckel:
- Ladda ner sæga från saega.app. Ingen inloggning, inget konto.
- Öppna appen. En liten pil visas i menubar:en. Första gången: bevilja mikrofontillstånd och tillgänglighet i Systeminställningar.
- Välj modell. Under Inställningar → Whisper-modell: välj KB-Whisper Small (gratis, ~150 MB). Den laddas ner en gång och sparas lokalt.
- Välj Raw-läget. Det här är standardläget — ingen API-nyckel behövs.
- Börja diktera. Tryck ⌥Space (Option+Mellanslag) för att börja. Släpp för att transkribera. Texten klistras in där din markör står.
Inget mer än så. Hela flödet — från tryck till text — körs på din Mac. Ingen nätverksanslutning krävs.
När lokal diktering är det enda alternativet
Det finns verksamheter och situationer där lokal exekvering inte är en bekvämlighet utan ett krav:
- Advokatkontor och juridiska bygår. Klientkommunikation och processdokument är sekretessbelagda. Att skicka dem till OpenAIs servrar är i många fall okompatibelt med advokatens tystnadsplikt.
- Vård och omsorg. Patientuppgifter är skärmade under GDPR och patientdatalagen. Molnbaserad diktering kräver en databehandlingsavtal med tjänsteleverantören, vilket de flesta appbyggare inte erbjuder för konsumentprodukter.
- Journalistik med källskydd. Källors identitet och citat som ännu inte publicerats bör inte lämna journalistens enhet.
- Offline-miljöer. Flygplanet, konferensrummet med dålig uppkoppling, fjärrkontorsarbet. Lokal diktering fungerar när internet inte gör det.
För alla dessa scenarion är sægas Raw-läge eller MacWhisper de enda relevanta alternativen på Mac. Jämför hela fältet av dikteringsappar för Mac 2026 →
Sammanfattning
“Lokal” är ett ord som slängs runt löst av appmarknadsförare. Det värda att fråga sig är: lokal vad? Lokal transkribering är en sak. Lokal hela vägen, inkl. redigering, är något annat.
För ren transkribering utan någon molnanslutning å vad som helst: sæga Raw och MacWhisper. För lokal transkribering med valfria molnlägen: sæga Pro eller SuperWhisper. För den som vill ha noll API-beroende och noll löpande kostnad: sægas Raw-läge är det enda alternativet med nordisk precisionsnivå.
Ladda ner sæga och börja diktera på svenska med KB-Whisper. Inget konto, ingen nyckel, inget ljud som lämnar din Mac.
Ladda ner sæga — gratis att börja