NB Whisper på kommandolinjen.

NB Whisper er Nasjonalbibliotekets talegjenkjenningsmodell for norsk — trent på 66 000 timers norsk tale fra NRK-sendinger, Stortingets taler, lydbøker og dialektopptak. Modellen forstår bokmål, nynorsk og norske dialekter, og er utviklet spesielt for å håndtere norskens store dialektmangfold. OSTT kobler den til ditt hurtigtast og ditt skall på Linux og macOS, via Bergets norgesbaserte infrastruktur.

NB Whisper

Trent på 66 000 timers norsk tale. Forstår dialekter.

NB Whisper er utviklet av NB AI-Lab ved Nasjonalbiblioteket og trent på et unikt datasett: NRK-undertekster, Stortingskorpuset (over 5 200 timers transkribert parlamentstale), NST-databasen, og lydbøker fra Nasjonalbibliotekets digitale samling. Resultatet er en modell som forstår norsk som faktisk snakkes — med dialekter, nynorsk og bokmål. Modellen kjører på Bergets infrastruktur, noe som gir GDPR-kompatibel databehandling uten ekstra konfigurasjon.

# ~/.config/ostt/ostt.toml — velg NB Whisper som standardmodell
[transcription]
provider = "berget"
model = "NbAiLab/nb-whisper-large"

[berget."NbAiLab/nb-whisper-large".params]
language = "no"
hotwords = ["OSTT", "Språkbanken"]
align = true

# Velg interaktivt
ostt model

# Ta opp med hurtigtast, transkriber med NB Whisper, kopier
ostt launch -c

Støtter bokmål og nynorsk

NB Whisper er trent til å transkribere til normalisert bokmål og nynorsk. Den håndterer begge målformene og produserer korrekt ortografi uavhengig av hvilken dialekt taleren bruker — noe generelle Whisper-modeller konsekvent sliter med på norsk.

Forstår norske dialekter

Treningsdataene dekker bred dialektal variasjon: NRK-sendinger fra hele landet, dialektopptak fra Språkbanken og spontantale fra ulike regioner. Modellen er spesifikt trent for å håndtere norskens dialektmangfold.

Data forblir i Europa

Berget er en europeisk skyleverandør. Alle transkripsjoner behandles på servere i Europa, noe som gir GDPR-kompatibel databehandling uten ekstra oppsett. Velg Berget der personvern og datasuverenitet er et krav.

Validerte Berget-valg

Legg til navn og fagtermer med hotwords, sett language=no, og aktiver align=true eller diarize=true når du trenger Bergets ordtidsstempler eller taleretiketter.

Rør til AI-verktøy

Bruk -p-flagget for å kjøre en behandlingshandling etter transkripsjon. Send NB Whisper-output direkte til OpenCode, Claude Code eller et vilkårlig skallkommando uten manuell kopiering og liming.

Retranskripsjon uten nytt opptak

OSTT lagrer alle opptak lokalt. Kjør ostt retry for å transkribere samme lyd med NB Whisper på nytt, eller bytt til en annen modell — uten å snakke igjen.

Arbeidsflyt

Fra tale til nyttig output.

1. Ta oppTrykk på ditt globale hurtigtast eller kjør ostt i terminalen.

2. TranskriberNB Whisper transkriberer lyden via Bergets API.

3. BehandleKjør valgfrie AI-ledetekster eller skallkommandoer på resultatet.

4. SendSkriv til stdout, kopier til utklippstavle, skriv til fil eller rør videre.

Pipeline

Beste norske talegjenkjenning i skallet ditt.

OSTT gjør NB Whisper til et vanlig Unix-verktøy. Transkripsjonresultatet havner på stdout — rør det gjennom jq, sed eller et hvilket som helst CLI-verktøy. Bruk -p for å kjede behandlingshandlinger. Legg til tekniske termer og egennavn i OSTT keywords én gang og forbedre treffsikkerheten i alle fremtidige opptak.

# Transkriber et lydklipp
ostt transcribe meeting.mp3 -o notater.md

# Ta opp, behandle med AI-handling, kopier til utklippstavle
ostt -p clean -c

# Transkriber og rør videre
ostt | mitt-skript.sh

Legg til NB Whisper i terminalen din med én kommando.

Dokumentasjon Berget-leverandørreferanse