Veiledning: Hvordan transkribere lyd til tekst?

Få innhold fra lyd- og videoopptak transkribert til tekst, slik at du kan bruke det på flere måter i bedriften.

Innhold
    Innhold

      Måten vi mennesker kommuniserer på, endres hele tiden. Hulemalerier, brevduer, trykkpressen, Internett, telekommunikasjon og tekstmeldinger er bare noen få eksempler. Vi tenker stadig nytt når det gjelder å spre informasjon.

      Uansett medium omfatter de fleste kommunikasjonsformer enten lyder vi kan høre, eller symboler vi kan se. Begge deler har sine fordeler og ulemper. I dagens digitale verden dominerer det visuelle.

      Gjennom Internett kan visuelt innhold ses og deles av uendelig mange personer over hele verden på uendelig mange måter. Det betyr at det ligger et stort potensial i å gjøre om lydopptak til tekst.

      Omgjøring av lyd- og videoinnhold til tekst kalles transkribering.

      Hva er transkribering?

      Det oppstår ofte forvirring når ord som «transkribering» blandes sammen med liknende ord som «oversettelse» og «transkribere».

      Selv om de ligner, betyr «oversettelse», «transkribering» og «transkripsjon» forskjellige ting. Med tanke på lingvistikk betyr oversettelse å uttrykke meningen i talt eller skrevet tekst på et annet språk, transkribere betyr å skrive ut en tekst og en transkripsjon er den skrevne versjonen av en talt tekst.

      Så de tre termene har ulike betydning, men de er nært beslektet (særlig når du oversetter en transkribents transkripsjon!).

      Hvorfor transkribere?

      Det er tidkrevende å overføre tale fra lyd- eller videoopptak til skrift. Så hvorfor ta seg bryet med å transkribere?

      Her følger fem eksempler på hvordan du og bedriften din kan dra fordel av transkribering.

      1. Bedre arbeidsprosesser
      Et skriftlig dokument sparer tid for alle som arbeider med lyd eller video. En redaktør kan merke tekst og sette inn kommentarer i et transkribert dokument på en måte som ellers ville vært mer tidkrevende, upraktisk eller kanskje helt umulig.

      2. Bedre rangering i søkemotortreff
      Videoer er alltid bedre enn tekst i sosiale medier og nettbutikker. Søkemotorer derimot kan kun arbeide med skriftlig innhold. Med transkribering får du begge deler: videoer som appellerer til mennesker, og skriftlig innhold som er enklere å finne for søkeroboter.

      3. Bedre kommunikasjon
      Få gjort om innhold fra møter, taler og kurs til varige, håndfaste dokumenter som kan brukes lenge etter at ordene ble sagt. Transkripsjoner fra ulike arrangementer kan brukes til flere formål. En tale kan for eksempel bli til markedsføringsinnhold eller en e-postmelding til medarbeidere, eller redigeres og bearbeides til en presentasjon av en ny forretningsmulighet.

      4. Bedre tilgjengelighet
      Transkribert innhold fra lyd- eller videoopptak (f.eks. undertekster) gjør det tilgjengelig for personer med nedsatt hørsel. I mange land er det lovpålagt å transkribere alt offentlig lyd- og videomateriale.

      5. Bedre effekt i sosiale medier
      Lydfiler er ikke like virkningsfulle i sosiale medier som tekst og bilder. Transkriberte lydopptak kan gjøres om til korte tekster som øker antall delinger i sosiale medier og genererer mer nettrafikk.

      Hvor brukes transkribering?

      Det er behov for transkribering i de fleste bransjer. Her følger en kort beskrivelse av hvordan ulike bransjer kan bruke transkribering til å oppnå salgs- og driftsfordeler.

      Medier
      Lyd- og videoopptak fra for eksempel arrangementer, taler på konferanser og podkaster kan transkriberes til redigerbare skriftlige dokumenter.

      Akademiske institusjoner
      Transkribering brukes i læreinstitusjoner som skoler og universiteter for å heve kvaliteten på undervisningen, gi bedre tilgang til læreressurser og gi studentene søkbare versjoner av forelesninger og foredrag på nettet.

      Forsikringsbransjen
      Forsikringsselskaper tar ofte opp intervjuer med skadeanmeldere, vitner og andre berørte parter. Transkripsjon av lydopptakene kan brukes som dokumentasjon i behandlingen av forsikringskrav.

      Journalistikk
      Når journalister gjør intervjuer, pleier de som regel å ta opp intervjuene og transkribere dem etterpå, ofte ved hjelp av programvare eller en leverandør av transkriberingstjenester. Journalister har et ansvar for å rapportere og sitere korrekt. Transkripsjoner gir dem nøyaktig dokumentasjon som de kan bruke når de skal skrive artikler eller hvis det er behov for å sjekke ting i etterkant.

      Markedsforskning
      Tilbakemeldinger fra fokusgrupper, intervjuer og observasjoner er viktige når et produkt skal lanseres på markedet. Markedsforskere bruker transkribering til å gjøre om lydopptak til søkbare dokumenter, slik at de har nøyaktig dokumentasjon på hva som ble sagt om hva, når og av hvem.

      Hvilke typer transkripsjoner finnes?

      Det finnes flere typer transkripsjoner. I noen tilfeller er ordrett transkribering viktig, i andre tilfeller er det viktigste at det er lett å lese. Noen ganger er en kort gjengivelse av innholdet tilstrekkelig.

      De fire vanligste typene transkripsjoner er ordrett transkripsjon, intelligent ordrett transkripsjon, redigert transkripsjon og fonetisk transkripsjon.

      1. Ordrett transkripsjon

      En ordrett transkripsjon inneholder alt som høres, og alle pauser som oppstår. Alt fra hosting og latter til opphold i snakkingen og fyllord (eh, hm, så, liksom) tas med. I en ordrett transkripsjon registreres også lyder som dører som slamres igjen, og telefoner som ringer.

      2. Intelligent ordrett transkripsjon

      I en intelligent ordrett transkripsjon fjernes alle irrelevante elementer fra teksten, for eksempel fyllord og unødvendige repetisjoner. Resultatet er en konsis, lettlest tekst som ellers er tro mot det opprinnelige lydopptaket.

      3. Redigert transkripsjon

      En redigert transkripsjon er en versjon der alt overflødig innhold fjernes, grammatikkfeil rettes og ufullstendige setninger fullføres. En slik transkripsjon kan bli mer formell enn den muntlige versjonen, men den vil være lettere å lese og forstå enn den opprinnelige ordrette transkripsjonen.

      4. Fonetisk transkripsjon

      I en fonetisk transkripsjon brukes symboler til å registrere fonemer (de minste språklydene med betydningsskillende funksjon i et språk) i stedet for ord. Fonetisk transkribering følger samme prosess for alle språk, med symboler som representerer samme lyd. En fonetisk transkripsjon er nyttig når uttale er viktig, for eksempel ved sammenligning av tale i ulike aldersgrupper, på ulike steder eller i ulike tidsperioder.

      Fonetisk versus ortografisk transkripsjon

      Til forskjell fra fonetisk transkripsjon følger ortografisk transkripsjon standardiserte språkregler og påvirkes ikke av endringer i uttale. Den populære australske TV-serien Naboer er for eksempel kjent for å ha introdusert stigende intonasjon på slutten av setninger for resten av den engelskspråklige verden. Mens dette ville vært umiddelbart gjenkjennelig i en fonetisk transkripsjon, vil en ortografisk transkripsjon ikke indikere noen forskjell. Ortografisk transkripsjon foretrekkes for store volumer, særlig ved bruk i forskning, der presis informasjon om uttale er uvesentlig.

      Manuell versus automatisk transkripsjon

      Transkribenter, for eksempel stenografer i retten og de som behandler sensitive opplysninger (for eksempel bevismaterialer i etterforskninger og avhør), bruker mange år på å bygge kompetanse til å levere transkripsjoner av ypperste kvalitet.

      Denne ekspertisen koster både tid og penger. Det gjør at manuell transkribering er uegnet for store prosjekter med stramme tidsfrister.

      Automatisert transkribering reduserer tidsbruken og kostnadene betydelig. Her brukes programvare til å utføre transkriberingen. En ulempe med dette er transkribering av dialekter. Resultatet varierer avhengig av AI-teknologien som brukes, og produktets maskinlæringsevne. Teknologien er ennå ikke god nok til at transkripsjonen blir helt nøyaktig.

      Om det er best å bruke manuell eller automatisk transkribering, avhenger av hvor sensitivt innholdet er, og hvor høy nøyaktighet som kreves. Ofte er tid viktigere enn presisjon. Et godt kompromiss kan være å kombinere de to metodene ved å først bruke programvare til å transkribere og deretter få en fagkyndig person til å rette feilene.

      Hvordan transkribere?

      Profesjonell transkribering krever høy kompetanse som må utvikles over mange år. Her er seks grunnleggende regler for den som vil bli en god transkribent:

      1. Lytt til hele lydopptaket før du begynner å skrive. Det gjør det lettere å fange opp stilnivået og oppfatte essensen i det som blir sagt. Dette er spesielt nyttig når du ikke kjenner dialekten.

      2. Lytt til hele setningen før du skriver den ned. Da forstår du konteksten bedre og unngår misforståelser fordi ting høres likt ut (for eksempel «kjære» og «tjære»).

      3. Gå nøye gjennom den ferdige transkripsjonen, se etter feil og dårlig grammatikk. En dyktig transkribent er også en dyktig redaktør.

      4. Lær deg en egnet tastemetode, slik at du kan taste raskt, nøyaktig og ergonomisk. Krampe i hånden kan skje den beste. I noen nye verktøy for transkribering brukes fotpedaler for å øke hastigheten og effektiviteten. Med en fotpedal kan brukeren starte og stoppe lydopptaket med foten, og har begge hendene frie til å taste.

      5. Gjør deg kjent med relevante sjargonger og forkortelser som brukes i lydopptaket som skal transkriberes. Dette er spesielt viktig innenfor fagområder, for eksempel medisin, der bruk av fagtermer kan gjøre at det som blir sagt, høres ut som et fremmed språk.

      6. Sjekk, sjekk og sjekk igjen at terminologien er korrekt, at alle setninger gir mening og at transkripsjonen er fullstendig og nøyaktig.

      Bruk tidsstempler som hjelpemiddel

      Tidsstempler har ofte formatet [HH:MM:SS] som angir timer, minutter og sekunder fra lydopptaket startet til en bestemt ting ble sagt. Det gjør det mulig for redaktører å gå rett til et bestemt sted i lydfilen uten å måtte gå gjennom hele opptaket. Tidsstempler er nyttige for transkribenter også, spesielt for å finne igjen og dobbeltsjekke ekstra vanskelige tekstavsnitt.

      Tidsstempler kan brukes på flere måter i transkripsjoner, for eksempel:

      • Tidsstempler som angir når tale begynner og slutter, er nyttige når det ikke er dialog helt fra starten av opptaket.
      • Tidsstempler som angir når en ny person begynner å snakke, kan være til hjelp når du skal finne viktige momenter i et lydopptak.

        Erna: (00:00:00) Hei, alle sammen, og velkommen til podkasten min.
        Bent: (00:00:02) Og min!
        Erna: (00:00:03) Okei, okei … Velkommen til podkasten vår da.
      • Du kan også legge til et nytt tidsstempel for hver setning (selv om dette kan føre til en mindre oversiktlig transkripsjon).

        (00:00:00) Dette er et kort eksempel på en transkripsjon. (00:00:02) Tidspunktet da hver enkelt setning starter, vises i tidsstemplet. (00:00:05) Dette er bare en av mange måter å bruke tidsstempel på.
      • Et vanligere krav er periodisk tidsstempel, som legges til med forhåndsdefinerte tidsintervaller (for eksempel hvert tredje sekund eller hver halvtime).

        (00:00:00) Dette er et eksempel på en transkripsjon (00:00:03) der det er satt inn et tidsstempel hvert tredje sekund (00:00:06).

      Transkribere intervjuer

      Det er mye informasjon å hente etter et intervju ved å analysere transkripsjonen av intervjuet.

      Det første trinnet når du skal transkribere et intervju, er å identifisere hva som er formålet med transkripsjonen. Hvis du bare trenger en kort oppsummering, kan du konsentrere deg om hovedpunktene i stedet for å transkribere ord for ord.

      En transkripsjon er et dokument der du kan søke etter bestemte ord. Tidsstempler gjør det enklere å følge teksten mens man lytter til lydopptaket. Det er raskere og enklere å dele en tekstfil med andre enn å dele lyd- og videofiler, som er mye større, og en tekstfil er mye enklere å redigere.

      Et skriftlig dokument gir også bedre muligheter til å gjøre en objektiv vurdering av det som blir sagt, uten å bli forstyrret av utseendet og kroppsspråket til den som snakker. Kommentarer og tagger transkribenten har lagt til, kan gjøre det lettere å evaluere teksten og gjøre en mer kvantitativ analyse (for eksempel merke bestemte følelsesladde ord).

      Transkribere samtaler

      Det kan være en utfordring å transkribere lydopptak der to eller flere personer snakker, særlig hvis det er mange avbrytelser og flere personer som snakker samtidig.

      Den mest brukte fremgangsmåten er å transkribere det hver enkelt person sier, på en egen linje. Hvis de snakker samtidig, kan du indikere dette ved å gi begge linjene samme tidsstempel. Hvis det ikke er mulig å høre hva den ene personen sier, kan du legge til taggen «uhørlig».

      Transkribere videoer

      Transkribering av muntlig innhold kan være tidkrevende, men lønnsomt. Teksting av videoer på nettsider har vist seg å føre til bedre rangering i søkemotortreff og ha større innvirkning på besøkere (i tillegg til å gjøre det lettere å søke etter innholdet).

      Så hvordan bør det gjøres?

      Her følger fire metoder som kan brukes til å transkribere videoinnhold. Hver metode har sine fordeler og ulemper. Velg den metoden som passer best for ditt behov.

      1. Transkriberingsapper for mobiltelefoner

      En mobiltelefon er et enkelt verktøy for lydopptak når du er på farten. De fleste smarttelefoner har en funksjon for å overføre tale til tekst, og du kan laste ned en rekke transkriberingsapper fra appbutikkene.

      2. Gratis transkribering av videoer på nettet

      Du får mange treff når du søker etter gratis transkriberingsverktøy på nettet. Kvaliteten på disse gratisprogrammene varierer mye. Derfor bør du alltid korrekturlese teksten, siden den kan være full av feil. Hvis en video kan lastes opp til YouTube, kan du bruke YouTubes funksjon for automatisk teksting, som tilbyr transkribering med en nøyaktighet på opptil 80 prosent, avhengig av lydkvaliteten (YouTube støtter imidlertid ikke alle språk).

      3. Transkriberingsprogramvare for datamaskiner

      I tillegg til transkriberingsverktøyene som finnes på nettet, kan Mac- og PC-brukere laste ned programvare til datamaskinene sine som gjør det mulig å bruke verktøyene uten internettforbindelse.

      4. Tekstingstjenester

      Profesjonelle tekstingstjenester og lokaliseringsleverandører er dyrere enn gratis programvare, men resultatet er utmerket og sikkerheten og konfidensialiteten ivaretas på en bedre måte.

      Eksempler på verktøy for transkribering

      Nylige fremskritt innen kunstig intelligens og maskinlæring har ført til at det har kommet en rekke nye produkter for overføring av tale til tekst, både mobilapper og programvare for datamaskiner, og både enkeltprodukter og operativsystemer med innebygde transkriberingsverktøy.

      Her følger en kort oversikt over noen av de mest populære verktøyene på markedet.

      Dragon Anywhere er egnet for Android og iOS, og kan også synkroniseres med skrivebordversjonen av programvaren. Programvaren gjenkjenner tale med høy nøyaktighet. Den er skybasert og krever derfor internettforbindelse. Du må abonnere på Dragon Anywhere, kjøp for engangsbruk er ikke mulig.

      Dragon Professional er laget for å hjelpe profesjonelle brukere gjennom hele prosessen. Enkel å bruke og mange funksjoner, blant annet for å diktere, redigere dokumenter, opprette regneark og talesøk på nettet. Appen har innebygd intelligens som gjør at den kan lære stemmer, ord og fraser mens den transkriberer.

      Otter er et skybasert program laget for bærbare datamaskiner og smarttelefoner. Transkribering i sanntid lar brukere søke, redigere, spille av og organisere data etter behov. Otter er godt egnet til transkribering av intervjuer og forelesninger, og forenkler også samarbeid mellom team.

      Verbit er laget spesielt for bedrifter og læreinstitusjoner. Det bruker nevrale nettverk til å oppnå best mulig resultat, også når det er støy i bakgrunnen. Med Verbit er det også mulig å bruke redaktører for å sikre nøyaktigheten.

      Speechmatics er en omfattende og fleksibel tjeneste for å overføre tale til tekst. Den støtter de vanligste engelske aksentene, uansett nasjonalitet, både ulike amerikanske og britiske dialekter, sør-afrikansk engelsk, jamaicansk engelsk og mange flere.

      Braina kombinerer transkriberingstjenester med en virtuell assistent i ett brukervennlig grensesnitt. Braina-brukere kan søke på nettet, ta notater og velge musikk under transkriberingen. Kan transkribere over 100 språk med opptil 99 % nøyaktighet.

      Windows 11, Microsofts nyeste operativsystem, har innebygd dikteringsprogramvare. I nesten alle tekstfelt kan brukere slå den på, begynne å snakke og se teksten på skjermen.

      I MacOS er Apples dikteringsverktøy bygd inn, slik at du kan bruke det i alle tekstfelt. Funksjonen blir bedre etter hvert som du bruker den, siden den kan lære seg talekjennetegn, blant annet dialekter.

      Google Voice Typing for Google Dokumenter gir det nettbaserte tekstbehandlingsprogrammet en funksjon for overføring av tale til tekst. Alt du trenger, er en Google-konto, nettleseren Chrome og internettforbindelse.

      Utnytt potensialet til lydinnhold med transkribering

      Transkribering er en lett tilgjengelig mulighet til å utnytte potensialet til lydmateriale for å oppnå konkurransefortrinn og raskt få nytt innhold ut på nettet.

      Når tale gjøres om til tekst, åpnes uendelige muligheter til å bruke teksten på blogger, som innlegg i sosiale medier, som markedsføringsmateriell, til opplæring og mye mer. Du vil bli overrasket over hvor mange muligheter det er til å utnytte lydinnhold etter at det er gjort om til tekst.

      Hvordan kan du få mer ut av dine lyd- og videoopptak?