• Huvudmeny

14 juni 2016

Projekt för att tillgängliggöra inspelningar

I institutets samlingar finns tiotusentals timmar inspelat tal. Projektet TillTal har nu fått anslag på 9,7 miljoner för att utreda hur man med talteknologins hjälp kan göra den stora arkivskatten mer tillgänglig för forskning.

Bild från inspelning på sextiotalet samt bild på gammal inspelningsutrustning

De äldsta inspelningarna i institutets samlingar är från 1890-talet och inspelningstekniken har skiftat flera gånger sedan dess. På bilden dokumenteras en av de många intervjuer som på 1960-talet gjordes med utvandrade svenskar i Chicago (arkivuppteckning ULMA Sv-Am 1962:1:77).

9,7 miljoner i anslag

Kungl. Vitterhetsakademien och Riksbankens Jubileumsfond har beslutat att ge 9,7 miljoner kronor i anslag till projektet ”TillTal - Tillgängligt kulturarv för forskning i tal” som är ett samarbete mellan Institutet för språk och folkminnen, Kungliga Tekniska högskolan och Digisam. Tanken är att utgå från det stora talmaterial som finns i institutets arkiv och undersöka hur taltaknologiska metoder kan göra inspelningarna mer tillgängliga för forskare. Projektet startar 2017 och pågår till och med 2020.

Tiotusentals timmar tal

Den stora arkivskatten med ljudande material innehåller mängder av godbitar för humanistisk och samhällsvetenskaplig forskning men är ändå dåligt utnyttjad.

”Det är svårt att forska i eftersom det inte går att söka i materialet. Är man intresserad av ett ord eller fenomen är det hopplöst att leta igenom. Bara i våra samlingar finns ungefär 13 000 timmar talinspelningar som är digitaliserade och att lyssna igenom alltihop en enda gång, åtta timmar om dagen, fem dagar i veckan skulle ta mer än sex år”, berättar projektledaren Rickard Domeij.

Syftet med projektet TillTal är att hitta metoder och verktyg för att kunna hantera och bearbeta stora mängder historiska talinspelningar.

Utmaning med historiskt material

Nyckeln till att kunna hantera och analysera stora mängder talinspelningar finns i talteknologin. Det är ett område som fått stort genomslag på senare år, taligenkänning finns till exempel i de flesta moderna mobiltelefoner. Även inom forskningen har talteknologin utvecklats som metod.

”De talteknologiska metoder som finns bygger på analyser och statistik om hur talet ser ut idag. I projektet vill vi undersöka hur man skulle kunna använda talteknologi för att forska i historiskt material. Med ett sådant forskningsverktyg skulle man kunna ta fram mycket spännande material ur väldigt stora mängder data”, säger Rickard Domeij.

Utmaningarna med det historiska talmaterialet är att både inspelningskvaliteten och dialekter, ord och uttryck skiljer sig från de moderna inspelningar som ligger till grund för dagens talteknologiska metoder.

Viktigt med samarbete

En viktig del i projektet är att språkteknologer och forskare arbetar tillsammans. Från institutet deltar förutom språkteknologer även forskare i dialekter och i folkminnen.

”Det användarcentrerade arbetet är viktigt och därför ska språkteknologerna och forskarna tillsammans undersöka behoven och utveckla metoder som passar”, säger Rickard Domeij.

Uppdaterad 22 juni 2016