• Huvudmeny

Vad är en språkdatabank?

Språkdatabanken ska innehålla stora mängder språk i digital form, det vill säga text- och talkorpusar, som kan användas för att utveckla språkteknologiska tjänster.

Allt material i språkdatabanken behöver märkas upp med information om uttal, ordklasser, meningsbyggnad med mera. Denna uppmärkning behövs för att med teknikens hjälp analysera och använda materialet i databanken. Språkbanken kan också innehålla olika sådana digitala språkverktyg.

Att etablera en sådan databank är ett dyrt och omfattande arbete, men språkdatabanken bör ses som en nödvändig digital infrastruktur för forskare och företag som sysslar med avancerade språkteknologiska tjänster.

Varför behövs en språkdatabank?

En nationell språkdatabank behövs för att främja språken i Sverige och stimulera utvecklingen av teknik som kan göra information och service tillgängliga för alla.

I dag finns det språkteknologiska lösningar för flera av samhällets tillgänglighetsproblem vad gäller kommunikation och information.

Ett exempel är automatisk direkttextning av tv-program. Talat språk kan omvandlas till text utan att gå via en mänsklig textares tangentbord. SVT har som mål att texta alla sina program, även de direktsända, och är därför i stort behov av ett sådant system.

Ett annat exempel är automatisk översättning från text eller tal till teckenspråk. Det finns animerade teckenspråksavatarer som på en skärm skulle kunna direkttolka en text eller ett samtal.

Ett tredje exempel är automatisk uppläsning, exempelvis av webbplatser, för synskadade eller människor i läs- och skrivsvårigheter.

Problemet är att dessa lösningar i dag främst finns för engelska och andra stora världsspråk. I Sverige måste vi anpassa systemen för svenska och för de nationella minoritetsspråken. Då krävs stora mängder tal och text i digital form, och det är ett för stort och för dyrt arbete för enskilda aktörer. Därför behövs en nationell språkdatabank med tillgängliga resurser för alla som har behov av dem. Det gäller forskare så väl som företag som gör översättningstjänster eller röstsynteser.

Uppdaterad 06 maj 2014