Stilling: Evisdom > Internett >

Hva er Datalingvistikk?

Datalingvistikk er et generelt felt som omfatter mange aspekter av psykologi, lingvistikk, logikk og informatikk. Den er opptatt med å hjelpe datamaskiner å forstå språklige problemstillinger for å bli flinkere til å automatisere aspekter ved oversettelse, generasjon, tale og forståelse.

Datalingvistikk ble født etter en rekke mislykkede forsøk på automatisert oversettelse. På slutten av 1940-tallet, så den amerikanske regjeringen et behov for maskin-håndtert oversettelse av tekster, spesielt russiske tekster. Det var antatt, fikk brukervennligheten som datamaskiner hadde blitt tilpasset for å håndtere matematiske problemer, som lærer dem å oversette språk ville være en enkel affære. Det ble raskt klart at problemet var mye vanskeligere, imidlertid, og disiplinen i datalingvistikk ble opprettet.

I de tidlige dager datalingvistikk, var det dominert av datamaskinen forskere. Siden 1970-tallet, har det imidlertid blitt klart hvor kompleks språk egentlig er, og moderne datalingvistikk gjør bruk av eksperter fra en rekke felt.

Maskinoversettelse har alltid vært et hovedmål med datalingvistikk, og en der feltet har gjort enorme framskritt. Oppgaven er svært kompleks og krever identifisering av ordklasser, en forståelse av grammatikk, et omfattende vokabular, og mekanismer for å håndtere talemåter og slang. Maskinoversettelse er langt fra perfekt, men med hvert år de oversettelsene blitt mer presis og mindre tvang.

Talegjenkjenning er et annet område i datalingvistikk som har sett mye offentlig interesse. Etter et par mislykkede forsøk på mainstream talegjenkjenning programvare på midten av 1990-tallet, gikk feltet stille en stund. I det tidlige 21. århundre, men en rekke nye talegjenkjenning programvarepakkene kom på markedet skryte omfattende læringssystemer og høy forekomst av nøyaktighet. Dette har ført til en fornyet interesse for talegjenkjenning programvare for allmennheten og en tilhørende økning i finansiering og forskning.

Tale generasjon er en beslektet felt av datalingvistikk som har sett jevn utvikling siden 1980-tallet. Nå en naturlig-klingende lesing av skrevet tekst er et svært vanskelig problem, men en som har enorme potensielle fordeler. For ikke-seende brukere, kan tale generasjons programvare være avgjørende for å nyte fruktene av den digitale tidsalder.

Datalingvistikk spiller også en stor rolle i automatiserte grammatikk korreksjon systemer, slik som integrert inn i de fleste populære tekstbehandlere . En nøyaktig grammatikkontrollen krever en sofistikert evne til å identifisere ordklasser og en omfattende liste med grammatiske regler og unntak. Mens de fleste mainstream grammatikkontroll fortsatt mange problemer, de er allerede blitt uunnværlig for mange i den nye generasjonen.

Datalingvistikk er et spennende felt å trekke fra en bredt spekter av fagområder. Problemene den har å løse er mange, og ingen er enkle. Den futuristisk visjoner den ser frem til, men gjøre det til en kamp vel verdt stund. Fra drømmen om en universell oversetteren å ord-perfekt talegjenkjenning, kan målene i datalingvistikk ikke annet enn å fremkalle en følelse av undring.

----------------------------------
Forholde Artikkelen:
----------------------------------