Íslendingar geta verið leiðandi á heimsvísu við að þróa máltækni fyrir lítil málsvæði sem gerir fólki kleift að tala við tölvur á eigin tungumáli. Slíkt er mikilvægt til að standa vörð um íslenskuna, segir Úlfar Erlingsson, doktor í tölvunarfræði sem starfar við öryggismál hjá Google.

Tölvan finni bestu myndina af ömmu

Úlfar var gestur Bergsteins Sigurðssonar í Helgarútgáfunni á Rás 2 í morgun. Hann ræddi þar um tölvugreind og möguleika til samskipta við tölvur. „Tölvan ætti að geta orðið að góðum aðstoðarmanni, hjálpa við ýmis verkefni umfram útreikninga og annað slíkt," sagði Úlfar. „Möguleikarnir eru eiginlega þeir að í staðinn fyrir að nota tölvur eins og við höfum notað þær, sem einhvers konar bókhaldstæki, þá hverfi tölvurnar einn í umhverfið hjá okkur og við getum í raun og veru beðið umhverfið um að gera eitthvað fyrir okkur með rödd eða ábendingum eða einhverju svoleiðis eins og við værum með aðstoðarmann með okkur." 

Úlfar sagði að í framtíðinni ætti ekki að skipta máli hvar fólk væri eða hvað það væri að gera. Tölvan ætti að geta hjálpað til við ýmis verkefni, hvort sem er að búa til góðan brandara fyrir fyrirlestur eða finna góðan tíma í dagbókinni þar sem maður eigi ekki að vera að leika sér með börnunum eða finna allra bestu myndina af ömmu sem hægt sé að nota í afmæliskort fyrir hana. „Hún ætti að geta leyst það þannig að þú þurfir ekki lyklaborð eða leita að rétta forritinu. Þú ættir að geta sagt: Mig vantar rosalega góða mynd af ömmu sem passar í kort fyrir hana, og tölvan ætti að geta komið með það undir eins á skjáinn."

Google lærði íslensku vegna starfa nokkurra Íslendinga

Tölvan ætti til dæmis að geta túlkað jafnóðum yfir á önnur tungumál, sagði Úlfar og lét símann sinn túlka orð sín jafnóðum yfir á þýsku og kínversku. Þannig ætti fólk sem skilur ekki mál hvors annars að geta talað saman með aðstoð túlkunarþjónustunnar.

Úlfar sagði í Helgarútgáfunni að flestar takmarkanir tengdust því að þetta krefðist mjög mikilla gagna. „Og ég ætla að láta hana túlka yfir á íslensku þar sem við erum ekki búin að nota stórar gagnanámsaðferðir á gagnagnótt til að búa til íslenska rödd. I would like to say something in Icelandic please. Mig langar til að segja eitthvað á íslensku takk. Þetta var ekki mjög gott!" sagði hann hlæjandi að lokum og sagði ástæðuna þá að ekki væri búið að leggja pening í máltæknina.

Android-notendur geta gúglað á íslensku með mæltu máli. Það er vegna þess að nokkrir Íslendingar starfa hjá Google og hafa komið því til leiðar að íslenskan hefur verið meðal þeirra tungumála sem fyrirtækið hefur unnið með. Til samanburðar má nefna að færeyskuna skilja tölvurnar ekki.

Íslenskan skilgreini þjóðina

Úlfar sagðist aðspurður vona að íslenskan myndi ekki deyja út vegna breytinga sem verði á umhverfi fólks á næstunni. „Vonandi hjálpar tölvugreindin að bjarga íslenskunni. Ég trúi því fastar en fótunum að íslenskan sé í raun og veru það sem skilgreini þjóðina. Án tungumálsins erum við ekkert svo mikið þjóð, það er einhver menningarheimur en hann tengist algjörlega inn í tungumálið."

Úlfar nefndi máli sínu til stuðnings að nú væru börn á leikskólaaldri farin að sletta á ensku eftir að hafa horft á myndir með enskutali. Hann sagði að Stúdíó Sýrland stæði framarlega á heimsvísu í talsetningu mynda en kvað að hægt yrði að fara aðrar leiðir með tölvugreind. „Þá væri hægt að fá tölvuna til að túlka þetta sjálfkrafa og búa til íslenska útgáfu af þessum teiknimyndum og þar með bjarga því að við séum ekki að hafa annað tungumál fyrir börnunum meðan þau eru á svona krítísku stigi við að læra tungumál."

Tiltölulega auðvelt en þarf tengingu við stærri rannsóknir

Hann segir að það væri hiklaust hægt að gera þetta tiltölulega auðveldlega. Takmörkin séu þó þau að gögnin fyrir lítið málsvæði eins og Ísland dugi ekki til vinnslunnar. Því þurfi að byrja á að læra á stærri grundvelli, svo sem hvað séu umhverfishljóð. „Bara það að skilja þar á milli þarf alveg ofboðslega mikið af dæmum og það færðu ekki bara á íslensku." Því þurfi að taka til dæmis allar kvikmyndir, allar bækur eða allt sem skrifað er á Wikipedia. Þetta þurfi svo að nota sem grunn svo tölvurnar skilji tungumálin.

Úlfar segir að Ísland geti verið leiðandi í þessari nýju tölvugreindartækni. „Íslensk máltækni getur verið leiðandi í að taka lítil málsvæði og fatta hvernig er hægt að nota þessa tækni til að búa til máltækni fyrir þetta málsvæði. Þannig að við getum verið leiðandi í að búa til máltækni fyrir færeyskuna og þó ótrúlegt megi virðast, fyrir svæði eins og málsvæði innan Indlands eða Bangladess þar sem 20 milljónir tala málið en þar sem þeir eru fátækir og búa úti í sveit mun aldrei neinn búa til máltækni fyrir þetta fólk."

Þannig geti Ísland verið leiðandi fyrir hundruð málsvæða. Eigi þau að fá tölvuna sem aðstoðarmann og geta talað við hann á sínu máli þurfi einhver að leiða þá vinnu og fatta hvernig hægt er að staðfæra námið og gögnin yfir á þessi litlu svæði.

Huga verði að tungunni ekki síður en niðurníddum húsum

Í ár voru settar 30 milljónir króna í máltækni á fjárlögum. Úlfar segir að sú upphæð dugi hvergi nærri til og að auki sé mjög mikilvægt að Íslendingar reyni ekki að byggja þetta upp sjálfir. Öll leiðandi tölvufyrirtæki vinni að lausnum og réttast sé að vinna með þeim.

Úlfar leggur þó áherslu á að unnið sé að þessu. „Ef það er verið að bjarga einhverjum húsum fyrir hundruð milljóna úti í bæ, einhverjum gömlum niðurníddum húsum eða eins og núna síðast þegar var verið að friða einhvern gamlan hlaðinn vegg niður við sjó finnst mér að ætti að huga að tungunni, sérstaklega þegar börn eru farin að leika sér á ensku í sandkössunum."

Úlfar segir að Íslendingar séu komnir að vatnaskilum þegar tungan er annars vegar. „Aðgangur að ensku efni og enskri tungu hefur aldrei verið meiri og hann hefur sérstaklega aldrei verið meiri fyrir leikskólabörn." 

„Vegna starfs örfárra Íslendinga sem vinna hjá Google þá er eina litla tungumálið í heiminum, sem við erum búnir að vera að tala um, íslenska. Þannig að ef einhver á að taka af skarið og leiða þá vinnu að fatta hvernig er hægt að nota þessa tækni fyrir lítil málsvæði þá eru það Íslendingar."

Úlfar segir að fólk á Íslandi geti unnið með stóru fyrirtækjunum. Hann benti á að nú skilji iPhone ekki íslensku en Android-símar geri það. Því lægi við að taka íslenskuna sem Google hefur lært fyrir Android og færa hana yfir í iPhone-símana. Hann sagði Google-fyrirtækið vera reiðubúið að gefa íslenskuna og þetta væri því bara spurning um áræðni Íslendinga.