Sarunājam tā, no sākuma pakopēšu mazliet “sausas” informācijas un pēc tam manas domas par šo tēmu.
Ideja
Valodu intelekta tehnoloģiju centra “Valodu krasts” projekts paredz Latvijā izveidot globālu mazo valodu tehnoloģiju sasniegumu centru. Tajā plānots apvienot un koordinēt pētniecības iestāžu, digitālā satura organizāciju, informācijas tehnoloģijas uzņēmumu, izglītības iestāžu un citu saistīto institūciju sadarbību valodas tehnoloģiju jomā.
Mērķis
Centra darbības pamatā ir dažādi projekti, un tā uzdevums ir attīstīt novatoriskus zinātniskos pētījumus un praktiskās izstrādnes, lai varētu nodrošināt labāko iespējamo tehnoloģisko atbalstu latviešu un citu mazo valodu lietotājiem, ikdienā izmantojot dažādas IT un saziņas tehnoloģiju programmas, informācijas meklēšanas iespējas, kā arī automātiskās tulkošanas un tiešsaistes pakalpojumus interneta vidē.
Idejas globālā aktualitāte
Attīstoties informācijas tehnoloģijai un tās nozīmei vienlīdzīgu informācijas ieguves un saziņas iespēju nodrošināšanā mūsdienu sabiedrībai, ir pieaugusi nepieciešamība tehnoloģiski attīstīt mazās valodas starptautiskā mērogā, lai samazinātu digitālo plaisu, kas vēsturiskajā un tehnoloģiskās attīstības kontekstā izveidojusies starp lielo un mazo valodu grupām. ES Pētniecības un tehnoloģiskās attīstības 7. ietvarprogrammā valodas tehnoloģiju attīstība ir noteikta kā viena no prioritātēm. Attiecīgi strauji pieaugusi nacionālo un starptautisko uzņēmumu interese par valodas un satura apstrādes tehnoloģiju iespējām balss apstrādes, meklēšanas, tulkošanas un citās jomās komercializācijas un produktu lokalizācijas vajadzībām.
Idejas ieviešanas nacionālā nozīme
Izveidojot valodu intelekta tehnoloģiju centru, Latvijai paveras iespēja specializēties un ieņemt patlaban vēl relatīvi brīvu nišu mazo valodu tehnoloģiju jomā globālā līmenī. Izveidojot centru, kas attīstītu un koordinētu šādu tehnoloģiju izstrādi un ražošanu starpvalstu līmenī, Latvijai rastos izdevība gūt starptautisku atzinību augsto tehnoloģiju tirgū un, veidojot pozitīvu valsts tēlu, pārstāvēt uz zināšanām un jaunievedumiem orientētu ekonomiku. Specifisku eksportspējīgu nozares produktu ar augstu pievienoto vērtību ražošana veicinās Latvijas IT kompāniju izaugsmes potenciālu starptautiskā līmenī, kā arī piesaistīs ievērojamas ārvalstu investīcijas valsts ekonomikai.
Partneri/dalībnieki
Īstenojot Valodu krasta iniciatīvu, notiek sekmīga sabiedrības Tilde un Microsoft izpētes centra Microsoft Research, kā arī Engineering Excellence sadarbība. Mašīntulkošanas sistēmas projekta attīstīšanā patlaban iesaistīta sabiedrība Tilde, Microsoft Corporation, Microsoft Latvia, Latvijas Nacionālā bibliotēka un Datorzinību centrs. Mazo valodu tehnoloģiju attīstības projektos iesaistīti vairāki pētniecības centri un uzņēmumi: Latvijas Universitāte, Ventspils Augstskola, Tartu Universitāte, Zagrebas Universitāte, Kārļa universitāte Prāgā, Helsinku Universitāte, Nantes Universitāte, Lietuviešu valodas institūts, Kopenhāgenas Universitāte, Štutgartes Universitātes mašīntulkošanas institūts, Bergenas Universitāte, Upsalas Universitāte, Līdsas Universitāte, Edinburgas Universitāte, Šefīldas Universitāte.
Avots: valodukrasts.lv
Šis projekts nav radies “vakar” un šāda tāda informācija par to publiskajā telpā figurēja jau pagājušajā gadā un par to liecina kaut vai šis ziņu portāla Apollo raksts: Latvija un «Microsoft» īstenos projektu «Valodu krasts». Esam aptuveni sapratuši par ko saruna un tagad tuvāk pie lietas. Šim skaistos vārdos ietērptajam projektam aizmugurē stāv Microsoft tehnoloģiskā platforma un koptulkošanā mēs varam iesaistīties divos veidos. Mēs varam savās mājaslapās/blogos izvietot Microsoft Translator logrīku (widget) un varam arī piedalīties tulkojumu labošanā citās lapās (ja to autors ir logrīkā norādījis iespēju saņemt lietotāju labojumus). Protams, ir vajadzīgs Microsoft LiveID konts, lai varētu piereģistrēt logrīku. Lapas apmeklētāji tulkošanā var piedalīties, ja tās saimnieks tulkošanas logrīkam ir aktivizējis Collaborative Translations iespēju. Lai to izdarītu, pie logrīka veidošanas jāpieprasa ielūguma kods, kas jāpiesaista savam LiveID kontam. Valodu krasta mājaslapā atrodama arī pamācība kā šo sistēmu pieslēgt mūsu mājaslapā.

Valsts prezidenta Valda Zatlera tikšanās ar Microsoft Centrāleiropas un Austrumeiropas reģionālo viceprezidentu
Vahi Torosjanu (Vahe Torossian), Microsoft Latvia pārstāvi Andreju Siliņu un uzņēmuma Tilde vadītāju Andreju Vasiļjevu.
Avots: Valsts prezidenta kanceleja
Mašīntulkošana Internetā nav nekas jauns, taču process ir gana sarežģīts un pat tagad vēl nav izveidotas plašām cilvēku masāma patiešām ērtas un kvalitatīvas tulkošanas sitēmas. Varbūt starp lielajām valodām tulkošana vēl ir kaut cik līmenī, tad mazajām valodām (starp kurām ir arī mūsu – latviešu valoda) šāda tulkošana brīžiem ir vairāk humora līmenī. Pamēģināju ar šo rīku notulkot savu blogu, piemēram, uz krievu valodu un bloga sadaļas nosaukums dzelži tika iztulkots kā “утюги” (no krievu valodas: gludekļi). Protams, rīkam nav īsti nojēgas kuri ir cilvēku personvārdi un tiešā veidā tiek tulkoti arī tie. Secinājums: latviešu valodas mašīntulkošana pagaidām ir bērna autiņos.
Ko darīt? Valodu krasts ir viens risinājums, ka mūsu valodu padarīt saprotamāku mašīnām un tādējādi paplašināt valodas pielietojuma iespējas Internetā. Lai to paveiktu nepietiks vien ar Valodu krastu un to veidojošajiem partneriem – ideālā gadījumā ir jāiesaistās arī visai palielam skaitam brīvprātīgo tulkotāju, kas pielabo greizos tulkojuma variantus un iesaka pareizos. Tamdēļ Valodu krasts arī aicina ikvienu piedalīties tulkošanā un savās lapās izvietot logrīku. Es gan saskatu, ka atsaucība Latvijā būs, maigi izsakoties, maza un tas patiešām ir skumji. Interesanti, ka starp Valodu krasta partneriem ir arī Latvijas Nacionālā bibliotēka un tas liek domāt, ka arī viņi ir ieinteresēti savu informāciju tulkot. Protams, to nevarēs darīt kamēr netiks sasniegts atbilstošs tulkojuma kvalitātes līmenis. Kā nekā bibliotēkas gadījumā teksti ir daudz nozīmīgāki un paliekošāki nekā viendienīšu blogu/ziņu portālu ieraksti. Un nav īsti pieļaujams, ka ģenerālis Balodis tiek iztulkots kā general Dove kā tas notiek šobrīd. Ir jāiegulda milzīgs darbs, lai situāciju uzlabotu.
Es pats testa nolūkos esmu savā blogā izvietojis Microsoft tulkošanas logrīku, lai papētītu cik tad tālu tikusi ir mašīntulkošana kopumā un konkrēti mūsu valodai. Tomēr es pats personīgi neredzu nākotni šādām lapā ievietojamām ārējām sistēmām, es gribētu domāt, ka tulkošanai (kad tiks sasniegts atbilstošs līmenis) būtu jānotiek automātiski/lietotājam neredzami un faktiski pārlūka līmenī. Es nespēju iedomāties tādu ārzemju resursu, kas sniegtu tādu informāciju, ko nevaru atrast citur un tādēļ būtu gatavs burties cauri automātiskajām tulkošanas sitēmām, lai tiktu pie satura. Protams, protams, var gadīties arī šāda vajadzība, bet tā ir ļoti reta, gandrīz tikpat reta cik rets ir kvalitatīvi automātiski nolatviskotas mēstules gadījums. :)
Ir vēl viena nianse, ko nevar neapskatīt. Kā jau iepriekš minēju, tulkošanas tehniskā platforma nāk no Microsoft un ieguldot mūsu pašu darbu mēs faktiski to izdaram kompānijas vietā. Un te var padiskutēt par to cik vajadzīgi tas ir. Jā, es saprotu, ka tukšā vietā nekas nenotiek un labāk, lai ir kāda sistēma ar ko strādāt nevis tikai sapņot par tulkošanu, bet reāli neko neizdarīt. Tomēr ideālā gadījumā es gribētu, lai par to rūpētos kāda pēc iespējas neatkarīga kompānija, kuras primārā interese būtu mūsu valodas tulkošana nevis tulkojuma izmantošana finansiāla labuma gūšanai. Šoreiz tas pat nav tiešs nopēlums Microsoft, kas savā ziņā man pat simpatizē. Tomēr mēs visi draudzīgi iztulkosim kaudzi rakstu darbu (kas gan ir utopiska vīzija zinot mūsu kūtrumu) un būsim vēl vairāk atkarīgi no Microsoft, jo, ak vai, ar laiku valodas risinājumu vislabāk darbosies tieši ar Microsoft pašu veidotām sistēmām, kas maksā reālu naudu. Cik reāli ir līdzīgu tehnisko bāzi izveidot pašiem, uzturēt pašiem? Man šajā jautājumā pats būtiskākais ir latviešu valodas korekta apstrāde un šī darba neatkarība no tehniskās platformas. Un tā arī ir galvenā tēma par ko apdomāt pirms uzsākt tik tālejošus projektus. Taču katrs no mums grib labi paēst jau šodien nevis domāt par skaistu nākotni, kas nāks (ja nāks?) kaut kad. Arī Microsoft. Arī Tilde.
Zinu, ka tuvākajā laikā ir gaidāma publiska diskusija par šiem jautājumiem un es noteikti par to ziņošu. Bet kādas ir jūsu domas par Valodu krastu? Ideja kā tāda ir cēla, bet kā padarīt (mums) labāku tās tehnisko pusi?
P.S. Par šo tēmu tiek rīkota diskusija “Cilvēks vai mašīna: diskusija par kopīgās tulkošanas platformu Latvijā“
Iesaku izlasīt:
- Microsoft Office Live Workspace beta tagad ir pieejams arī latviešu valodā
- Google AdSense reklāmas nu var izvietot arī latviešu lapās
- diena.lv/8778 – piedalies mediju satura veidošanā
- PlatformaMusic.lv: latviešu mūzika bez maksas
- Piedalies Nokia Ovi spēlē un laimē Nokia N97 Mini telefonu

