Lätlased ja jaapanlased lõid parima eesti-inglise-eesti tõlkemootori ERR
Eestlased Eestis | 06 Nov 2018  | EWR
  FB   Tweet   Trüki    Comment   E-post
 - pics/2018/11/52495_001_t.png

Tehnika
TÜ arvutiteaduse instituudi keeletehnoloogia õppetooli juhataja Mark Fišeli hinnangul on eesti keel masintõlke jaoks keerukas.
Autor/allikas: Erakogu
Tänu Tartu Ülikooli teadlaste pingutustele kasutati masintõlkesüsteemide rahvusvahelisel võistlusel esimest korda eesti keelt. Kõige paremini tõlkisid eesti ja inglise keelt omavahel Lätis ja Jaapanis loodud tõlkemootorid.

https://novaator.err.ee/874855...

Rahvusvahelist masintõlkekonverentsi WMT, mille osana tõlkemootorite võistlus toimub, korraldatakse alates 2006. aastast. Möödunud nädalal pandi Brüsselis võistlusel peale eesti keele inglise keelega paari veel saksa, hiina, tšehhi, türgi, vene ja soome keel.

TÜ arvutiteaduse instituudi keeletehnoloogia õppetooli juhataja Mark Fišeli hinnangul on eesti keel masintõlke jaoks keerukas.

"Eesti keele teeb masintõlke ja automaatse keeletöötluse jaoks raskeks rikas morfoloogia ehk suur arv käändeid ja pöördeid. Samuti on tõlkemootorite jaoks raske eesti keeles vabalt varieeruv sõnade järjekord. Probleem on ka see, et eestikeelsete tõlkenäidete arv on teistest keeltest väiksem. Võistlusel kasutatud väljundikeeltest ongi kõige keerulisemad eesti, soome ja türgi keel," rääkis Fišel.

Ta lisas, et hoolimata eesti keele keerukusest on tänapäevane masintõlge üllatavalt hea kvaliteediga ja suudab luua soravat teksti. "Kuigi tööd tuleb veel palju teha, on juba olemas täiesti kasutatavad tõlkemootorid."

Inimesed hindasid masinat

Konverentsil ja võistlusel osalejad said jaanuaris iga keelepaari kohta mitu miljonit tõlkenäidet. Nad kasutasid näiteid, et masinõppe abil oma tõlkesüsteeme õpetada.

Mai alguses anti kõigile osalejatele iga keelepaari kohta tõlkimiseks kaks teksti. Nii said nad eesti-inglise-eesti tõlkemootori testimiseks ühe ingliskeelse teksti, mille nad pidid tõlkima eesti keelde, ja ühe eestikeelse teksti, mis tuli tõlkida inglise keelde. Võistlejatel tuli panna need tekstid automaatse tõlkesüsteemi abil teise keelde ümber ühe nädala jooksul.

Seejärel hindasid teadlased ja tudengid Tartu Ülikooli korraldatud talgutel, kui hästi on automaatsüsteemid ingliskeelsed tekstid eesti keelde tõlkinud. Nad võrdlesid automaattõlget inimtõlkega.

Kogutud hinnangute alusel reastati tõlkesüsteemid usaldusväärsuse järgi. Tõlkemootorite tõlgitud tekstidest leiti nii häid, omajagu häid kui ka naljakaid lauseid (vaata näiteid artikli lõpust).

Nii eesti-inglise kui ka inglise-eesti suunal hinnati kõige usaldusväärsemaks läti firma Tilde tõlkesüsteem. Mõlemal tõlkesuunal tuli teisele kohale Jaapanis loodud süsteem NICT.

"Lätlaste ja jaapanlaste kasuks rääkis see, et nad saavad kasutada suuri teadusarvutuste keskuseid. Samuti on neil väga targad ideed ja kõige uuemad meetodid, mis teevad nende eesti-inglise-eesti tõlke muu hulgas paremaks Google Translate'ist," kiitis Mark Fišel parimaid masintõlkijaid.

"Õnneks on kõik süsteemid kirjeldatud avalikult jagatud teadusartiklites ning nende abil parandame ka Tartu Ülikoolis loodud tõlkemootorit Neurotõlge."

 
  FB   Tweet   Trüki    Comment   E-post
Eestlased Eestis
SÜNDMUSED LÄHIAJAL

Vaata veel ...

Lisa uus sündmus