Google Translator Toolkit: fordíts és tanítsd

Szerző: Dátum: jún 10, 2009 Kategória: Egyéb Google

A Google fordító szolgáltatása körül legutóbb akkor volt komolyabb élet a magyar interneten, amikor bekerült a magyar nyelv is a kiválasztható nyelvek közé. Akkoriban sok kritika érte a szolgáltatás pontosságát. Nem csak a magyar fordítások Achilles-sarka az eltérő nyelvtan, a sok szinonima, amelyek közül nem mindig választja ki a szövegkörnyezetnek megfelelő változatot a fordító rendszer. A hibás fordítások jelzésére, javaslatok beküldésére a kezdetektől fogva lehetőségünk van, most azonban még egy fokozattal feljebb kapcsoltak a Google háza táján: megjelent a nagyobb, hosszabb szövegek, Wikipédia szócikkek fordítását támogató Google Translator Toolkit.

Kicit beszélni magyar

Mindenki tudja, hogy szép nyelv a magyar és amikor furcsán csóváljuk a fejünket, amikor angol vagy más nyelvvizsgán ülünk, jusson eszünkbe mindig, hogy aki a magyart tanulja, annak talán el is törik néha a nyaka a sok csóválástól. Nincs egyszerű helyzetben a Google sem, amikor a magyar nyelvvel kell megküzdenie.

Néhány szalagcím, bekezdés helyes fordításának beküldése mellett azonban sokkal több tanulási lehetőséget biztosít a rendszernek a Google Translator Toolkit.

Wikipedia, Knol, meg amit akartok

A rendszer új fordításnál jelenleg négy lehetőséget kínál, ami alapvetően le is fed szinte minden eshetőséget: feltölthetünk egy dokumentumot, ami a sima szöveges fájltól a Word dokumentumon át az OpenOffice dokumentumig bármilyen ismert formátum lehet, de elkezdhetjük egy weboldal fordítását is a címének megadásával.

Google Translator Toolkit: feltöltés

Google Translator Toolkit: feltöltés

A Googleról olvastam már, hogy nagyon szerelmes a Wikipédiába, hiszen az egyes szócikkek sokszor első találatként jelennek meg, ami talán nem is annyira meglepő: az enciklopédia karbantartását, moderálását nagyon komolyan veszik, az Index egyik cikke is megerősítette, hogy a fontosabb, nagyobb látogatottsággal bíró szócikkekbe történő vandálkodást hamar észreveszik és korrigálják, így megbízható információ forrás lehet (bár ez a kijelentésem könnyen válthat ki hitvitát :-)) Egy Wikipédia oldal címének beírásával külön eszközt kapunk a magyar nyelvű szócikkek bővítésére, a kész fordítást pedig rögtön visszatölthetjük a magyar nyelvű Wikipédiába!

Google Translator Toolkit: Wikipedia fordítás

Google Translator Toolkit: Wikipedia fordítás

A Google saját megoldása sem maradhatott természetesen ki a lehetőségek közül. A Knol-t sokan kritizálták már pontatlansága miatt, sok spam jellegű, önreklámozó szócikk jelent meg benne és igazából hiába áll mögötte egy Google, valahogy sosem tudott kitörni és komoly konkurenciaként működni. Ennek ellenére természetesen a Wikipédiához hasonló módon Knol bejegyzéseket is fordíthatunk és publikálhatunk néhány klikkeléssel.

Tanulni, tanulni, tanulni

A Google Translation Toolkit egy érdekes háttértárat is tartalmaz, amit translation memory-ként említenek. Ez az adatbázis az emberi fordításokat tartalmazza és kiegészítőként, tudásbázisként szolgál a gépi fordítások pontosítására, fejlesztésére. Amikor egy mondat vagy bekezdés fordításán dolgozunk, a rendszer előveszi ezt a tudásbázist a háttérben és megnézni, fordítottak-e már ilyen vagy hasonló szöveget korábban.

A leginkább relevánsként értékelt lehetőségeket felkínálja, amit ha elfogadunk, tovább csökkenthetjük a fordítások elkészítéséhez szükséges időt. Nyilván minél többen használják az eszközt, annál nagyobb adatbázist lehet építeni és annál pontosabb, eredményesebb javaslatokkal állhat elő a rendszer.

Akik pedig azért aggódnak, hogy saját fordításaikat, féltve őrzött szövegrészeiket valaki az engedélyük nélkül felhasználja, saját dokumentumaiknál létrehozhatnak külön, privát translation memory-t is, amelyet nem oszt meg a rendszer másokkal, mi magunk viszont elővehetjük későbbi projektjeink során.

Végezetül álljon itt az a kis videó, ami bemutatja az új eszköz képességeit:

Szóljon hozzá!