Google Translate încă traduce „brânză prăjită și cer”, dar „îmbunătățește”.
Dacă ați tradus ceva prin Google Translate în ultimele săptămâni, este posibil să fi observat că traducerea din slovacă în engleză și invers este mai bună. Compilatorul folosește o tehnologie nouă și îmbunătățită.
Până pe 19 aprilie, Google a folosit un așa-numit sistem statistic care a tradus textul după modele gramaticale predefinite. Nou, folosește rețele neuronale care permit sistemului să învețe cum să traducă texte, astfel încât rezultatul să fie mai aproape de vorbirea umană naturală. Mai bine spus, pentru a face rezultatul mai asemănător cu textele pe care i le-au dat pentru învățare.
Am testat noua tehnologie pe diverse texte în redacție și am consultat rezultatele cu traducători profesioniști.
Deși Google Translate încă traduce expresia „brânză prăjită și cer” ca „brânză prăjită și cer”, altfel s-a îmbunătățit din mai multe puncte de vedere. Noua traducere neuronală vă permite să traduceți propoziții întregi simultan, nu bit cu bit. Folosește un context mai larg în jurul cuvintelor și oferă astfel o traducere mai potrivită. Îmbunătățirea calității ar trebui să fie vizibilă mai ales în cazul propozițiilor mai lungi. Google spune că noua tehnologie poate elimina erorile de traducere cu 55-85%.
„La nivelul propoziției în sine, el poate deja să flexeze în slovacă, știe ce prepoziție este asociată cu verbul, există o schimbare mare în asta. Dar încă îi lipsește conștiința cititorului pe care o are doar o ființă umană ", spune traducătorul și fondatorul inac Aňa Ostrihoňová.
Există multe exemple pe Internet despre greșelile stupide pe care le-a făcut Google Translate până acum. De exemplu, el a tradus expresia „nu lebădă” ca „nu trezi o lebădă”. Astăzi oferă două posibilități - traducerea literală „nu fi o lebădă” și, de asemenea, ca frazeologie „nu fi prost” (nu fi prost). Când traduce din cehă, el știe al treilea sens al „haide” (o poți face, faci progrese, nu ezita).
Graficul arată evaluarea de către utilizator a traducerilor din engleză în spaniolă, franceză, chineză și invers. Traducerea din franceză în engleză arată că traducerea neuronală (verde) este percepută aproape la fel de bine ca traducerea traducătorului uman bilingv mediu (portocaliu). Traducerile în și din chineză sunt mai rele până acum, dar traducerea neuronală a îmbunătățit semnificativ traducerea statistică originală (albastru). Sursa: research.googleblog.com
Sistemul se învață singur
Google înregistrează aproximativ un miliard de traduceri în fiecare zi. El traduce 140 de miliarde de cuvinte în fiecare zi, tastate de peste 500 de milioane de oameni.
Compania a introdus noua tehnologie în noiembrie anul trecut, când a lansat traduceri neuronale pentru primele opt limbi mondiale - germană, franceză, spaniolă, portugheză, chineză, japoneză, coreeană și turcă. Astăzi, noi traduceri funcționează între engleză și peste două duzini de limbi. Din aprilie, slovaca este printre ei.
Traducerea neuronală nu învață de la oameni, ci analizează el însuși textele traduse și învață de la ei. În același timp, limbile individuale nu sunt predate separat, ci sunt prelucrate de mai multe simultan. Este similar cu o persoană care, dacă cunoaște o limbă romanică (franceză sau spaniolă), este mai ușor să învețe limba străină a unei alte rude (portugheză sau italiană).
„Rețelele neuronale traduc propoziții întregi și au nevoie de o putere de calcul enormă. Google traduce între 103 limbi și, dacă ar trebui să creăm un model separat pentru fiecare combinație, hardware-ul nu l-ar strânge ", a declarat Barak Turovsky, Manager de produs al Translator, pentru IMM-uri. „De aceea combinăm limbile în grupuri. În mod ideal, acestea sunt limbi similare din punct de vedere lingvistic, cum ar fi slavă sau indiană. "
Traducătorul Ostrihoňová spune că traducătorul este mult mai inteligent astăzi decât a fost timp de trei sau patru ani. În același timp, el adaugă că traducerea este foarte literală și nu reglementează stilistica. Însuși traducerea cuvintelor dintr-o limbă în alta este minimă. „Dar apoi există registrul, stilul, diferitele straturi de limbaj pe care naratorii le folosesc în dialoguri - Google Translate nu știe asta.”
Cuvintele ei sunt confirmate de Martin Kubuš, care predă la Universitatea Matej Bel despre literatura engleză și traducerea textelor artistice: „Google nu are competență strategică, nu are competență socio-lingvistică. Are doar o bază lingvistică - schimbă materiale lingvistice. "
Potrivit acestuia, compilatorul nu poate decoda stilul, nu are o sintaxă bună. „Este util pentru o persoană care are nevoie să facă o traducere urâtă grosolană, dar nu este suficientă pentru o traducere artistică. Acest lucru necesită o persoană care poate veni cu o strategie adecvată pentru a plăti într-un anumit pasaj al textului. "
„Probabil că nici un singur limbaj nu poate fi redus la reguli pe care software-ul le poate folosi”, adaugă Ostrihoňová. „În plus, limbajul se schimbă și evoluează în fiecare zi, cuvintele capătă conotații diferite”.
Ce greșeli face noua traducere Google în traduceri?
Uneori nici măcar nu traduce text simplu
Se pare că există încă erori în sistem care fac imposibilă traducerea chiar și a textului simplu.
Google Traducere: Nu poți lua de la el în Mexic. Moarte. Sânge. Durere. Tortura este peste tot.
Traducere corectă: Nu-l vei scăpa în Mexic. Moarte. Sânge. Durere. Tortură la fiecare pas.
Unele propoziții nu se traduc corect, deoarece nu le văd în context
Unele propoziții sunt greșite deoarece nu sunt traduse în contextul unui întreg paragraf sau pagină. Ca urmare, nu au sens.
Google Traducere: "Nu are sens."
- Ei bine, este.
Traducere corectă: "Nu are sens"
- Da, da.
Se însușește inutil
„Engleza, germana, franceza sunt adesea însușite - de exemplu,„ ea i-a luat lucrurile ”,„ s-a dus în camera lui ”. O traducem în slovacă, așa cum a mers în camera lui sau „a mers în camera lui” ”, explică Ostrihoňová. „Nu are simțul limbajului. El nu știe că ceea ce este esențial într-o limbă poate să nu fie esențial într-o altă limbă sau dacă este doar o funcție gramaticală care nu este tradusă într-o altă limbă sau este tradusă lexical sau stilistic. "
Google Traducere: Când operatorul a sunat în cele din urmă în cameră, ea stătea pe un scaun la fereastră, aproape că termina oja mâinii stângi.
Traducere corectă: Când în sfârșit a sunat clopotul în camera ei, ea stătea lângă fereastră, pictându-și aproape toate unghiile de pe mâna stângă.
El repetă în mod inutil unele dintre cuvintele din traducere
Google repetă unele cuvinte, deși acest lucru nu este necesar în traducere. „El schimbă doar materiale lingvistice și nu ține cont deloc de unele specificuri ale slovacului”, spune Kubuš.
Google Traducere: "Cine a zis asta?"
„Comodorul spune așa”.
Traducere corectă: "Care a spus?"
- Comodor.
Probleme cu personajele și numele acestora
Google de multe ori nu își dă seama ce fel de personaj are personajul în poveste. Chiar dacă personajul a fost introdus, este posibil ca sistemul să nu mai știe în următoarea propoziție dacă a fost o fată sau un băiat. De asemenea, uneori nu poate gestiona numele personajelor - uneori le lasă în versiunea originală, le traduce câteva rânduri mai jos. Pe partea pozitivă, se înclină, deci știe că ar trebui să folosească sufixul -ová pentru numele de familie ale femeilor.
Dacă nu poate traduce ceva, va folosi limba cehă
În situațiile în care Google nu poate gestiona traducerea unui cuvânt, acesta va ajunge în cehă.
Google Traducere: - Bună ziua, spuse ea, ținând degetele mâinii stângi întinse și îndepărtându-se de halatele albe de mătase.
Traducere corectă: - Te rog, spuse ea, întinzându-și mâna stângă cât mai departe de halatul alb de mătase.
Traducerea este artificială și literală necorespunzător
Unele traduceri sunt literal, deși în slovacă unele lucruri vor fi spus diferit. Astfel, chiar dacă Translator nu face o eroare gramaticală, traducerea este inadecvată. „Este artificial. Nu există nicio interpretare a traducătorului ", spune Kubuš.
Google Traducere: Nu este natura lui
Traducere corectă: Nu este în natură.
Nu știe cine este actorul
În situațiile în care literatura nu menționează în mod explicit cine a făcut ce, traducătorul este pierdut.
Google Traducere: L-am auzit pe Charlie urcând scările și sărind în pat, prefăcându-mă că doarme. El a închis capul în cameră și mi-a spus numele, dar nu i-am răspuns.
Traducere corectă: L-am auzit pe Charlie urcând scările și m-am aruncat în pat în timp ce dormeam profund. S-a uitat în cameră și s-a adresat mie, dar eu nu am răspuns.
Probleme de punctuație
Compilatorul face uneori erori de punctuație fără sens. Uneori introduceți incorect un spațiu între un cuvânt și ghilimele de închidere. De asemenea, inserează incorect un spațiu între cuvânt și următoarele trei puncte, deși această eroare nu a apărut în textul sursă. S-a mai întâmplat să înlocuiască punctul cu o virgulă, deși a lăsat cuvântul următor cu o majusculă, de parcă ar fi începutul unei propoziții.
Are o problemă cu cuvintele învechite
Unele cuvinte mai vechi au evoluat, iar sensul lor s-a schimbat treptat. Cu toate acestea, Google Translate nu poate datează textul, deci nu știe ce traducere să folosească. A avut probleme, de exemplu, când l-am pus să traducă un text din cartea Nouă povestiri, scrisă de J. D. Salinger în 1953.
Google Traducere: Își scoase doi gâturi proaspete pe gât.
Traducere corectă: Scoase două fire mici de pe semn.
El nu știe că slovacul nu mai are vocativ
Google de multe ori nu poate folosi stilul potrivit. În timpul testării, ni s-a întâmplat să folosească cel de-al 5-lea caz, deși aproape nu mai există în slovacă.
Google Traducere: „Mama, dragă, nu țipa la mine, te aud frumos”, a spus fata.
Traducere corectă: „Mamă, dragă, nu țipa la mine. Te aud foarte bine ", a spus fata.
Nu va înlocui încă traducătorii
Testarea noului Translator arată că tehnologiile nu vor înlocui traducătorii profesioniști în viitorul apropiat. Sistemul face încă greșeli pe care traducătorul sau interpretul mediu nu le-ar face.
„Noi, traducătorii, putem fi în continuare liniștiți. Această mașină nefericită nu ne va înlocui încă ", spune traducătorul Martin Kubuš. El consideră că Google Translate ar trebui să traducă cu ușurință texte informative în cazul în care interpretarea traducătorului nu este necesară, cum ar fi manuale și instrucțiuni de utilizare.
„Există o diferență între un text experiențial-expresiv și un text informativ. Google ar putea fi capabil să traducă unele șabloane de contracte, poate s-ar ocupa de așa-numita literatură gri a Uniunii Europene, dar chiar și acolo probabil că ar mai avea nevoie de o ajustare ", spune el. „Dar când vine vorba de interpretarea textului, adăugarea a ceva care nu este de înțeles, scurtarea a ceva, sistemul nu știe”.
Google Translate nu numai că nu înlocuiește traducătorii literaturii frumoase, dar până acum nu poate fi invocat nici măcar în domeniile în care limba utilizată este mai simplă. În textele profesionale, tehnice, financiare sau juridice, gramatica este adesea mai simplă, dar chiar și greșelile mici sunt inacceptabile.
În plus, autorii noului traducător recunosc că noua tehnologie de traducere poate fi în unele momente mai puțin precisă decât vechiul mod de a traduce de fapt cuvânt cu cuvânt. Sistemul încearcă să găsească cea mai bună traducere sonoră și poate avea o problemă, de exemplu, cu traducerea cuvintelor folosite rar. Uneori este posibil să nu puteți traduce toate cuvintele.
Viitorul traducătorului depinde și de calitatea textelor bilingve de la care sistemul va continua să învețe. Utilizarea rețelelor neuronale pentru traducere este într-adevăr o schimbare tehnologică majoră și semnificativă, dar dacă software-ul învață din texte slab traduse, poate învăța și căi rele.
- Farmaciști F Nu există nicio asociere între mortalitatea cauzată de COVID-19 și consumul de ibuprofen
- Droguri printre noi
- Google AdWords în 2017 Opțiuni noi de direcționare
- Google Chrome va începe în curând să filtreze anunțurile lungi enervante înainte sau în mijlocul videoclipului
- Google combate conspirațiile New Time