Przyszłość internetu i branży tłumaczeniowej z dużymi modelami językowymi

Przyszłość internetu i branży tłumaczeniowej z dużymi modelami językowymi

1 marca 2023 roku odbyła się wyjątkowa konferencja online pod nazwą „ChatGPT in Localization”, zorganizowana przez firmę Custom.MT. Było to pierwsze tego typu wydarzenie w całości poświęcone roli nowej technologii wykorzystywanej w branży tłumaczeniowej i lokalizacyjnej.

Konferencję rozpoczął Marco Trombetti, prezes firmy Translated, który opowiedział o sztucznej inteligencji (AI) i tłumaczeniu maszynowym oraz o wpływie modelu ChatGPT na lokalizację oraz przyszłość branży językowej.

Człowiek a maszyna

Dlaczego przekład jest tak ważny? Ponieważ język to najbardziej ludzka rzecz, jaka istnieje. Bez niego nie jesteśmy w stanie ewoluować. Z pomocą tłumaczenia możemy przełamać bariery utrudniające komunikację osobom mówiącym w różnych językach, a to z kolei – według Trombettiego – pozwoli nam wejść na wyższe stopnie drabiny ewolucji.
Istnieje pogląd, że maszyny nie są w stanie tłumaczyć tak dobrze jak ludzie, ponieważ nie potrafią one zrozumieć realiów codzienności oraz szerszego kontekstu. Aby udowodnić nieprawidłowość tego stwierdzenia, Trombetti wziął udział w następującym eksperymencie:

  • Przygotowano angielskie zdanie: „A language translator in the 90s translating on a computer. Oil painting” („Tłumacz języka pracujący na komputerze w latach 90. Obraz olejny”), po czym przełożono je na język francuski za pomocą tłumaczenia maszynowego: „Un traducteur de langue dans les années 90 traduisant sur un ordinateur. Peinture à l’huile”.
  • Następnie skorzystano z modelu enkoder-dekoder, który bazuje na rekurencyjnych sieciach neuronowych występujących m.in. w systemach przetwarzania języka naturalnego. Model ten został wytrenowany, aby „wejść w umysł” maszyny w celu zinterpretowania jej procesu myślowego – do przeprowadzania eksperymentu użyto właśnie tej funkcji.
  • Zaopatrzony w konkretne wytyczne program stworzył system przetwarzający słowa na obrazy, czego rezultatem było dzieło przedstawiające identyczne znaczenie zawarte w oryginalnym zdaniu:

Według Trombettiego eksperyment ten udowadnia, że maszyny rozumieją sens tekstów, które tłumaczą – i to o wiele lepiej, niż nam się wydaje. To ludzie nie są jeszcze w stanie wydać im odpowiedniego polecenia, aby wydobyć z nich pożądane informacje. Czy na podstawie wyników eksperymentu możemy jednoznacznie stwierdzić, że sztuczna inteligencja ma możliwość głębszego zrozumienia otaczającego nas świata? Jest to temat na zupełnie inny artykuł.

ChatGPT

Czym dokładnie jest ChatGPT? To chatbot stworzony przez amerykańskie laboratorium badawcze OpenAI, działający na zasadzie przewidywania następnego słowa w danym kontekście (który na chwilę obecną może być tekstem liczącym nawet do 1500 słów). Jak każde automatyczne rozwiązanie ma on swoje plusy i minusy:

  • Bardzo dobra identyfikacja kontekstu. Program nie tłumaczy tekstów słowo po słowie lub zdanie po zdaniu, lecz patrzy na całą treść, w związku z czym nie popełnia błędów wynikających z nieznajomości kontekstu.
  • Bardzo dobre dostosowanie tłumaczenia do wytycznych. Aplikacja wykona tłumaczenie w stylu, jakiego będziemy od niej wymagać – nawet w tym bardzo formalnym.
  • Średnia jakość tłumaczenia. Sprawdzając tłumaczenie świeżo przygotowane przez program, redaktorzy znajdują wiele błędów – ChatGPT robi ich więcej niż popularne narzędzia do tłumaczenia maszynowego, np. Google Translate.
  • Powolne tłumaczenie. Program poświęca przynajmniej pięć sekund na jedno słowo.

Choć ChatGPT wciąż boryka się z licznymi problemami (np. halucynacjami), Trombetti przewiduje, że poradzenie sobie z nimi to tylko kwestia czasu. Jedno jest pewne – będzie z czego wybierać, ponieważ na rynku sztucznej inteligencji pojawiają się coraz to nowsze duże modele językowe (large language models lub LLM-y), takie jak BLOOM (BigScience), Chinchilla (DeepMind) czy LLaMA (Meta).

Przyszłość rynku tłumaczeniowego

W jaki sposób duże modele językowe mogą wpłynąć na rynek tłumaczeniowy? Ludzie będą korzystać z tych narzędzi, aby tworzyć treści bezpośrednio w języku docelowym, zatrudniając następnie doświadczonego copywritera, który zweryfikuje poprawność powstałego tekstu. Da nam to możliwość publikowania lepszych tekstów przy jednoczesnym zmniejszeniu kosztów. Narzędzia takie jak ChatGPT będą wykorzystywane również jako pomoc przy pisaniu całkiem nowych treści, a także do tworzenia contentu od zera na podstawie istniejących już publikacji – z tą różnicą, że prawdopodobnie będzie on lepszy jakościowo.

Mimo że technologia ta nadal budzi pewne wątpliwości, wiele osób jest zachwyconych działaniem ChatGPT. Dlaczego?

Pierwszym powodem jest wiara, że program będzie stale udoskonalany. Już teraz działa wyjątkowo dobrze – i to pomimo korzystania z minimalnej ilości danych. W tym miejscu warto też podkreślić, że ChatGPT nie zastępuje takich narzędzi jak wyszukiwarki internetowe czy translatory, a jedynie stanowi dla nich ekscytującą alternatywę.

Co więcej, wszystko wskazuje na to, że ludzie po prostu tego chcą. Może wynikać to z konieczności lub ze zwykłej ciekawości, jednak faktem pozostaje rekordowa liczba 100 milionów użytkowników zarejestrowanych w zaledwie dwa miesiące od uruchomienia aplikacji.

Ostatnim powodem jest otwarta przestrzeń, w której każdy może odegrać jakąś rolę – możliwości są nieograniczone, a dane darmowe i ogólnodostępne. Jedyną przeszkodą są koszty ponoszone za trenowanie tego typu modeli, jednak nawet to może szybko ulec zmianie.

A co z internetem?

Jak zauważył Trombetti, internet opiera się na tworzeniu treści, z którymi użytkownicy mogą wejść w interakcję, a to z kolei napędza biznes. Status quo został jednak zaburzony przez LLM-y, stąd twórcy contentu mają dwie możliwości: zablokować LLM-om dostęp do swoich publikacji lub stworzyć ogromną ilość treści, które mogą wpłynąć na sposób, w jaki model będzie przekazywać informacje użytkownikom. Obie te opcje nie są w pełni zadowalające – czy też możliwe.

Jaka więc przyszłość czeka internet?

Najlepszym rozwiązaniem wydaje się zadbanie o synergię modeli językowych i treści tworzonych przez ludzi. Udostępniając użytkownikom źródła, z których czerpią informacje, LLM-y będą napędzały ruch na stronach, a ludzie zaczną sprzedawać więcej produktów i usług przy użyciu LLM-ów.

Musimy jednak działać szybko – o ile modele językowe są stosunkowo nowym wynalazkiem, nie będą nim wiecznie. Wkrótce zostaną zastąpione przez jeszcze nowsze technologie i rozwiązania.

Podsumowując swoją prezentację, Trombetti powiedział: „Tłumaczenia są największym problemem dla sztucznej inteligencji, ale to właśnie one zainspirowały jej powstanie” . Tworzone są coraz to nowsze rozwiązania, które tak naprawdę mają jeden wspólny cel: pomóc ludziom porozumieć się ze sobą nawzajem.

Podziel się tym wpisem

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *