Generowanie tekstu za pomocą narzędzi sztucznej inteligencji, takich jak ChatGPT, stało się dla części użytkowników bardzo ważnym narzędziem, które znacząco skraca czas pracy i ją ułatwia. Wadą jest jednak brak dostępu do metod wykrycia udziału AI w tworzeniu tekstu. OpenAI ma w zanadrzu kilka sposobów (np. znaki wodne), aby taki zabieg wykryć, jednak nadal ich nie stosuje, a „rozważa” – dlaczego?
Twórcy bota ChatGPT dostrzegają wady w znakach wodnych dla generowanego tekstu
Sztuczna inteligencja jest przydatna, ale wzbudza również niepokój. Dlatego też istotne jest, aby producenci oprogramowania wykorzystującego AI oznaczali wygenerowane treści – nawet wtedy (albo i przede wszystkim wtedy), gdy użytkownik tego nie chce. O ile na obrazach wdrożenie np. znaków wodnych jest proste, o tyle w tekście wydaje się to być problematyczne.
OpenAI – firma będąca właścicielem bota ChatGPT, już rok temu opracowała system do tworzenia znaków wodnych w tekście oraz narzędzie do ich wykrywania. Dotąd jednak ich nie udostępniono – przedsiębiorstwo zastanawia się, czy byłoby to słuszne. Póki co skupiono się na wdrażaniu rozwiązań, które określają pochodzenie treści audiowizualnych, gdyż nagrania wideo i audio są uważane za bardziej ryzykowne aniżeli tekst.
Twórcy bota ChatGPT rozważają dwie metody na określanie pochodzenia treści tekstowych. Jedną z nich jest znakowanie wodne tekstu. Przedsiębiorstwo uważa, że rozwiązanie cechuje się wysoką skutecznością w przypadku lokalnych manipulacji i jednocześnie jest dokładne. Jednak we wpisie zaznaczono, że tę technologię można łatwo obejść poprzez manipulacje globalne, takie jak zastosowanie tłumaczenia, parafrazowanie tekstu lub poproszenie modelu o dodanie znaków specjalnych pomiędzy słowami – co można później łatwo przefiltrować. Dodatkowo OpenAI obawia się, że znaki wodne mogą zniechęcić niektórych użytkowników do korzystania z narzędzi AI do generowania tekstu.
Skoro nie znak wodny, to co?
Twórcy bota ChatGPT opracowali też inną metodę, która miałaby pomóc w rozpoznawaniu treści tekstowych powstałych przy udziale modeli sztucznej inteligencji. Metadane miałyby odpowiadać za określanie pochodzenia danego tekstu, jednak na ten moment firma jest jeszcze na zbyt wczesnym etapie badań – nie jest w stanie wystarczająco dobrze określić skuteczności tego sposobu.
Mimo to przedsiębiorstwo twierdzi, że metadane są bardziej obiecujące od znaków wodnych. Jedną z zalet wymienionych we wpisie blogowym jest brak fałszywie pozytywnych wyników, gdyż sposób ten wykorzystuje kryptografię w przeciwieństwie do znaków wodnych. Te ostatnie co prawda mają niski wskaźnik fałszywie pozytywnych wyników, lecz stosowanie ich do dużych ilości tekstu doprowadziłoby do dużej liczby całkowitych fałszywych wyników pozytywnych.