Nie bez powodu mówi się, że „Google wie wszystko”. Zaczęło się od wyszukiwarki stron internetowych, która rozszerzyła swoją funkcjonalność o przeszukiwanie obrazów. Obecnie inteligentne algorytmy pomagają w uzyskiwaniu wyników wyszukiwania dokładniejszych niż kiedykolwiek. Google chce tak samo katalogować filmy. Z tym, że nie zawsze się to udaje.
Cloud Video Intelligence jest szumnie brzmiącym terminem określającym technologię używaną przez Google, która pozwala maszynom identyfikować kształty i przedmioty na filmach, w taki sam sposób jak robią to już inteligentne algorytmy w przypadku statycznych zdjęć. Dzięki temu filmów nie muszą oglądać ludzie, by później ręcznie oznaczać rodzaj ich treści. Jest tylko jeden problem. Algorytm Google daje się zwodzić jak małe dziecko.
Zespół naukowców z Uniwersytetu Waszyngtońskiego dokonał swego rodzaju incepcji u CVI (Cloud Video Intelligence). Badacze wykazali, że system wykrywania treści jest bardzo podatny na sugestie, które w wypadku ludzi nazwalibyśmy przekazem podprogowym. W efekcie: film jest o jednej rzeczy, a CVI „myśli”, że jest o czymś kompletnie innym. Po zorientowaniu się, na jakich zasadach działa algorytm, ekipa z Waszyngtonu zdała sobie sprawę, że regularne umieszczenie pojedynczych zdjęć między klatkami filmu może kompletnie odmienić postrzeganie materiału przez system CVI.
Żeby udowodnić swoją tezę, naukowcy edytowali wideo przedstawiające bawiącego się tygrysa. Wcześniej „przepuścili” je przez wspomniane zaawansowane narzędzie Google. Pierwsza próba potwierdziła przydatność Cloud Video Intelligence – algorytm oznaczył film tagami „zwierzę”, „przyroda”, „zoo”, „natura” i „turystyka”, co rzeczywiście odpowiadało temu, co znajdowało się na filmie. Następnie, co 50 klatek wstawili pojedyncze zdjęcie samochodu Audi.
Gdy zmodyfikowany film został odesłany do CVI, etykiety przypisane przez algorytm kompletnie się zmieniły – pojawiły się „Audi”, „pojazd”, „samochód”, „pojazd silnikowy” i „Audi A4”. Nie było żadnej wzmianki o dzikich zwierzętach czy naturze, mimo, że tylko 1/50 całości klipu stanowiły zdjęcia auta, a przez resztę czasu ekranowego tygrys chłodził się w basenie.
Narzędzie Google jest wciąż w stosunkowo wczesnym stadium rozwoju i na razie nie jest dostępne publicznie, działając jako wersja beta. Ciekawe, czy odpowiednie modyfikacje sprawią, że algorytm będzie w stanie „oglądać” filmy bardziej całościowo, tak by nie pojawiały się tego typu kwiatki podczas prób etykietowania zawartości. W końcu precyzyjne wykrywanie treści jest tym, do czego Cloud Video Intelligence został stworzony.
źródło: BGR, Типичный Водитель