Gdyby nie bohaterowie drugiego planu, internet w minionej dekadzie byłby co najmniej kilka razy mniej śmieszny. Na szczęście wtedy nie było jeszcze takich technologii jak ta, którą zaprezentowano jako nowość w Microsoft Teams – komunikator ma umożliwiać rozmazywanie tła podczas wideorozmowy.
We współczesnych czasach, coraz częściej różne istotne rozmowy przeprowadza się za pomocą komunikatora przesyłającego zarówno dźwięk, jak i obraz. Ba, znam przypadki przeprowadzania rozmów kwalifikacyjnych za pomocą Skype’a lub rozwiązań mu podobnych. Microsoft wpadł na pomysł, który może zmienić tego typu konwersacje na lepsze.
Jakiś przykład? Chociażby widoczne na powyższym filmie dziecko, które nieco zaburzyło wywiad dla BBC News. Cała sytuacja spotkała się w internecie ze sporym rozgłosem i prawdopodobnie po dziś dzień, wiele osób zna profesora Roberta Kelly wyłącznie z tej wpadki. A co byłoby, gdyby rozmówca korzystał ze współczesnej wersji Microsoft Teams?
Rozmazanie tła odbywa się w czasie rzeczywistym i wcale nie trzeba używać go do ukrywania aż tak ekstremalnych sytuacji. Sztuczna inteligencja równie dobrze poradzi się z zakryciem bałaganu, którego nie zdążyliśmy uporządkować jako leniwy rozmówca, czy nawet ze zwyczajnym ukryciem otoczenia, w jakim aktualnie się znajdujemy w celu zachowania odrobiny prywatności.
Widoczne na przykładzie rozmazanie tła nie wygląda idealnie i daleko mu do efektu bokeh, którym mogą się pochwalić współczesne smartfony, o aparatach pełnowymiarowych nawet nie wspominając. Swój wpływ może mieć na to jakość wykorzystanego nagrania, ale po prawdzie nie ma to szczególnego znaczenia – nie liczy się tutaj efekt artystyczny, a skuteczne odcięcie od tła. Istnieje również nadzieja, że algorytmy będą wraz z czasem coraz lepsze, co pozwoliłoby udoskonalić tę technikę.
Warto nadmienić, że to nie jedyny sposób, w jaki Microsoft Teams wykorzystuje sztuczną inteligencją. Drugim zastosowaniem może być nagrywanie spotkań oraz ich późniejsze odtwarzanie wraz z adnotacjami i specjalnie przygotowanymi transkrypcjami z dźwięku, które są oznaczone czasowo i mogą zostać wykorzystane do dokumentowania danego wydarzenia.
źródło: The Next Web
grafika główna: Microsoft