Profilowanie w internecie to temat, któremu niezwykle blisko do tajemnicy poliszynela współczesnych czasów. Każdy z nas wie, że za darmo to można dostać tylko (w) jedną część ciała, ale jednocześnie z ogromną chęcią korzystamy z bezpłatnych aplikacji, często wybierając gorsze rozwiązanie tylko dlatego, że za lepsze trzeba zapłacić kilka złotych. Czym jest profilowanie i czy należy się go (choć trochę) bać?
Zastanawialiście się kiedyś, jakim cudem funkcjonują w ogóle darmowe usługi? Niby wyświetlają się jakieś reklamy, ale mało kto z nas się im jakoś szczególnie przygląda. Wielu zdecydowało się nawet na ich bezwarunkowe blokowanie. Ale może zwróciliście uwagę, że niezwykle często wyświetlone reklamy są jak uszyte na miarę? Niedługo po tym, jak zniszczyliście buty, przyjemny dla oka baner proponuje zakup nowych. Kiedy długo wyszukiwaliście informacje na temat specyfikacji nowego iPhone’a, sklep proponuje Wam zakup akurat tego urządzenia. Skąd oni to wiedzą?
Przy omówieniu całego zagadnieniu chciałbym się wspomóc konkretnym przykładem, jakim są statystyki z tegorocznego festiwalu Open’er. Przyjrzyjcie się im dokładnie – szczególnie części „Profile użytkowników”.
Być może kojarzycie tę grafikę – została ona opublikowana przez firmę Selectivv i muszę przyznać, że jest ona bardzo interesującym kawałkiem „wiedzy”. Być może właśnie z tego powodu wzbudziła tak duże zainteresowanie. Bo skąd znają płeć? No dobra, to da się oszacować, jeśli bilety są imienne. Najpopularniejsze miasta? OK, po prostu sprawdzili, gdzie sprzedało się najwięcej biletów.
Ale jakim cudem Oni wiedzą, że kobieta stara się o dziecko? Z odpowiedzią na te pytania przychodzi źródło danych. I tutaj należy oddać firmie to, że jest ono wyróżnione nawet na samej grafice. W celu rozwiania wszelkich wątpliwości pozwolę sobie dodatkowo przytoczyć fragmenty tekstu, który został opublikowany wraz z powyższą infografiką.
Baza powstała w oparciu o gromadzone od dwóch lat dane z 200 tysięcy bezpłatnych aplikacji mobilnych oraz 14 milionów mobilnych stron WWW, zawierających reklamy.
Tak, dobrze widzicie. Podczas zdobywania danych statystycznych, firma współpracuje z aż 14 milionami stron WWW i 200 tysiącami mobilnych aplikacji. Sam Selectivv chwali się, że posiada dane o 15 milionach ludzi z Polski (to więcej niż 1 na 3 Polaków), zaś cała baza liczy 50 milionów osób. Niemało, prawda?
Profile konstruowane są na podstawie aktywności w aplikacjach i na stronach www. Przykładowo profil „kobiety starające się o dziecko” zawiera użytkowniczki programów takich, jak PeriodTracker, WomanLog, GetBaby. Profil „mniejszości seksualne” obejmuje użytkowników aplikacji randkowych, skierowanych do osób LGBT. „Osoby zainteresowane zakupem nieruchomości” to użytkownicy, którzy w ciągu ostatnich sześciu miesięcy odwiedzili fizycznie targi mieszkaniowe.
I tutaj pojawiają się szczegóły. Owszem, można kłócić się, że taki sposób zbierania danych jest niedokładny, bo każda kobieta może zainstalować dowolną aplikację, mającą na celu śledzenie cyklu miesiączkowego, ale wcale nie to musi oznaczać, że liczy na rychłe zajście w ciążę. Ale oprócz tego, że sam algorytm uwzględnia takich gagatków, to niemal analogicznie do prawa wielkich liczb Bernoulliego – im większa liczba badanych, tym większa dokładność. A wydaje mi się, że 50 milionów to wystarczająco dużo, aby zatrzeć działalność pojedynczych żartownisiów.
Spójrzcie teraz na swój smartfon i z czystym sumieniem powiedzcie, ile jest na nim darmowych aplikacji. Mówimy o tych, które zainstalowaliśmy ze Sklepu Play, ale pomińmy takie, jak aplikacje banków i tym podobne – te firmy uzyskują pieniądze w inny sposób, przy czym nawet sam Google i Facebook zarabiają na personalizowanych reklamach.
Co prawda deweloper aplikacji z Allegro otrzymuje pieniądze od samego portalu aukcyjnego, którego właścicielom zależy na rozpropagowaniu platformy, ale programista, który zrobił dwie trafne gierki, ma mało sposobów na zarobek – może liczyć na to, że ktoś kupi jego aplikacje na oślep albo wyświetlać reklamy. A jakikolwiek liczący się zysk dają reklamy nie inne niż te, które są spersonalizowane.
Korzystam z darmowych aplikacji – czy jestem zagrożony?
Nie popadajmy w paranoję ;). Pomińmy w naszym rozważaniu nieuczciwe zagrywki i wymuszanie danych, ale… reklama polega na swego rodzaju personalizacji grona odbiorów. Firmom na ogół nie chodzi o poznanie naszych wrażliwych danych, miejsca zamieszkania i tego, kiedy wyjeżdżamy na wakacje, żeby w odpowiednim momencie zorganizować rabunek. Stwierdziłbym nawet, że nie jesteśmy analizowani „jednostkowo”, lecz w bardzo dużych grupach, które łączą poszczególne cechy – na przykład na podstawie konkretnych, zainstalowanych aplikacji, odwiedzanych stron WWW lub… lokalizacji. Tak, nasza lokalizacja też jest analizowana – bo po co wyświetlać reklamę nowego sklepu w Warszawie komuś z Radomia? Skąd Selectivv wie o osobach, które były ostatnimi czasy za granicą, a Mapy Google wiedzą o korkach na trasie? Oczywiście, w celu gromadzenia tych danych potrzebne są konkretne uprawnienia, które my bezmyślnie przyznajemy, ale czasami taka jest cena za coś, na co nie trzeba wydać pieniędzy.
Wielu z Was może się teraz zastanawiać, po co to całe profilowanie i myśleć, że to jakaś niezwykle skomplikowana zagrywka. Ale tak nie jest. To bardzo proste. Wyświetlanie reklam samochodów ludziom, którzy dopiero za kilka lat będą mogli się starać o prawo jazdy, mija się z celem. Szkoda pieniędzy. Ośmieliłbym się nawet powiedzieć, że… szkoda czasu konsumentów!
Ale z drugiej strony, reklamy rzadko kiedy mają na celu obustronną korzyść. Reklamodawcy wzięli sobie (chyba) za punkt honoru omamienie potencjalnego kupca, oszukanie go w celu opchnięcia jakiegoś produktu lub usługi. Teraz w reklamach nie chodzi o to, żeby zwrócić uwagę na daną rzecz. Chodzi o to, żeby próbować wmówić wszystkim, że smartfon za 200 złotych to demon prędkości, suplement diety za kilka złotych zmieni Wasze życie na lepsze, a jedyną słuszną receptą na szczęście jest picie określonego napoju.
Czy profilowanie to coś złego?
Zdecydowanie nie. Chodzi raczej o to, żeby każdy z nas był świadomy tego, na co się pisze. Przecież każdy korzysta z różnorakich usług darmowych – ten wpis też czytacie bez żadnych opłat. Jednym ze sposobów zarobku (lub zwrotu poniesionych kosztów) są właśnie reklamy. A, jak już wspomniałem, reklama jest skuteczna wtedy, kiedy jest trafna. Nie ma w tym nic złego, naprawdę.
Przerażające jest jednak to, że gdzieś na serwerze w odległym miejscu, w folderze o nazwie 105MFE#%#@mkweOW! znajdują się megabajty danych na mój temat, a ja nie mam nad tym kontroli. Nie mogę zalogować na specjalną stronę i kliknąć tam przycisku podpisanego Zapomnijcie o mnie. Nie wiem nawet kto i w jakim celu gromadzi dane na mój temat. I właśnie to jest problem. Nie wyobrażam sobie płacić teraz subskrypcji za każdą usługę, z której korzystam, ale nie miałbym nic przeciwko, gdybym miał wybór. Gdybym mógł płacić kilka dolarów miesięcznie za korzystanie z Gmaila, a oni w zamian obiecaliby mi, że już nigdy nie zajrzą do mojej skrzynki pocztowej.
Czy z profilowania można zrezygnować?
Teoretycznie… tak. Wystarczy wejść w Ustawienia, Google, Reklamy i tam wypisać się z profilowanych reklam oraz zresetować swój identyfikator. To samo można zresztą zrobić na iOS w zakładce Ustawienia Prywatności. Podobno, zgodnie z COPPA (Children’s Online Privacy Protection Act), niezgodne jest zbieranie danych na temat użytkowników poniżej 13. roku życia, więc ustawienie wieku na niższy powinno zbliżyć nas odrobinę do anonimowości.
Przeraża mnie jednak to, ile aplikacji pytało mnie o wiek, a ja nie rozumiałem czemu. Powoli dociera do mnie również fakt, że aby korzystać z Facebooka wystarczy mieć 13 lat (no, lub przekłamać swój wiek). Całość układa się w całkiem logiczną całość, prawda? Strach zadać pytanie, czy da się uciec przed profilowaniem, bo odpowiedź raczej brzmi… nie. Już nawet w Żabkach pojawiają się kamery, które analizują płeć i wiek klientów – po to, żeby móc dostosować i „spersonalizować” ofertę sklepu.
W powyższym wpisie temat profilowania od strony technicznej został poruszony tylko powierzchownie, ale jeśli jesteście zainteresowani tą tematyką, to odsyłam Was do artykułu na portalu Niebezpiecznik (link w źródle), który był inspiracją do napisania tego tekstu.
źródło: Niebezpiecznik, Selectivv
grafika tytułowa: Pexels