Od redakcji: Analiza Chrisa Kanavaugh - antropologa z Oxfordu - pierwotnie ukazała się na łamach jego bloga i w portalu Medium.com. Wywołała mnóstwo komentarzy w stylu: "Nareszcie ktoś to napisał". Jest to ważny głos w dyskusji na temat Facebooka i danych, które trafiły do Cambridge Analytica. Tekst publikujemy za zgodą autora.
***
Jeśli obserwujesz “Guardiana”, “New York Times” czy inne duże portale, prawdopodobnie zauważyłeś, że firma Cambridge Analytica często pojawia się w nagłówkach.
Historia pokrótce wygląda tak: podejrzana firma analityczna z Wielkiej Brytanii, z pomocą 24-letniego geniusza, wymyśliła innowacyjny sposób na zhakowanie Facebooka i wykradzenie danych 50 milionów użytkowników. Później użyła tych danych, by pomóc Trumpowi i twórcom kampanii promującej Brexit zmanipulować wyborców za pomocą precyzyjnie targetowanych reklam. W rezultacie w brytyjskim referendum zdecydowano o wyjściu z Unii Europejskiej, a Trump został wybrany na prezydenta USA.
Niestety, niemal wszystko w powyższym podsumowaniu jest nieprawdziwe lub mylące.
Po pierwsze, nie było wycieku.
Dane zebrano z profili użytkowników Facebooka, po tym, jak ci wyrazili zgodę, by dostęp do nich miały firmy zewnętrzne. Kojarzycie te małe okienka, które wyskakują podczas gry w Candy Crush albo gdy logujecie się za pomocą Facebooka zamiast stworzyć osobny profil na dowolnej stronie? To właśnie one.
Screen z Facebooka god-knows-what.com
Wykładowca Cambridge Aleksandr Kogan - nie Cambridge Analytica i nie informator Christopher Wylie - stworzył aplikację “Test your personality”. Żeby ją wypromować, płacił użytkownikom dolara za jej zainstalowanie, a następnie używał jej do zebrania danych zgromadzonych od osób, które udzieliły wymaganych zgód podczas uruchamiania aplikacji. Aplikację zainstalowało 270 tys. osób, więc wydawałoby się, że zgromadzono dane z 270 tys. profili, ale w rzeczywistości było ich aż 50 milionów.
50 milionów? Tak. W 2014 roku na Facebooku istniała opcja “friends permission”, która pozwalała twórcom aplikacji na dostęp nie tylko do osoby, która instalowała program, ale również do wszystkich jej znajomych. Jedynym sposobem, by temu zapobiec, była zmiana ustawień prywatności, o których istnieniu wiedziało wtedy jeszcze niewielu użytkowników Facebooka. Dzięki “friends permission” Kogan z 270 tys. zezwoleń zgromadził dane z 50 milionów profili.
To, że użytkownicy Facebooka dzielą się swoimi danymi przez znajomych, bez swojej wiedzy i bezpośredniej zgody, zaniepokoiło wiele osób działających na rzecz ochrony danych osobowych. Dlatego w 2015 roku, w związku z rosnącą krytyką, Facebook skasował opcję “friends permission”, twierdząc, że chcą dać użytkownikom “większą kontrolę”. Ta decyzja wywołała konsternację wśród twórców aplikacji, wśród których opcja dostępu do profili znajomych była niezwykle popularna. Sandy Parakilas, były manager Facebooka, mówił Bloombergowi, że przed usunięciem używały jej “dziesiątki albo nawet setki tysięcy twórców”.
Dla przypomnienia, dwie kluczowe rzeczy do zapamiętania:
To, jak ważny jest ten drugi punkt, widać, gdy czytamy tego typu wypowiedzi:
Simon Milner, policy director brytyjskiego Facebooka, pytany, czy Cambridge Analytica posiadało wewnętrzne dane Facebooka, odpowiedział parlamentarzystom: “Nie. Mogli mieć wiele danych, ale nie takie dane użytkowników Facebooka. To mogły być dane osób, które są na Facebooku, a które zdobyli sami, ale to nie są dane udostępnione przez nas”.
Te słowa podaje się za dowód, że Facebook okłamał polityków co do swoich związków z Cambridge Analytica. Ale kiedy zrozumiecie różnice między niedostępnymi dla nikogo wewnętrznymi danymi Facebooka i danymi zebranymi przez twórców zewnętrznych aplikacji, zrozumiecie, że policy director firmy najprawdopodobniej mówi prawdę.
A więc, gdzie w tej historii pojawia się Cambridge Analytica?
Cóż, zapłacili Koganowi za zebranie dla nich wspomnianych 50 milionów profili. Kto wpadł na ten pomysł – nie wiemy, ponieważ obie strony mają jedynie słowo przeciwko słowu. Kogan twierdzi, że Cambridge Analytica zgłosiło się do niego, a Cambridge Analytica – że to Kogan przyszedł do nich. Bez względu na wersję, to właśnie w tym momencie całej historii nastąpiło przekroczenie uprawnień. Uprawnień wciąż niezwiązanych z samymi danymi wewnętrznymi Facebooka, ale z zasadami udostępniania danych zebranych przez aplikacje. Twórcy aplikacji, także wtedy, w 2014 roku, posiadali zgodę jedynie na ich zbieranie, a nie sprzedawanie ich innym firmom.
Z drugiej strony, wbrew oficjalnym zapewnieniom, reprezentanci Facebooka nie przyłożyli specjalnej wagi do tego, co dzieje się z danymi, które udostępnili twórcom aplikacji. Najprawdopodobniej właśnie to lekkie podejście spowodowało, że po wykryciu sprzedaży danych zebranych przez Kogana do Cambridge Analytica w 2015 roku, wystarczyła im jedynie pisemne zapewnienie o tym, że dane znajdujące się w posiadaniu obu stron zostały skasowane.
Istnienie kolejnych dziesiątek lub setek tysięcy twórców z dostępem do tego samego rodzaju danych prawdopodobnie więc oznaczało kolejne transakcje z osobami trzecimi i innymi firmami. I znów były manager facebooka potwierdza – spytany o kontrolę Facebooka nad udostępnianymi danymi, odpowiedział, że jest ona “Zerowa. Absolutnie żadna. W chwili opuszczenia serwerów, nie było żadnego wglądu w to, co się z nimi dzieje”. Parakilas dodał, że “zawsze podejrzewał istnienie czegoś w rodzaju czarnego rynku”, na który trafiały dane przekazane zewnętrznym twórcom.
Wiemy zatem, że Facebook niespecjalnie utrudniał pozyskiwanie danych przez nieuprawnione podmioty, a także że istnieje wiele zewnętrznych podmiotów z informacjami na temat większej ilości użytkowników niż te powiązane z 270 tysiącami profili. Czemu w takim razie to Cambridge Analytica skupiło na sobie uwagę dziennikarzy?
Stało się tak głównie za sprawą dziennikarzy, a w szczególności Carole Cadwalladr i sposób, w jaki zaprezentowała całą historię. Większość publikacji ukazała sprawę dwutorowo. Z jednej strony opowiadano o informatorze z Cambridge Analytica , który ujawnił to, jak złamano zasady udostępniania danych, z drugiej – że wyciek miał związek z sukcesem kampanii prezydenckiej Donalda Trumpa.
Christopher Wylie Jwslubbock - Own work, CC BY-SA 4.0, https://commons.wikimedia.org/w/index.php?curid=67925183
Drugie ujęcie sprawy jest równie podejrzane, co pierwsze, i opiera się głównie na sensacyjnych doniesieniach Chrisa Wyliego, byłego pracownika Cambridge Analytica. Carole Cadwalladr, która poświęciła tej historii kilka lat pracy, tłumaczy, że postanowiła zaprezentować temat nie z perspektywy dziennikarki śledczej, lecz bardziej osobiście. Oznacza to, że skupiła się na jego ludzkim wymiarze, a konkretnie – na Chrisie Wylie’m. Taka perspektywa ma swoje plusy i minusy, jednak głównym problemem jest to, jak bardzo zależna od punktu widzenia Wyliego stała się zarówno ona, jak i cały jej materiał, który dziwnym trafem przedstawia go jako młodego geniusza stojącego za ogólnoświatowym spiskiem politycznym.
Cadwalladr w pełni przyjmuje jego punkt widzenia i dość pochlebnie prezentuje go słowami: “sprytny, zabawny, sarkastyczny, mądry, piekielnie inteligentny, intrygujący”, “niewiarygodnie młody”, “jego ścieżka kariery, tak samo jak reszta życiowych osiągnięć, jest niespotykana, absurdalna, niemożliwa do osiągnięcia”, “Wylie żyje dla idei”, “obserwując go, gdy skupia na czymś siłę swojej uwagi – swój strategiczny umysł, dbałość o każdy szczegół, zdolność planowania na 12 kroków w przód – można się go nawet przestraszyć”, “lista jego wybitnych talentów zawiera również wysoko rozwiniętą intuicję polityczną, przy której House of cards przypomina raczej wesoły program kulinarny”.
Cóż to za człowiek!
Spojrzenie Cadwalladr, skupione na osobie, sprawia, że artykuły stają się łatwiejsze w odbiorze, jednocześnie jednak sprzyja pominięciu istotnych szczegółów technicznych na rzecz ekscytujących cytatów i osobistych anegdot Wyliego i jego znajomych oraz współpracowników. Prezentowane w ten sposób informacje potencjalnie mogą być przydatne, jeśli tylko podda się je rzetelnej weryfikacji, jednak rzadko kiedy dzieje się tak w praktyce. Zamiast tego, dziennikarka zdaje się bezkrytycznie przyjmować całość narracji Wyliego: “od pierwszego spotkania na żywo, byłam z nim już w stałym, codziennym kontakcie”.
Rozprawmy się więc z przeoczeniami wynikającymi z podejścia prezentowanego przez Cadwalladr i spójrzmy na to, co mówi Wylie krytycznym okiem:
Ostatni podpunkt, choć najważniejszy dla przebiegu historii, jest tym, któremu brakuje największej liczby dowodów.
Kuszące w tej sytuacji może wydać się wskazanie jako dowodu niespodziewanego zwycięstwa Donalda Trumpa, jednak sprawa jest bardziej złożona. Tak, Trump oczywiście wygrał, jednak zdobył zwycięstwo konkurując z najmniej popularnym kandydatem Demokratów we współczesnej historii, który dodatkowo ubiegał się o trzecią kadencję tej partii (co nie udało się nikomu od lat 40-tych). Ponadto, wygrał niewielką różnicą, zdobywając zresztą mniejszą liczbę głosów.
Czy może to być dowód na skuteczność i precyzję “psychologicznego” targetowania przez Cambridge Analytica? Być może, ale tym samym wkraczamy w strefę, w której stawiane tezy stają się nie do udowodnienia. Sensowniejszym podejściem jest przestudiowanie dotychczasowych osiągnięć i porażek Cambridge Analytica w podobnych przypadkach. Nie posiadamy niestety dostępu do pełnej listy ich klientów, wiemy natomiast, że pierwsze głośne wzmianki na ich temat zaczęły pojawiać się przy okazji kampanii prezydenckiej Teda Cruza. Tak, zgadza się, ten sam Ted Cruz, który odniósł spektakularną porażkę przeciw Trumpowi podczas prawyborów dotyczących prezydenckiego kandydata Republikanów, posiadał całą siłę Cambridge Analytica na swoje żądanie. Nie jestem pierwszą osobą, która zauważyła tę sprzeczność, w zeszłym roku Martin Robbins z Little Atoms opisał to tak:
Wydarzenia związane z prawyborami Republikanów zdają się sugerować, że nowoczesne technologie używane przez zespół naukowy Cambridge Analytica przegrały z gościem, który prezentował się na stronie stworzonej za tysiąc dolarów. Stworzenie z tego ekscytującej historii o pseudonaukowej metodzie, która zapewniła Trumpowi triumf w późniejszych wyborach prezydenckich, jest więc sporym nadużyciem. Dla kogo jeszcze pracowała firma? Bez listy klientów łatwo jest dobrać przykłady tych, o których jest głośno, czyli tych, którzy odnieśli sukces.
Techniki rzekomo stosowane przez Cambridge Analytica to między innymi generowanie komunikatów stworzonych na podstawie danych pozyskanych z mediów społecznościowych, dzięki czemu treść dopasowana indywidualnie do konkretnego użytkownika może mieć najwyższą skuteczność. Dokładnie to mają na myśli osoby mówiące o “mikro-targetach” i “psychografikach” skierowanych do wyborców. Spora część twierdzeń na temat skuteczności tego typu działań jest zdecydowanie przesadzona. Kogan – wspomniany wcześniej pracownik naukowy z Cambridge, który znajduje się w samym centrum tej kontrowersyjnej sprawy – twierdzi podobnie. Uważa, że zrobiono z niego kozła ofiarnego i tłumaczy, że zgromadzone przez niego informacje o profilach nie były zbyt pomocne przy tworzeniu mikro-targetowanej kampanii:
Po głębszym zbadaniu tematu odkryliśmy, że na podstawie przewidywań, którymi podzieliliśmy się z SCL [grupa, której częścią jest Cambridge Analytica], prawdopodobieństwo błędnego wykazu wszystkich pięciu badanych cech jest 6 razy wyższe niż wskazanie ich zgodnie z rzeczywistością. W skrócie – nawet, jeśli dane zostały użyte w mikro-targetującej kampanii, to mogły jej jedynie zaszkodzić.
Kogan nie jest rzecz jasna osobą bezstronną, ale jego wypowiedź znajduje potwierdzenie w innych badaniach, które jednoznacznie wskazują na mniej niż zadowalające rezultaty podstępnych manipulacji w mediach społecznościowych. Przykładem może być tutaj kontrowersyjne badanie Facebooka funkcjonujące pod nazwą “mind control”, czyli dosłownie “władza nad umysłem”, na które dziennikarze w ostatnich dniach chętnie się powołują. To, czego w tych wzmiankach brakuje, to informacja o tym, jak rozczarowujące były jego wyniki.
Facebook przeprowadził eksperyment na niemal 689 tysiącach profili – badanie polegało na zmianie algorytmu odpowiedzialnego za wyświetlanie nowych postów swoich znajomych na tablicy danego użytkownika. Algorytm pokazywał więc posty z większą liczbą pozytywnych lub negatywnych słów w zależności od wybranej grupy. Każdy badacz wie, że tak duża próba gwarantuje znalezienie wymiernych statystycznie różnic pomiędzy grupami. Jeszcze ważniejszym kryterium w przypadku dużej grupy badawczej jest sprawdzenie siły efektu eksperymentu. Efekt jest rzeczywiście “zatrważający”: osoby otrzymujące bardziej pozytywny przekaz zaczęły używać w swoich własnych statusach o około 0,05 pozytywnego słowa więcej na 100 napisanych słów. Te, które widziały negatywne wpisy, posługiwały się natomiast o 1 negatywne słowo więcej na 100 słów. Oznacza to, że Facebook był w stanie zmanipulować użytkowników w taki sposób, żeby używały o jedno negatywne słowo więcej na sto innych – nie powinniśmy oceniać więc możliwości Facebooka jako nieistniejących, bo większa ingerencja w algorytm być może oznaczałaby większe zmiany w zachowaniu, ale mimo wszystko pamiętajmy o utrzymaniu szerszej perspektywy.
Wykres danych god-knows-what.com
Sednem całej sprawy nie jest zatem wypracowanie niesamowicie sprytnego sposobu na zhackowanie facebooka przez Kogana, Wylie’ego czy Cambridge Analytica. Jest nim fakt, że poza sprzedażą danych przez Kogana, cała operacja bazowała na metodach, które przed 2015 rokiem były ogólnodostępne, popularne i zgodne z regulaminem Facebooka. Od momentu pojawienia się historii w mediach, Cambridge Analytica prezentuje się swoim potencjalnym klientom jako nieprzyjemny i nieetyczny usługodawca, jednak większość medialnych doniesień opiera się na bezkrytycznym powtarzaniu tego, co sama firma (oraz Chris Wylie) mówi o swoich wyjątkowych możliwościach. Problem polega na tym, że nie ma niemal żadnych dowodów na głoszoną przez nich własną skuteczność, jest natomiast mnóstwo materiałów na poparcie tezy, że ta skuteczność jest dużo niższa niż twierdzą – Ted Cruz nie jest prezydentem Stanów Zjednoczonych.
Nikt nie jest w stu procentach odporny na zabiegi marketingowe i hasła polityczne, lecz istnieje bardzo niewiele dowodów na to, że akurat Cambridge Analytica jest skuteczniejsze w trafianiu do wyborców niż jakakolwiek podobna firma PR-owa czy doradcza. Targetowanie polityczne i kampanie dezinformacyjne, promowane na przykład w Rosji, z całą pewnością miały wpływ na wynik ostatnich wyborów, ale czy były czynnikiem decydującym? Czy miały większy efekt niż słowa dyrektora FBI Jamesa Comeya, gdy ogłosił ponowne otwarcie śledztwa w sprawie afery mailingowej z Hillary Clinton tydzień przed wyborami? Czy wpłynęły na wyniki referendum bardziej, niż zwolennicy Brexitu mówiący o 250 milionach funtów kradzionych co tydzień z Narodowej Służby Zdrowia przez Unię Europejską? Wątpię.
Dla jasności – nie próbuję udowodnić, że Cambridge Analytica i Kogan są krystalicznie czyści. W najlepszym wypadku ich działania były sprzeczne z zasadami udostępniania danych Facebooka. Jednocześnie sam Facebook miał w tym czasie bardzo nonszalanckie podejście do przekazywania prywatnych informacji na temat swoich użytkowników firmom zewnętrznym.
Chodzi mi o to, że wbrew dominującej w mediach narracji, Cambridge Analytica nie jest demonicznym graczem, który pociąga za najważniejsze sznurki. Ze swoimi szumnymi obietnicami i szeroko komentowanymi deklaracjami wybitnych zdolności, zdecydowanie bardziej przypomina łączonego z firmą Donalda Trumpa.
---
Chris Kavanagh zajmuje się antropologią kognitywną (poznawczą) na Uniwersytecie Oksfordzkim. Kontakt do autora: @C_Kavanagh
Tłum. Wiktoria Beczek