Skip to content Skip to sidebar Skip to footer

Drobne złodziejaszki i wielcy malwersanci – o rzeczywistej skali fraudu w Polsce.

Między 800 mln zł a 1,2 mld zł: takie pieniądze w skali roku padają w Polsce łupem reklamowych fraudsterów. To kwota wchłaniana przez szeroki ekosystem reklamowy za usługi, które nigdy nie dotarły do żadnego żywego odbiorcy.

Rynek reklamy cyfrowej jest łakomym kąskiem dla przestępców. Jupiter Research[1] oszacował w 2018 r. globalną wartość zdefraudowanych tu pieniędzy na 42 miliardy dolarów, to 13% wydatków całego tortu reklamy online. I nakreślił perspektywę sporego wzrostu zjawiska – aż o 21 proc. w 2019 r. Te prognozy są spójne z danymi World Federation of Advertisers[2], która zakładała, że fraud osiągnie skalę 50 mld dolarów do roku 2020.

Jak na tym tle plasuje się Polska?

Dane ABTShield pokazują, że z 4,6 mld zł wydawanych tu na reklamę online od 17 do 26 proc. można klasyfikować jako fraud. To – wbrew obiegowym branżowym opiniom – nie pozwala umieszczać Polski w ogonie światowego Ad Fraudu. Niestety.

Pompowanie widowni

Czemu fraud rośnie tak szybko? „Powiększanie widowni” przez tworzenie botów udających żywych odbiorców reklam jest jak drukowanie pieniędzy. W związku z tym, że rynek rośnie szybciej niż zasoby reklamowe, odsetek fraudów jest coraz większy. Na naszych oczach dochodzi do narastania bańki finansowej i powstawania jednej z największych malwersacji finansowych XXI wieku.

Boty oraz sztuczna widownia bardzo szybko rosną w czasie, na co wskazują chociażby liczby pochodzące z rynku serwisów społecznościowych.

Facebook w pierwszym kwartale 2019 roku usunął 2,2 miliardy fałszywych kont (blisko dwa razy więcej niż w poprzednim kwartale[3][4]). Należy zwrócić uwagę na to, że Facebook raportuje oficjalnie, że obecnie posiada 2,41 mld użytkowników aktywnych miesięcznie i 1,59 mld codziennie[5].

W samym 2018 roku Google – dostawca największego ekosystemu reklamowego – usunął za pomocą własnych filtrów 2,3 miliarda nieregulaminowych reklam oraz ponad milion kont nieuczciwych reklamodawców. To 6 milionów usuniętych reklam dziennie!

A nie tylko fałszywe konta są problemem – z sieci reklamowej Google usuwa się setki tysięcy nieuczciwych wydawców, a Facebook w 2019 roku pierwszy raz w historii wniósł do sądu pozew przeciwko twórcom aplikacji generującym fałszywe kliknięcia w reklamy publikowane w serwisie.

To tylko przegląd ogólnie dostępnych informacji pokazujących skalę problemu.

Od kieszonkowców po grube ryby

ABTShield pracuje dla kilkudziesięciu podmiotów z branży reklamowej. Na podstawie oceny ich kampanii estymuje poziomy fraudu w Polsce. Co nasza technologia antyfraudowa „widzi” na podstawie danych za okres październik 2019 – marzec 2020?

Poziom fraudów jest bardzo niejednolitym zjawiskiem– w zależności od powierzchni, typu kampanii i jej rozliczenia, wyniki mogą być bardzo różne.

Średni spodziewany poziom fraudów sięga zazwyczaj kilku-kilkunastu procent, ale występowanie sytuacji o bardzo wysokich poziomach fraudów (sięgających nawet 80%), sprawia, że średnia robi się dość wysoka. Nie należy myśleć o fraudach w kategoriach uśrednionych. To kradzież pieniędzy – czasem nie dzieje się nic, czasem trafimy na kieszonkowca, a niekiedy ktoś zechce zrobić wielki skok na nasz budżet. 

Warto myśleć o ubezpieczeniu kampanii jak o ubezpieczeniu samochodu lub mieszkania przed kradzieżą. Szkoda występuje stosunkowo rzadko, ale jak wystąpi – jest duża.

Rachunek e-sumienia

Jak wyglądają zatem straty na rynku?

Patrząc na całkowitą estymowaną kwotę fraudów w Polsce (dolny przedział) i proporcje we fraudach w przypadku różnych typów kampanii, najwięcej (blisko 360 mln zł w skali roku) rynek traci na działaniach direct przeprowadzanych w modelu CPM. Jest to pochodną ich popularności, a jednocześnie łatwości generowania ruchu przez boty na impresjach.

Jeśli chodzi o procentową skalę fraudu, w antyrankingu prowadzą kampanie afiliacyjne. Nierzadko dostawcy takich kampanii ulegają pokusie „podkręcania wyników” przez dostarczenie fałszywych leadów lub klików. W tym przypadku również dochodzi do wykorzystania robotów lub złośliwego oprogramowania, które tworzy tzw. oszustwa atrybucyjne.

Coraz popularniejsze są zaawansowane roboty, które nie tylko dobrze udają żywych klientów, ale również wypełniają formularze skradzionymi lub fałszywymi danymi osobowymi. Kampanie o najmniejszym poziomie fraudów to z kolei te programatyczne. Przed oszustwami zabezpieczają je zaszyte w nich różne filtry anty-fraudowe. I w programmatic zdarzają się jednak duże przypadki naruszeń:

Typ kampanii ze względu na rozliczenie % fraudu w budżecie Szacowana wielkość strat w mln zł (2019)
Kampanie Programmatic (CPM) 12% 222
Kampanie CPC, CPL (głównie afiliacja) 25% 229
Kampanie Direct (głównie CPM) 19% 358

Jak wyglądają proporcje fraudów ze względu na typ zasobow? Najbardziej podatne okazują się te o trudnej dostępności, jak np. wideo.

Rodzaj kampanii ze względu na inventory % fraudu w budżecie Szacowana wielkość strat w mln zł (2019)
Display bez Video 19% 304
SEM 12% 178
Ogłoszenia 21% 156
Video 28% 181

Można wyróżnić również pewne charakterystyki źródeł połączeń ze względu na ruch botowy w obrocie reklamy digital. Przykładowo, w przypadku połączeń pochodzących wprost z serwisów cloudowych, występuje wysokie prawdopodobieństwo spotkania bota. W przypadku Windows jest to znacznie wyższe prawdopodobieństwo niż w przypadku Mac. Wynika to z tego, że za pośrednictwem serwisów „cloudowych” można wygenerować efektywnie duży ruch zachowując względną anonimowość, z kolei Windows jest najbardziej popularnym systemem, który również łatwo wykorzystać i ukryć pomiędzy innymi użytkownikami, jest również bardziej podatny na malware, który infekuje i wykorzystuje urządzenia użytkowników.

Źródła połączeń ze względu na fraud (OS) % botów
1 Cloud 54%
2 Linux 21%
3 Windows 18%
4 Chrome OS 13%
5 Android 13%
6 Ubuntu 10%
7 Mac 8%
8 Game Console 2%

Poniżej zestawienie top 10 typów konfiguracji maszyn (według deklaracji User Agent), na których wystąpiło najwięcej ruchu fraudowego:

Top źródła ze względu na fraudy:
User Agents
Interpretacja % botów
1 Mozilla/5.0 (X11; Linux x86_64; Rigor) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.106 Safari/537.36 Chrome 80 on Linux 94%
2 Mozilla/5.0 (X11; Linux x86_64; Rigor) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.79 Safari/537.36 Chrome 79 on Linux 84%
3 Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36 Chrome 69 on Windows 10 66%
4 Mozilla/5.0 (Linux; Android 5.1.1; SAMSUNG SM-J320FN) AppleWebKit/537.36 (KHTML, like Gecko) SamsungBrowser/10.2 Chrome/71.0.3578.99 Mobile Safari/537.36 Samsung Browser 10.2 on Android (Lollipop) 28%
5 Mozilla/5.0 (iPad; CPU OS 12_4_5 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/12.1.2 Mobile/15E148 Safari/604.1 Safari 12.1 on iOS 12.4 27%
6 Mozilla/5.0 (Linux; Android 6.0; ALE-L21) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.117 Mobile Safari/537.36 Chrome 80 on Android (Marshmallow) 26%
7 Mozilla/5.0 (Linux; Android 7.0; SM-A510F) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.117 Mobile Safari/537.36 Chrome 80 on Android (Nougat) 26%
8 Mozilla/5.0 (Linux; Android 8.1.0; SM-J710F) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.99 Mobile Safari/537.36 Chrome 80 on Android 8.1 25%
9 Mozilla/5.0 (Linux; Android 10; SM-G965F) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.117 Mobile Safari/537.36 Chrome 80 on Android 10 25%
10 Mozilla/5.0 (Linux; Android 10; JSN-L21) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.119 Mobile Safari/537.36 Chrome 80 on Android 10 23%

Kolejnym ciekawym przykładem źródeł generowania ruchu botowego jest podział na kraje. Większość fraudów reklamowych w Polsce jest realizowanych z rodzimych maszyn, natomiast są kraje zagraniczne, które przodują w generowaniu ruchu botowego (odsetki oznaczają % ruchu z danego kraju do PL, który został oznaczony jako botowy)

Top źródła ze względu na fraudy: Kraje % botów
1 Singapur/ Chiny 66%
2 Argentyna 27%
3 Bośnia i Harzegovina 27%
4 Australia 27%
5 Stany Zjednoczone Ameryki (USA) 23%
6 Japonia 20%
7 Rosja 19%
8 Izrael 18%
9 Szwajcaria 17%
10 Białoruś 16%

W jaki sposób wykrywane są fraudy? Analiza fraudów ABTSHIELD polega na identyfikacji źródeł połączeń za pomocą sygnatur powiązanych z warstwą TCP/IP. Następnie źródło połączenia podlega analizie behawioralnej. Metryki behawioralne wskazują na podejrzane zachowania, które złożone ze sobą w określonej logice, pozwalają wskazać na maszyny nie kierowane przez żywe osoby.

Top 10 metryk wykrywanych przez ABTShield w przypadku złapania bota to (% botów – oznacza, że takiemu odsetkowi maszyn zakwalifikowanych jako boty została przypisana okreslona strategia zachowania):

Top 10 metryk świadczących o wykryciu botów % botów
1 maszyna kasuje często cookie i unika identyfikacji przez zmianę IP lub UAgent 97%
2 duża liczba wyświetlonych stron/ kliknięć 37%
3 nienaturalnie duża liczba różnych stron przeglądana w ciągu krótkiego czasu 28%
4 zbyt wysoka aktywność w dłuższych przedziałach czasowych 19%
5 nienaturalnie duża liczba różnych stron przeglądana w dłuższych przedziałach czasowych 19%
6 maszyna skoncentrowana na generowaniu połączeń z pojedynczymi stronami 19%
7 wykryta wysoka powtarzalność działania w dłuższych okresach 18%
8 wykryto powtarzalny schemat generowania ruchu w dłuższych okresach 13%
9 historia przeglądania nie pokazuje wiarygodnego źródła połączeń (referal) 12%
10 zbyt wysoka aktywność w krótkim okresie czasu 11%

Walka z fraudami reklamowymi oraz dezinformacją (również społeczną) to dwa elementy współczesnej cyberwojny. Wywiera ona wpływ zarówno na biznes, sferę publiczną, jak i zwykłych obywateli. Obok dobrodziejstw, nasza cyfrowa era niesie wielke zagrożenia. By z nimi skutecznie walczyć – musimy je sobie uświadomić.

Dobromir Ciaś
Managing Director at Edge NPD
Pokaż komentarzeUkryj komentarze

Napisz komentarz