Aktualności 13 lipca 2020
2012Views
Między 800 mln zł a 1,2 mld zł: takie pieniądze w skali roku padają w Polsce łupem reklamowych fraudsterów. To kwota wchłaniana przez szeroki ekosystem reklamowy za usługi, które nigdy nie dotarły do żadnego żywego odbiorcy.
Rynek reklamy cyfrowej jest łakomym kąskiem dla przestępców. Jupiter Research[1] oszacował w 2018 r. globalną wartość zdefraudowanych tu pieniędzy na 42 miliardy dolarów, to 13% wydatków całego tortu reklamy online. I nakreślił perspektywę sporego wzrostu zjawiska – aż o 21 proc. w 2019 r. Te prognozy są spójne z danymi World Federation of Advertisers[2], która zakładała, że fraud osiągnie skalę 50 mld dolarów do roku 2020.
Jak na tym tle plasuje się Polska?
Dane ABTShield pokazują, że z 4,6 mld zł wydawanych tu na reklamę online od 17 do 26 proc. można klasyfikować jako fraud. To – wbrew obiegowym branżowym opiniom – nie pozwala umieszczać Polski w ogonie światowego Ad Fraudu. Niestety.
Czemu fraud rośnie tak szybko? „Powiększanie widowni” przez tworzenie botów udających żywych odbiorców reklam jest jak drukowanie pieniędzy. W związku z tym, że rynek rośnie szybciej niż zasoby reklamowe, odsetek fraudów jest coraz większy. Na naszych oczach dochodzi do narastania bańki finansowej i powstawania jednej z największych malwersacji finansowych XXI wieku.
Boty oraz sztuczna widownia bardzo szybko rosną w czasie, na co wskazują chociażby liczby pochodzące z rynku serwisów społecznościowych.
Facebook w pierwszym kwartale 2019 roku usunął 2,2 miliardy fałszywych kont (blisko dwa razy więcej niż w poprzednim kwartale[3][4]). Należy zwrócić uwagę na to, że Facebook raportuje oficjalnie, że obecnie posiada 2,41 mld użytkowników aktywnych miesięcznie i 1,59 mld codziennie[5].
W samym 2018 roku Google – dostawca największego ekosystemu reklamowego – usunął za pomocą własnych filtrów 2,3 miliarda nieregulaminowych reklam oraz ponad milion kont nieuczciwych reklamodawców. To 6 milionów usuniętych reklam dziennie!
A nie tylko fałszywe konta są problemem – z sieci reklamowej Google usuwa się setki tysięcy nieuczciwych wydawców, a Facebook w 2019 roku pierwszy raz w historii wniósł do sądu pozew przeciwko twórcom aplikacji generującym fałszywe kliknięcia w reklamy publikowane w serwisie.
To tylko przegląd ogólnie dostępnych informacji pokazujących skalę problemu.
ABTShield pracuje dla kilkudziesięciu podmiotów z branży reklamowej. Na podstawie oceny ich kampanii estymuje poziomy fraudu w Polsce. Co nasza technologia antyfraudowa „widzi” na podstawie danych za okres październik 2019 – marzec 2020?
Poziom fraudów jest bardzo niejednolitym zjawiskiem– w zależności od powierzchni, typu kampanii i jej rozliczenia, wyniki mogą być bardzo różne.
Średni spodziewany poziom fraudów sięga zazwyczaj kilku-kilkunastu procent, ale występowanie sytuacji o bardzo wysokich poziomach fraudów (sięgających nawet 80%), sprawia, że średnia robi się dość wysoka. Nie należy myśleć o fraudach w kategoriach uśrednionych. To kradzież pieniędzy – czasem nie dzieje się nic, czasem trafimy na kieszonkowca, a niekiedy ktoś zechce zrobić wielki skok na nasz budżet.
Warto myśleć o ubezpieczeniu kampanii jak o ubezpieczeniu samochodu lub mieszkania przed kradzieżą. Szkoda występuje stosunkowo rzadko, ale jak wystąpi – jest duża.
Jak wyglądają zatem straty na rynku?
Patrząc na całkowitą estymowaną kwotę fraudów w Polsce (dolny przedział) i proporcje we fraudach w przypadku różnych typów kampanii, najwięcej (blisko 360 mln zł w skali roku) rynek traci na działaniach direct przeprowadzanych w modelu CPM. Jest to pochodną ich popularności, a jednocześnie łatwości generowania ruchu przez boty na impresjach.
Jeśli chodzi o procentową skalę fraudu, w antyrankingu prowadzą kampanie afiliacyjne. Nierzadko dostawcy takich kampanii ulegają pokusie „podkręcania wyników” przez dostarczenie fałszywych leadów lub klików. W tym przypadku również dochodzi do wykorzystania robotów lub złośliwego oprogramowania, które tworzy tzw. oszustwa atrybucyjne.
Coraz popularniejsze są zaawansowane roboty, które nie tylko dobrze udają żywych klientów, ale również wypełniają formularze skradzionymi lub fałszywymi danymi osobowymi. Kampanie o najmniejszym poziomie fraudów to z kolei te programatyczne. Przed oszustwami zabezpieczają je zaszyte w nich różne filtry anty-fraudowe. I w programmatic zdarzają się jednak duże przypadki naruszeń:
Typ kampanii ze względu na rozliczenie | % fraudu w budżecie | Szacowana wielkość strat w mln zł (2019) |
Kampanie Programmatic (CPM) | 12% | 222 |
Kampanie CPC, CPL (głównie afiliacja) | 25% | 229 |
Kampanie Direct (głównie CPM) | 19% | 358 |
Jak wyglądają proporcje fraudów ze względu na typ zasobow? Najbardziej podatne okazują się te o trudnej dostępności, jak np. wideo.
Rodzaj kampanii ze względu na inventory | % fraudu w budżecie | Szacowana wielkość strat w mln zł (2019) |
Display bez Video | 19% | 304 |
SEM | 12% | 178 |
Ogłoszenia | 21% | 156 |
Video | 28% | 181 |
Można wyróżnić również pewne charakterystyki źródeł połączeń ze względu na ruch botowy w obrocie reklamy digital. Przykładowo, w przypadku połączeń pochodzących wprost z serwisów cloudowych, występuje wysokie prawdopodobieństwo spotkania bota. W przypadku Windows jest to znacznie wyższe prawdopodobieństwo niż w przypadku Mac. Wynika to z tego, że za pośrednictwem serwisów „cloudowych” można wygenerować efektywnie duży ruch zachowując względną anonimowość, z kolei Windows jest najbardziej popularnym systemem, który również łatwo wykorzystać i ukryć pomiędzy innymi użytkownikami, jest również bardziej podatny na malware, który infekuje i wykorzystuje urządzenia użytkowników.
Źródła połączeń ze względu na fraud (OS) | % botów | |
1 | Cloud | 54% |
2 | Linux | 21% |
3 | Windows | 18% |
4 | Chrome OS | 13% |
5 | Android | 13% |
6 | Ubuntu | 10% |
7 | Mac | 8% |
8 | Game Console | 2% |
Poniżej zestawienie top 10 typów konfiguracji maszyn (według deklaracji User Agent), na których wystąpiło najwięcej ruchu fraudowego:
Top źródła ze względu na fraudy: User Agents |
Interpretacja | % botów | |
1 | Mozilla/5.0 (X11; Linux x86_64; Rigor) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.106 Safari/537.36 | Chrome 80 on Linux | 94% |
2 | Mozilla/5.0 (X11; Linux x86_64; Rigor) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.79 Safari/537.36 | Chrome 79 on Linux | 84% |
3 | Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36 | Chrome 69 on Windows 10 | 66% |
4 | Mozilla/5.0 (Linux; Android 5.1.1; SAMSUNG SM-J320FN) AppleWebKit/537.36 (KHTML, like Gecko) SamsungBrowser/10.2 Chrome/71.0.3578.99 Mobile Safari/537.36 | Samsung Browser 10.2 on Android (Lollipop) | 28% |
5 | Mozilla/5.0 (iPad; CPU OS 12_4_5 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/12.1.2 Mobile/15E148 Safari/604.1 | Safari 12.1 on iOS 12.4 | 27% |
6 | Mozilla/5.0 (Linux; Android 6.0; ALE-L21) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.117 Mobile Safari/537.36 | Chrome 80 on Android (Marshmallow) | 26% |
7 | Mozilla/5.0 (Linux; Android 7.0; SM-A510F) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.117 Mobile Safari/537.36 | Chrome 80 on Android (Nougat) | 26% |
8 | Mozilla/5.0 (Linux; Android 8.1.0; SM-J710F) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.99 Mobile Safari/537.36 | Chrome 80 on Android 8.1 | 25% |
9 | Mozilla/5.0 (Linux; Android 10; SM-G965F) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.117 Mobile Safari/537.36 | Chrome 80 on Android 10 | 25% |
10 | Mozilla/5.0 (Linux; Android 10; JSN-L21) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.119 Mobile Safari/537.36 | Chrome 80 on Android 10 | 23% |
Kolejnym ciekawym przykładem źródeł generowania ruchu botowego jest podział na kraje. Większość fraudów reklamowych w Polsce jest realizowanych z rodzimych maszyn, natomiast są kraje zagraniczne, które przodują w generowaniu ruchu botowego (odsetki oznaczają % ruchu z danego kraju do PL, który został oznaczony jako botowy)
Top źródła ze względu na fraudy: Kraje | % botów | |
1 | Singapur/ Chiny | 66% |
2 | Argentyna | 27% |
3 | Bośnia i Harzegovina | 27% |
4 | Australia | 27% |
5 | Stany Zjednoczone Ameryki (USA) | 23% |
6 | Japonia | 20% |
7 | Rosja | 19% |
8 | Izrael | 18% |
9 | Szwajcaria | 17% |
10 | Białoruś | 16% |
W jaki sposób wykrywane są fraudy? Analiza fraudów ABTSHIELD polega na identyfikacji źródeł połączeń za pomocą sygnatur powiązanych z warstwą TCP/IP. Następnie źródło połączenia podlega analizie behawioralnej. Metryki behawioralne wskazują na podejrzane zachowania, które złożone ze sobą w określonej logice, pozwalają wskazać na maszyny nie kierowane przez żywe osoby.
Top 10 metryk wykrywanych przez ABTShield w przypadku złapania bota to (% botów – oznacza, że takiemu odsetkowi maszyn zakwalifikowanych jako boty została przypisana okreslona strategia zachowania):
Top 10 metryk świadczących o wykryciu botów | % botów | |
1 | maszyna kasuje często cookie i unika identyfikacji przez zmianę IP lub UAgent | 97% |
2 | duża liczba wyświetlonych stron/ kliknięć | 37% |
3 | nienaturalnie duża liczba różnych stron przeglądana w ciągu krótkiego czasu | 28% |
4 | zbyt wysoka aktywność w dłuższych przedziałach czasowych | 19% |
5 | nienaturalnie duża liczba różnych stron przeglądana w dłuższych przedziałach czasowych | 19% |
6 | maszyna skoncentrowana na generowaniu połączeń z pojedynczymi stronami | 19% |
7 | wykryta wysoka powtarzalność działania w dłuższych okresach | 18% |
8 | wykryto powtarzalny schemat generowania ruchu w dłuższych okresach | 13% |
9 | historia przeglądania nie pokazuje wiarygodnego źródła połączeń (referal) | 12% |
10 | zbyt wysoka aktywność w krótkim okresie czasu | 11% |
Walka z fraudami reklamowymi oraz dezinformacją (również społeczną) to dwa elementy współczesnej cyberwojny. Wywiera ona wpływ zarówno na biznes, sferę publiczną, jak i zwykłych obywateli. Obok dobrodziejstw, nasza cyfrowa era niesie wielke zagrożenia. By z nimi skutecznie walczyć – musimy je sobie uświadomić.
[1] https://www.juniperresearch.com/press/press-releases/advertising-fraud-losses-to-reach-42-billion
[2] https://www.businessinsider.com/ad-fraud-estimates-doubled-2017-3?IR=T
[3] https://edition.cnn.com/2019/05/23/tech/facebook-transparency-report/index.html
[4] https://www.buzzfeednews.com/article/craigsilverman/facebook-fake-accounts-afd
[5] https://www.wirtualnemedia.pl/artykul/facebook-ilu-ma-uzytkownikow-w-2019-roku-w-roznych-regionach-swiata-ile-zarabia-z-reklam-jaki-zysk