0

SoundScan jest bardziej skomplikowany niż sądzicie

nielsen

Każdy z Was co jakiś czas korzysta z zestawień Billboardu. Ale czy wiecie jak one działają? Nie, nie chodzi mi o magiczne przeliczniki, tylko skąd tak naprawdę Billboard wie ile sprzedano płyt i piosenek?

Jaka jest najbardziej prestiżowa lista sprzedaży płyt? Bez wątpienia Billboard 200, przede wszystkim dlatego, że obejmuje ona rynek USA, który jest pierwszym co do wielkości na świecie – w pierwszej połowie tego roku roku sprzedano tam 100 mln albumów (fizyczne + digital), a razem z TEA i SEA, ekwiwalent albumów wyniósł 280 mln.

Od 1945 roku metodologia listy ulegała wielokrotnym zmianom. Jedną z kluczowych było w 1991 roku przejście na nowy system raportowania sprzedaży. Do tego momentu magazyn Billboard zbierał informacje o sprzedaży płyt na własną rękę faksem lub drogą telefoniczną, a następnie sam kompilował swoje zestawienia. 1 marca 1991 roku krajowym monitoringiem sprzedaży zajął się SoundScan (założony przez Mike’a Fine’a and Mike’a Shaletta), który później przejęła korporacja Nielsen przyjmując nazwę najpierw „Nielsen SoundScan” a obecnie „Nielsen Music”. I tak od maja 1991 roku Billboard 200 przygotowywany jest przez Billboard, ale na podstawie danych SoundScanu.

SoundScan zyskał aprobatę nie tylko Billboardu, ale także wytwórni muzycznych, które za jego pomocą mogły w prosty sposób monitować sprzedaż detaliczną swoich wydawnictw, a więc realne zainteresowanie konsumentów. Trzeba pamiętać, że owszem, podstawą finansów firm fonograficznych jest sprzedaż hurtowa do dystrybutorów (tj. sieci sklepów) i zwroty (sklepy płacą wytwórniom za zakupione całe nakłady, a nie realnie sprzedane płyty w danym okresie, z możliwością zwrotu pewnego procentu kupionego nakładu), jednak nie wskazuje ona na realne, chwilowe zainteresowanie słuchaczy. Co z tego, że sklepy zamówiły przed premierą milion płyt, skoro klienci kupili kilka tysięcy i sprzedaż spadła do zera?

Jak działa SoundScan?

Zasada działania SoundScanu w gruncie rzeczy jest bardzo prosta. Właściwie każdy większy sklep prowadzi elektroniczną ewidencję sprzedaży produktów z wykorzystaniem systemów point-of-sale (POS). POSy polegają na monitoringu zakupionych produktów na podstawie specjalnych identyfikatorów – zna je każdy pod hasłem „kod kreskowy”, a precyzyjniej są to barcody kodów EAN i UPC, które są przypisane dokładnie jednemu produktowi, np. płycie o konkretnym tytule.

Większość sieci sklepów z POS informacje o sprzedaży codziennie przesyła do zbiorczej bazy tak, że osoby odpowiedzialne za przygotowywanie zamówień czy ogólnej analizy sprzedaży, mają dostęp do rzeczywistego zainteresowania produktem (to, że do sklepu trafi w poniedziałek tona bananów, nie musi przecież oznaczać, że ta tona zostanie od razu kupiona!). SoundScan podczepia się pod takie systemy (a właściwie pobiera zrzuty generowane z systemu i przesyłane przez serwer FTP), a następnie umieszcza je w swoich bazach.

Do takich baz trafia nie tylko informacja o sprzedaży ze sklepów stacjonarnych, ale oczywiście również ze sklepów cyfrowych czy serwisów streamingowych (Nielsen Music monitoruje nie tylko sprzedaż albumów, ale też pobrania i odsłuchania poszczególnych utworów), a nawet umożliwia wytwórniom i wykonawcom raportowanie sprzedaży płyt na koncertach czy swoich stronach internetowych (za co dostają 500 dolarów rocznie). I teraz moje wyrazy uznania dla działu IT. Po pierwsze, baza, która to przechowuje musi być naprawdę zaplanowana z głową. Po drugie, serwer, który to obsługuje, musi mieć naprawdę niezłe parametry (teraz pewnie jest to chmura…), szczególnie, że dane trafiają tam codziennie (tak więc arkusz excela milionem linii raczej by się nie sprawdził…). No i po trzecie – auto-matching!

fot. SoundScan

fot. SoundScan

Tak jak już wspomniałem, każda płyta posiada przypisany, unikalny identyfikator – z reguły jest to UPC (w Europie EAN, chociaż kody są bardzo podobne do siebie), więc skompilowanie listy najlepiej sprzedających się produktów we wszystkich sklepach, jeśli w rekordach bazy mamy kolumnę „UPC” nie jest trudne i można to zrobić nawet w Excelu (o ile baza ma mniej niż 1 048 576 rekordów, tj. 2^20). Problem pojawia się wtedy, gdy chcemy do jednej płyty podczepić kilka wydań – digital, na CD, winylu, w wersji deluxe i standard itd. Każda ma inny kod UPC, więc pomysł z tabelą przestawną odpada. Co więcej, pod każdą płytę należy podczepić znajdujące się tam utwory, żeby móc wyliczyć TEA i SEA. Każdy utwór ma osobny kod ISRC, a jeśli jest dostępny w sprzedaży cyfrowej to i UPC. Pamiętajmy też, że Billboard podczepia do jednego singla kilka wersji (oryginalna i remiksy), a je następnie pod płytę (co trochę dziwi, ale jeśli remiks nie jest z płyty, ale oryginalna wersja utworu już tak, to Billboard podczepia obie). Możliwości jest wiele i tak naprawdę od pomysłowości twórców systemu, zależy czy poprawnie przypnie się wszystkie wydania, czy też nie.

„Ważenie”

I teraz przechodzę do najciekawszego tematu – obróbki danych. Tak naprawdę inspiracją do napisania tego wpisu był wywiad  HITS z Jimem Lidestri, CEO Border City Media, do którego należy BuzzAngle Music. BAM jest stosunkowo nowym, jednym z kilku alternatywnych do SoundScanu systemów monitorowania rynku muzycznego. Do tej pory HITS bazował na własnym systemie, ale obecnie w pełni wykorzystuje dane BuzzAngle do kompilowania list sprzedaży albumów (SPS i Pure Sales), listy streamingowej oraz Song Revenue Chart. Ponieważ BAM raportuje z reguły nieco inne wartości niż SoundScan i HITS bardzo nielubi się z Billboardem, Lidestri, aby podnieść wiarygodność swojego źródła, skrytykował metodologię Nielsena mówiąc, że jest przestarzała, niepoprawna i daje możliwość manipulowania zestawieniami. Całość do przeczytania tutaj.

Problem polega na tym, że ani SoundScan ani BAM (ani mało znany StreetPulse) nie monitorują 100% rynku. BuzzAngle uważa, że tak po prostu jest i zestawienia kompiluje na podstawie surowych danych. Nielsen ma zupełnie inne podejście – owszem, nie monitoruje 100% rynku (wg danych Billboardu jest to ok. 90%), jednak na podstawie swoich modeli statystycznych potrafi oszacować 100-procentową wartość sprzedaży. Jak dokładnie działa ten algorytm, nie wiadomo. Wiadomo, że Nielsen dzieli wszystkie raportujące źródła na dwa sektory: digital i fizyczne. Sektor cyfrowy jest monitorowany w blisko 100% i nie jest ważony. Sektor fizyczny dzielony jest na 4 grupy:

  • mass merchants – sieci dużych sklepów o szerokim asortymencie; w USA np. Target i Walmart.
  • chain retailers – sieci dużych sklepów, których głównym źródłem dochodów jest sprzedaż muzyki. W USA jest to np. Tower Records;
  • independent retailers – małe, niezrzeszone sklepy sprzedające muzykę;
  • non-traditional – sprzedaż internetowa czy sprzedaż podczas koncertów.

Największy udział posiadają mass merch i non-traditional (ze względu na sprzedaż internetową), które w 2015 roku obejmowały 67% rynku fizycznego. Tak się szczęśliwie składa, że wartość sprzedaży w tych sektorach (szczególnie mass merch i sprzedaż internetowa) jest monitorowana w prawie 100% (np. wystarczy podpiąć się pod główny system Targetu, żeby monitorować całą sprzedaż we wszystkich sklepach sieci), więc nie jest ważona.

fot. Nielsen. Uwaga! To są dane WAŻONE!

fot. Nielsen. Uwaga! To są dane WAŻONE!

Problem sprawiają jednak chain retailer i przede wszystkim sklepy niezależne. Te drugie stanowią co prawda mały wycinek rynku – 12,5% sprzedaży fizycznej i ok. 7% w digital + pure – jednak ich monitoring odbywa się w poniżej 50%. Nielsen (a więc i Billboard) stara się oszacować rzeczywistą wartość sprzedaży w każdym sektorze – w jaki sposób, nie do końca wiadomo. Najprostsze rozwiązanie to dzielenie wielkości sprzedaży przez procent monitorowanego rynku (w przypadku sklepów niezależnych – pomnożyć przez dwa), jednak, jak wynika z artykułu HITS, jest to bardziej złożona metodologia i przeliczniki zmieniają się z tygodnia na tydzień.

I tu pojawia się zarzut Pana Lidestri (i HITS) – jego zdaniem stosowane przeliczniki są niepoprawne i miały sens 20 lat temu, kiedy pełny monitoring nie był możliwy. CEO BuzzAngle zwraca uwagę także na „sztuczne ruchy na listach” i jako przykład podaje sytuację z tygodnia 28.10 – 03.11: według surowych danych numerem jeden był album COSMIC HALLELUJAH, a według ważonych danych SoundScanu – TRAP OR DIE 3. Wszystko dlatego, że ten drugi krążek był chętniej kupowany w sklepach typu chain i independent niż płyta Chesney’a.

Czy Nielsen podstępuje dobrze? Trudno mi jest to ocenić, jednak wydaje się, że samo założenie jest jak najbardziej dobre, pod warunkiem, że stosowane modele są po prostu właściwe. Nie chce mi się też wierzyć, że Nielsen – gigant w branży analitycznej, podlegający regularnym audytom – używa błędnej metodologii. Faktem jest, że w latach 2014 – 2015 „surowa” sprzedaż płyt CD wg BAM wyniosła 193,1 mln, czyli 73% zaraportowanej przez RIAA sprzedaży hurtowej (co można utożsamiać z wielkością monitorowania rynku). W segmencie cyfrowym wskaźnik ten był oczywiście lepszy i wynosił 95%, ale już w przypadku LP, które kupowane są chętnie w mniejszych sklepach – zaledwie 33%. W przypadku SoundScanu jest to średnio 94% dla wszystkich form konsumpcji.

Źródła: Nielsen measurement, HITS, Billboard