Za początek branży fonograficznej uznaje się 1878 rok, kiedy Edison opatentował fonograf – pierwsze szeroko rozpowszechnione urządzenie do utrwalania i odtwarzania dźwięku. Od tego czasu przemysł muzyczny zmienił się nie do poznania, a motorem napędowym była, jest i z pewnością będzie technologia. Co warto obserwować? W co inwestować? Co rozwijać, aby być krok do przodu na rynku? Postaram się odpowiedzieć na te pytania w mini-cyklu „New Tech w muzyce”. W tym wpisie na ruszt idzie digital audio watermarking.
Grudniowy wieczór 2016. W zaciszu studia nagraniowego, Taylor Swift pisze nową piosenkę o swoim byłym chłopaku. Kilka miesięcy później nagranie jest gotowe i machina promocyjna rusza. Trzeba przecież nakręcić teledysk, przygotować choreografię, zaplanować sesje zdjęciowe. Zanim to Taylor prezentuje nagranie ludziom z wytwórni, oni przesyłają nagrania do ludzi z A&R i tastemakerów w celu zasięgnięcia opinii o materiale.
Do ilu osób trafiło nagranie przed premierą? 10? 20? Teoretycznie. W praktyce nikt ze sztabu Swift nie może mieć pewności, że asystent dyrektora kreatywnego nie skopiował pliku z komputera szefa i nie wrzuci na ATRL. Innymi słowy – kontrola nad rozpowszechnianiem nagrania jest żadna i nawet umieszczanie piosenki na wewnętrznych stronach z opcją „tylko do odsłuchu” niewiele pomoże. Mimo to Swift może spać spokojnie i raczej nikt nie zniszczy jej godzin pracy. Zasługa zgranego teamu? Na pewno też, ale przede wszystkim piosenkarka może podziękować technologii. A dokładniej digital audio watermarkingowi.
Co to audio watermark?
Watermark, czyli znak wodny, możemy spotkać na co dzień płacąc w sklepie – dla przykładu: na banknocie 10 zł pod światło widoczny jest profil Mieszka I i liczba „10”. W domowych warunkach jest praktycznie niewykonalne zrobić podróbkę z takim artefaktem, dlatego znaki wodne świetnie spisują się w weryfikacji pieniędzy (więcej na NBP).
Ideę oznaczenia, którego „w normalnych warunkach eksploatacji” nie widać, a dopiero zastosowanie specjalnych narzędzi (tutaj: patrzenie pod światło, ale może być to także wykorzystanie światła UV) można przenieść na inne pola – w tym na muzykę. W przypadku muzyki watermark posiadać musi dwie cechy:
- Informacja zakodowana jest bezpośrednio w dźwięku – nie jest to więc metadana, która znajduje się w nagłówku pliku i którą oczywiście można usunąć. Kodowanie w muzyce sprawia, że informacja jest nie do usunięcia w sposób trywialny (oznaczałoby to usunięcie… dźwięku, a w najlepszym przypadku jego znaczne zniekształcenie).
- Informacja nie zniekształca muzyki z perspektywy słuchacza – dodanie informacji do muzyki nie jest problemem, wystarczy ją… powiedzieć i zmiksować. Takie rozwiązanie – tzw. tagowanie – nie wchodzi jednak w grę – informacja musi być „niesłyszalna”.
Wydaje się to bardzo trudne, ale… jest możliwe! Nie chcę wdawać się w nudne dla większości techniki kodowania watermarków, ale w dużym uproszczeniu – polega ona na modyfikacji widma Fouriera sygnału. Więcej informacji znajdziecie tutaj (z rozwiązań tej firmy korzysta polski agregator E-Muzyka obsługujący Muzodajnię i Empik.com), na tej stronie możecie sprawdzić czy potraficie rozpoznać różnicę między piosenkami z akustycznymi znakami wodnymi i bez nich.
Ochrona materiałów promocyjnych
Audio watermarking nie jest ideą nową i od lat znajduje zastosowanie w branży muzycznej. Pierwszym z przykładów jest wspomniane na początku markowanie materiałów promocyjnych przed premierą. Zasada działania jest prosta – każda osoba, która dostaje dostęp do odsłuchu przed premierą, dostaje plik audio z indywidualnym znacznikiem. Wytwórnia, która rozsyła materiały, zapisuje te znaczniki wraz z osobami, do których dane audio zostało wysłane. Jeśli więc utwór wycieknie do internetu przed premierą, label bez problemu może zidentyfikować jego źródło.
Oczywiście są to działania post-factum, dlatego osoba, która uzyskuje plik, dostaje także informację, że audio zawiera indywidualny watermark – w ten sposób, jeśli ktokolwiek miał pomysł pochwalić się „dobremu koledze” nowym utworem panny Swift, po takim ostrzeżeniu na pewno pomyśli dwa razy. Dlatego zapewne zauważyliście, że często wycieki przedpremierowe (nie mówię tutaj o sytuacjach, kiedy np. sklep wyłoży za wcześnie płyty na półki) pojawiają się w niskiej jakości – dopiero tak drastyczne zniekształcenie dźwięku jak w przykładzie poniżej gwarantuje, że watermark będzie nieczytelny.
Wytwórnie od bardzo dawna korzystają z takiego systemu. Na stronie Universala możemy przeczytać opis programu StudioCDN. Na nowszej stronie możemy dowiedzieć się, że firma bierze udział w procedurze DMCA Notice-Takedown – jeśli nawet chroniony materiał trafi do sieci, to dzięki watermarkowi może być zidentyfikowany i usunięty. Innymi dostawcami technologii watermark dla marketingu są AudioLock, PromoJukeBox czy Haulix.
Informacja o prawach autorskich
Dla mnie najbardziej oczywistym pomysłem wykorzystania audio watermarków jest zapis informacji o prawach do nagrania bezpośrednio w pliku audio. Przykładowo: wystarczy zamieścić kod ISRC, żeby w prosty sposób zidentyfikować nagranie, a co za tym idzie – tytuł, wykonawcę i właścicieli praw. Rozwiązanie ma jednak pewną wadę – mimo że z założenia watermark jest niesłyszalny (nie zawsze niestety tak jest…), to jednak jest ingerencją w dzieło „grubych szefów korporacji, dla których nie liczy się muzyka tylko kasa” (tak przeczytałem na jednym z forów internetowych). Nie jest to więc dobrze postrzegane – nic więc dziwnego, że informacji na ten temat jest jak na lekarstwo. Ja się nie poddałem i zrobiłem małe śledztwo.
Pierwsza poszlaka prowadzi na polską stronę z audiobookami – azymut.pl. Jak czytamy:
Utwory objęte są prawami autorskimi. Zobowiązaliśmy się do ich należytego chronienia. Wspólnie z Wydawcami i Autorami naszych audio książek do bezpośredniego pobrania proponujemy innowacyjne rozwiązanie zabezpieczeń – technologię „watermarków”.
Watermarki, inaczej zwane „markerami” lub „znakami wodnymi”, stanowią metodę zabezpieczenia udostępnianych w Internecie wszelkich treści cyfrowych (muzyka, film, audio książka). Watermark to unikalne „oznaczenie”, niepowtarzalny identyfikator kopii pliku, wprowadzony na całej długości trwania pobranego pliku.
Istnieją dwa typy watermarków – watermark, który ma na celu wskazywać źródło pochodzenia pliku (tzw. watermark pochodzenie) lub wskazujący konkretną osobę, która pobrała dany plik (tzw. watermark transakcyjny). Watermark transakcyjny wnosi kompletnie nową jakość do grupy zabezpieczeń cyfrowych.
Można domniemywać więc, że wydawcy książek wymuszają na dostawcach cyfrowych markowanie plików z informacją zarówno o źródle skąd został pobrany jak i konkretnym koncie (użytkowniku). Czy podobnie jest z muzyką? Tak. Jak wcześniej wspomniałem, właściciele audiowatermarking.info chwalą się, że z ich usług korzysta m.in. polski agregator E-Muzyka, operator m.in. serwisów Muzodajnia.pl czy dostawca plików cyfrowych dla Empik.com. Oznacza to, że i tutaj treści są znaczone.
W dość starym wpisie z 2013 roku, Matt Montag – realizator dźwięku i programista Spotify – wprost napisał, że Universal „znaczy” pliki audio, które następnie rozsyłane są do dostawców cyfrowych. O ile w utworach popowych, o rozwiniętych aranżacjach, watermarki są niesłyszalne, to w przypadku muzyki akustycznej o niskiej kompresji zmiany mogą być wychwycone przez audiofilów (i łatwo zgadnąć, że nie są z tego zadowoleni). Czy materiały audio znakowane są też przez inne labele – stawiam piwo, że tak, przy czym, widząc jakie komentarze pojawiły się pod adresem UMG, skrzętnie tę informacje ukrywają.
Watermark + blockchain
Prawdziwy potencjał watermarków nie jest jeszcze w pełni wykorzystywany. Pisałem o tym już wcześniej na blogu (m.in. we wpisie Jak bitcoin może zmienić biznes publishingowy) i będę pisał jeszcze w przyszłości, że branża publishingowa (zajmująca się prawami autorów i kompozytorów) stoi przed gigantycznym „streamingowym” wyzwaniem.
Przy okazji publikacji statystyk rynkowych wszyscy (w tym ja) piszczą z zachwytu jak to streaming ratuje biznes muzyczny – to oczywiście prawda. Problemem jest jednak to, że w przypadku praw autorskich, droga tantiem od serwisu strumieniowego do kieszeni autora jest tak bardzo zawiła, że ten na wypłatę czekać musi nawet… kilka lat lub co gorsza – może w ogóle nic nie zarobić. Przyczyny są dwie: danych jest jednocześnie za mało i za dużo:
- Za dużo – streaming to miliardy mikropłatności – każde odtworzenie trzeba traktować jako oddzielną „transakcję” na kwotę rzędu ułamków groszy; oczywiście serwisy strumieniowe te dane agregują, ale nadal – wykazy utworów są tak duże, że systemy potrzebują miesięcy na ich przetworzenie.
- Za mało – z punktu widzenia stowarzyszeń autorskich takich jak ZAiKS, które podpisują umowy z serwisami, wykazy utworów nie zawierają najważniejszych informacji – informacji o autorach. Brak takich danych oznacza w najlepszym przypadku zatrzymanie naliczeń na rezerwie w plikach UP, w gorszym – nierozpoznanie repertuaru i brak płatności!
Potencjalnym rozwiązaniem ma być technologia blockchain do stworzenia zdecentralizowanej bazy danych – początkowo łączącej informacje o nagraniu (kody ISRC) i kompozycji (kody ISWC), w przyszłości może nawet umożliwiającej automatyczne naliczanie tantiem. Do tego co prawda długa droga, niemniej jednak w tym całym przedsięwzięciu ogromną rolę mogą spełnić watermarki. Dzięki nim możliwe będzie połączenie bloku danych z oznakowanym plikiem audio.
Więcej o tej idei możecie przeczytać tutaj: https://www.digimarc.com/docs/default-source/digimarc-resources/whitepaper-blockchain-in-music-industry.pdf?sfvrsn=2