0

Jak wygenerować listę świątecznych utworów dzięki algorytmom matematycznym?

fot. YouTube

Jako że sezon świąteczny za pasem, dla wszystkich masochistów, którzy słuchają bożonarodzeniowej muzyki w listopadzie, przygotowałem specjalną, świąteczną playlistę na Spotify z 200 piosenkami. Specjalną, bo doborem repertuaru zajęła się sztuczna inteligencja.

No dobra, nie zajęła się, bo trudno nazwać sztuczną inteligencją współczynnik korelacji Pearsona, ale z drugiej strony start-upowcom to w ogóle nie przeszkadza.

Jak to działa? Nie jest wielkim zaskoczeniem, że popularność muzyki świątecznej wykazuje cykliczne wahania, którą można zmierzyć poprzez liczbę odtworzeń. Dla YouTube wygląda to tak:

Okazuje się, że wystarczy wybrać zaledwie jeden przykładowy utwór świąteczny (np. najpopularniejsze „All I Want For Christmas Is You”) i obliczyć współczynniki korelacji Pearsona dla liczby odsłuchów w parze ze wszystkimi innymi utworami. Dla osób mało matematycznych – współczynnik Persona jest miarą tego jak dwa ciągi liczb (matematycy powiedzą: zmienne losowe) są do siebie podobne.

W ten sposób, wybierając utwory o silnej korelacji z „AIWFCIY” otrzymujemy wprost listę świątecznych utworów posortowaną pod względem popularności. Ja posłużyłem się zbiorem danych ze spotifycharts.com dla Polski w okresie 2017 – 2019. Tutaj największą wartość korelacji Pearsona ma „Last Christmas” z wynikiem na poziomie 0.9976, czyli co oznacza bardzo silną korelację:

Uwaga! Przypominam, że R^2 to nie to samo co współczynnik Pearsona, choć należą do tej samej grupy miar korelacji!

Wszyscy, którzy chcą pobawić się surowymi danymi – wersja finalna do pobrania tutaj (plik Excel 310KB).