ОСТАННІЙ ПОДКАСТ
Підписуйся на найнауковішу розсилку!
І отримуй щотижневі новини науки і технологій

    Ми під'їдаємо крихти cookies за вами. Навіщо це нам?

    Читати

    Пардон за відволікалочку. Допоможи Куншт бути незалежним!

    Пардон за відволікалочку. Допоможи Куншт бути незалежним!

    Повідомлення успішно надіслано

    Для пошуку
    введіть назву запису

    Як Shazam вгадує мелодію, а лейбли використовують його щоб краще знати ваші вподобання?/ Начитав KHAYAT

    00:00
    00:00
    Технології — 12.12.20
    ТЕКСТ: Віталій Мочарський
    Ілюстрації: Каталіна Маєвська
    Ми любимо тексти без помилок. Якщо ви все ж таки щось знайшли, виділіть фрагмент і натисніть
    Ctrl+Enter.
    Вгадай мелодію

    Ми слухаємо музику, а вона (точніше – лейбли) слухає нас і аналізує наші вподобання, аби штампувати один хіт за іншим.

    Вечір п’ятниці, відпочиваю з друзями в підвальному барі. Ми щойно закінчили обговорювати проблему, і тому в повітрі зависла мовчанка. Я почув перші акорди дуже відомої пісні, назви якої я не пам’ятав, але яку чув у багатьох місцях. Таксі, флешмоб у парку, плейліст подруги… Наче відчувши мій музичний феномен прескевю (відчуття, коли знаєш слово, але не можеш його згадати), бармен робить гучніше. З передчуттям, що зараз мою проблему буде вирішено, дістаю мобільний. Хочете знати, навіщо?

     

    У 2012 році Іспанська Національна дослідницька рада вивчала еволюцію сучасної західної музики на основі півмільйона пісень, написаних з 1955 по 2010 роки. Кожну композицію аналізували за трьома показниками: гучність, висота звуку і тембр. У результаті виявилося, що з роками мелодії стали менш різноманітними та більш гучними. Сергій Кейн, головний редактор музичного видання «Comma» коментує це так: «Адам Левін з Maroon 5 одного разу зізнався, що не пише пісні, а проєктує хіти. Так і є, суперуспішні пісні частіше за все створюються за прагматичними формулами, усі змінні яких давно систематизовані хітмейкерами на кшталт Макса Мартіна (автора пісень «It’s my life» Bon Jovi та «Womanizer» Брітні Спірс) або Лінди Перрі (автора синглів Ґвен Стефані, Пінк, Крістіни Аґілери). Підштовхує їх до цього «закон джунглів» – звіряча боротьба лейблів за гаманці слухачів.

     

    Наведу приклад того, як це працює. Кілька разів на рік компанія Music Research Consultants Inc з Лос-Анджелеса збирає простих людей різного віку та статусу у великих залах, видає їм навушники та пульти для голосування з єдиною кнопкою, а потім вмикає їм 7-секундні фрагменти 700 пісень. У кожного учасника є 7 секунд, аби вирішити, подобається йому ця пісня чи ні. Так компанія тестує майбутні хіти, на промо яких варто витрачати астрономічні суми грошей.

     

    Робить своє діло і цифрова компресія звуку для радіоверсій, яка «каструє» частоти. На виході отримуємо безліч гучних пісень, написаних за лекалами».

     

    Що стосується потреби до гомогенізації музики, її уодноманітнення, то тут є кілька пояснень. Вже давно доведено, що наш мозок більш охоче сприймає те, що йому відомо і вписується в шаблони, адже тоді опрацювання інформації забирає менше часу. На музику це теж розповсюджується. Сергій Кейн розповів: «Якщо говорити про найгучніші хіти 2015-ого, то в них, окрім всього іншого, чудово спрацьовує загравання з минулим. Люди схильні до ностальгії, тому щасливі оживити в пам’яті Майкла Джексона під «Can’t Feel My Face», а під «Uptown Funk» – весь жанр фанку. До речі, Марк Ронсон і Бруно Марс тепер ділитимуться прибутками від цього хіта з групою The Gap Band, оскільки один з мотивів був украдено з їхньої пісні 1979 року «Ooops Upside Your Head». Саймон Рейнольдс присвятив відмінну книжку «Ретроманія» феномену того, що сучасна поп-культура будується на відлуннях минулого».

     

    Я дістав свій телефон, аби зашазамити цю пісню.

     

    Програма Shazam вміє розпізнавати музику та телепередачі, які ви чуєте. На сьогодні більше ніж 500 мільйонів людей завантажило цей додаток на свої пристрої.

     

    Історія його створення розпочалась у 2000 році, коли доктор Стенфордського університету Ейвері Вонґ з парою випускників бізнес-школи запустив стартап Shazam. Ідея полягала в тому, щоб створити сервіс, який би дозволяв за декілька секунд розпізнавати будь-яку пісню, використовуючи тільки мобільний телефон. Вонґ займався аналізом аудіоданих і відповідав за розробку програмного забезпечення.

     

    Програма стала доступною у 2002 році. Раніше, щоби скористатися Shazam, потрібно було набрати номер і повернути телефон до джерела музики. Потім користувачі отримували SMS із назвою пісні та іменем виконавця. У 2011 році було додано розпізнавання телевізійних програм і реклами.

     

    Для чого потрібний Shazam?

     

    На сьогодні Shazam – це не тільки програма для розпізнавання музики, а й система для раннього виявлення хітів, якою користуються всі відомі лейбли у світі.

     

    Кожного дня Shazam аналізує близько 20 мільйонів запитів і може передбачити, яка пісня стане хітом. Чим більше запитів на пошук тієї чи іншої пісні, тим вона популярніша. Компанія вже анонсувала, що скоро запустить новий додаток за підтримки Warner Music Group для музичних агентів, що дасть змогу їм набагато швидше шукати нових музичних виконавців, які можуть стати зірками. Крім того, додаток дає змогу аналізувати, які стилі чи мікси стилів музики подобає­ться людям у тій чи іншій місцевості. Це буде важливо для композиторів та авторів пісень, адже багато хто з них хотів би комерціалізувати свою творчість, написати хіт і заробити на цьому багато грошей, а для цього потрібно розуміти, що саме сьогодні подобається людям.

     

    Крім того, програму використовують при складанні програм музичних турів виконавців. Аналіз популярності їхніх пісень дає змогу скласти продюсерам окремий список хітів для кожного міста, а також обрати саме ті міста для туру, де пісні виконавця є дійсно популярними. Наприклад, уявімо, що ви продюсер американського рок-гурту і хочете поїхати в тур по містах США. 

     

    Як він працює?

     

    Я запускаю додаток і натискаю кнопку Shazam.

     

    У цей момент буде створено цифровий відбиток музики, що грає за барною стійкою, і впродовж декількох секунд він порівняється з мільйонами треків і телепередач з бази даних Shazam. Після цього вам буде передано назву композиції та ім’я виконавця, а також додаткова інформація: слова пісні, відео, біографія виконавця, квитки на концерти та рекомендовані треки. Також буде можливість придбати або прослухати цю композицію через один з партнерських сервісів Shazam.

     

    Алгоритм програми порівнює відбитки музики, засновані на спектрограмах. Основні кроки цього алгоритму наступні: Shazam попередньо створив картотеку відбитків музики, користувач «відзначає» почуту пісню, для якої генерується відбиток на основі десятисекундного зразка звуку, додаток відправляє відбиток сервісу Shazam, який шукає відповідності в базі даних, якщо відповідність знайдено, інформація про пісню відображається користувачеві, в іншому випадку повертається помилка.

     

    “Будь-який музичний твір можна представити частотно-часовим графіком, який називається спектрограма. На одній осі відкладають час, на іншій − частоту, на третій − інтенсивність. Кожна точка на графіку представляє інтенсивність конкретної частоти в даний момент часу. Розташовуючи часову шкалу на осі х, а частотну – на осі у, одержуємо горизонтальну лінію, яка являє собою безперервний чистий тон і вертикальну лінію, яка ілюструє миттєвий сплеск білого шуму.

     

    Shazam робить відбиток пісні шляхом створення цього тривимірного графіка і виявляє частоти «піку інтенсивності». Для кожного з цих пікових значень він відстежує частоту і проміжок часу від початку треку.

     

    Програма будує свій каталог відбитків у вигляді хеш-таблиці, в якій роль ключа виконує значення частоти. Коли Shazam одержує відбиток, про який розповідали вище, він використовує перший ключ для пошуку відповідних пісень.

     

    Shazam не просто відзначає точку в спектрограмі, а відзначає пари точок: «пік інтенсивності», а також другу «опорну точку». Тому ключ містить не тільки одиничну частоту – це хеш частот обох точок. Що, своєю чергою, призводить до меншого числа збігів (коли хеш двох різних ключів збігається) і прискорює пошук по каталогу в кілька разів, даючи програмі змогу більш раціонально використовувати відведений на виконання час.

     

    Якщо в пісні виявили кілька збігів, тоді перевіряють відповідність частот за часом. Створюється двовимірна ділянка частот, на яких спостерігалися збіги. На одній осі відкладають час появи частоти в треку, на іншій – аналогічний час для зразка. Якщо між безліччю точок спостерігається кореляція, точки утворюють діагональ.

     

    Shazam – не єдиний додаток для розпізнавання музики. Існують також SoundHound, TrackID, Google Ears та багато інших. Але велика база даних та найбільша кількість користувачів, а також постійні новинки у функціоналі від розробників утримують Shazam впевненим лідером представленої галузі на сьогодні.

     

    Проходить кілька секунд, на екрані висвічується виконавець і назва пісні. Бармен посміхається і пропонує послухати останній альбом гурту. Я прошу повторити замовлення і вмощуюся зручніше.

    ТЕКСТ: Віталій Мочарський
    Ілюстрації: Каталіна Маєвська
    Статті
    Медицина
    Невидимий ворог на нашій землі: чому варто зробити щеплення від правця

    За останні декілька місяців українці навчились остерігатись багатьох речей: ракет, мін, російської музики та ютубу, але ми все ще забуваємо про невидимого ворога у нашій землі. Неприємно познайомитись – Clostridium tetani, збудник правця.

    Промо
    Проєкт інтелект. Воєнний сезон. Епізод 5: NFT та Україна

    Чи можна написати «Проєкт інтелект» на гривні й продати за мільйони доларів як NFT?

    Людина
    Від батька до сина: що таке генеалогія і як досліджувати свій рід

    Що таке ДНК-генеалогія і як далеко кожний з нас може просунутися у вивченні свого роду?

    Наука
    Екологічно чиста отрута: уривок з книжки «Зоологічна екскурсія супермаркетом»

    Чому краще утриматися від «дикого» промислу морепродуктів, особливо у водоймах, де цвіте вода?

    Наука
    Передумови приходу диктаторів до влади: Італія, Німеччина, РФ

    Що стало передумовами приходу диктаторів до влади на прикладі фашистської Італії, нацистської Німеччини та путінської росії? Розповідає співавтор і ведучий каналу «Історія Без Міфів» Владлен Мараєв.

    Людина
    Як кожен з нас може подякувати військовим і допомогти їм з адаптацією

    Як змінюється світосприйняття військових і що ми можемо зробити, аби висловити їм вдячність і допомогти в адаптації до мирного життя?

    Повідомити про помилку

    Текст, який буде надіслано нашим редакторам: