ОСТАННІЙ ПОДКАСТ
Підписуйся на найнауковішу розсилку!
І отримуй щотижневі новини науки і технологій

    Ми під'їдаємо крихти cookies за вами. Навіщо це нам?

    Читати

    Пардон за відволікалочку. Допоможи Куншт бути незалежним!

    Пардон за відволікалочку. Допоможи Куншт бути незалежним!

    Повідомлення успішно надіслано

    Для пошуку
    введіть назву запису
    Технології — 08.08.19
    ТЕКСТ: Оленка Лаущенко
    Фото: ajps cs
    Ми любимо тексти без помилок. Якщо ви все ж таки щось знайшли, виділіть фрагмент і натисніть
    Ctrl+Enter.
    Визначна data

    У 2013 році компанія Netflix заявила: «Є 33 мільйони різних версій Netflix». У той час на сервіс підписалися 33 мільйони користувачів. Тоді, коли звичайні телевізійні компанії для аналізу аудиторії використовували стандартні масиви даних (вікову та географічну сегментацію), Netflix почала шукати закономірності перегляду у різні дні тижня, різний час доби та за різних погодних умов. Завдяки набору кількісної інформації про підписників компанія створила «ідеальний серіал», який потенційно мав залучити до перегляду велику частку глядачів Netfliх. Цим серіалом став «Картковий будинок». Віце-президент з корпоративних комунікацій Cтів Свейзі в одному з інтерв’ю зазначив, що тепер компанії не потрібно витрачати мільйони на те, щоб прорекламувати продукт і змусити глядачів звернути увагу на серіал. За допомогою алгоритмів Netflix відстежує тих, кому подобається Кевін Спейсі чи політична драма, і пропонує їм переглянути «Картковий будинок».

    Старший Брат пильнує за тобою: хто збирає про нас інформацію 

    У 2017 році видання The Economist ствердило, що найцінніший світовий ресурс змінився. Новою цінністю ХХI cтоліття визнали дані й інформацію. Інформація стала ціннішою за нафту, яка понад 100 років вважалася найважливішим ресурсом. Тепер твердження «Хто володіє інформацією, той володіє і світом» – безсумнівне. Однак поява комп’ютерних технологій змінила саме поняття інформації та даних.  Зараз Кембриджський словник подає визначення даних як «факти чи цифри, зібрані для розгляду та використані для ухвалення  рішень, або інформацію в електронній формі, яка може зберігатися та використовуватися комп’ютером»

     

    Створення Ларі Пейджем у 1995 році пошукової системи Google повністю змінило наше сприйняття інформації. Тепер, коли ми хочемо щось дізнатися, просто гуглимо. Раніше інформацією вважалися лише знання, набуті через досвід чи навчання. Від початку 2000-х пристроїв, які можуть генерувати дані, а отже – самих даних щороку ставало дедалі більше. За підрахунками компанії IBM, до 2003 року у світі було близько 5 ексабайтів даних (1 ЕБ = 1 млрд гігабайтів). До 2008 року цей обсяг зріс до 0,18 зеттабайтів (1 ЗБ = 1024 ексабайта), до 2011 року – до 1,76 зеттабайтів, до 2013 року – до 4,4 зеттабайтів. У травні 2018 року обсяг усіх даних перевищив 16,5 зеттабайтів. За прогнозами, до 2020 року людство створить 40-44 зеттабайтів інформації, а до 2025 року її обсяг збільшиться в 10 разів. Великі дані містять інформацію із соціальних медіа, дані з пристроїв з доступом до інтернету (включно зі смартфонами та планшетами – наприклад, дані про геолокацію), машинні дані (цифрова інформація, генерована пристроями – наприклад, дані про відвідування сайтів), відео та голосові записи.

     

    Науковці почали аналізувати великі масиви даних для того, щоб досягти певної мети: таргетування реклами, персоналізації покупок чи вдосконалення речей і механізмів, що вже існують. Так з’явилася наука про великі дані, яка вивчає структуровану і неструктуровану інформацію й аналізує її. Вперше про великі дані у 2008 році заговорив редактор журналу Nature Кліффорд Лінч. Відтоді iнструменти обробки великих даних з кожним роком ставали більш поширеними, а у 2018 році цей термін став одним з основних запитів згідно з підрахунками Google Trends. 

     

    Тепер всі, від найбільших світових корпорацій до невеликих локальних супермаркетів, прагнуть дізнатися усе про своїх клієнтів: від статі й віку до останньої покупки та улюбленої іграшки дитинства. Джерелом інформації для збору великих даних стає будь-що: від сторінки в соціальних мережах до банківської поведінки клієнта. Аналіз останніх запитів дозволяє передбачити наступні і персоналізувати пропозиції. У клієнта складається враження, що компанія працює особисто для нього, погоджується на пропозицію, а отже, статки компанії збільшуються. 

     

    Персоналізація – не єдина сфера застосування великих даних. Світова мережа кав’ярень Starbucks володіє близько 25 000 точок в усьому світі. Прибуток компанії напряму залежить від розташування кафе. Команда з планування ринку Starbucks регулярно використовує набір даних, отриманих за допомогою інструментів картографування та бізнес-аналітики, щоб визначити, де найкраще відкрити новий заклад. Система навіть розраховує, як впливатиме нова кав’ярня на інші їхні локації в місті. Інколи здається, що закладів на одній вулиці аж забагато, але те, що вони є, свідчить, що дані прогнозують кожному з них своїх клієнтів. Ба більше, популярний за кордоном додаток від Starbucks може прогнозувати, де ймовірно перебуватиме підписник у конкретний час доби. Він аналізує дані геолокації, попередні покупки користувача у схожий день тижня, час доби, за схожих погодних умов і навіть настрій клієнта. І якщо для аналізу перших пунктів достатньо удосконаленої системи аналізу відносно аналізу за статтю і віком, то для того, щоб постійно моніторити настрій клієнта, використали систему «емоційної аналітики». Cпеціальне програмне забезпечення через фото з камери на телефоні розпізнає вираз обличчя (задоволений, спантеличений, заінтригований). На основі цих даних воно сегментує ринок і формує «особливі пропозиції» для кожного клієнта. 

     

    Вибори президента США у 2016 році показали, що використання великих даних  може вплинути навіть на те, як громадяни роблять вибір на користь того чи того кандидата. Через місяць після виборів шведський журнал Das Magazin опублікував розслідування, у якому йшлося про те, що виграшем чинний американський президент завдячує британській аналітичній компанії Cambridge Analytica. Компанія ж вважала цей інцидент прикладом якісної роботи. Її працівники проаналізували поведінку користувачів у Facebook, поділили аудиторію на психотипи і відповідно до цього розробляли рекламні політичні меседжі для кожної аудиторії. 

     

    Великі дані можуть використовуватися й для того, щоб контролювати групи осіб. У китайському адміністративному окрузі Сіньцзян за допомогою використання мобільних додатків, які збирають дані, фактично ізолювали місцеве населення і створили справжній концтабір для уйгурів – тюркського мусульманського народу, який проживає на території Китаю. Окрім того, що влада країни постійно збирає дані про ДНК та інші біодані, вона ще зобов’язала кожного представника уйгурів встановити додаток Jing Wang («чистий інтернет»). За допомогою цієї програми влада стежить за контентом на телефонах: телефонними розмовами, повідомленнями та пошуковими запитами. Програма має відстежувати релігійні та екстремістські меседжі. Офіційно ці заходи виправдовуються боротьбою з тероризмом. 

    Не лише кав’ярні: великі дані і наші речі 

    У 1999 році працівник компанії Procter&Gamble Кевін Ештон вперше вжив термін «інтернет речей» (IoT – Internet of things). Згідно з ідеєю Кевіна, кожна буденна річ, від будильника до системи безпеки у будинку, повинна бути під’єднана до інтернету. Так вона зможе принести власнику більше користі. Годинники, чайники і телефони тепер постійно можуть бути під’єднані до інтернету. Вони стають «розумними» і звільняють нас від необхідності робити ту роботу, якої теоретично можна уникнути. За допомогою спеціальних мікрочіпів, які можуть зчитувати  інформацію, холодильники тепер повідомляють, коли у них закінчується молоко, а кавоварки можна вимкнути, навіть їх не торкаючись. 

     

    Аналітична компанія Gartner прогнозує, що до 2020 року до інтернету підключать 26 мільйонів побутових пристроїв. Водночас нові функції дозволили нашій техніці збирати про нас дані. В наших акаунтах у хмарі збирається інформація про те, скільки годин на день власник спить, скільки кроків проходить і який спосіб життя веде. Цим скористалася, наприклад, американська компанія Jawbone. Їхні звичайні фітнес-браслети зчитують інформацію про сон власника. Так компанія може проаналізувати, який район міста спить менше. Ці дані передають фармацевтам, які збільшують рекламу пігулок від безсоння у конкретному районі, а отже, збільшують прибуток.

    У 2012 році дослідники зібрали дані про подорожувальників у Барселоні та Мадриді. Виявилося, що найбільше ці міста відвідують люди з Великої Британії, Франції та Італії. Вони становили 50% туристів за аналізований період. Аргентинці, бразильці та португальці надають пріоритет Мадриду, а відвідувачі з північних країн обирають Барселону

    Розумне місто: ДТП, туризм, джентрифікація 

    Відділ населення Департаменту економічних і соціальних питань ООН визначив, що станом на 2018 рік 55% мешканців Землі проживають у містах. До 2030 року це число збільшиться ще на 5%. Настільки стрімкий розвиток поставив науковців перед викликом: як адаптувати сучасне місто до постійної зміни базових потреб. Міста починають використовувати дані про своїх мешканців, а також великі дані та ІoT для того, щоб удосконалити не лише окремі речі, а й усю інфраструктуру на великій території. Масиви даних потенційно можуть покращити функціонування культурної, наукової, фінансової, екологічної та транспортної сфери. 

     

    Великі дані змінять будівлі та архітектуру міста. Для того, щоб удосконалити кампус школи управління імені Джона Кеннеді при Гарвардському університеті, науковці використали дані про пересування студентів, здобуті через додаток My Campus. Дослідники виявили, що майже ніхто зі студентів не використовує головні вхідні двері, щоб потрапити всередину. Ця інформація стала відправною точкою для нового плану кампусу. Міські архітектори можуть враховувати дані про завантаженість тої чи тої частини міста для планування нових гуртожитків та розміщення інших інфраструктурних елементів у кампусі університету. 

     

    У сучасних розвинених містах пересуватися стає дедалі важче. Дані про мешканців застосовують для того, щоб забезпечити безпеку на дорозі. Наприклад, у Сінгапурі запровадили систему, яка дозволяє фіксувати ділянки з найбільшою кількістю ДТП. Потім аналітики опрацьовують зібрані дані і передають висновки владі міста. Найнебезпечніші ділянки дороги убезпечують додатковими знаками чи патрулем. Також на дорогах встановлюють спеціальні світлофори з датчиками, що фіксують, які автомобілі найчастіше порушують правила дорожнього руху. 

     

    Великі дані покращують туризм і культурне життя міста. Так, компанія Anagrama розробила Smart City Map. Це не зовсім карта, а радше набір даних про конкретне місто. Мобільний додаток персоналізується відповідно до потреб користувача. Людина може дізнатися будь-яку інформацію, яка їй потрібна: програма повідомляє про рівень злочинності та ДТП в місті, пункти безкоштовного Wi-Fi, місцеві пункти переробки сміття та туристичні локації міста. 

     

    Великі дані використовує Іспанія для популяризації себе як країни для відпочинку і збільшення потоку туристів. У 2012 році дослідники зібрали дані про подорожувальників у Барселоні та Мадриді. Виявилося, що найбільше ці міста відвідують люди з Великої Британії, Франції та Італії. Вони становили 50% туристів за аналізований період. Аргентинці, бразильці та португальці надають пріоритет Мадриду, а відвідувачі з північних країн обирають Барселону. Це дослідження дозволило обом іспанським містам переорієнтувати ринок послуг. 

     

    Ще одна цікава можливість застосування великих даних, яка змінить місто – це робота з неструктурованими даними, які є у вільному доступі. Соціологи Джеклін Хван і Роберт Сампсон використали Google Street View, щоб зібрати дані про показники джентрифікації Чикаго (реконструкції і оновлення будівель в раніше непривабливих частинах міста та асоційованого з ними переїзд до району багатших мешканців). Ґрунтуючись лише на спостереженнях та відкритих даних, вони виявили, що райони, де проживає більше чорношкірих та латиноамериканців, відновлюються повільніше. Вони зробили висновок, що влада розподіляє гроші на різні райони нерівномірно.

     

    Поліція Нью-Йорка разом з компанією Microsoft розробила програму The Domain Awareness System, яка за допомогою спеціального алгоритму відстежує місця, де вища ймовірність виникнення правопорушення, і повідомляє про це поліцейських. Дані з 9000 камер відеоспостереження зберігаються протягом 30 днів. У 2014 році журнал Justice Quarterly опублікував статтю, у якій припускається, що через машинне навчання система може дискримінувати певні групи населення та порушувати конфіденційність. 

     

    У 2015 році компанія Google вибачилася за збої у роботі додатку Google Photos. Тоді технологія розпізнавання облич називала темношкірих користувачів горилами. Користувач з ніком Jacky Alciné твітнув зображення і написав, що додаток провалився, а його друзі – не горили. Збої відкоригували, і тепер фото мавп, горил і шимпанзе у додатку заблоковані. 

    Безпека 

    З кожним роком речей і компаній, які збирають про своїх споживачів інформацію, ставатиме щораз більше. Відповідно, уникнути цього буде майже нереально. Отже, гостріше постане питання конфіденційності та відповідальності за поширення інформації. Усі великі дані зберігаються на так званих хмарах. Найголовніша проблема в тому, що зараз немає надійних способів захистити «хмари» від хакерських атак. Поки що жодна база даних повністю від них не захищена. У 2014 році хакери напали на найбільший торговий онлайн-майданчик eBay. Близько 146 мільйонів користувачів втратили дані, захищені паролем. Частина користувачів після цього відмовилася від покупок на сайті. 

     

    Ще одна невизначеність полягає у тому, чи не почнуть компанії масово продавати зібрані дані, відкривши ще один спосіб прибутку, чи не потрапить інформація про осіб до владних структур. У 2016 році уряд США надіслав майже 50 тисяч запитів на користувацькі дані лише до Facebook. Розслідування опублікували видання The New York Times і The Guardian. Після публікації акції компанії Марка Цукерберга впали на 7%. 

     

    Дані користувачів Facebook аналітики використували ще й для того, щоб вплинути на результати британського референдуму щодо Brexit. Компанія Cambridge Analytica поділила користувачів з Великої Британії на три групи: ті, хто хоче залишитися в ЄС; ті, хто проти; і ті, хто хотів би відділитися, але вважає, що це надто страшно. На основі цих даних були розроблені повідомлення для кожної з груп з очевидним акцентом на третю категорію, яка потенційно була найбільш схильною змінити думку. Кампанія Brexit була зосереджена на головній тезі taking back control (повернути контроль назад), але аналітики відстежили, що слово back негативно сприймається реципієнтами, бо підкреслює відчуття втрати. Тож меседж відредагували, залишивши taking control

     

    Збір великих масивів даних може вдосконалити життя конкретної людини і навіть цілого міста. Та все-таки не варто забувати, що цією технологією можуть користуватися різні люди з різною метою. Якщо торгові мережі використовують великі дані переважно для того, щоб краще пристосовуватися до потреб клієнтів, то хакери можуть використати особисті дані людини, щоб контролювати її. Саме тому варто цікавитися, хто та які дані про вас збирає, коли вони будуть знищені і з якою метою використані. 

    ТЕКСТ: Оленка Лаущенко
    Фото: ajps cs
    Статті
    Наука
    Екологічно чиста отрута: уривок з книжки «Зоологічна екскурсія супермаркетом»

    Чому краще утриматися від «дикого» промислу морепродуктів, особливо у водоймах, де цвіте вода?

    Наука
    Передумови приходу диктаторів до влади: Італія, Німеччина, РФ

    Що стало передумовами приходу диктаторів до влади на прикладі фашистської Італії, нацистської Німеччини та путінської росії? Розповідає співавтор і ведучий каналу «Історія Без Міфів» Владлен Мараєв.

    Людина
    Як кожен з нас може подякувати військовим і допомогти їм з адаптацією

    Як змінюється світосприйняття військових і що ми можемо зробити, аби висловити їм вдячність і допомогти в адаптації до мирного життя?

    Біологія
    Не тільки в історії. Який слід залишить війна в наших генах

    Як війни, голод та важкі психологічні травми залишають слід у геномі людини й чи можемо ми на це якось повпливати?

    Космос
    Що таке сонячні плями і чи впливають вони на людей

    Чи можуть спалахи на Сонці та магнітні бурі провокувати погане самопочуття в людей?

    Ідеї
    Пропаганда у російському кіно

    Як кіно стало частиною пропагандистської та політичної ідеології росії та чи можна якось дати цьому раду?

    Повідомити про помилку

    Текст, який буде надіслано нашим редакторам: