fbpx
ОСТАННІЙ ПОДКАСТ

Ми під'їдаємо крихти cookies за вами. Навіщо це нам?

Читати

Пардон за відволікалочку. Допоможи Куншт бути незалежним!

Пардон за відволікалочку. Допоможи Куншт бути незалежним!

Повідомлення успішно надіслано

Для пошуку
введіть назву запису
Технології — 05.06.20
ТЕКСТ: Дар'я Кузява
Ілюстрації: Каталіна Маєвська
Ми любимо тексти без помилок. Якщо ви все ж таки щось знайшли, виділіть фрагмент і натисніть
Ctrl+Enter.
ШІ for She: інтерв’ю з Веронікою Юрчук

Вероніка Юрчук дуже хотіла знайти прикладне застосування математиці. Згодом вона заснувала компанію Traces AI, яка допомагає шукати людей за зображеннями. Вероніка поговорила з Кунштом про технологічні й етичні питання використання штучного інтелекту, розвиток своєї компанії а також про найвідоміший у світі стартап-акселератор.

На якому етапі свого життя ти зрозуміла, що саме комп’ютерне бачення, комп’ютерне навчання – це твоє? Чому ти вирішила піти саме в цю сферу?

 

Комп’ютерне бачення – це один із різновидів штучного інтелекту. Алгоритми комп’ютерного бачення працюють із зображеннями та відео. Вони здатні розуміти, що відбувається на відео та картинках: розпізнавати, класифікувати і знаходити, що зображено (об’єкти, місцевість, дії тощо), а також створювати нові чи модифіковані картинки та відео.

 

Я навчалася на механіко-математичному факультеті КНУ Шевченка за спеціальністю «Статистика». Власне, в університеті ми багато вивчали теорію ймовірності, а також математичну та комп’ютерну статистику. Усе життя мені було цікаво, як можна використовувати математику для розв’язання прикладних задач.

 

Але це було досить давно. Тоді в Україні навіть таких слів як data science або machine learning взагалі не було чути. Коли я навчалась на магістратурі і шукала роботу, то в Києві було, можливо, дві вакансії зі словами «data science», але навіть те було не зовсім data science. Це був десь 2015 рік, напевно. 

 

Попри все, мені дуже подобалася це сфера, бо я бачила, як можна використовувати складну, так би мовити, університетську математику для вирішення реальних проблем у різних галузях. Тому і почала вивчати data science та мову програмування R. Це були класичні задачі з табличними даними. Потім я почала проходити більше курсів з комп’ютерного бачення (computer vision) (їх було достатньо багато, зокрема курс зі Стенфорда про комп’ютерне бачення, курс на Coursera, багато книжок). Я почала заглиблюватися в цю тему, і так усе почалося.

Під час навчання, роботи і кар’єрного зростання ти потрапляла в ситуації, коли тобі казали, що це не дуже жіноча справа?

 

Так, проте це мені не надто заважало. Завжди є такі люди (хоча їх достатньо мало) зі стереотипним баченням, що математика, технології – для чоловіків, а дівчата мають цікавитися чимось іншим. Але скільки людей, стільки й думок. Я завжди нейтрально реагувала на такі коментарі. Ці люди не могли ніяким чином збити мене з мого шляху чи моєї мрії. Я просто займалася тим, що мені цікаво. 

 

Власне, про Traces AI. Як взагалі ця ідея прийшла до тебе? Наскільки я розумію, ти розробила унікальний на ринку алгоритм.

 

Я зацікавилася цією технологією і працювала як дослідниця над цією темою, з’ясовувала, як можна покращити ці алгоритми. Як це відбувається? Люди роблять якесь дослідження одного з алгоритмів, що використовується в комп’ютерному баченні, є якісь набори данихДля різних задач є різні датасети. Якщо говорити про комп’ютерний зір, то в більшості випадків це великий набір різних зображень та відповідних лейблів/класів, які мають інформацію про кожну з картинок. (datasets), і на них люди, можна сказати, змагаються своїми метриками. Зазвичай метрики – це складні оцінки того, як працює певна модель. Наприклад, є метрика «точність моделі для задачі класифікації». Нехай треба визначити на певному наборі картинок, де розташовані котики. Точність – це відношення правильно визначених об’єктів до всіх об’єктів цього класу, тобто просто відношення кількості правильно знайдених котиків до загальної кількості картинок з котиками в певному наборі даних.

 

Найчастіше в таких змаганнях беруть участь групи дослідників з провідних технічних університетів чи працівники ШІ-департаментів топових компанії. Однак загалом в цьому може змагатися будь-хто, хто вважає себе дослідником або інженером з комп’ютерного бачення. От і я вирішила в свій час дослідити один алгоритм і взяти участь у таких змаганнях. Я читала багато статей, знала, які підходи та алгоритми вважаються найкращими у світі і паралельно розробляла свої алгоритми і постійно їх покращувала, а також ставила екперименти й перевіряла власні гіпотези. Після деяких модифікацій, покращень і впровадження власних ідей моє рішення спрацювало найкраще. Мій алгоритм побив всі найкращі результати на той момент, і з цими результатами я подалася на одну з дуже популярних конференцій серед AI-спеціалістів – NeurIPS, зробила маленьку статтю, пройшла декілька етапів відбору, і її прийняли. Потім я поїхала до Монреаля, у Канаду, презентувати своє рішення. Але це стосується більш дослідницької роботи. Це був для мене суперкрутий досвід – побачити, що будь-хто може, маючи ідею і запал, публікувати свої статті й презентувати їх на конференціях дуже високого рівня. І для цього необов’язково мати PhD або бути представником якогось крутого університету.

 

NeurIPS – одна з найбільший і найпопулярніших конференцій у світі зі штучного інтелекту. У  2018 році, коли я презентувала своє рішення, було десь 10 тисяч відвідувачів, а минулого року – приблизно 13 тисяч. Минулого року квитки розкупили за три хвилини з моменту появи в продажу, це надзвичайно швидко. І, до слова, менше ніж 15% відвідувачів в 2018 році – жінки.

 

Алгоритм, який ти презентувала на NeurIPS, потім став основою Traces AI?

 

Саме цей алгоритм наштовхнув мене на розробку ще кращого рішення, яке б мало вже не лише наукове застосування, але й бізнес-перспективи. Зараз Traces AI – це дуже великий набір моделей.

 

Яку основну проблему вирішує стартап?

 

Дуже активно використовувалася технологія розпізнавання обличчя. І це чудова технологія, якщо потрібно розблокувати наші телефони або використовувати як сканери в аеропортах. Але вона добре працює, коли камера розташована близько до обличчя: якщо ти дивишся прямо в камеру, є хороше освітлення, а у самої камери висока якість. 

 

Водночас було багато спроб використати розпізнавання обличчя для CCTV – камер відеонагляду. Вони найчастіше розміщені вгорі, якість цих камер зазвичай достатньо низька, бо це, як правило, старі камери, їх нечасто змінюють. До того ж ми рідко дивимося вгору. Тому камерам відеонагляду дуже складно зафіксувати наше обличчя якісно. Деякі компанії пробували використати розпізнавання обличчя для того, щоб допомогти знаходити зловмисників або людей, які загубилися. Але якість і точність цього підходу не найкращі. 

 

Ця технологія суперечлива і з етичного боку. Адже її можуть використовувати, щоб, наприклад, стежити за політичними активістами або журналістами, використовувати зображення їхніх облич і знати, де вони перебувають в будь-який момент. 

 

Одного разу я там мій співзасновник подумали: з якою технологією вдасться не порушувати права людини, але знаходити крадіїв, злодіїв або людей, які загубилися. Ми думали, що це може бути, крім обличчя. Очевидно, зовнішній вигляд людини. За зовнішнім виглядом ми можемо шукати певну людину на багатьох камерах, які встановлені в різних місцях, з різним освітленням, з різною якістю зйомки. 

 

Traces.AI аналізує понад дві тисячі параметрів. Беремо картинку цієї людини, розмиваємо їй обличчя, щоб алгоритм жодним чином не використовував дані про нього. Ми також не використовуємо аналіз ходи. Бо за ходою, як і за обличчям, можна знаходити людину протягом багатьох років. Наш підхід унеможливлює такий варіант. 

 

Якщо ми говоримо про принципи роботи самого алгоритму, наскільки я розумію, існує два режими введення даних: пошук за фото і пошук за вербальним описом. Скажімо, треба знайти жінку в червоному капелюсі. Як це реалізується? 

 

Так, у нас є два режими. Пошук за фото працює набагато точніше. Нехай у нас є фото тротуару, де видно людину, яку треба знайти, і багато іншого фону. Насамперед ми знаходимо на зображенні людину. Далі слід обрізати це зображення так, щоб утворився прямокутник (кроп), в якому ідеально видно саме цю людину. Все решта (фон), видаляється. Саме цю частину фото – вирізаний прямокутник з людиною – далі використовують наступні алгоритми. Потім нейронна мережа створює для цього кропу так званий унікальний вектор, тобто набір чисел, який ідеально описує саме цю людину за ознаками її зовнішності. Друга частина нашого алгоритму може порівнювати ці вектори і знаходити візуально схожих людей. Наприклад, є два вектори, що в деякому просторі розташовані близько один до одного, отже, певно, це одна людина. Якщо взяти інші два випадкові вектори й порівняти їхню відстань у цьому деякому просторі, то там ці вектори розташовуватимуться далеко один від одного, а отже, це різні люди.

 

Отож, ми можемо знайти вектори, які розташовані близько до людини в цьому просторі, і потім, використовуючи вже додаткову постобробку, знаходячи два чи три фото однієї людини, покращувати точність алгоритму і знаходити цю людину в гірших фреймах. Наприклад, у фреймах, де було погане освітлення або людину хтось перекрив.

 

Що стосується введення опису, у нас є низка параметрів, за якими ми можемо знайти людину. В системі можна обрати будь-які параметри і ввести відому інформацію. Наприклад, чорні шорти, синя кофта, синя футболка з написами білого кольору та білі кросівки. А також годинник та блакитний рюкзак. За цими параметрами система відсортує всіх людей і покаже тільки всіх схожих за цим описом. Далі, коли ви знайшли потрібну вам людину, ви можете використати це фото в першому режимі (тобто пошуку за картинкою), що видасть дуже точно всі фото, де з’являлася ця людина.

 

Уточнювальне запитання. Ми не можемо ввести вільний текст про певну жінку, це вже закладені системою параметри?

 

Наразі це працює саме так. Є велика кількість параметрів, які можна вводити – від футболки чи сорочки до малюнка на цій футболці (наприклад, з логотипом вона чи в клітинку). У майбутньому ми прямуємо до того, щоб зробити це простішим для користувачів, щоб людина могла просто ввести текст, а потім алгоритм вичленив інформацію з тексту і знайшов цю людину. Але наразі пошук за зображенням набагато популярніший, ніж пошук за описом людини, тому ми більше сфокусовані на ньому. 

 

Дуже часто також використовують й іншу можливість. Якщо немає фото, але є опис, алгоритм знаходить цю людину за описом. Якщо знайдене зображення підходить під ваш опис і ви хочете знайти цю людину, ви вже можете використати це знайдене зображення в нашому першому алгоритмі, який шукає за фото. І тоді ви отримаєте значно більше результатів. 

 

Тобто фінальний результат роботи алгоритму – це список ймовірних збігів?

 

Так, це відсортований список. Він поділений на три типи ймовірностей. У нас є жовта, зелена й червона зони. Зелена означає, що є велика ймовірність того, що це та сама людина. І там часто є відео, які можна переглянути, щоб отримати більше інформації про те, що відбулося або хто ще був на місці злочину, наприклад.

 

На яких базах даних ви тренували ці алгоритми? Чи ви боролися з biased databiased data – масиви даних, які не враховують людей з різним кольором шкіри, національністю, гендером тощо. («упередженими» даними)?

 

Ми починали з open source data (дані з відкритих джерел – прим. ред.). Потім ми знайшли свій метод балансування даних, додали людей різної національності, різного гендеру і кольору шкіри, наприклад. Пізніше на більш збалансованих даних ми витренували нашу модель. Також після цього відбувається повторне тренування на даних клієнта. Так алгоритм покращує свою точність. Для кожного клієнта це відбувається паралельно. На кожен тип клієнтів ми тренуємо особливий тип моделі. Це дозволяє покращити розпізнавання в особливих умовах, де встановлені камери цього клієнта.

 

Зараз питання про упередження в алгоритмах дуже актуальне. Це те, про що ми завжди думаємо і намагається щоразу покращувати наш основний набір даних, додаючи туди більшу кількість людей з різними ознаками.

 

Яким було найбільш нестандартне застосування вашого алгоритму?

 

Загалом ми сфокусовані на сфері безпеки, і наші рішення використовуються в охоронних компаніях у Штатах. Але до нас якось звернувся представник компанії з реклами. Ця компанія займається встановленням великих екранів на рухомих поверхнях, на машинах. Ці машини їздять містом і показують рекламу. Їм було цікаво порахувати кількість унікальних людей, які бачать цю рекламу. 

 

Ми ніколи не думали, що наша розробка може бути комусь корисною в такому застосуванні. Але це достатньо велика компанія, у них багато машин їздять по різних великих містах США. Вони розповідали нам, що намагалися робити звичайний підрахунок усіх людей, але їм це не підходить. Бо машина може стояти в заторах, і одна людина буде рухатися з такою самою швидкістю, як авто, вони постійно наздоганятимуть одна одну. Так цю людину порахують кілька разів. А вони хотіли отримати точні дані.

 

Ми досить довго спілкувалися з представником цієї компанії і зрозуміли, що це реальна проблема, яку вони намагаються вирішити. Їм це потрібно, від цього залежить ціна для компаній, які рекламуються на цих екранах. Наша технологія підійшла для цього. Хоча спочатку ми взагалі не думали про таке застосування.

 

У цьому і є крутість стартапу. У тебе є бачення продукту і можливі сфери його застосування, але ти завжди маєш бути відкритим до таких вхідних ідей.

 

Завжди потрібно бути гнучким до цього. Інколи ринок може пропонувати нові методи використання твоєї технології, про які ти навіть не здогадувався раніше, бо був сфокусований на чомусь іншому, наприклад.

 

Чи є якийсь вплив пандемії на ваш бізнес?

 

Так. Зараз у Штатах багато підприємств закриті через карантин, вони переживають не найкращі часи. Деякий бізнес не може функціонувати і просто перенести роботу в онлайн. Наприклад, ці машини, які їздять по місту, призупинили свою діяльність і чекають, поки люди знову вийдуть на вулиці, щоб можна було знову запускати машини з рекламою. Але все це тимчасово. Ми до цього ставимося просто як до нового періоду, до якого потрібно адаптуватися.

 

Але є й інша сторона впливу пандемії на нашу компанію. Поточні клієнти почали використовувати нашу технологію як метод аналітики і відстежувати, хто з ким спілкувався на заводі. Це дозволило їм не закривати весь завод, а відправляти на карантин окремих людей, які контактували з хворими. 

 

Ми підкинули цю ідею іншим нашим клієнтам, і вони тепер так само використовують нашу технологію. Наше рішення дало змогу не закривати бізнес одразу і не допустити високого рівня захворюваності в офісах і на заводах. Погано, що у світі панує пандемія, але добре, що нашу технологію можна використати, аби зберегти здоров’я людей.

 

Чи готові ви до співпраці з урядами?

 

З нашого досвіду уряди достатньо повільні. Щоб співпрацювати з урядом, потрібно багато часу. Ми вважаємо, що це майже неможливо. Бо це велика бюрократія. У цьому питанні набагато легше працювати з компаніями, з бізнесами, тому що вони більш гнучкі й швидше адаптуються до змін, швидше впроваджують нові технології. Тому ми насамперед зосереджені на роботі з бізнесами. 

 

Яким був найбільший факап у твоєму професійному житті, що позитивно вплинув на тебе в майбутньому?

 

Я можу почати з однієї історії і, можливо, мені щось спаде на думку. Це історія про те, як ми приїхали в Америку. Спочатку нас прийняли в акселератор в Нью-Йорку. Але у нас ще було останнє інтерв’ю в Сан-Франциско з представниками іншого акселератора – Y CombinatorY Combinator – один із найвідоміших бізнес-інкубаторів, який допомагає розвиватися найперспективнішим стартапам з усього світу. (YC). Ми їхали з валізами і думкою про те, що будемо жити в Нью-Йорку. Ми хотіли в Y Combinator, але розуміли, що відсоток компаній, які туди потрапляють, дуже низький. 

 

І от ми пройшли співбесіду – і нас взяли в YC. Нам потрібно було вирішити, що робити далі. Адже ми не могли проходити два акселератори одночасно, і потрібно було обирати. А часу обирати не було. З YC зателефонували у той самий день, коли ми проходили інтерв’ю, і сказали: «Ви пройшли. Вітаємо в YC». Уявіть, а ми відповіли: «Ой, почекайте, будь ласка, нам треба подумати». Тож ми сиділи зі співзасновником Костянтином Шишем у парку в Стенфорді і думали, що робити далі. Звісно, ми обрали YC. Це найбільший акселератор у світі. Тому ми мали відмовитися від акселератора в Нью-Йорку. Але потім у нас склалися з його представниками дуже хороші стосунки. Коли мій співзасновник полетів до Нью-Йорка, то кілька разів зустрічався з представниками акселератора, і зараз ми підтримуємо хороші стосунки. 

 

Складність була ще в тому, що ми взагалі не думали про житло в Кремнієвій долині. Був початок літа, гарячий період для інтернів. Тобто всі студенти і фахівці з усього світу прилітають на літо проходити стажування в Facebook, Google, Amazon. Знайти житло в Долині просто неможливо. Очевидно, якщо порівнювати з нашими цінами, все дороге. Ще й неможливо знайти якесь місце.

 

Я, напевно, тиждень їздила й намагалася знайти помешкання, щоб можна було залишитися.  Виявилось, що ціна за житло вища майже вдвічі при оренді на три місяці, ніж при оренді на рік. Але оскільки ми знали точний термін нашого перебування в Каліфорнії, нашою основною метою було знайти помешкання на три місяці. Це була велика проблема і для інших стартапів, які потрапили до YC. 

 

На щастя, я згадала про свого знайомого, з яким познайомилася в Канаді, коли презентувала своє рішення на великій AI-конференції. Я написала йому. У нього була подруга, ми з нею познайомилися, вона виявилась прикольною і відкритою, от ми і оселилися в неї на три місяці. Це цікава історія про те, який світ тісний. Ми знали одне одного два дні, а він розв’язав мою колосальну проблему з житлом в Кремнієвій долині. Я досі дуже вдячна йому і його подрузі за допомогу. На перший погляд, написати знайомому в Торонто було не найкращою ідеєю: як він мені допоможе, якщо я в Кремнієвій долині? Але так сталося, що він допоміг. 

 

Тоді я зробила для себе висновок: не треба недооцінювати слабкі соціальні зв’язки. Треба завжди намагатися шукати нетривіальні розв’язання проблеми, якщо традиційні підходи не працюють.

ТЕКСТ: Дар'я Кузява
Ілюстрації: Каталіна Маєвська
Статті

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: