Найкращі речі в житті не масштабуйте

Найбільші модники в техніці не зможуть, оскільки вони просто не мають масштабу.

Коли ми швидко впроваджуємо нові інноваційні технології, ми маємо пам’ятати, чи є наші інновації практичними та здійсненими. У світі, де ми нараховуємо користувачів у тисячах і тривалість виконання в мілісекундах, важливіше, ніж будь-коли, гарантувати нові технічні масштаби.

Ось чому шокуюче, що три найбільші мовленнєві слова повністю не в змозі змінити масштаб.

Звичайно, я говорю про три категорії, до яких, здавалося б, кожен біт технологічних новин потрапляє в наш час:

  1. Штучний інтелект
  2. Блокчейн
  3. Змішана реальність (XR, AR / VR)

Здається, що майже все або використовує, або додає їх, але все ж божевільно (як і неможливо) масштабувати ці послуги.

Нам потрібно більше обладнання

Першим і головним недоліком залишається обладнання. Ні для кого не секрет, що вимоги до обладнання до технологій з кожним роком зростають експоненціально, як у ціні, так і в технічних характеристиках. Це фактично стає блокуючим фактором широкого поширення, а у випадку з blockchain - це вбивця.

Blockchain, як правило, покладається на "шахтарів", які блокують "шахту" і дозволяють мережі виконувати основні завдання (тобто перевірку транзакцій). Процес «видобутку» - це те, про що я не заглиблююсь, але він включає виконання великих криптографічних функцій, процес відомий як «хешування».

Проблема хешування полягає в тому, що воно вимагає значної кількості обчислювальної потужності; насправді для такої великої кількості, що ефективно видобуває блокчейн, потрібне спеціальне обладнання - або графічний процесор, або ASIC. Щоб бути навіть найменшим шахтарем, вам знадобиться високоспеціальний GPU (нехай це буде реально, Intel HD Graphics зараз є споживчим стандартом, так що в основному кожен графічний процесор вище, ніж висококласні) або спеціалізований ASIC. Це набирає досить велику суму, при цьому більшість пристроїв коштують від сотень до тисяч доларів за одиницю, не враховуючи високого споживання електроенергії, що вважається експлуатаційною вартістю.

великий дефіцит GPU 2018 року

Це виявилося важливим, блокуючим фактором прийняття блокчейна. Насправді, саме з цієї причини ціни на GPU злетіли, а акції майже не зникли, залишивши майбутніх шахтарів без будь-яких інструментів, розбивши індустрію ігор ПК та заважаючи дослідникам отримати доступ до апаратних засобів високого класу. Навіть виробники графічних процесорів, як Nvidia, які отримували прибуток від зростання, в кінцевому рахунку висловилися про серйозний дефіцит як пряму причину блокчейн.

Через рік більшість цих технологій blockchain зникли, а ціни основних криптовалют впали на чверть їхньої оцінки. Найпоширенішим занепокоєнням щодо blockchain є його неспроможність до масштабування, а апаратне забезпечення залишається (і надалі залишатиметься) блокувальним фактором в масштабуванні технології blockchain.

Однак ця проблема не обмежена блокчейню. Штучний інтелект покладається на одне і те ж апаратне забезпечення (GPU), і це стає блокуючим фактором і в цій галузі; більшість майбутніх стартапів не можуть дозволити собі побудувати величезну ферму GPU, як Google, а придбання обчислювальної потужності у хмарних провайдерів, таких як AWS, приходить в 4 рази дорожче, що нагромаджує величезний рахунок на сервер.

З XR питання ще більше переживає. Для запуску цього досвіду споживачі повинні рендерувати візуальні зображення, а пристрій споживача повинен обробляти сенсорні дані. Це значною мірою покладає на себе споживача, що чудово підходить для підприємств, які прагнуть потрапити в простір XR, але викликає велику проблему із масштабуванням.

Наприклад, візьмемо Oculus VR. Oculus була однією з перших гарнітур VR, яка запустила і залишається популярним ім'ям у цій галузі, з тих пір придбавши Facebook і закріпивши своє місце на ринку.

Смішно високий

На жаль, Oculus майже ексклюзивно працює на настільних ПК, крім того, вимагає високих специфікацій GPU. Він стикається з тими ж підводними каменями, що і блокчейн та AI, але з набагато більшими занепокоєннями: тоді як з AI бізнес може просто кинути гроші на їх інфраструктуру, щоб тимчасово вирішити проблему, з XR тягар лягає на споживачів. Цикл прийняття AR / VR розраховує на те, що споживчі графічні процесори стають більш поширеними та вищими специфікаціями, а також чекають, коли ціни впадуть до рівнів, доступних середньому користувачеві. Це процес, який потенційно може зайняти десятиліття - в той час, як генеральний директор Nvidia Дженсен Хуанг заявляє, що закон Мура надає перевагу графічним процесорам, час, необхідний для достатньої розробки, необхідної для підняття специфікацій при зниженні цін, все ще становить кілька років.

Щодо трьох найбільших мовних слів у техніці, це жахливе речення.

Час виконання

Коли ми говоримо про час виконання обчислень, ми зазвичай маємо на увазі це в мілісекундах, оскільки користувачі виросли в очікуванні миттєвої взаємодії.

На жаль, це зовсім не так у всіх трьох перерахованих вище технологій.

За допомогою blockchain видобуток одного блоку займає більше часу і триває час. Це дійшло до того, що людям вже не вигідно видобувати великі криптовалюти, і майнінг-пули почали дзвонити по знімках в мережу. Щодо „децентралізованої” технології, то це сприяє надзвичайно багато централізації.

Це також заклинання до дум для найбільшого випадку використання блокчейна: криптовалюти. Криптовалюта процвітає у швидких операціях, без централізованих органів влади, через кордон та без великих комісій.

Однак, коли блокчейн не зміг масштабувати і кількість часу (час = електроенергія), необхідного для видобутку блоку, плата, пов'язана з транзакціями, зросла до рекордно високих показників; на піку, Bitcoin досяг точки, коли комісії, пов'язані з більшістю дрібних транзакцій, були більшими, ніж фактична вартість трансакції, що робить його абсолютно марним і повним збоєм для повсякденних споживачів. Операції почали займати години, а регулювання через відбій, зростання цін на біткойн ускладнило переміщення Bitcoin через кордон.

Криптовалюта стала всім, що вона обіцяла знищити.

Що стосується штучного інтелекту, виникає зовсім інше питання. Час висновку для багатьох масштабних моделей займає кілька секунд, що звучить як невелика кількість часу, але починає збиватися і стає блокуючим показником при обговоренні баз користувачів, які нараховують тисячі.

Більше того, цифри, вказані на час висновку з більшості моделей, є хитрими - вам потрібно прочитати між рядками, а точніше до наступного рядка, який зазвичай звучить "як знайдено в нашому стеку GPU XYZ", в якому "стек GPU XYZ" коштує кілька тисяч доларів і має бути повністю присвячений цій єдиній задачі.

Гугл TPU Google, який часто використовується для навчання їх моделей

Звичайно, тут проводяться дослідження, але дослідження, яке проводиться майже повністю, зосереджене на навчальному часу, що, на мою думку, не дуже важливе. Для навчання тиждень - це не велика справа - будь-який стартап може витратити тиждень на підготовку моделі, яка стане наріжним каменем їхнього бізнесу.

Більша проблема полягає у висновку. На кореневому рівні навчання вимагає висновку - висновок зазвичай котирується як фаза "вперед" мережі, і це має відбуватися в тренуванні до того, як буде проведено задній фон. Однак у навчанні всі дані, про які потрібно зробити висновок, доступні на початку.

Іншими словами, всю партію можна обробити одразу (тобто 100 зображень одночасно), завдяки математичному масштабуванню - множення більшої матриці на кілька матриць є більш ефективним, ніж множення декількох матриць на 1 матрицю (іншими словами , ефективніше робити відразу більше). Це доходить до певного моменту, подібного до ідеї зменшення прибутку в економіці, але залишається, що пакетне навчання дозволяє нам масштабувати висновки на великих обсягах даних.

На жаль, у практичному сенсі пакетна обробка трапляється рідко.

Рідко трапляється, що модель повинна робити висновок на 200 зображеннях одночасно; більша ймовірність, що 200 зображень будуть подані для висновку, скажімо, за хвилину. Буде важке вузьке вузьке місце для виведення зображення; навіть час висновку, скажімо, третина секунди (це шалено швидко - це часи, якими можна похвалитися найшвидші моделі, такі як супер-оптимізована модель прогнозування пропозицій Gmail) призведе до того, що лише 180 зображень будуть оброблені за хвилина. Навіть при малому навантаженні 200 / хв модель не вдається розширити масштаб, і для оцінки зростаючого відставання необхідно створити другий екземпляр, щоб збалансувати.

Важко таблетку ковтати в світі, де даються великі навантаження; насправді, Node's Express вже потрапляв під обстріл, оскільки підтримував лише пару тисяч з'єднань / секунду, подібно до популярних баз даних NoSQL.

гребля, яка гарантовано лопне

Це цифра, нечувана у світі AI, яка стикається із жорстким вузьким місцем на пару сотень в секунду з точки зору окремих висновків на одному екземплярі моделі, навіть із найсучаснішими оптимізаціями, які ви можете зробити.

З XR існує дуже-дуже інша проблема. Проблема полягає в зануренні - для занурення та уникнення дивовижної долини взаємодії мають відбуватися, і візуалізація повинна адаптуватися швидше, ніж люди можуть сприймати. Іншими словами, пару сотень мілісекунд недостатньо швидко.

За допомогою XR ми вимірюємо речі в невеликих кількостях мілісекунд. Ми вимірюємо прийнятну затримку нижче ~ 20 мс (цифра, з якою багато геймерів не погоджуються, оскільки 100+ кадрів в секунду і менше десяти пінг вважаються нормальними для більшості програм).

Це фігура, яка залишається вузьким місцем і є такою, яку ми ніде не знаходимося; хоча XR техніка інтенсивно зосереджується на цьому і в цій галузі досягнуто численних проривів у плані регулярного сенсорного введення та надання, ми все ще стикаємося з питаннями взаємодії; саме XR відкриває цілий новий, нескінченний спектр можливостей взаємодії, який просто не може бути оброблений дуже швидко двигунами.

Двигун із доповненими зображеннями ARCore, представлений на Google I / O 2018

Більше того, щоб запустити збільшення зображення з чим-небудь складнішим, ніж гомографія, затримка занадто висока, щоб вважати “прийнятною” більшістю досвіду. Найшвидший тест, який ми протестували дотепер, - це доповнені зображення ARCore Google, в яких використовуються гомографії (є також демонстрація «Доповнені обличчя», яка трохи повільніше і має помітну затримку / відставання).

Демонстрація ARCore Faces Faces

Це велика проблема

Тільки за останні два роки кількість просування в цих трьох сферах непереборне.

В AI ми побачили стрибок природного мови вперед з GPT-2, який заробляє свою репутацію Imagenet NLP. Це відкриває новий світ можливостей для обробки тексту. Ми також бачили звивисті мережі та GAN, які перетворюються на прийняття 4-х зображень, і ми вступаємо в епоху, коли AI може імітувати зображення HD та створювати вміст, який здається правдоподібним для людського ока.

Завдяки блокчейну, поле стало менш замуленим, і кілька грошових захоплень вимирали, і було більше місця для експозиції на існуючих платформах. Steam помітно виріс за останній рік, разом зі Stellar та використанням blockchain у звичайній техніці. JPMorgan, BofA і Facebook оголосили про свій блокчейн, і застосований блокчейн бачить зростання платформ на зразок DLive, які почали переходити на мейнстрім (DLive нещодавно створила партнерство з найбільшою особистістю Youtube зі своєю першою платформою для творців).

У XR ми бачили, що XR та AR на рівні телефону стають реальністю із багатьма вдосконаленнями ARCore. Стає можливим інтегрувати інтелектуальний інтелект у XR та розвивати досвід, який дозволяє досягти певного рівня взаємодії між людьми (ми ще не на фізичному контакті, але є проекти, що дозволяють здійснювати іншу взаємодію, наприклад, Fiddler AR).

Це все сфери, які несуть великий, істотний вплив на майбутнє технології, і де людська цивілізація йде в цілому. Це технології, які не впливають на економіку; вони переосмислюють це; вони не впливають на суспільство та взаємодію; вони його оживляють. Це робить можливим капітальний ремонт всієї нашої культури, і на кореневому рівні це називається ще однією промисловою революцією.

Для руху, який має такий великий вплив на широку громадськість, це життєво важливо і головне, що він може масштабувати, щоб легко підтримати громадськість. Поки це не буде здійснено, це перешкоджає прийняттю та формує жорсткий бар'єр на шляху до вступу в інновації за межами великих корпорацій.

Я сподіваюся побачити більше інновацій у масштабі масштабування цих технологій. На Epic.ai ми зосередилися на розробці додатків, які значною мірою покладаються на AI та blockchain - ми занадто добре знайомі з обмеженням масштабування; це проблема, над якою ми будемо активно працювати протягом наступних кількох років, і проблема, яку ми сподіваємося, галузь вирішить вирішити.

Гей! Я Томер, підприємець і виробник. Ви можете знати мене з Mevee, Crane та Shots, Slides та тепер investorintelligence.io серед інших продуктів, які я запустив! Ця стаття є частиною більш обширної серії, яку я пишу здебільшого на основі свого досвіду і головним чином складається з мене та моєї команди.

Сподіваюся, це допоможе вам уникнути тих же помилок, що і я, і пам’ятайте, щоб продовжувати доставку!

Будь ласка, плескайте якщо ви вважаєте це цінним, і слідкуйте за мною , щоб більше писати так, як я ділюся розповідями про те, як виглядає розробка програмного забезпечення та підприємництво в реальному житті.

Ця історія опублікована в найбільшій підприємницькій публікації "Середній бізнес", де перебувають +442 678 осіб.

Підпишіться, щоб отримувати наші основні історії тут.