Воскресенье, 4 декабря 2016

Екатеринбург: -15°

$ 64,15 Стоимость продажи доллара Официальный курс ЦБ РФ на 04.12.2016 € 68,47 Стоимость продажи евро Официальный курс ЦБ РФ на 04.12.2016
Brent 54,46$ Стоимость барреля нефти, в долларах. По данным Finam.ru Квартиры 68 166₽ Средняя стоимость одного квадратного метра на вторичном жилом рынке Екатеринбурга. Данные: Уральская палата недвижимости / upn.ru
Ключевая ставка: 10,00% По данным ЦБ РФ.

Воскресенье, 4 декабря 2016

Екатеринбург: -15°

$ 64,15 Стоимость продажи доллара Официальный курс ЦБ РФ на 04.12.2016 € 68,47 Стоимость продажи евро Официальный курс ЦБ РФ на 04.12.2016
Brent 54,46$ Стоимость барреля нефти, в долларах. По данным Finam.ru Квартиры 68 166₽ Средняя стоимость одного квадратного метра на вторичном жилом рынке Екатеринбурга. Данные: Уральская палата недвижимости / upn.ru
Ключевая ставка: 10,00% По данным ЦБ РФ.

Воскресенье, 4 декабря 2016

Екатеринбург: -15°

$ 64,15 Стоимость продажи доллара Официальный курс ЦБ РФ на 04.12.2016 € 68,47 Стоимость продажи евро Официальный курс ЦБ РФ на 04.12.2016
Brent 54,46$ Стоимость барреля нефти, в долларах. По данным Finam.ru Квартиры 68 166₽ Средняя стоимость одного квадратного метра на вторичном жилом рынке Екатеринбурга. Данные: Уральская палата недвижимости / upn.ru
Ключевая ставка: 10,00% По данным ЦБ РФ.

Машинный интеллект и машинное обучение. Лекция Андрея Себранта («Яндекс»)

×
Интеллекции 29 сентября в 18:30
Проблемы с видео?
В материале:

Себрант Андрей

Директор по маркетингу сервисов компании «Яндекс» Андрей Себрант рассказывает, что такое искусственный (машинный) интеллект и машинное обучение.


Пять главных тезисов лекции

1. Новая технология совершает революцию, когда становится простой, доступной и дешёвой. Революция применения электричества случилась не тогда, когда появилась лампочка Эдисона, а тогда, когда для того, чтобы им воспользоваться, стало достаточно купить любой электроприбор и воткнуть его в розетку. Сейчас это произошло с машинным обучением.

Машинный интеллект доступен из розетки всем, кто знает, где находится эта розетка.

2. Технологии перестали быть информационными и стали операционными. Они могут сами принимать решения и исполнять их. Главная современная задача — научить машину принимать решения и доверить ей их исполнение.

3. Уже существуют алгоритмы, которые учатся сами. «Яндекс», Mail.ru, Facebook, Google используют такие алгоритмы, которые обучаются на действиях пользователей.

У машины оказывается свойство, которое мы побоимся назвать интуицией, потому что не знаем, что такое интуиция, но его внешнее проявление неотличимо от человека, обладающего глубочайшей интуицией.

4. Важнейшие умения специалиста 2020+:

  • работа в одной команде разных экспертов: аналитиков, специалистов по общению с алгоритмами, программистов, психологов, творческих людей и творческих машин;
  • умение учить машины (алгоритмы), а не только людей;
  • умение отличать, какие решения лучше принимает человек, а какие машина, и иметь смелость делегировать задачи машине, а не только людям.

5. Мир гораздо более умных, чем мы, машин, с которыми нам вместе жить, — точно будет.

Полную расшифровку лекции читайте по ссылке


Вопросы Malina.am

Екатерина Дегай: В сериале «Карточный домик» у одного из кандидатов в президенты был друг, который владел поисковой системой. И они выстроили все свои предвыборные лозунги и программу на основе поисковых запросов. Они считали, что смогут предсказать реакцию людей, и у них получалось. Этот пример из категории фантастики?

Андрей Себрант: Совершенно не секрет, что вторая кампания по выборам Обамы была выиграна в основном его лучшей на тот момент в Штатах командой дата-сайентистов. Строго говоря, упрекнуть людей там было не в чем — они не говорили ему: «Наври вот про это». Хорошая пропаганда никогда не лжёт. Она правильно отбирает факты, придаёт им интонацию и контекст и работает гораздо сильнее, потому что поймать не на чем.

Так же работала и команда этих дата-сайентистов Обамы. Они не говорили ему: «Запусти такой лозунг». Они, зная, о чём он может говорить и какие задачи его заводят — когда живой человек выходит на сцену к избирателям, его должно переть от того, что он говорит, — выбирали, в каком штате, перед какой аудиторией, в какой день, в каком СМИ и на какую тему он должен выступать.

И каждый раз они замеряли, как это сказывается на опросах типа «За кого вы будете голосовать, если выборы пройдут в ближайшее воскресенье». Частично там работали самообучаемые алгоритмы, частично старомодные дэшборды, но все решения о том, что «ты будешь выступать сегодня, на эти темы, в Кентукки, и только перед студентами» принимал не политтехнолог, владеющий интуицией и пониманием людей, а только дата-сайентисты. По оценкам они дали ему 8-10%. Учитывая, с каким разрывом он победил, это означает, что они за него выиграли.

Читать все вопросы

Екатерина Дегай: Первый вопрос из области экономики. Один из тезисов твоей лекции — доступность технологий для всех, не только для глобальных корпораций, но и для совсем маленьких компаний. При этом инвестиции в искусственный интеллект в 2015 году составили 2,4 миллиарда долларов. Продолжается ли война за лидерство в этой сфере? Или она уже закончилась?

Андрей Себрант: Здесь много разных рынков. Война за то, чьи технологии будет покупать вертикально интегрированная нефтяная компания, не закончилась. Там будут сражаться настоящие киты. Поучаствует и «Яндекс», и «СКБ Контур»… В России есть игроки, которые могут поспорить, скажем, с IBM.

А вот войны за то, чтобы дать бесплатное счастье маме с огурцами, не будет. Там всё уже доступно.

В этом смысле работа большого числа программистов в малом и среднем бизнесе становится гораздо более специфичной: это работа человека, который хорошо собирает что-то из Lego, а не пишет код для решения задачи. Он никогда не напишет ничего похожего на то, что выложено на TensorFlow. Но если он знает, где что лежит и как из этого собрать необходимое, он решит свою задачу. Пример с Lego — отличная иллюстрация. Я хочу собрать конкретный паровозик, я знаю, из каких деталей его делать, и умею делать это быстрее, чем Вася, который сам вырезает кусочки из пластмассы и будет вырезать ещё год. А у меня паровоз за это время уже поедет по рельсам.

ЕД: Где здесь место России? Эта конкуренция — между странами или компаниями?

АС: Как всегда, и так, и так. Сами по себе алгоритмы универсальны, и там конкуренция глобальна. А дальше начинается затачивание этих алгоритмов под конкретные задачи — то самое собирание из кубиков, которое завязано на данные. Хороший пример — 1С: рынок финансового софта глобальный, но важно, чтобы продукт совпадал с требованиями российского бухучёта — и вот тут у 1С возникает конкурентное преимущество. Российские компании умеют и имеют право работать со специфическими российскими данными, а иностранцам сложнее. В этом смысле на любом национальном рынке всегда есть куски, для которых существуют определённые преференции для локальных компаний.

ЕД: Могут ли российские компании серьёзно повлиять на мировой рынок?

АС: Тот факт, что коллайдер в CERN помогает обслуживать «Яндекс», меняет наше представление о мире. На мой взгляд, это вполне мировая поляна.

ЕД: Ты много говорил о том, что могут нейронные сети. А что они не могут? Например, машинный перевод — когда переводит человек, он понимает контекст, суть, а когда это сможет сделать и машина?

АС: Я отвечу смешным примером, который хорошо объясняет суть дела. «Нейронная оборона» — пример того, что машина может писать стихи. Для того чтобы «Нейронная оборона» работала, пришлось в нейроночку загрузить всю доступную «Яндексу» русскую поэзию. Потом ей предложили писать стихи в стиле разных известных поэтов.

С Пушкиным пока возникла проблема: он всё-таки очень сюжетен. Там много фоновой информации. Машине сложно написать стихотворение под Пушкина, зная только структуру языка, манеру стиля и тонкости рифмы, потому что нужна идея и её развитие, а для этого нужны фоновые знания, не содержащиеся явным образом в текстах, которые машина перелопатила, учась писать стихи.

А есть тексты, которые являются потоком сознания — в них больше красивых эмоций, меньше сложной логики и драматургии. Егор Летов — прекрасный пример: оказалось, что машина может отлично освоить панк-рок. Так появился проект «Нейронная оборона» — альбом песен под Егора Летова, написанных нейросетью.

ЕД: Я знаю, вы проводили тестирование, и люди не смогли отличить «Гражданскую оборону» от «Нейронной обороны».

АС: Да. И примерно в то же время похожая история произошла в Японии. Примерно за месяц до того, как мы записали «Нейронную оборону», в Японии проходил конкурс короткого рассказа, на котором случился казус. Конкурс был онлайновый, судили его люди — признанные литературоведы и критики. Вручение призов должно было быть офлайн, только первый приз некому было вручать, потому что лучший рассказ написала нейронка. В японском созерцательном стиле она может творить сколько угодно.

ЕД: А зачем вообще это «покушение» искусственного интеллекта на то, что всегда казалось зоной человека, зоной души? Музыка, поэзия, кино… Зачем это нужно?

АС: А зачем нужно, чтобы бездушный робот на заводе выкачивал что-то из болванки? Есть ведь живой токарь.

ЕД: Ладно, пусть будет робот с душой (улыбается). Приведу ещё один пример из поп-культуры. В сериале «Карточный домик» у одного из кандидатов в президенты был друг, который владел поисковой системой. И они выстроили все свои предвыборные лозунги и программу на основе поисковых запросов. Они считали, что смогут предсказать реакцию людей, и у них получалось. Этот пример из категории фантастики?

АС: Совершенно не секрет, что вторая кампания по выборам Обамы была выиграна в основном его лучшей на тот момент в Штатах командой дата-сайентистов. Строго говоря, упрекнуть людей там было не в чем — они не говорили ему: «Наври вот про это». Хорошая пропаганда никогда не лжёт. Она правильно отбирает факты, придаёт им интонацию и контекст и работает гораздо сильнее, потому что поймать не на чем.

Так же работала и команда этих дата-сайентистов Обамы. Они не говорили ему: «Запусти такой лозунг». Они, зная, о чём он может говорить и какие задачи его заводят — когда живой человек выходит на сцену к избирателям, его должно переть от того, что он говорит, — выбирали, в каком штате, перед какой аудиторией, в какой день, в каком СМИ и на какую тему он должен выступать.

И каждый раз они замеряли, как это сказывается на опросах типа «За кого вы будете голосовать, если выборы пройдут в ближайшее воскресенье». Частично там работали самообучаемые алгоритмы, частично старомодные дэшборды, но все решения о том, что «ты будешь выступать сегодня, на эти темы, в Кентукки, и только перед студентами» принимал не политтехнолог, владеющий интуицией и пониманием людей, а только дата-сайентисты. По оценкам они дали ему 8-10%. Учитывая, с каким разрывом он победил, это означает, что они за него выиграли.

ЕД: А вы так можете?

АС: Мы — нет. Мы в этом не специализируемся. Но подход совершенно понятный. Это не rocket science. Весь мой сегодняшний рассказ об этом. Если вы что-то и запомните из сегодняшнего вечера, так это то, что ещё пять лет назад технологиями машинного интеллекта владели только Google, «Яндекс» и Microsoft. Теперь задачи, которые решает Google, решают и первокурсники на лабах. Опенсорсный код доступен всем, а на время лабораторки студенты могут арендовать в облаке ресурсы — университет заплатит, — которые абсолютно не уступают ресурсам дата-центров Google. Это доступно каждому.

ЕД: О чём сейчас болит голова у вас в «Яндексе»?

АС: Во-первых, она дико болит о персонализации. Я тут нарисовал идеалистическую картинку. Я понимаю, что любой нормальный человек меня спросит: «Если вы такие умные, то почему уже вторую неделю после того, как я купил скороварку, меня этими скороварками ретаргетинг травит по всему интернету?».

Дарю лайфхак. После того как вы купили топор, чтобы не любоваться топорами ещё две недели, зайдите в магазин модной одежды. Дальше, в зависимости от ваших гендерных предпочтений, зайдите либо в мужское, либо в женское бельё. Бросьте несколько предметов в корзину, закройте корзину и уйдите. У этих ребят очень большие бюджеты на ретаргетинг: следующие две недели вас, в зависимости от ваших предпочтений, будут преследовать либо красивые полуодетые мужчины, либо красивые полуодетые женщины. Это лучше чем топор.

ЕД: Можешь ли ты сформулировать основные тренды отрасли? Сфер применения искусственного интеллекта много — что самое важное?

АС: По всем конференциям, на которых собираются люди, занимающиеся машинным обучением, видно, что на них максимально представлены люди из трёх огромных отраслей. Первая — здравоохранение, и понятно почему: распознавание образов — это 90-95% всей медицинской диагностики, будь то рентгенограмма, анализ крови, вся цитология и гистология. Всё это — работа с распознаванием изображений, и сейчас надёжность распознавания, точность подсчёта формулы крови у машины правда лучше, чем у самого опытного лаборанта. Есть и ещё более сложные задачи. IBM в этом направлении делает офигенно много, и я думаю, что если у вас будет выступать человек из IBM, он расскажет о том, как их технологии уже сейчас помогают в медицине.

Вторая область — транспорт. Все мы знаем про беспилотные автомобили, и это далеко не только Google и Tesla — в том или ином виде этим заняты практически все автопроизводители. По дорогам Европы уже караванами ездят беспилотные грузовики. Мы начали работать с «КамАЗом» — это вполне мировая марка, и они понимают, что у них сейчас должен быть беспилотный «КамАЗ».

ЕД: В рамках Национальной технологической инициативы как раз накануне была опубликована дорожная карта по AutoNet. Веришь ли ты, что это будет работать?

АС: Пускай они публикуют дорожные карты, а мы, если можно, работать будем. Это не связанные процессы.

Но должен заметить, что в нашей стране иногда происходят хорошие вещи. Например, Иннополис, при всех его минусах вроде странной транспортной доступности, очень классное место. И вообще Татарстан с точки зрения внедрения IT впереди России всей. Нам было дико обидно, когда наше приложение «Транспорт», где видно, как автобусы ездят по городу, запустили сначала у них, а потом в Москве. Вроде бы очень продвинутая Москва не имела нормальных данных с городского транспорта, а в Казани было всё прекрасно.

Иннополис — перспективный центр разработок. Рядом — заинтересованный автомобильный гигант. И мы с Иннополисом и с «КамАЗом» сейчас начнём что-то делать. Надо понимать, что мы немного не того размера, что Google. Мы точно не будем делать свой автомобиль, но будем заниматься софтовой начинкой. А «КамАЗ» в железе разбирается нехило.

ЕД: Медицина, автопром — какая третья отрасль?

АС: Там, на самом деле, две соперничающие области: финансовые технологии и блокчейн. Под финансовыми технологиями я имею в виду не только банковский рынок, но и страховщиков; они очень рядом и технологически очень похожи.

Некоторые говорят, что ещё одна перспективная область применения машинного обучения — это образование. Вскрытие покажет. Во всем мире образование — тоже большой бизнес и большие деньги, а не только социальная составляющая.

ЕД: Я знаю, что ты не любишь философские вопросы, но всё равно задам один. Ник Бостром, профессор Оксфорда, написал книгу «Искусственный интеллект», которая представляет собой предупреждение. Он говорит, что люди, которые занимаются искусственным интеллектом, это дети с бомбой в руках. Как ты относишься к подобным тезисам? Правы ли те, кто предупреждает нас об опасности искусственного интеллекта?

АС: Что Бостром, что я можем высказывать лишь своё просвещённое мнение. Пока, к счастью, экспериментально он не может предъявить доказательств. А те доказательства, которые иногда предъявляют, не являются доказательствами. Люди говорят: «Ну, вот был же первый случай, когда беспилотный автомобиль попал в аварию!». Ребята, только на дорогах Америки ежедневно гибнет несколько сотен человек. Понятно, что беспилотные автомобили будут давить людей — они их будут давить в сотни или тысячи раз меньше, но от них будут смерти. Утверждать при этом, что это страшная технология и что роботы убивают людей… Всего лишь в тысячу раз меньше, чем люди убивают людей. Может, всё-таки стоит согласиться на это?

Я не случайно рассказывал про птичку и мозг. Я рассматриваю технологии как нечто очень специализированное, заточенное под конкретную область. Вот планы захвата мира — это, наоборот, очень человеческое. Я не утверждаю, что положение вещей останется таким надолго. Я всегда помню последний слайд своей презентации: может быть, я чего-то не вижу. Ну, может быть.

Вопросы зрителей

Я учусь в 11 классе, и мне предстоит выбрать институт. Я собираюсь заниматься программированием, хочу стать дата-сайентистом и рассматриваю Иннополис, МГУ, ВШЭ и так далее. Что бы вы посоветовали?

АС: Это ощущение не только моё, но и нашей компании в целом, что ничего сильнее Вышки сейчас нет. Я сам с Физтеха и был бы рад сказать, что Физтех здесь силён, но нет… Когда мы пришли в Вышку, мы сказали: «О! Ребята, давайте сразу делать факультет». И факультет компьютерных наук Вышки по оценке многих людей, и не только из России, сейчас второй в мире после Стэнфорда. Высшая школа экономики — неожиданно самая сильная школа по computer science в стране. Все остальные, включая Физтех и МГУ — где-то позади.

Читать все вопросы

Сейчас появляются специальные нейрочипы, в которых особым образом соединено много нейронов. Повлияет ли это качественно на нейронные сети и на нашу жизнь?

АС: Да, повлияет, и очень сильно. Все истории про закон Мура, про то, что мы достигли предела плотности современных микросхем, и прогресс вычислительной мощности теперь прекратится, в момент появления нейронных сетей перестали быть релевантными. Запускать нейронную сеть на архитектуре x86 довольно бездарно — но просто других процессоров нет. И то вот появились, слава богу, Nvidia. Там процессы, требующие чудовищного распараллеливания, и я думаю, что даже графические карты являются костылём. И нейронные чипы, которые сейчас делаются, являются костылём — окей, протезом — из синтетического материала.

Но там ещё будет огромный прогресс, который позволит эффективно реализовывать нейронные сеточки на аппаратном уровне в маленьких устройствах. Это важно. Очень хочется, чтобы хорошая нейронная сетка жила в смартфоне; сейчас это немного сложно сделать. Да, история с нейрочипами — история про то, что мы даже не понимаем, как аппаратная база позволит нам всё это ускорить, Скорее всего, очень быстро ускорит.

Мы помним расхожую фразу: «Что бы учёные ни делали, в конечном счёте у них всегда получается оружие». Прозвучали тренды: медицина, образование, третье место делят образование и финансисты. А как же военные?

АС: Как ни странно, они занимают меньшую долю рынка. Безусловно, это тоже огромный рынок, но на нём не возникают дополнительные деньги. Например, беспилотная авиация — это не расширение рынка. Просто часть задач, которые решаются очень дорогим пилотируемым истребителем, в котором ещё нужны системы жизнеобеспечения, чтобы человек не превратился в желе, легче решается беспилотником. Но повторюсь, это не означает, что появились дополнительные миллиарды; это перераспределение бюджета внутри отрасли. Конечно, там есть огромное количество задач, но я говорил про рынки.

А вот то, что всё это сильно изменит ведение боевых действий — о, да. Это отдельная большая история.

Понимая, что эти технологии уже вовсю работают, закладывают ли изначально специалисты, работающие в области искусственного интеллекта и нейросетей, какие-то ограничения на уровне этических норм, чтобы у нас вдруг не возник Терминатор?

АС: Сложный вопрос. Есть огромное количество людей, которые только этой проблемой и занимаются. Только они не имеют никакого отношения к людям, которые занимаются самими сетками, технологиями и так далее. Эти люди занимаются этикой.

Есть ли между ними диалог? Есть. На эту тему существует очень интересный проект, который называется OpenAI — «Открытый искусственный интеллект». Он финансируется Илоном Маском и ещё некоторыми людьми, которые и в технологиях разбираются, и обладают финансовыми возможностями.

Но есть проблема, связанная с тем, что, к сожалению, большому количество людей, которые хорошо понимают про этику, не удаётся после длительных объяснений донести всё, о чём я сейчас рассказывал. Есть целая толстая книжка, называется The Black Box Society. В описательной части она ровно про то, что я говорил, — что «чёрные ящики» начинают менять нашу судьбу, ломают систему юриспруденции… А потом идёт вывод: «Поэтому все крупнейшие корпорации, начиная с Google, должны… раскрыть свои формулы! Чтобы этическое сообщество экспертов могло оценить, справедливо ли решение Google о том, что вот этот сайт упал в выдаче на 100 позиций, и бизнес разорился!».

Объясните этим ребятам, что мы не можем сделать реверс-инжиниринг. Уже много лет никто из нас не знает, почему сегодня в Екатеринбурге лично вам в это время по этому запросу этот сайт на первом месте. Не верят. Говорят: «Как? Я оптимизатору заплатил, он меня вывел. Значит, он знает». Нет. Никто не знает.

Вопрос по поводу распознавания текста по смыслу. Какие сейчас существуют технологии?

АС: Пока самая большая задача и засада с системами сентиментоанализа состоит в том, как разобраться с иронией и сарказмом. Понимание в контексте — вот задача ближайших не знаю скольки лет. Неслучайно есть несколько премий для систем машинного обучения, которые должны научиться писать анекдоты. В отличие от стихов Егора Летова придумать анекдот нейронка пока не может.

Я учусь в 11 классе, и мне предстоит выбрать институт. Я собираюсь заниматься программированием, хочу стать дата-сайентистом, и я рассматриваю Иннополис, МГУ, ВШЭ и так далее. Что бы вы посоветовали?

АС: Это ощущение не только моё, но и нашей компании в целом, что ничего сильнее Вышки сейчас нет. Я сам с Физтеха и был бы рад сказать, что Физтех здесь силён, но нет… Когда мы пришли в Вышку, мы сказали: «О! Ребята, давайте сразу делать факультет». И факультет компьютерных наук Вышки по оценке многих людей, и не только из России, сейчас второй в мире после Стэнфорда. Высшая школа экономики — неожиданно самая сильная школа по computer science в стране. Все остальные, включая Физтех и МГУ — где-то позади.

Я слышал, что у Microsoft был опыт работы над чат-ботом, основанным на нейросети. Туда загрузили разные книги, и в их число попала нацистская. Как можно бороться с тем, чтобы в сетку не попадало что-то лишнее?

АС: Это история про бедную девочку Тай — это имя, под которым чат-бот был в твиттере. В течение суток она стала дикой расисткой, гомофобом и так далее. Надо понимать историю вопроса. Сначала чат выкатили в Китае, а там интернет подконтролен. Там хорошо модерируемая среда, и Тай действительно отлично работала в Китае — её там очень многие не могли раскусить и даже не могли поверить, когда им в лоб сказали, что это нейроночка.

А потом её пустили в свободный западный твиттер, где её начали троллить. А она не поняла. И поскольку она действительно быстро обучаема, она училась у троллей, которые её травили цитатами из Гитлера, — и в итоге сама начала с удовольствием цитировать Гитлера. Это история про то, что все эти технологии при внедрении требуют рядом психолога. Неслучайно сейчас в «Яндексе» работают квалифицированные психологи.

Это детская ошибка. Будь там психолог, который понимает разницу между модерируемой и немодерируемой средой, он бы сказал: «Тай нельзя пускать в твиттер! Это последнее место, куда её можно пускать».

Занимается ли «Яндекс» проблемой оценки достоверности информации?

АС: Совсем всерьёз не занимаемся: это адовая по сложности задача.

А если у меня есть для этого описанные алгоритмы?

АС: Нет таких алгоритмов, поверьте.

ЕД: А вдруг?

АС: Ну прекрасно. Зайдите в офис «Яндекса» в Екатеринбурге…

Если мы моделируем сложную среду на основе математических моделей, мы используем «агентов», куда закладываем алгоритмы, и они работают по определённой программе. Можем ли мы контролировать группу агентов с помощью нейронной сети? Можем ли мы их учить?

АС: В общем случае — да. Конкретно — надо разбираться.

Можем ли мы подключить к агентам источники данных — базы, сервисы?

АС: А вот это большая тонкость, потому что это сильно зависит от типа агента. В классической data science засада в том, как работать с «грязными данными». Если вы привыкли работать с информацией, которая настолько структурирована, что её можно занести в базу данных, то вы отрубили себе 90% информации из окружающего мира. Как ваши агенты будут в состоянии пережёвывать «грязную информацию» — это отдельная большая кухня.

Склонны ли вы соглашаться с теорией Курцвейла и вообще с его прогнозами?

АС: Краткосрочно — скорее да. Долгосрочно, особенно в том, что касается general intelligence — скорее нет. Даже по нему самому видно, что это понятие он совсем не понимает. Моё представление вообще в том, что все прогнозы за горизонтом десяти лет — вилами по воде писаны.

Нейронки хорошо работают, когда у нас много данных. Мы берём их, чистим, засовываем в нейронку, она на них учится и потом даёт предсказания. Что делать, когда у нас мало данных или очень высокая стоимость сэмплов? Могут ли нейронки в этом случае предложить что-то новое?

АС: Нет, это не их задача. В вертикально интегрированной компании нейронки отлично занимаются операционным управлением, но они точно не могут заниматься стратегией. Нейронка, обученная на тысяче предыдущих смен, принимает решения лучше диспетчера смены. Но принять решение «А не пора ли нам диверсифицироваться?» она никогда не сможет по той простой причине, что не существует выборки из тысячи успешных диверсифицировавшихся компаний и тысячи прогоревших. Не имея таких дата-сетов, ты не можешь обучать. Это решение придётся принимать людям силой нашего разума.

У меня вопрос про переобучение. Наш «чёрный ящик» больше похож не на программу, которая представляет набор багов и фич, а на котика-питомца, которого мы должны приучить к туалету и следить, чтобы он не гадил. Что случится, если мы в течение нескольких лет обучали машину, а потом она переобучилась и фактически потеряла свою ценность? Это же проблема будущего.

АС: Да, да, да. Как я сказал, умение учить машины — отдельный и супердорогой скилл. Простейшая история: у нас стояла задача находить красивые картинки. Когда ты делаешь статистический сэмпл по наиболее кликабельным картинкам, ты получаешь на выходе нейронку, которая выбирает только котиков. Это сильно переобученная нейронка: для неё всё представление о красоте сводится к котикам и немножко младенцам. Так что приходится ручками задавать, что мир разнообразен: в нём ещё есть закаты, радуги, единороги…

Есть совершенно прекрасный немецкий стартап, который снаружи выглядит как бесплатная социальная сеть фотографов. Они там постят фоточки, тегируют, критикуют, баллы ставят. Это потрясающий дар человечеству. Это люди, которые обучают нейронку. Бизнес этой штуки — обслуживание огромного количества коммерческих запросов, где нужно оценивать изображения по эстетическим принципам. Там работает команда хороших программистов, которые балансируют исходные данные талантливых фотографов, чтобы нейронка оценивала красоту, а не просто считала, что котики красивее всего на свете.

Просто вы говорили, что розетка уже доступна, и не надо быть электриком, чтобы в неё воткнуться. Но ведь получается, что всё равно нужно быть специалистом, понимать, что внутри «чёрного ящика».

АС: Где-то да, где-то нет. Ты правильно меня поймал на том, что если речь идёт о новой задачке, то нужен специалист. Как тот мужик из Калифорнии нарвался на то, что его сетка не опознавала ночных котов, и пришлось её на них переобучать. Но для кучи задач уже доступны прямые API. Например, для распознавания речи тебе не надо думать, как переобучать сетку. За тебя это сделают и дадут тебе по API ответ.

Почему я говорил про Lego? Ты правильно меня ткнул носом в эту крайность, но я в неё впал специально: сейчас важно не делать всё самому. Lego сделают без тебя; уметь из него собрать — да, требует специальных скиллов. В нашем случае это скилл обучения сетки правильно.

Но соглашусь с тобой, пока для конкретной задачи надо немного поработать с паяльником. Тут ты прав.

Искусственный интеллект вытеснит огромное количество профессий. Куда пойдут все эти люди? Что им делать?

АС: Это случится не так скоро. Я по образованию экспериментатор и свято верю в экспериментальные данные. Поэтому я очень рад, что сейчас в мире есть масса экспериментов в области того, что называется гарантированным доходом. И ладно бы экспериментировали правительства — можно было бы списать на то, что это социальный эксперимент.

Знаешь компанию Y Combinator? Это крупнейший инвестфонд и акселератор для стартапов. Эти ребята затеяли десятилетнюю программу в очень бедном городе Окленд, который находится через залив от Кремниевой долины. Они выбрали офигенное количество семей — прямо скажем, не самых продвинутых жителей Окленда, — которым они начинают платить такие деньги, что те могут жить очень интересно и достойно, вообще ничего не делая. Такого эксперимента ещё не было. Мы пока не знаем, как будут вести себя люди, которым не надо зарабатывать на жизнь — причём не только в первый месяц, но и когда всё устаканится и пыль осядет. Так что я надеюсь, что через несколько лет у нас появится нужная экспериментальная информация. Пока же даже самые опытные психологи говорят: «А хрен его знает, что будет».


«Интеллекции» — совместный проект телеканала Malina.am, благотворительного фонда Владимира Потанина, Президентского центра Б. Н. Ельцина и УрФУ

Организаторы




Генеральный информационный партнёр

Заметили ошибку в тексте? Выделите текст и нажмите Ctrl+Enter
Комментарии
В материале:

Себрант Андрей

Будьте с нами!
×
×
Наверх^^