Про искусственный интеллект ч.1

Опубликовано · 13.11.2020

Это – интервью Игоря Ашманова, разрезанное на 6 частей (из-за размера).

Часть 1. Искусственный Интеллект вокруг нас

Сокращенный вариант этого интервью с наиболее интересными местами можно прочитать здесь – Как искусственный разум угнетает людей.

— Игорь Станиславович, хочется начать нашу беседу с цитаты руководителя лаборатории машинного обучения «Яндекса» Александра Крайнова: «Про искусственный интеллект говорят и пишут очень много. Заголовки почти всегда стараются сделать максимально эффектными, что, увы, приводит к неправильному пониманию того, что такое искусственный интеллект. Для многих ИИ — это пока что-то вроде чуда, с ним связаны различные заблуждения, страхи, надежды и фантазии. Так что же такое искусственный интеллект?

— Если брать техническое определение, а не голливудские выдумки, то ИИ — это такой набор алгоритмов, программных правил, методов оптимизации, машинного обучения и так далее, который позволяет машине имитировать некоторые когнитивные (то есть умственные) функции человека. Именно имитировать.

При этом есть такая специфическая романтика ИИ, которую привносят разнообразные книги про ИИ, фильмы про человекоподобных роботов и так далее, которая обычно касается нерешенных задач искусственного интеллекта.

Как только задача имитации какой-то конкретной когнитивной функции решена, романтический флер с нее сдувается, ей тут же начинают пользоваться в быту, и большим художникам это становится уже не интересно, нет драмы. Вот робот, который совсем-совсем как человек…

Вообще, программой искусственного интеллекта можно назвать любую компьютерную программу, которая автоматически анализирует какие-то данные и принимает решения. Например, если у вас жилой дом или офисное здание имеют много этажей и несколько лифтов, то ими, конечно, управляет программа искусственного интеллекта. Ей надо понять, где какие лифты, где уже люди едут, какой вам лифт прислать, если вы нажали кнопку вызова, или какой и где остановить, чтобы оптимизировать время подачи и доставки. Вокруг нас уже есть своеобразное облако бытового искусственного интеллекта.

— Уже есть?

— Да, конечно, причем десятки лет, поскольку заниматься этим люди стали уже довольно давно. Лично я пришел после вуза в отдел искусственного интеллекта вычислительного центра Академии наук в 1983 году. Вычислительный центр АН СССР — это был такой большой академический институт на 500 с чем-то сотрудников. Он и сейчас существует в Москве, находится по адресу: улица Вавилова, 40. Там был отдел искусственного интеллекта, которым руководил Гермоген Сергеевич Поспелов — академик, глава совета по искусственному интеллекту при Академии наук. То есть к 1983 году ИИ уже разрабатывали много лет, и уже было довольно много сделано.

Движуха в нашем ВЦ шла вовсю: в соседней с нами комнате делали распознавание речи, в другой — диалоговый процессор, в третьей — развивали антивирус Dr. Web, в четвертой Пажитнов делал игру «Тетрис», в пятой Веселов писал редактор «Лексикон» и так далее. В нашем отделе занимались, в частности, анализом речи, текстов и чертежей. Уже тогда в ВЦ АН была работающая система, которая находила размерные линии, считывала размер, отделяла друг от друга разные детали и так далее. В это же время по всей стране делали системы управления, автоматической посадки и тому подобное.
То есть этим всем в нашей стране занимаются уже довольно давно. Вот Гермоген Сергеевич Поспелов, академик, боевой генерал, который участвовал в Великой Отечественной войне, ныне уже покойный, занимался ИИ еще в годы ВОВ, а именно автоматической посадкой самолетов на аэродром.

Если вы помните, наш космический челнок «Буран» в ноябре 1988 года летел и садился в полностью автоматическом режиме, с точностью до 1 секунды и 1,5 метра полосы, им управлял искусственный интеллект. В любой крылатой ракете с момента их появления есть искусственный интеллект. Другое дело, что в некоторых случаях (например, в системе С-300) этот ИИ мог быть в некоторых подсистемах не цифровой, а аналоговый. То есть, условно говоря, там вместо модных сейчас нейронных сетей, машинного обучения или каких-то цифровых алгоритмов, написанных на языке программирования, использовалось что-то другое — аналоговым способом решались дифференциальные уравнения. Но не это важно, а то, что крылатая ракета вот уже 50 лет как распознает по фотографиям местность и летит на небольшой высоте туда, куда ей задано, а С-300 автоматически наводится на многие цели сразу.

— То есть не «пройдет время — и технологии искусственного интеллекта станут такой же привычной частью жизни, как лампочка и розетка», а они уже ими стали, просто мы об этом не задумываемся и воспринимаем как должное?

— Да. «Бытового» искусственного интеллекта уже очень много вокруг нас. Скажем, в любом смартфоне десятки программ искусственного интеллекта. Там есть распознавание пальца, лиц по фотографии, сейчас в последней модели смартфонов от Huawei или Samsung вы наводите камеру, а она вам пишет: «Люди, зелень, снег, вода, зима, осень», — и так далее. То есть там стоит «распознавалка» объектов, пейзажей, сезонов и тому подобное. Есть «болталка»: «Алиса», «Окей, Google» или какая-то другая. И так далее.

В каждом таком смартфоне или компьютере есть, к примеру, программа проверки правописания. Я занимался этим довольно много. Как раз в вычислительном центре АН СССР мы сделали эту программу, которая сейчас работает в каждом русскоязычном Microsoft Office. Мы впервые ее выпустили в 1988 году.

Это иллюстрация того, что, когда нечто уже сделано, оно не вызывает никакого восхищения, трепета или ужаса, его просто перестают замечать. Работает, мы все пользуемся — ну понятно, что тут такого.

Алгоритм Т9, который есть у всех на смартфонах, сокращает время набора и мучает внезапными дурацкими подстановками слов — тоже довольно сложный искусственный интеллект. Поисковик «Яндекса» — мощнейший искусственный интеллект, гигантский, в который ежемесячно вкладывается труд 500–600 человек.

Антивирус Касперского — тоже искусственный интеллект, потому что вообще любая программа распознавания — это искусственный интеллект, а антивирусная программа должна распознавать разнообразнейшие вирусы и трояны, которых в год пишется несколько миллионов. Это очень сложный искусственный интеллект.

У каждого есть в смартфоне «Яндекс.Карты» и «Яндекс.Навигатор» — это сложные программы искусственного интеллекта, которые за человека выбирает маршрут. Тут так же, как с проверкой правописания, — 50 лет назад это могли делать только очень образованные люди, а сейчас такое под силу любому устройству. То же самое с прокладкой маршрута. Это довольно сложная задача даже для опытного водителя, знающего город, где какие пробки, возможные объезды, развороты и ремонты, а сейчас за секунду-две ИИ всё идентифицирует, и к этому все привыкли.

— Это уже решенные задачи ИИ, которые стали частью нашей жизни. Но есть же еще масса нерешенных.

— Да, на другой стороне, где еще сохраняются эта романтика и страх перед машиной, есть нерешенные задачи искусственного интеллекта, которые сейчас пытаются решить. Это происходит всю историю ИИ — переползание задачи с одной стороны на другую, в категорию решенных.

Скажем, распознавание лиц было такой совершенно непонятной и нерешаемой задачей 10 лет назад. Какие-то программы распознавания лиц делались, но они работали плохо, с большим количеством ложных тревог. В 1990 и 2000 годах были попытки поставить камеры и распознавание лиц в аэропортах и по городу (в Лондоне, Атланте и так далее), их через несколько месяцев везде в ужасе отключили — было столько ложных обнаружений «преступников», что отделы полиции захлебнулись. А сейчас, спустя 15–20 лет, после появления новой техники (графических карт) и глубоких нейронных сетей это делают повсеместно, все работает.

Распознавание тематики текста 20 лет назад было серьезной задачей. Распознавание объектов на фотографии — сейчас практически все интернет-сервисы и гигантское количество интернет-программ распознают живые и неживые объекты. Узнают кошку, собаку, человека и так далее, и это уже кажется тривиальным. 10 лет назад, когда я пытался нанять лучших в России специалистов по распознаванию образов, они не решались такое сделать. Брались распознавать лица, потому что известно, что такое лицо, а любую кошку автоматически назвать на фотографии кошкой они не брались. Потом, где-то 8 лет назад, произошел прорыв в нейронных сетях и объекты на фотографиях и видео стали распознавать. Это в некотором смысле уже ширпотреб сейчас.

Сейчас не решена пока задача нормального диалога на естественном языке с машиной. Машина не может поддерживать связного диалога, держать фокус, понимать необычные вопросы. Хотя тема чат-ботов модная, чат-ботов предлагают много, которые как бы говорят (в том числе голосом — задача синтеза и анализа речи в целом решена), но обменяйтесь с ботом хотя бы несколькими связанными репликами — и вы поймете, насколько он все еще тупой.

Не решена задача хорошего, настоящего перевода, машинного перевода с языка на язык, хотя сейчас за счет тех же нейронных сетей машинные переводы стали довольно гладкими. Они стали намного лучше, чем 25 лет назад, когда я этим занимался.

— Лично столкнулся с машинной расшифровкой диктофонной записи текста — это же просто ужас. Проще все это сделать вручную, чем потом исправлять ошибки за машиной.

— Это отдельная интересная история про порог использования системы ИИ. Когда мы делали проверку правописания, мы понимали, что у нее есть порог использования, потому что реальных ошибок на странице всего несколько — от 2–3 до 4–6. Если у системы будет больше неизвестных слов, то есть ложных срабатываний, лишних «подсветок», чем реальных опечаток на странице, никто не будет использовать. Нужно было преодолеть этот порог, добиться такой полноты словаря, чтобы у системы оказывалось не более 1–2 неизвестных ей слов на странице. С машинным переводом такая же история. До какого-то момента переводить текст, например, с английского на русский было выгоднее просто с нуля, потому что переводчику нужно было нажать меньше клавиш при переводе с нуля, чем при исправлении корявого результата машинного перевода.

Но сейчас этот порог преодолен, и тут же произошла другая ужасная вещь — сейчас стало невозможно заказать чисто человеческий литературный перевод. Качество перевода резко упало. Сейчас все, даже самые дорогие переводческие конторы, которые называют себя суперспециалистами, вначале дают текст перевести машине, а потом человек дорабатывает то, что получилось. По сути, ты платишь только за качество «выглаживания» машинного перевода. Фрилансер подсунет вам сырой результат, прямо со всеми глупостями МП, переводчик из бюро все-таки как-то подчистит косяки МП. Все используют Google или «Яндекс», в результате в тексте всегда видны артефакты — следы машинного перевода. И эти «косяки» плохого машинного перевода вылезают даже после перевода тех, кто утверждает, что от начала до конца текст переводил человек. МП все равно делает ляпы, заговаривается, подставляет не те значения, а те, кто выглаживает текст после МП, уже даже не заморачиваются полезть в словарь и проверить странное место. Машинный текст перевода стал настолько относительно хорош (оставшись плохим), что его выгоднее «докрутить», чем делать перевод человеком от начала и до конца. В итоге этому искушению не может противостоять ни одно даже самое крутое переводческое бюро, даже самое пафосное. Так экономика вместе с ИИ сожрала или «перепрошила» человеческих переводчиков.

Так вот, у упомянутых вами программ, которые транскрибируют свободную звуковую речь, пока этот порог, похоже, не преодолен. Примерно каждое третье-четвертое слово не соответствует тому, что было действительно сказано (это легко видеть в автоматических титрах на YouTube), и править в итоге такой текст сегодня более трудозатратно и долго, чем обработать его вручную, без использования машины.

Такой порог использования в ИИ есть везде. В очень многих программах, которые как бы демонстрируют отличную работу, на самом деле этот порог не преодолен. В диалоговых ботах он также не преодолен, как мне кажется, в дистанционном образовании то же самое. Он по многим параметрам не преодолен в беспилотниках. БЛА пока на улицы не выпускают.

Часть 2. Фантазии и реальность
Часть 3. Социальные аспекты
Часть 4. Заблуждения и страхи
Часть 5. Метафизика
Часть 6. Будущее