Сначала были шашки
Сколько времени существуют компьютеры, столько же развиваются алгоритмы, способные состязаться с человеком в логических играх. Для каждой из игр путь развития алгоритма был своим. Но в большинстве случаев все начиналось с набора эвристик, которые было сравнительно легко «поймать». Пытаясь усложнить решение, применяли метод Монте-Карло и различные гибридные подходы – это позволило улучшить качество ботов и даже играть наравне с человеком. А рост доступных аппаратных мощностей в некоторых играх окончательно передал победу машине.

К примеру, шашки были решены полностью в 2007 г., ведь на фоне других логических игр шашки просты в просчете, количество комбинаций в них – порядка десяти в двадцатой степени.
Разработка программ для игры в шашки началась с середины 50-х годов прошлого века. Наиболее известная среди них – Chinook, созданная Джонатаном Шеффером.
Chinook была представлена на компьютерной олимпиаде в 1990 г. А два года спустя программа сыграла в международном чемпионате по шашкам против многократного чемпиона мира Мариона Тинсли и сумела его победить два раза, проиграв, правда, при этом четыре раза, а 33 партии сведя в ничью.
На тот момент Chinook видела игру на 14–17 шагов вперед и могла полностью просчитать все возможные позиции, если на доске оставалось восемь шашек. По мере развития техники глубина просчета увеличивалась, как и база данных окончаний игр. К началу 2000-х гг. программа знала все возможные окончания матча, если на доске оставалось 10 шашек. А в 2007 г. появилась публикация, в которой сообщалось, что шашки решены полностью. На эту задачу у Шеффера ушло 19 лет.

Затем вычислительные алгоритмы продолжили покорять другие игры с большим числом комбинаций. Решения на основе старых подходов быстро уперлись в «комбинаторный взрыв» и вычислительную сложность. Поэтому им на смену пришли архитектуры, основанные на нейронных сетях. Но и они не панацея. Человек подходит к игре принципиально иначе, нежели вычислительный алгоритм. Он использует интуицию, предположения о противнике и его прошлых играх, невербальные коммуникации с ним. В итоге, не перебирая все варианты, а работая с образами, он находит выигрышную стратегию. И в этом может быть выход.
Цифровой кентавр – сочетание человека и алгоритмов – структура, которая берет лучшее от обоих миров. Компьютер просчитывает ближайшие возможные шаги, но человек принимает решение, каким именно путем пойти.
Как цифровые кентавры пришли в шахматы
Шахматы намного сложнее шашек. Количество возможных комбинаций фигур на поле – 10 в 46 степени. Однако здесь компьютер тоже победил человека.

Попытки создать «шахматную» программу предпринимаются более 30 лет. Различных идей было настолько много, что в конце 1980-х уже проходили отдельные чемпионаты для компьютеров, играющих в шахматы.
11 мая 1997 г. IBM Deep Blue обыграл чемпиона мира Гарри Каспарова в матче из шести партий. Компьютер использовал поиск по шахматному дереву, а для ускорения процесса применялись специально разработанные под шахматы процессоры. Казалось бы, тот матч должен был поставить точку в состязании человека с компьютером на шахматном поле. Но именно Каспаров предложил ввести в игру цифровых кентавров, ведь шоу должно продолжаться!
Кентавры учитывают нюансы взаимодействия людей с машинами, сохраняя присутствие человека. Последнее приносит в игру своего рода шумы: дает оригинальность решений и игровых состояний.
Скорее всего, цифровой кентавр не выиграет у полноценного искусственного интеллекта для игры в шахматы, если тот будет создан. Участие человека не сделает его более эффективным. Однако система «кентавра» помогает человеку совершать меньше ошибок.
В 1998 г. прошло первое соревнование «шахматы кентавров». Игроки использовали программы, которые подсказывали им следующие ходы.
Почему го не сразу покорилась машине
До недавнего времени человек легко обыгрывал машину в го. В этой игре на стандартной доске 19 на 19 слишком много комбинаций – 10 в 171 степени – так что доступные вычислительные мощности даже с ИИ не могут с ними справиться.
Настоящим прорывом в этой области стала разработка AlphaGo. Компания Google DeepMind вкладывала в развитие этой нейросети огромные ресурсы, обучая ее на статистике матчей ведущих мировых игроков. И в 2015 г. AlphaGo выиграла 499 из 500 партий с другими программами для го. По результатам этого теста AlphaGo признали достойной сражения с человеком.
В том же году она выиграла у Фань Хуэя – трехкратного чемпиона Европы, а в 2016 г. у Ли Седоля – лучшего мирового игрока десятилетия. Итоговый счет оказался разгромным – 4:1 в пользу AlphaGo.

AlphaGo осталась закрытым проектом и с 2017 г. не участвовала в чемпионатах. Google DeepMind не планирует выпускать новые версии или возвращаться в игру.
В 2017 г. вышла бесплатная программа для го с открытым исходным кодом Leela Zero. Ее автор – Джан-Карло Паскутто из Бельгии. На уровне кода в нее заложены правила игры, а тренировалась она, играя сама с собой. Однако и ее время уже проходит: в феврале 2021 г. проект распределенного обучения был закрыт. Сегодня сообщество тренирует KataGo – еще одно открытое решение, по некоторым параметрам превосходящее Leela Zero.
Пока существующие программы с ИИ продолжают тренироваться, в го пришлась ко двору идея цифровых кентавров, которые уже активно выступали в шахматах. Например, компании Vova.pro и AmberCore развернули свои многопользовательские сервера, где можно было играть с человеком или с ИИ на уменьшенных досках – 13 на 13 вместо оригинальной 19 на 19. Был и гибридный режим работы, когда играющий человек получал подсказки от Leela Zero. Так началась подстройка программ для игры в го под роль советчика.
Главная задача при разработке цифровой составляющей «кентавра» – обеспечить максимум полезной информации при минимуме подсказок на основе аналитики от ИИ. Подсказки могут рекомендовать определенную часть поля для следующего хода, подсказывать сами ходы или прикидывать шансы на победу в том или ином случае. Вопрос лишь в том, как представить эту информацию игроку, чтобы он принял верное решение.
Как плодятся «кентавры» в России
В России идея цифровых кентавров в го нашла себя в 2019 г. Разумеется, в студенческой среде, где много свободных и пытливых умов. Затем она стала развиваться в рамках одного из проектов Кружкового движения НТИ. Ее принес туда известный ученый Александр Горбань, который сейчас руководит Центром искусственного интеллекта Университета Лестера в Великобритании.
Весной этого года под крылом того же проекта прошел хакатон для школьников и студентов, целью которого было создание интерфейса программ-подсказчиков для участия в логической игре. Участники решали, какая минимальная информация необходима игроку и в какой форме ее требуется преподнести. В финале принимали участие 20 команд, лучшие из которых продолжили развивать свои решения для участия в реальных соревнованиях по го.
Первый международный матч «кентавров» в го состоялся чуть позже в рамках Чемпионата мира по го во Владивостоке на площадке Дальневосточного федерального университета.
В общей сложности провели 70 игр. Учитывая количество игроков и ограничения доступных ресурсов, игра шла на поле 13х13. С этим упрощением для обеспечения работы платформы цифровых кентавров был задействован достаточно мощный сервер с видеокартой Tesla v100 и 32 Gb видеопамяти.
В двух матчах ИИ против «кентавров» участвовали Илья Шикшин и Александр Динерштейн. Это одни из сильнейших игроков в Европе. Итог весьма любопытен: на доске 13 на 13 «кентавры» выиграли у ИИ Leela Zero.


По сути, «кентавры» в го только начинают свой путь. И пока нет возможности полностью просчитать эту игру, она остается отличным плацдармом для проработки идей экспертных систем, помогающих принимать решения, причем в совершенно разных отраслях.
