Публикации по теме 'game-theory'
Камень ножницы Бумага
Математическая модель всего одного нейрона может предсказывать афтершоки землетрясения, используя только два параметра и логистическую регрессию (такую же, что используется в системе уравнений Лотки-Вольтерра) с той же или большей точностью, что и глубокая нейронная сеть из шести скрытых слоев из 50 нейронов. в каждом, обрабатывая более 13 тысяч параметров.
История об этом наделала много шума в узких кругах в 2018–19 годах. С тех пор я постоянно задаюсь вопросом: не имеют ли..
Краткий обзор кооперативной экономики
Эта статья открывает серию статей, основанных на книге Кооперативный вид, человеческая взаимность и ее эволюция издательства Bowles & Gintis, 2011.
Эта книга о многих вещах, но эта серия статей посвящена (a) урокам, которые она извлекла в отношении кооперативных игр, (b) урокам, которые она преподнесла в отношении того, как люди ведут себя в небольшие настройки командной работы и (c) чему это может научить нас о децентрализованном сотрудничестве.
Цель состоит в том, чтобы..
Стратегии размножения
Поздравляю с преодолением титула! Это статья об игре goofspiel и о разработке стратегий goofspiel с использованием генетических алгоритмов. Однако не требуется никакого опыта в области шутливых или генетических алгоритмов , только мимолетный интерес к теории игр или машинному обучению.
Код для этой статьи находится здесь: https://github.com/gaffney2010/goofspiel-python
Гуфшпиль
Гуфшпиль — простая игра, которую иногда обсуждают в теории игр. Есть 2 или более игроков и набор карт...
Друзья Джека, часть 2: компьютерные сказки
С самого первого игрового теста я увидел захватывающий опыт, который был широко доступен и достаточно прост, чтобы практически обучать сам себя. Однако проблемы были достаточно широкими, чтобы через них мог проехать грузовик. Каждых трех игроков выигрывал гигант, а каждую игру из четырех игроков выигрывал человек. Это было без исключения и совершенно неприемлемо. Мои плейтестеры были снисходительны, но у меня не было желания подвергать их бесконечной настройке, необходимой для..
Теория игр в конкурентном программировании, часть 12
Codeforces: удаление делителей
Добро пожаловать в 12 часть этой серии, если вы пропустили 11 часть, вот ссылка: Часть 11
Постановка задачи
Алиса и Боб играют в игру.
Они начинаются с положительного целого числа n и поочередно выполняют над ним операции.
Каждый ход игрок может вычесть из n один из его делителей, который не равен 1 или н . Игрок, который не может сделать ход в свой ход, проигрывает. Алиса всегда ходит первой.
Обратите внимание, что они..
Слияние информатики и экономики
Блокчейн-алгоритм Сатоши Накамото - это всего лишь недавнее детище этого брака.
«Интернет изменил информатику и превратил ее в физику…»
«… И обществознание».
- Христос Пападимитриу
Почему это важно?
Раньше экономикой занимались письменно. Когда я встречался с моим научным руководителем (эконометчиком, написавшим самую цитируемую статью по экономике с 1970 года ), нам требовались только блокнот и две ручки.
Экономика сейчас практикуется на суперкомпьютерах...
Обучение с подкреплением и теория игр
В последние годы методы машинного обучения и глубокого обучения демонстрируют выдающуюся производительность в различных областях, таких как обработка речи, прогнозирование, компьютерное зрение, машинный перевод, прогнозирование, робототехника и т. Д. Сущность различных концепций машинного обучения заключается в следующем:
1. Обучение с подкреплением
Что делает RL уникальным? Обучение с подкреплением помогает машинам научиться принимать решения о действиях, которые соответствуют..