ИИ

Aug. 20th, 2025 11:32 am
ny_quant: (Default)
[personal profile] ny_quant
Задача.
There is a pile of pebbles on the table. Two players, A and B, are playing a game whereby they take turns removing some pebbles from the table. The goal of the game is to take the last pebble from the table, i.e. the player who takes last pebble wins. The rules are: (1) obviously, player A cannot take all pebbles on his first move; (2) a player cannot take more stones than was taken by the other player before him. Assuming both players make their best moves, who wins if the there are 2025 pebbles on the table? What if there are 2026 pebbles? Who wins and what is the optimal strategy that the players should use?

Еще раз протестировал gpt-5-high против gemini-2.5-pro. Чтобы запутать противника, первый вопрос задал тривиальный, так чтобы любой человек мог на него ответить за секунду. ИИ на это приглашение не клюнули (не заметили shortcut) и сразу стали решать общую задачу. Тут gemini-2.5-pro залез в числа Фибоначчи и неведомые мне представления Зекендорфа и позорно провалился. Тогда как gpt дал совершенно правильный ответ, хотя и без объяснения как он туда попал.

Для сравнения, у меня на интервью кандидаты с PhD решили далеко не все и многим были нужны подсказки. Так что, если gpt не видел эту задачу раньше, то это довольно впечатляюще. Но gemini это какой-то хлам, по-моему. Сам я когда-то решил за несколько минут за рулем машины, а один умный коллега решил пока мы ходили за кофе.

UPDATE. Заодно попробовал claude-opus-4-20250514 и gpt-4.1-2025-04-14. Оба решили неправильно. Далеко еще канадским профессионалам до наших любителей! (с)

UPDATE2. deepseek-v3-0324 и grok-4-0709: deepseek моментально написал фигню, а грок за два часа не придумал ничего, наверное рассчитывает полное дерево вариантов. Я его сейчас выключу, а то неудобно как-то.

Date: 2025-08-20 08:33 pm (UTC)
From: [identity profile] apo03.livejournal.com
Ради интереса дал решить сыну (7 класс), который ходит в кружок по олимпиадной математике. Решил за 5 минут оба варианта…

Date: 2025-08-20 08:47 pm (UTC)
From: [identity profile] ny-quant.livejournal.com
Общий случай тоже решил?

Date: 2025-08-21 09:00 am (UTC)
From: [identity profile] apo03.livejournal.com
Поначалу — нет. Сказал, что есть два варианта — четное и нечетное число камней, везде первый игрок выигрывает.

Я его попросил объяснить случай с 8 камнями. Тут он согласился, что выиграет второй. Оба пришли к гипотезе, что если камней 2 в степени k, то выигрывает второй игрок.

Минут через десять он предложил решение в случае, если число камней в начальной куче четно, но не равно степени двойки. Первый ход в этом случае — взять максимальное число двойки, которое входит в представление начального числа
Edited Date: 2025-08-21 11:56 am (UTC)

Profile

ny_quant: (Default)
ny_quant

December 2025

S M T W T F S
 12 34 56
7 89 10 111213
14 151617 181920
21 2223 24252627
28 29 30 31   

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 1st, 2026 04:48 pm
Powered by Dreamwidth Studios