Сможет ли солвер побить NL25? Ответ кажется слишком очевидным. Конечно же, сможет, правильно? А вот я совсем не убеждён. Конечно, мы говорим о винрейте после уплаты рейка – побить этот лимит с рейком совсем не так легко. Да, на этом лимите много слабых регов и любителей, но рейк и правда высокий.
Попробуем подойти к вопросу логически. Обсудим рейк, сильные стороны солвера, то, в чём он превосходит всех соперников, потом поговорим о ситуациях, в которых винрейт солвера будет ниже, чем у регуляров. Сравним его со слабыми регулярами, потом с сильными, винрейты которых на NL25 нам известны. Это неплохая точка отсчёта. Далее я хочу поговорить о том, почему людям так нравится повторять действия солвера и почему это не всегда правильно. Возможно, мне даже удастся убедить кого-то из вас перестать его копировать. Если меня слушают тренеры, которые заставляют учеников играть строго по солверу, может быть, они задумаются, зачем они это делают: потому что это полезно для игрока или потому что так проще? А потом мы вынесем вердикт.
Итак, рейк. Рейк – это налог, который мы платим, выигрывая банки. У него есть процент от банка и верхний предел. В зуме25 на PokerStars верхний предел, кажется, около 8 бб, а ставка – 5%. То есть выигрывая стандартный банк 200 блайндов, вы платите меньше 5%, но совсем чуть-чуть. На более высоких лимитах верхний предел рейка снижается, нагрузка становится чуть меньше. Если посчитать рейк на NL25 в бб/100, он будет где-то между 7.5 и 9 бб. Это чертовски много. Наверное, какую-то его часть можно возвращать за счёт рейкбека, но давайте на время о нём забудем. Бить игру с такой комиссией очень тяжело даже когда вы заметно превосходите поле. Поэтому вопрос о том, сможет ли солвер побить рейк на этом лимите, кажется мне открытым.
Я, конечно, говорю сейчас про 6-макс. Хэдз-ап – другое дело. Там играются почти все руки, баттон фолдит всего 15% раздач, а в остальных 85% может использовать преимущество в классе. В 6-макс мы заходим в банк намного реже. Если ваш VPIP примерно равен оптимальным 22%, это значит, что от 70 до 80 раз из 100 вы просто выбросите свои карты в пас. Там будут и J4o на катоффе, и восьмёрки, когда к вам пришли рэйз и 3-бет, и так далее. Поэтому винрейт по сравнению с хэдз-апом будет ниже.
Мы с самого начала оказываемся во враждебном мире – с одной стороны высокая комиссия, с другой – необходимость фолдить множество рук до флопа. И хотя солвер, играющий в неэксплуатируемую стратегию по равновесию Нэша, по определению не проиграет людям без учёта рейка, нет гарантии, что он останется в плюсе после уплаты комиссии.
В чём солвер превосходит человека? Во-первых, в балансе и неэксплуатируемости. В его стратегии нет дыр, все частоты идеальны. Никакие подстройки не помогут вам повысить своё ожидание против него. Его алгоритм основан на балансе. (Можно, конечно, сконструировать бота, который будет играть в эксплуатирующем стиле, но мы говорим именно о GTO-солвере.) Его сила в том, что даже если вам точно известна его стратегия, никакие подстройки не помогут вам увеличить ожидание против неё.
Насколько это важно на практике? Насколько ценно то, что соперник не может вас эксплуатировать, даже зная вашу стратегию во всех нюансах? Если хотите, поразмышляйте над этим. По моему мнению, никакой пользы это не принесёт. Даже если бы в стратегии солвера были уязвимости, люди всё равно никогда бы их не раскрыли.
Во-вторых, солвер намного точнее выбирает линии с максимальным EV. Если GTO считает контбет на определённой текстуре с конкретной рукой ошибкой, солвер не сделает эту ошибку. Если у руки достаточно ценности на вскрытии, чтобы не блефовать с ней на тёрне, солвер не станет блефовать. Оказавшись на ривере с блефкетчером с плохим блокером, он не оплатит ставку оппонента.
Это ценно. Но ценность безошибочности не абсолютна. Понятно, машина покажет результат намного лучше, чем отъехавший фиш, совершающий грубые и дорогие ошибки. Однако когда мы сравниваем солверный идеал с решениями околонулевых регуляров, которые неплохо научились избегать очевидных ошибок, кто сказал, что разница выйдет такой уж огромной? Слышу ваши возражения: «Да ладно! Что за ерунда? Конечно, солвер сыграет намного сильнее!» Хочу взять на себя роль адвоката дьявола и поспорить со столь тривиальным утверждением.
Идеальная точность солвера в пограничных ситуациях – это маленькие мазки на большом полотне игры. Крупные мазки – это простые и очевидные решения, а также наглый эксплойт!
Жёстко эксплуатирующие действия против определённых типов игроков влияют на винрейт намного сильнее, чем изящные штрихи, основанные на блокерах и других теоретических тонкостях. Оказавшись против тильтующего фиша, который потерял способность фолдить, солвер сделает то, чего не сделает ни один регуляр: в ответ на потбет тёрна сыграет чек-рэйз и запушит ривер не только с вэлью-руками, но и с блефами. Разумеется, его вэлью отыграет всё EV, потерянное на блефах, но суть здесь в том, что не только сильный, но и довольно средний регуляр разыграет своё вэлью так же, а вот с блефами притормозит, видя, с каким оппонентом приходится иметь дело. Сомневаюсь, что безошибочная игра солвера принесёт ему против фишей хотя бы столько же, сколько получит регуляр своими грубыми подстройками. Это мой главный аргумент.
Я был бы рад всегда знать во время раздачи идеальную теоретическую линию и EV каждого действия, но не думаю, что это множество маленьких плюсиков перевесит несколько огромных плюсов от резких подстроек под фишей. На NL25 деньги приходят от слабых игроков. Именно поэтому на этом лимите ключевую роль играет селект. Именно поэтому Гаррет Адельстайн показывал такие результаты на стримах кэш-игры в казино Hustler – потому что он оказывался за столом, полным рекреационных игроков. Не случайно хорошие реги так одержимы селектом. Как показали расчёты в моей группе в дискорде, много проигрывающий игрок добавляет винрейтам остальных 5-8 бб/100. Это больше любого перевеса, который топ-рег может получить над слабым регом. Если бы умение лучше трактовать сложные и близкие ситуации было настолько ценным, винрейты сильных и слабых регуляров различались бы намного сильнее.
Солвер будет играть точнее регуляров, но он никогда не отклонится от баланса. Регуляр, играя против фиша, сделает намного больше плюсовых отклонений, чем минусовых. Когда я сижу за столом зума 200 или зума 500 с четырьмя регами и одним фишом, я делаю очень жёсткие подстройки против фиша, которые с высокой вероятностью выгодны. Не могу посчитать, но интуитивно мне кажется, что эти подстройки скажутся на винрейте сильнее солверной безошибочности.
Из тренерской практики я знаю, что слабый рег играет с винрейтом -2... -3 бб/100, иногда даже -5 бб/100. Сильнейшие регуляры лимита бьют его с винрейтом 3-4 бб/100 – более высокие винрейты на NL25 получить очень трудно без безумного селекта и очень хорошего понимания слабых оппонентов, хотя такое тоже возможно. Таким образом, разница между слабым и сильным регулярами не так уж велика – максимум 6-7 бб/100.
При этом даже слабый регуляр, очевидно, будет играть очень много больших банков против несбалансированных фишей эффективнее солвера.
Когда я обсуждал этот вопрос в твиттере, часто возникал следующий контраргумент: солвер размажет соперников, потому что будет намного чаще и жёстче блефовать, вынуждая людей совершать дорогие ошибки. Частично я согласен, однако мы все знаем, что бывают ситуации, в которых фолдэквити близко к нулю – а в солверном мире их нет, и машина будет биться головой об стенку и безнадёжно блефовать в самые сильные линии. С другой стороны, есть маленькие банки, в которых любители часто чудовищно оверфолдят – и регуляры эксплуатируют эту слабость намного чаще, чем солвер. Так что ещё вопрос, кто будет больше выигрывать без вскрытия – солвер или хороший регуляр!
Может быть, вы не считаете мои аргументы достаточно убедительными и остались при своём мнении, что солвер уничтожит NL25. Может быть, вы заколебались и думаете, что в этом что-то есть. О большем я и не прошу.
Но почему люди так переживают за гипотетический успех солвера? Почему им так тяжело принять саму возможность того, что машина не побьёт рейк? В комментариях очень многие вошли в стадию тотального отрицания без сколько-нибудь серьёзных аргументов. Никого не хочу обидеть, но я просто не вижу, откуда будет браться дополнительное EV, чтобы компенсировать нехватку жёсткого эксплойта.
Наверное, дело в том, что людям кажется очень привлекательной идея прийти к плюсовой игре, просто копируя линии солвера. Однако это вредная и ошибочная концепция, от которой я призываю вас как можно скорее избавиться. Людям свойственно искать надёжную опору, защититься от хаоса. Неопределённость пугает. Нам нужен порядок, и мы ищем защиты у солвера. Однако подумайте сами: может ли приносить максимальное ожидание то, что робот делает против стратегии, которую против нас не применяет никто и никогда? Если вы даёте положительный ответ, я просто не понимаю вашей логики. Похоже, это просто вопрос веры.
Не поймите меня неправильно. Я не пренебрегаю теорией. Я считаю, что теория – это обалдеть как круто! Я потратил годы, учась у солвера тому, как устроен покер. Но игра за реальным столом – это хаос, и её надо принимать такой, какая она есть. В каждой раздаче мы играем против оппонента с конкретной стратегией, а не против машины, с которой тренировались вчера вечером. И наша задача – поскорее разобраться в их отличиях.
В заключение давайте обсудим эмпирические данные. Нет, я не сыграл сто тысяч раздач с GTO-подсказчиком, это было бы неэтично. Однако у меня есть данные тренировок в GTO Wizard, в которых ответы игроков можно сравнивать с солверными линиями – программа считает разницу в EV между вами. Верите или нет, но я знаю людей, которые не могут побить NL5, однако фанатично изучают GTO и очень близки к солверным линиям – их решения хуже программных всего на 2-3 бб/100! Похоже, близость к GTO мало влияет на ваш практический винрейт.
Также мы проделали эксперимент с парой околонулевых регуляров зума 500. Их результаты в GTO Wizard были практически неотличимы от солверных. Таким образом, оказавшись на их месте, солвер играл бы лишь микроскопически лучше, и это ещё до подстроек под оппонентов. Скорее всего, зум 500 солвер не побьёт.
Побьёт ли он намного более слабый лимит (правда, с более высоким рейком)? Сложный вопрос. Если силой заставить меня ответить, я бы сказал, скорее, нет. 70 на 30, что нет.
NewPokerSoft, рум, запускающий собственного бота, который будет обыгрывать всех желающих — шикарная реклама, Дон Дрейпер просто с ума бы сошел от зависти 😎
готов поставить что ГТО будет иметь положительный ВР на 25ке. причём нормальный
Если бы солвер мог испытывать эмоции, то долго бы смеялся