Результаты 100 партий не должны восприниматься слишком серьезно.
Но все равно видно, что значимость скорости не такая уж и существенная.
Интересно было бы провести одной и той же Каллисто с разными контролями времени. Тут уже ситуация должна быть другой.
И еще было бы интересно попробовать Аврору под оболочкой Каллисто. Можно будет сопоставить как движки играют под разными оболочками.
Я видел одну позицию где под Авророй Каллисто считала не так как под родной оболочкой. Но так до сих пор и не удалось вникнуть в чем причина.
Зарегистрирован: Авг 29, 2002
Сообщений: 221
Откуда : Якутск
По Авроре:
Турнирная версия с Каллисто 2 набирала
46,5% (+5-12=83) по 1 минуте + 0.5 на ход
это версия с шаблонами и несжатой ЭБ5.
После турнира отключил шаблоны и подключил сжатую ЭБ5 получилось
38,5% (+3-26=71), уже с Каллисто 3.
Пока шаблоны я забросил, попробую максимально все выжать из того что осталось.
Лучший вариант модификации алгоритма (поиск уточненного PV) дал
40,5% (+3-22=75)
без ЭБ
35% (+3-33=64), то есть ЭБ5 дало +42 пункта.
Что интересно - на варианте поиска неуточненного PV версия с ЭБ5 даже набрала на 1,5% меньше.
Дальше - давно хотел сравнить результаты разницы в скорости, для этого запустил матчи где у Авроры было больше времени чем у Каллисто 3 (вариант уточненного PV как лучшего алгоритма из используемых):
То есть при увеличении времени (скорости) в 2 и даже 4 раза клинически значимого результата в моем случае не получено.
Интересно было бы посмотреть какая разница между сжатыми и несжатыми ЭБ - Игорь утверждал что сжатые ЭБ намного хуже - но ту версию я уже прибил и заново переделывать лень.
По движкам посмотрел записи, когда я их сравнивал получил следующие результаты (усредненно по матчам):
Каллисто 2 ЭБ6 - 2600 (это бралось как основа, так как такой TPR был у Каллисто в турнире среди людей по 3 мин.) ЭБ5..ЭБ0 показывали в среднем всего на 5-10 пунктов меньше.
Каллисто 1 - 2460
Kestog 1.2 - 2425
MiuMiu - 2437
Sidra - 1885
Зарегистрирован: Авг 22, 2006
Сообщений: 613
Откуда : Санкт-Петербург
Две разные вещи - предложенный в 50-ых - 60-ых годах примерный способ подсчета рейтингов (Сам Эло считал, что при коэффициенте 10 она работает в турнирах до 20-ти партий каждого участника)
И современные точные методы расчета.
Рейтинг ПО ГОДУ не считается никогда - идет пресчет после каждого турнира, если посчитать по году, и допустим каждый сыграл по 200 партий - то погрешность будет просто чудовищная.
В случае матча из 200 партий, при перевесе в 200 пунктов будет показан перевес в 1000 пунктов. То есть формула ошибется в 5 раз, и она никогда не будет сходтся к правильному результату.
Из более точных методов простейший - через набранный процент очков, но необходима корректировка на количество участников.
По этому методу без корректировки разница 265 пунктов, реальная разница (с корректирвкой) около 200.
Завтра смогу посчитать точно (методом максимального правдоподобия), с подсчетом доверительных интервалов.
Согласен, правильнее считать рейт после каждого круга. Тогда разность в рейте нивелирует большую разницу в очках. Но кто так делает? Если не ошибаюсь, рейт в шашках считается один раз в год!
Knew=Kold+(dK1+dK2+...+dKn)
где dKn - рез-таты выступления в соревнованиях за определенный период.
Зарегистрирован: Авг 22, 2006
Сообщений: 613
Откуда : Санкт-Петербург
Предложенная доктором Эло формула пересчета после каждой партии/турнира работает Только до определенного количества партий.
В случае Коэффициента пересчета 10 - не больше 50 партий каждого участника. И это не просто примерная формула - она ужасна, она не годна даже в качестве прикидки для первого приближения...
Нашел все-таки я свои записи:
dK=10*(P-E) - это изменение рейтинга
P - показанный рез-тат в очках
E - ожидаемый рез-тат в очках
В матчах и по швейцарке - E=M*Pe
M - число соперников
Pe - ожидаемый % очков по таблице ЭЛО
Для турниров по круговой системе:
E=H*Pe-0.5
H - число всех участников турнира
Применительно к проведенному турниру:
Каллисто3 набрала 57.5 очков из ожидавшихся 42.
dK=10*(57.5-42)=155
т.е. ее рейт вырос на 155 пунктов!
Скифи003 набрала 27 очков
dK=10*(27-42)=-150
т.е. потеряла 150 пунктов рейта.
Разница в рейте после турнира м/у Каллисто3 и Скифи составляет 305 пунктов.
Конечно расчеты неправильные, поскольку турнир был многокруговым.
Зарегистрирован: Авг 22, 2006
Сообщений: 613
Откуда : Санкт-Петербург
Это больше похоже на правду, но всё-равно значения разницы завышны. Разница между Каллисто3 и Skifi0.03 должна быть около 200 пунктов Эло. Нужно коэффициент еще уменьшить, а лучше пользоваться "правильными программами" считающими методом наибольшего правдоподобия. Тогда задается только средний рейтинг.
Провел небольшой турнирчик,чтобы разобраться с силой игры движков.Движки играли друг с другом с заданным первым ходом белых.Таких ходов как известно-7.Регламент 2мин.+2сек.
Движок Корнилова,к сожалению оказался слишком слаб.И был исключен.
Зарегистрирован: Авг 22, 2006
Сообщений: 613
Откуда : Санкт-Петербург
То есть простейший пример.
Личный матч двух программ Программа1 и Программа2.
Результат:
Программа1 75/100 75%
Программа2 25/100 25%
Система Эло говорит о том что разница в силе 200 пунктов Эло.
Если считать через результат - То программа1 показала результат +200 пунктов, программа2 показала результат -200 пунктов. Разница 400 пунктов. Расчет через "средний рейтинг" ошибся в два раза, правильное значение 400/2 = 200 пунктов Эло.
При увеличении числа соперников в турнире - завышение разницы уменьшается.
Зарегистрирован: Авг 22, 2006
Сообщений: 613
Откуда : Санкт-Петербург
Цитата:
Я все-таки полагаю, что разницу в рейте по таблице следует удвоить.
Если в матч вступают две проги, с одинаковым начальным рейтом, при этом одна из прог набирает 64% очков, то ее рейт увеличивается на 100 пунктов, соответственно у другой проги набравшей 36% - на 100 пунктов падает. Т.е. налицо 200 пунктов разницы в силе.
Вот если они начнут играть второй матч то первой проге, чтобы подтвердить свой рейт уже нужно набирать >75% очков. Т.е. первая прога немного потеряет, вторая приобретет и т.д.
Ничего удваивать не надо. Есть система Эло. Она говорит о том, что если в личном матче одна программа против другой набирает 75%, это значит что разница в силе между ними 200 пунктов Эло, а никак не 400. Как раз при расчете через средний рейтинг разница удвоится (в случае двух соперников), и для получения правильного значеия - её надо не удвоить, а поделить пополам.
Я все-таки полагаю, что разницу в рейте по таблице следует удвоить.
Если в матч вступают две проги, с одинаковым начальным рейтом, при этом одна из прог набирает 64% очков, то ее рейт увеличивается на 100 пунктов, соответственно у другой проги набравшей 36% - на 100 пунктов падает. Т.е. налицо 200 пунктов разницы в силе.
Вот если они начнут играть второй матч то первой проге, чтобы подтвердить свой рейт уже нужно набирать >75% очков. Т.е. первая прога немного потеряет, вторая приобретет и т.д.