Автор |
Сообщение |
NS |
|
Тема сообщения:
Отправлено: Май 07, 2007 - 08:33 PM
|
|
Зарегистрирован: Авг 22, 2006
Сообщений: 671
Откуда : Санкт-Петербург
|
|
Цитата: А вот это ты зря. Доверительный интервал можно посчитать даже для такого метода. Нижняя граница будет несколько сотен пунктов.
Доверительный интервал можно посчитать для любого метода
Только в данном случае это будет [-много;+0]
приведенный рейтинг выйдет за доверительные 95% интервалы ЭлоСтата.
Что мешает скинуть все партии в .pdn и посчитать рейтинг ЭлоСтатом? |
|
|
|
|
|
Kallisto |
|
Тема сообщения:
Отправлено: Май 07, 2007 - 08:29 PM
|
|
Зарегистрирован: Авг 18, 2003
Сообщений: 747
|
|
NS писал(а): но в приведенном случае рейтинг посчитанный русским шашкам просто вне доверительного интервала.
А вот это ты зря. Доверительный интервал можно посчитать даже для такого метода. Нижняя граница будет несколько сотен пунктов. |
|
|
|
|
|
Alkand |
|
Тема сообщения:
Отправлено: Май 07, 2007 - 08:27 PM
|
|
Зарегистрирован: Июль 16, 2002
Сообщений: 3653
Откуда : Москва
|
|
Kallisto писал(а): На самом деле. Ведь достоверность такого рейтинга просто никакая.
По такому малому количеству партий никакой способ составления рейтингов не поможет.
Тут нужны тысячи (в крайнем случае сотни) партий. И применять методы расчета человеческих рейтингов здесь нет необходимости. Если есть желание, можно ввести неофициальный "рейтинг программ сайта". Даже два. Один посчитать по итогам турниров, пусть их и было немного. Но там каждая программа получит свой рейтинг.
А второй можете считать по итогам матчей, который проводите вы и другие энтузиасты. |
_________________ Aurora Borealis - единственный инструментарий для истинных профессионалов
|
|
|
|
|
NS |
|
Тема сообщения:
Отправлено: Май 07, 2007 - 08:13 PM
|
|
Зарегистрирован: Авг 22, 2006
Сообщений: 671
Откуда : Санкт-Петербург
|
|
Да, но нормальные методы дадут цифры хоть немного, но похожие на правду. Хотя конечно доверительный интервал по 12 париям очень велик, но в приведенном случае рейтинг посчитанный русским шашкам просто вне доверительного интервала. |
|
|
|
|
|
Kallisto |
|
Тема сообщения:
Отправлено: Май 07, 2007 - 08:10 PM
|
|
Зарегистрирован: Авг 18, 2003
Сообщений: 747
|
|
На самом деле. Ведь достоверность такого рейтинга просто никакая.
По такому малому количеству партий никакой способ составления рейтингов не поможет.
Тут нужны тысячи (в крайнем случае сотни) партий. И применять методы расчета человеческих рейтингов здесь нет необходимости. |
|
|
|
|
|
NS |
|
Тема сообщения:
Отправлено: Май 07, 2007 - 07:48 PM
|
|
Зарегистрирован: Авг 22, 2006
Сообщений: 671
Откуда : Санкт-Петербург
|
|
Вы посмотрите на разницу между сильнейшей и слабейшей программой!
Формула Эло была придумана для простого расчета силы в условиях возможного её изменения во времени.
Пересчет после каждой партии/турнира через отклонение от ожидаемого результата.
1. Сила конкретной версии программы не меняется во времени.
2. Простой расчет в данном случае не нужен.
Что нужно для программ? Расчет наиболее достоверного рейтинга
Который считается методом наибольшего правдоподобия.
Расчет рейтингов программ в русских шашках застрял в каменном веке.
Поищите что такое BayesElo и EloStat, и посмотрите как нужно считать рейтинги программ
Возьмете любые крупные рейтинг-листы шахматных программ, и посмотрите как расчитан рейтинг.
Когда программа сыгравшая только в одном турнире, и набравшая 2 очка из 12-ти возможных отстает от лидера рейтинг-листа меньше чем на сотню пунктов Эло - это даже не смешно! |
Последний раз редактировалось NS в Май 07, 2007 - 10:40 PM; всего редактировалось 2 раза
|
|
|
|
|
Alkand |
|
Тема сообщения:
Отправлено: Май 07, 2007 - 06:41 PM
|
|
Зарегистрирован: Июль 16, 2002
Сообщений: 3653
Откуда : Москва
|
|
NS прошу вас не переходить за рамки. Поверьте мне, Владимир в рейтингах (и в шашках) понимает ну никак не меньше вашего.
Ну, если вы занимаетесь обсчетом рейтингов и игрой в шашки не более 15 лет |
_________________ Aurora Borealis - единственный инструментарий для истинных профессионалов
|
|
|
|
|
NS |
|
Тема сообщения:
Отправлено: Май 07, 2007 - 05:26 PM
|
|
Зарегистрирован: Авг 22, 2006
Сообщений: 671
Откуда : Санкт-Петербург
|
|
Цитата: Конечно интересно.
Кстати, выкладываю старенький рейтинг программ, что Владимир Шулюпов сделал. Может он время найдет его обновить ? Добавить Кубки сайта и матчи Тундры с ПЛЮСОМ и Каллисто.
Это не рейтинг, а издевательство над здравым смыслом.
Кто-же так считает рейтинги программ? |
|
|
|
|
|
letas |
|
Тема сообщения:
Отправлено: Май 07, 2007 - 03:10 PM
|
|
Зарегистрирован: Фев 08, 2003
Сообщений: 1771
|
|
Будет оболочка для движков типа шахматной "Арены".Найдутся желающие проводить матчи между движками.Да и движков скорее всего прибавиться.Хотя и то что Вы уже успели сделать является огромным вкладом в развитие шашек. |
|
|
|
|
|
Kallisto |
|
Тема сообщения:
Отправлено: Май 07, 2007 - 11:48 AM
|
|
Зарегистрирован: Авг 18, 2003
Сообщений: 747
|
|
Еще было бы интересно выравнять рейтинги программ с человеческими. Может кто-то, имеющий рейтинг, играл с каким-нибудь движком довольно много?
Или может найдется человек с рейтингом, который сыграет большой матч в леталки против "Каллисто 1". Я предполагаю она играет где-то между кандидатом и мастером. |
|
|
|
|
|
Alkand |
|
Тема сообщения:
Отправлено: Май 07, 2007 - 11:26 AM
|
|
Зарегистрирован: Июль 16, 2002
Сообщений: 3653
Откуда : Москва
|
|
Конечно интересно.
Кстати, выкладываю старенький рейтинг программ, что Владимир Шулюпов сделал. Может он время найдет его обновить ? Добавить Кубки сайта и матчи Тундры с ПЛЮСОМ и Каллисто. |
Описание: |
|
Скачать |
Имя файла: |
BASE-PR.RAR |
Размер: |
8.5 KB |
Скачано: |
501 Раз(а) |
_________________ Aurora Borealis - единственный инструментарий для истинных профессионалов
|
|
|
|
|
Kallisto |
|
Тема сообщения: Рейтинги шашечных программ
Отправлено: Май 07, 2007 - 07:07 AM
|
|
Зарегистрирован: Авг 18, 2003
Сообщений: 747
|
|
Я иногда запускаю матчи между шашечными движками. Из результатов можно составить рейтинг-лист (по минуте на партию):
Код:
Place Name Rating Perf. Av.opp Games
1. Kallisto 1 2450 0.685022 2293 227
2. KestoG 1.3 2383 0.60093 2297 753
3. KestoG 1.2 2307 0.511905 2297 714
4. MiuMiu 2299 0.456467 2336 1183
5. Skifi 0.03 2293 0.427954 2354 1041
Если это кому-нибудь интересно, то буду здесь выкладывать обновления рейтингов.
В дальнейшем можно будет попробовать сделать рейтинг для 5 минут на партию. Рейтинги вероятно очень сильно сожмутся. |
|
|
|
|
|
|