Google
 

Сайт Андрея Иванова

Андрей Иванов - все секреты шашек и шашистов

Login





 


 Забыли пароль?
 или новый пользователь? Зарегистрируйся!

Кто с нами

Пользователей:  На сайте
Пользователей:  Пользователей: 0
Гостей:  Гостей: 389
Всего:  Всего: 389
Пользователей:  Зарегистрированные
No members connected


Новая тема   Ответить
Предыдущая тема Версия для печати Войти и проверить личные сообщения Следующая тема
Автор Сообщение
NS
Тема сообщения:   СообщениеОтправлено: Май 07, 2007 - 06:33 PM



Зарегистрирован: Авг 22, 2006
Сообщений: 671
Откуда : Санкт-Петербург
Цитата:
А вот это ты зря. Доверительный интервал можно посчитать даже для такого метода. Нижняя граница будет несколько сотен пунктов.


Доверительный интервал можно посчитать для любого метода Smile
Только в данном случае это будет [-много;+0]

приведенный рейтинг выйдет за доверительные 95% интервалы ЭлоСтата.

Что мешает скинуть все партии в .pdn и посчитать рейтинг ЭлоСтатом?
 
 Профиль пользователя отправить личное сообщение  
Ответить с цитатой Наверх
Kallisto
Тема сообщения:   СообщениеОтправлено: Май 07, 2007 - 06:29 PM



Зарегистрирован: Авг 18, 2003
Сообщений: 747

NS писал(а):
но в приведенном случае рейтинг посчитанный русским шашкам просто вне доверительного интервала.

А вот это ты зря. Доверительный интервал можно посчитать даже для такого метода. Нижняя граница будет несколько сотен пунктов.
 
 Профиль пользователя отправить личное сообщение Послать e-mail WWW  
Ответить с цитатой Наверх
Alkand
Тема сообщения:   СообщениеОтправлено: Май 07, 2007 - 06:27 PM



Зарегистрирован: Июль 16, 2002
Сообщений: 3635
Откуда : Москва
Kallisto писал(а):
На самом деле. Ведь достоверность такого рейтинга просто никакая.
По такому малому количеству партий никакой способ составления рейтингов не поможет.

Тут нужны тысячи (в крайнем случае сотни) партий. И применять методы расчета человеческих рейтингов здесь нет необходимости.
Если есть желание, можно ввести неофициальный "рейтинг программ сайта". Даже два. Один посчитать по итогам турниров, пусть их и было немного. Но там каждая программа получит свой рейтинг.
А второй можете считать по итогам матчей, который проводите вы и другие энтузиасты.

_________________
Aurora Borealis - единственный инструментарий для истинных профессионалов Smile
 
 Профиль пользователя отправить личное сообщение Послать e-mail WWW  
Ответить с цитатой Наверх
NS
Тема сообщения:   СообщениеОтправлено: Май 07, 2007 - 06:13 PM



Зарегистрирован: Авг 22, 2006
Сообщений: 671
Откуда : Санкт-Петербург
Да, но нормальные методы дадут цифры хоть немного, но похожие на правду. Хотя конечно доверительный интервал по 12 париям очень велик, но в приведенном случае рейтинг посчитанный русским шашкам просто вне доверительного интервала.
 
 Профиль пользователя отправить личное сообщение  
Ответить с цитатой Наверх
Kallisto
Тема сообщения:   СообщениеОтправлено: Май 07, 2007 - 06:10 PM



Зарегистрирован: Авг 18, 2003
Сообщений: 747

На самом деле. Ведь достоверность такого рейтинга просто никакая.
По такому малому количеству партий никакой способ составления рейтингов не поможет.

Тут нужны тысячи (в крайнем случае сотни) партий. И применять методы расчета человеческих рейтингов здесь нет необходимости.
 
 Профиль пользователя отправить личное сообщение Послать e-mail WWW  
Ответить с цитатой Наверх
NS
Тема сообщения:   СообщениеОтправлено: Май 07, 2007 - 05:48 PM



Зарегистрирован: Авг 22, 2006
Сообщений: 671
Откуда : Санкт-Петербург
Вы посмотрите на разницу между сильнейшей и слабейшей программой!
Формула Эло была придумана для простого расчета силы в условиях возможного её изменения во времени.
Пересчет после каждой партии/турнира через отклонение от ожидаемого результата.

1. Сила конкретной версии программы не меняется во времени.
2. Простой расчет в данном случае не нужен.

Что нужно для программ? Расчет наиболее достоверного рейтинга
Который считается методом наибольшего правдоподобия.


Расчет рейтингов программ в русских шашках застрял в каменном веке.

Поищите что такое BayesElo и EloStat, и посмотрите как нужно считать рейтинги программ

Возьмете любые крупные рейтинг-листы шахматных программ, и посмотрите как расчитан рейтинг.

Когда программа сыгравшая только в одном турнире, и набравшая 2 очка из 12-ти возможных отстает от лидера рейтинг-листа меньше чем на сотню пунктов Эло - это даже не смешно!


Последний раз редактировалось NS в Май 07, 2007 - 08:40 PM; всего редактировалось 2 раза
 
 Профиль пользователя отправить личное сообщение  
Ответить с цитатой Наверх
Alkand
Тема сообщения:   СообщениеОтправлено: Май 07, 2007 - 04:41 PM



Зарегистрирован: Июль 16, 2002
Сообщений: 3635
Откуда : Москва
NS прошу вас не переходить за рамки. Поверьте мне, Владимир в рейтингах (и в шашках) понимает ну никак не меньше вашего.
Ну, если вы занимаетесь обсчетом рейтингов и игрой в шашки не более 15 лет Embarassed

_________________
Aurora Borealis - единственный инструментарий для истинных профессионалов Smile
 
 Профиль пользователя отправить личное сообщение Послать e-mail WWW  
Ответить с цитатой Наверх
NS
Тема сообщения:   СообщениеОтправлено: Май 07, 2007 - 03:26 PM



Зарегистрирован: Авг 22, 2006
Сообщений: 671
Откуда : Санкт-Петербург
Цитата:
Конечно интересно.
Кстати, выкладываю старенький рейтинг программ, что Владимир Шулюпов сделал. Может он время найдет его обновить ? Добавить Кубки сайта и матчи Тундры с ПЛЮСОМ и Каллисто.


Это не рейтинг, а издевательство над здравым смыслом.
Кто-же так считает рейтинги программ?
 
 Профиль пользователя отправить личное сообщение  
Ответить с цитатой Наверх
letas
Тема сообщения:   СообщениеОтправлено: Май 07, 2007 - 01:10 PM



Зарегистрирован: Фев 08, 2003
Сообщений: 1696

Будет оболочка для движков типа шахматной "Арены".Найдутся желающие проводить матчи между движками.Да и движков скорее всего прибавиться.Хотя и то что Вы уже успели сделать является огромным вкладом в развитие шашек.
 
 Профиль пользователя отправить личное сообщение WWW  
Ответить с цитатой Наверх
Kallisto
Тема сообщения:   СообщениеОтправлено: Май 07, 2007 - 09:48 AM



Зарегистрирован: Авг 18, 2003
Сообщений: 747

Еще было бы интересно выравнять рейтинги программ с человеческими. Может кто-то, имеющий рейтинг, играл с каким-нибудь движком довольно много?

Или может найдется человек с рейтингом, который сыграет большой матч в леталки против "Каллисто 1". Я предполагаю она играет где-то между кандидатом и мастером.
 
 Профиль пользователя отправить личное сообщение Послать e-mail WWW  
Ответить с цитатой Наверх
Alkand
Тема сообщения:   СообщениеОтправлено: Май 07, 2007 - 09:26 AM



Зарегистрирован: Июль 16, 2002
Сообщений: 3635
Откуда : Москва
Конечно интересно.
Кстати, выкладываю старенький рейтинг программ, что Владимир Шулюпов сделал. Может он время найдет его обновить ? Добавить Кубки сайта и матчи Тундры с ПЛЮСОМ и Каллисто.



BASE-PR.RAR
 Описание:

Скачать
 Имя файла:  BASE-PR.RAR
 Размер:  8.5 KB
 Скачано:  422 Раз(а)


_________________
Aurora Borealis - единственный инструментарий для истинных профессионалов Smile
 
 Профиль пользователя отправить личное сообщение Послать e-mail WWW  
Ответить с цитатой Наверх
Kallisto
Тема сообщения: Рейтинги шашечных программ  СообщениеОтправлено: Май 07, 2007 - 05:07 AM



Зарегистрирован: Авг 18, 2003
Сообщений: 747

Я иногда запускаю матчи между шашечными движками. Из результатов можно составить рейтинг-лист (по минуте на партию):

Код:

Place     Name                      Rating      Perf.   Av.opp    Games

   1. Kallisto 1                     2450     0.685022   2293      227       
   2. KestoG 1.3                     2383     0.60093    2297      753       
   3. KestoG 1.2                     2307     0.511905   2297      714       
   4. MiuMiu                         2299     0.456467   2336      1183     
   5. Skifi 0.03                     2293     0.427954   2354      1041     


Если это кому-нибудь интересно, то буду здесь выкладывать обновления рейтингов.

В дальнейшем можно будет попробовать сделать рейтинг для 5 минут на партию. Рейтинги вероятно очень сильно сожмутся.
 
 Профиль пользователя отправить личное сообщение Послать e-mail WWW  
Ответить с цитатой Наверх
Показать:     
Перейти к:  
Время в формате GMT + 3
Новая тема   Ответить
Предыдущая тема Версия для печати Войти и проверить личные сообщения Следующая тема
PNphpBB2 © 2003-2007 
 
Page created in 0.594527006149 seconds.