ny_quant: (Default)
ny_quant ([personal profile] ny_quant) wrote2017-12-21 04:12 pm
Entry tags:

Data mining - дорога в ад

Поскольку содержательные идеи у меня кончились, решил порыть вслепую. Стал резать данные на куски и смотреть где какие видны аномалии. Для одного почти бессмысленного ratio of 2 parameters в некотором интервале обнаружилась некоторая странность. ОК, быстренько запрограммировал и проверил на модели. Трах-тибидох! Результаты такие, что можно завтра увольняться и больше вообще никогда о деньгах не заботиться.

If it's too good to be true it probably is. Проверил out of sample, а там в некотором смысле только хуже стало. Ну чо, облизнулся? Однако, обидно мне стало такую жырную идею сразу выкидывать. Дай думаю, попробую не весь интервал, а только его подмножество, типа ещё одно линейное ограничение добавить. Ну и оказалось, что если правильно провести эту линию, то получается не такое огромное как в начале, но вполне заметное улучшение результатов в обоих data sets.

Только теперь у меня больше нет никаких out of sample tests и всем этим достижениям цена ровно ноль. Придётся выбросить.

[identity profile] tandem-bike.livejournal.com 2017-12-21 10:02 pm (UTC)(link)
нихуя не поняла но "отрезонировала" - похоже на фишинг. когда анализируешь дата без гипотезы. шит ин, шит аут..

может это не к месту, я же говорю не поняла :-)

[identity profile] ny-quant.livejournal.com 2017-12-21 11:58 pm (UTC)(link)
В общем - к месту. Но сейчас такой machine learning бывает, что гипотезы нет, а результат всё равно есть. Вернее, есть семейство гипотез, а алгоритм из них выбирает лучшую.

[identity profile] misha-b.livejournal.com 2017-12-22 12:47 am (UTC)(link)
Everybody looks at test set in any case. Who knows how valid the published results actually are. Not a new thing though, it has always been like that.

[identity profile] aron-turgenev.livejournal.com 2017-12-21 10:20 pm (UTC)(link)
Как говорил один финансовый математик, у меня есть идея, если пройдет - разбогатею, если нет - напишу книгу.

[identity profile] ny-quant.livejournal.com 2017-12-21 11:42 pm (UTC)(link)

Вот. Сразу видно, что умный человек. Кто такой, если не секрет?

[identity profile] aron-turgenev.livejournal.com 2017-12-22 02:57 am (UTC)(link)
Фамилии я не помню (честно). Помню в каком университете он работал перед переходом на Уолл-Стрит.
(deleted comment)

[identity profile] ny-quant.livejournal.com 2017-12-22 12:06 am (UTC)(link)
Думаю

[identity profile] ny-quant.livejournal.com 2017-12-26 09:42 pm (UTC)(link)

Sorry, глупость сказал, от усталости.

Edited 2017-12-27 00:02 (UTC)

[identity profile] nefedor.livejournal.com 2017-12-24 12:19 am (UTC)(link)
Это Ваша модель или по работе?

[identity profile] ny-quant.livejournal.com 2017-12-24 05:44 am (UTC)(link)
Моя