Как мы определяем похожесть ПИФов друг на друга

Андрей Липов
01 июля 2014 г.

Сейчас на сайте «Богатый Хомячок» действует первая версия алгоритма определения похожести ПИФов. Это всего лишь определение евклидового расстояния между ними. За пространственные точки берутся следующие показатели:

  1. Доходность за 12 месяцев
  2. Коэффициент Шарпа
  3. Коэффициент Альфа
  4. Коэффициент Бета

Соответственно, чем ближе ПИФы друг к другу по этим показателям, тем более «похожими» мы их считаем.

Что такое евклидово расстояние

Евклидово расстояние — это удаленность точек друг от друга в геометрическом понимании в многомерном пространстве признаков. Вычисляется как корень из квадратов суммы разности между значениями каждого признака вот по такой формуле:

Расчет похожести ПИФов

Если признака всего два, то легко пояснить что это на вот такой простой картинке.

Евклидово расстояние. Пример

В этом случае вычисление проводится так:

Евклидово расстояние. Формула

Так как наш сайт написан на языке Python, то «Богатый Хомячок» предпочитает использовать соответствующую функцию модуля scipy:

from scipy.spatial import distance
x = [1.0, 20.4]
y = [3.0, 21.3]
print distance.euclidean(x,y)

Вот и все. Если вы можете улучшить наш алгоритм, пожалуйста, пишите на hamster@bhom.ru Мы заинтереснованы чтобы сделать наши расчеты как можно лучше, ведь мы сами ими пользуемся.

Комментарии

Реклама: