Сейчас на сайте «Богатый Хомячок» действует первая версия алгоритма определения похожести ПИФов. Это всего лишь определение евклидового расстояния между ними. За пространственные точки берутся следующие показатели:
Соответственно, чем ближе ПИФы друг к другу по этим показателям, тем более «похожими» мы их считаем.
Евклидово расстояние — это удаленность точек друг от друга в геометрическом понимании в многомерном пространстве признаков. Вычисляется как корень из квадратов суммы разности между значениями каждого признака вот по такой формуле:
Если признака всего два, то легко пояснить что это на вот такой простой картинке.
В этом случае вычисление проводится так:
Так как наш сайт написан на языке Python, то «Богатый Хомячок» предпочитает использовать соответствующую функцию модуля scipy:
Вот и все. Если вы можете улучшить наш алгоритм, пожалуйста, пишите на hamster@bhom.ru Мы заинтереснованы чтобы сделать наши расчеты как можно лучше, ведь мы сами ими пользуемся.