Forkify Channel

Какая выгода от ручного сопоставления событий?

2020-10-12 18:23 Обзоры Общее
О проблеме:
Каждый букмекер дает названия командам, как ему взбредет в голову. И даже бывают случаи, когда во время игры меняется название или порядок команд. 

Парсер получает события в лайв и передает их сервису, который определяет есть ли вилка между событиями. На одну БК один парсер (бывает что и много парсеров на каждую бк, все зависит от архитектуры решения).  

Возьмем самый популярный вид спорта и разберем на его примере суть проблемы сопоставления названий команд на различных БК.

Допустим, у нас есть парсер букмекера А и парсер букмекера Б. Оба парсера передали собранные данные в штуку, которая определяет вилку между букмекерами.
Как эта штука, определяющая вилку, понимает, что игра X с одного парсера и игра Y с другого парсера - это одно событие? Названия команд прогоняются через специальные алгоритм (или алгоритмы) по сравнению строк. Но эти алгоритмы не особо умные. Они могут сравнить символы с по порядку и выдавать некий коэффициент сходства.

Возьмем название команды на бет365 Desna Chernihiv Reserves и на фон Desna Chernigov U21. В этом случае в слове Chernigov разные окончания у каждой бк, и различно помечены резервные команды Reserves и U21. Написание довольно разное. Если мы снизим допустимый порог сходства, то эти команды будут считаться, как одинаковые, и по ним будут приходить вилки. Почему бы и нет? Возьмем 2 другие команды.
Hapoel Ramat Gan и Hapoel Ramat Hasharon. Коэффициент сходства этих команд выше, чем в предыдущем примере. Но это разные команды, которые играют одновременно. Если мы оставим допустимый порог схожести строк как для первого случая, то алгоритм решит, что команды из второго случая тоже одни и те же.
Последняя команда здесь лишняя. 

Выходит, что если мы поставим, такой порог, чтобы отсечь ситуации из второго случая, мы потеряем вилки из первого случая. Таких ситуаций в футболе очень много. И свыше 50% событий просто игнорируются, так как не проходят по порогу сходства. Такое происходит в любом боте. И вариантов решения этой проблемы два: либо кто-то 24/7 мэтчит все события, либо упускать большое количество вилок.

Наше предложение:
Отправлять все вилки, в которых хоть сколько то схожи команды по умолчанию. Вы же сами выставите порог в платформе, например 90%, и тогда все вилки, в которых сходство от 90 и выше, будут ставиться автоматически (остальные, те, что ниже, будут скрыты). 

Далее, мы даем вам возможность подключить к своему аккаунту телеграм-бота. В него будут приходить начавшиеся спортивные события, которые только что появились в лайв на букмекерах. События будут сопоставлены и объединены в группы (Игра А на бет365, Игра А на фон, Игра А на олимп, Игра А на пинке...). Вы смотрите на эту группу и принимаете решение - "Да, эти игры действительно одинаковые", или "Нет, это разные игры", или "Игра А на олимп лишняя в группе". После этого, посылается фильтр в платформу, которая из скрытых вилок, в которых порог у команд ниже 90, отображает и те вилки, в которых вы подтвердили события. Подтвердить нужно лишь начавшуюся игру. И после этого, все вилки по игре будут отображаться в форкифай.


Какие же в этом преимущества?
Во-первых, избегаются ошибки при проставлении плеч.
Во-вторых, станет значительно больше вилок.
В-третьих, события, которые вы подтвердили, могут не оказаться в других ботах, потому что их алгоритм не пропустил, либо их человек не сопоставил вручную. То есть вы реже попадаете в прогрузы на лоу маркетах.

Какие минусы?
К сожалению, комьюнити вилочников в большинстве своем очень ленивые люди, многие хотят кнопку "бабло" и чиллить за кальяном. Так что главный минус, что на то, чтобы 50-100 раз в телеграме отжать кнопочку нужно потратить свое внимание и несколько минут в сутки.