Инструмент, который поможет нам учесть количество оценок, а не только средний рейтинг – это доверительный интервал (confidence interval, ci). В данном случаен он поможет нам оценить в каком диапазоне может находиться истинное значение рейтинга, учитывая то, что на выборке некоторого размера мы наблюдаем значение R.
Если построить доверительные интервалы для двух наших баров, то...
Bar Abraham: R = 4.6, N = 57, CI = [4.248, 4.952]
Cold Bar: R = 4.2, N = 10702, CI = [4.165, 4.235]
Однозначным победителем будет Bar Abraham со всего 57 оценками на картах.
К сожалению, у людей нет хорошей универсальной интуиции на математику, особенно – статистику. Поэтому, чтобы быть data driven, надо считать-считать-считать, и стараться не придумывать в голове историю пока не посмотришь на циферки.
Отдельным сюрпризом для меня стало то, сколько удивительных и интересных не количественных, а качественных аспектов пытались учесть продакты из нашего коммьюнити.
→ а так ли хороши популярные бары?
→ а стабильно ли качество обслуживания во времени?
→ не куплены ли отзывы за стопку водки?
→ а не реклама ли это бара/ алкоголизма/ курса по статистике
Умение везде видеть какую-то историю, и смотреть не только на цифры – это безусловно здорово. Но мне начинает казаться, что умение анализировать цифры более дефицитно среди продактов, поэтому если давать советы по образованию, то я бы советовал посмотреть в сторону курса по аналитике для продактов, или A/B тестированию.
С эмпатией и пользовательскими историями у вас и так скорее всего всё хорошо.