Подробнее о видах digital-стратегий в этом материале. Какая связь между психотипированием и биг датой/предиктивной аналитикой? Люди за все время существования интернета очень сильно наследили и продолжают это делать.
Даже в реальном мире мы оставляем следы. Допустим, посетители ходят в одну и ту же аптеку, поскольку там продавцы улыбаются, а в другую они предпочитают не ходить, поскольку там не очень приветливы. Такое поведение вполне соответствует психологической потребности. Если кому-нибудь удастся измерить психотип клиентов и сопоставить эти измерения с посещаемостью, то можно вывести очень важные для бизнеса гипотезы.
Для этого необходимо связать между собой большие наборы данных. Нужно совместить данные из разных источников, не только внутренних, но и внешних. Одному человеку это не под силу без технических средств. И тут появляется набор инструментов: а именно компьютерная статистика, инструменты Big Data (средства сбора данных, хранения, распределенной обработки), инструменты Data Science (алгоритмы классификации, обнаружения аномалий, отбора признаков, разметки последовательностей и т.д.).
Их основная задача - помочь человеку найти взаимосвязи между данными, определить устойчивость и качество этих взаимосвязей.
Наука, в принципе, занимается тем же самым. Она ищет взаимосвязи между процессами и описывает их формулами. Однако, как говорил
Фейнман, наука занимается поиском взаимосвязей, но не их объяснением. В то же время, каждый физический закон мы принимаем до того момента, пока не найдется лучшего закона. Мы продолжаем считать, что наличие автомобиля позволяет оценить вероятность отдачи кредита до того момента, пока не найдется такой характеристики человека, которую так же легко узнать, как и наличие автомобиля, но которая позволит лучше оценить вероятность отдачи кредита.
Анализируя данные ПиК, мы с помощью статистики поняли, что этаж влияет на готовность людей платить больше за квартиру. Но взаимосвязь была не очень значимой. Более того, часть людей была готова платить больше за нижние этажи. Почему? Как так? Мы воспользовались еще несколькими инструментами Data Science, провели классификацию и обнаружили, что этот феномен как-то связан с видом из окна. Так, идя от данных, мы выстроили целую схему, когда и как разные характеристики складываются в единое впечатление от квартиры.
Но и этого было мало. Далее оказалось, что не всегда любовь к нижним этажам объясняется видом из окна. То есть, оказалось, что даже когда есть характеристики, отношение к которым едино у всех клиентов, есть и такие характеристики, когда одни люди предпочитают одно, а другие - другое. И тут уже, просто анализируя данные, невозможно найти какую-либо связь.
В таких случаях нас выручают знания о психологии клиента. Разделяя людей на психологические типы по поведению, мы снабдили алгоритм классификации новыми признаками, и тогда он справился с этой задачей.
В итоге мы получили способ оценивать квартиры не просто глазами среднестатистического клиента, а глазами каждого отдельного клиента.
И это очень важно. Тогда как, один аналитик ограничен в своих ресурсах и может производить расчеты по индексации квартир только усредненно и приблизительно, то машина может помочь ему это сделать быстро и точно. В этом как раз ее задача - снять с человека необходимость производить расчеты, позволить ему больше посвящать времени анализу.
Как математически проверить правильность сегментации (и возможность предсказывать поведение)? Что позволяет нам утверждать, что найденная взаимосвязь имеет характер закона? И как использовать этот закон? Допустим, мы нашли некую связь между поведением человека и тем продуктом, который он купит. Можем ли мы воспользоваться полученной формулой и сделать прогноз на будущее? Например, можем ли мы сказать, что если к нам придет N человек такого-то типа, то будет M продаж такого-то товара? Можем ли мы пойти дальше и сказать, завтра август, активизируются люди такого-то типа, мы сейчас на них дадим рекламу, из них к нам придет N человек, мы продадим M штук товара?
Да, все это возможно. И существует ряд методов самопроверки. Вот один из них, простой и наглядный.
Мы можем использовать для анализа только часть данных, а, скажем, один месяц продаж исключить, и попросить машину составить прогноз на этот месяц, а затем сравнить с фактическим результатом. Так мы проверим, может ли быть наша взаимосвязь законом, заранее узнать, какую ошибку мы можем получить.
Конечно, одна такая проверка не может полностью нас удовлетворить. Она лишь может усилить нашу уверенность. К счастью, в арсенале Data Science есть более строгие способы проверки и более строгие способы прогнозирования. Чтобы не уходить в математику, здесь мы привели самый наглядный из этих способов: прогноз - сравнение.
Подробнее о наших подходах к проверке данных можно прочитать в этом материале. Есть еще один показательный способ проверки - проверка на непротиворечивость. Наблюдения должны соответствовать известным законам поведения.
Разбирая данные ПиК, мы обнаружили одну существенную закономерность. Доплачивая за лучшие условия, человек оценивал уровень возможной доплаты вдвое меньше, чем уровень возможной выгоды, отказываясь от этих условий. И это было справедливо для всех характеристик квартир: этаж, вид, площадь… - для всех.
Это очень яркое наблюдение. Оно само по себе имеет большую практическую ценность для компании, поскольку наглядно демонстрирует разницу между оценкой, которую рассчитывает продавец, и оценкой, которую подсознательно выводит покупатель.
И это наблюдение, в силу своей важности и того, что оно может иметь общий характер и повлиять не только на расчеты в данном конкретном случае, но и на работу аналитического отдела компании, должно соответствовать некоторому общему закону психологии.
Этот закон существует. В
статье Канемана и Тверски, положившей начало теории перспектив в поведенческой экономике, описывается именно такое поведение человека и приведены соответствующие формулы расчета.