Знаете ли вы, что наука о данных — это задавать вопросы? Да, в любом проекте, за который вы беретесь, успех зависит от вопроса, который вы задаете. Только в этом случае рабочими данными является допрашиваемая сторона, ну а она должна давать ответы следственной группе.

"Наука о данных — это задавание интересных вопросов на основе данных, которые у вас есть, а часто и данных, которых у вас нет".

~ Сара Джарвис, директор по прикладному машинному обучению и науке о данных в Secondmind

Прежде чем мы рассмотрим вопросы, которые необходимо задать, давайте вернемся к ним и поймем, как генерируются данные и зачем нам вообще нужны эти данные. В каждой выполняемой задаче данные генерируются с нашим ведомом или без него. Этот процесс в конечном итоге создает шаблоны, которые могут решить проблему, ответить на вопрос или повлиять на принятие решений в будущем.

Определите проблему.

Примером исследования будет кредитный отдел финансового учреждения.

Вы менеджер финансового учреждения, которое предлагает кредитные продукты. Вы обнаружите, что за последние 3–4 месяца доходность кредита снизилась, что привело к нескольким неудачам в вашем финансовом учреждении. Вам нужно решить проблему или рискнуть будущим учреждения.

Вопрос Почему?

Неработающие кредиты. Определив проблему, нам нужно собрать необходимые данные, чтобы «ответить на вопрос, почему». Это первый вопрос о данных.

Почему не работают кредиты? На это ответят данные, собранные при выдаче кредитов. Мы получаем данные от кредитного отдела и выполняем процесс очистки данных, чтобы исключить предвзятость при анализе данных. Мы начинаем видеть такие закономерности, как идентификатор ссуды, типы выданных ссуд, количество выданных ссуд, способ денежного перевода, период погашения, тип клиента (работающий или бизнес), работодатель, выполнение ссуды, кредитный специалист, выдающий ссуду. и дата выдачи кредита.

В данном случае мы смотрим на переменные типа клиента. Глядя на данные, которые вы обнаруживаете,

  • За последние 5 лет было выдано 15180 кредитов, из них погашено 50%. 10% кредитов имеют срок погашения менее 6 месяцев.
  • Большое количество неработающих сотрудников попадают в категорию отметок и стоп-приказов.
  • Большинство наших клиентов, работающих по найму, являются государственными служащими из различных государственных структур.
  • Работающие кредиты выдаются бизнес-клиентам.
  • Подавляющее большинство неэффективных клиентов — сотрудники.
  • Срок и дата погашения не имеют отношения к доходности кредита.
  • Кредитный инспектор не имеет никакого отношения к исполнению кредита.

Примечание. Данные исключают человеческие предубеждения.

С приведенными выше выводами вам необходимо предоставить рекомендуемые решения для сокращения количества неработающих кредитов. Таким образом, мы подходим к вопросу что.

Вопрос: что?

В чем причина просроченных кредитов от работающих клиентов?

Взаимосвязь между типом клиента и способом перевода денег Огромное количество клиентов, работающих по найму, предпочитают Checkoff или Stop Payment в качестве вариантов погашения кредита. Чтобы ответить на вопрос: «Что вам нужно знать о взаимосвязи между доходностью по кредиту, работодателем, денежным переводом и типом клиента?»

С помощью приведенного выше анализа мы можем ответить на вопрос о том, что является причиной низкой доходности кредита. Ответив на вопрос, мы теперь должны придумать решение проблемы. Собрав информацию, мы теперь переходим к тому, как это сделать.

Вопрос: как?

Как решить проблему низкой доходности по кредитам, выданным работающим клиентам?

Открытие. Произошла задержка с денежными переводами от работодателей в учреждение. Как глава учреждения, вы решаете связаться с четырьмя различными учреждениями с клиентами от одних и тех же работодателей с запросами о денежных переводах. Это добавит уверенности в решении, которое вы принимаете, исходя из низкой эффективности вашего учреждения. Имея такой эталон, а также идеи и закономерности из проанализированных данных, вы идете вперед и принимаете решение, основанное на данных.

После анализа всех данных и сравнительного анализа проблемы можно принять несколько решений, в том числе:

  • Прекратить выдачу кредитов клиентам из разных компаний.
  • Назначение встречи с соответствующими работодателями для обсуждения проблемы
  • Выделите последствия задержки платежей клиентам.
  • Консультирование клиентов по погашению кредитов другими способами, кроме кассы

Заключение

Решение проблем с данными зависит от вопроса, который вы задаете. Одним из навыков, которым следует овладеть специалисту по данным, является любопытство.

Как специалисты по данным, мы не просто думаем нестандартно; мы стремимся переопределить коробку». Стремление исследовать, открывать, тестировать, смешивать или создавать новые подходы, задавая вопросы, чтобы лучше понять проблему и найти лучшие решения, является задачей номер один для специалиста по данным.

Счастливого обучения

#наука о данных #машинное обучение