В сегодняшней быстро меняющейся предпринимательской среде путь от стартапа к масштабированию сопряжен с проблемами и беспрецедентными возможностями для бизнеса по автоматизации и оптимизации своих процессов. Интеграция машинного обучения (МО) в бизнес-процессы — одно из таких интересных направлений, но это непростая задача. Это требует тщательного планирования, многоэтапного подхода и глубокого понимания как деловых, так и технических аспектов. Но как ориентироваться в этом сложном ландшафте? Методологии Lean и Agile предлагают путеводный свет. Давайте изучим дорожную карту:

Пять фаз

1. Фаза индивидуального участника (этап MVP)

Вот тут-то все и начинается. Один человек, часто основатель, берет на себя задачу в ее самой простой форме. В методологии бережливого производства мы называем это этапом минимального жизнеспособного продукта (MVP). Это этап прототипа, который отличается высокой гибкостью и низкими инвестициями, где неудача обходится дешево, а обучение происходит быстро.

Представьте себе администратора в офисном здании, который управляет телефонными звонками и направляет посетителей. Это прекрасная возможность для прототипирования, потому что это дешево и гибко. Обратной стороной является то, что полагаться исключительно на одного человека может быть рискованно; если этот человек уйдет, уйдет и его опыт.

Выводы:

  • Создание прототипов. Используйте легкие инструменты, такие как Jupyter Notebooks, для создания эскизов исходных моделей данных.
  • Сбор данных. Используйте базовые методы сбора данных, такие как электронные таблицы Excel или формы Google.
  • Человеческий опыт ценен, но не масштабируем.

2. Фаза делегирования (поворот или настойчивость)

По мере того, как задача приобретает значимость, эстафета передается нескольким людям. Сейчас основное внимание уделяется обзорам и ретроспективам спринтов. В игру вступает маневренность, позволяющая быстро корректировать курс, эффективно масштабироваться или поворачиваться, когда это необходимо.

Представьте себе несколько кассиров в супермаркете. Этот этап помогает формализовать роль и определить показатели успеха. Хотя этот этап помогает масштабировать процесс, он также означает более высокие затраты на каждого дополнительного сотрудника.

Вывод:

  • Формализация бизнес-процессов имеет решающее значение.
  • Делегирование — это шаг к масштабируемости, но за это приходится платить.
  • Управление базами данных: переход к системам баз данных, таким как SQL или NoSQL, для управления данными.
  • Проверка данных. Внедрите базовые проверки качества данных.

3. Этап оцифровки (масштабирование)

Компьютеры выходят на сцену. Каждый повторяющийся элемент задачи автоматизирован, что сокращает количество человеческих ошибок и освобождает творческий потенциал человека для решения проблем. Именно здесь вы хотите применить модели Канбан для управления рабочим процессом и ресурсами.

Подумайте о банкоматах, заменяющих банковских кассиров для снятия наличных. Автоматизация начинается здесь. Однако пропуск этого этапа и переход сразу к ML может привести к катастрофическим сбоям, поскольку вы упустите необходимую ИТ-инфраструктуру.

Вывод:

  • Цифровизация — это не конец, а значительный шаг на пути к автоматизации.
  • Инфраструктура имеет значение.
  • API и микросервисы. Интегрируйте различные программные компоненты с помощью RESTful API.
  • CI/CD: используйте непрерывную интеграцию и непрерывное развертывание для обновлений программного обеспечения.

4. Фаза больших данных и аналитики (генерация идей)

Идеи заменяют предположения. Метрики и ключевые показатели эффективности станут вашим новым компасом, который проведет вас через лабиринт поведения пользователей и операционной эффективности. Теперь вы не просто догадываетесь, чего хотят ваши клиенты; вы применяете действенные идеи для его реализации.

Такие компании, как Toyota, демонстрируют этот этап своими процессами бережливого производства. Это этап, на котором вы можете переопределить свои показатели успеха на основе собранных вами данных.

Вывод:

  • Озеро данных. Используйте озеро данных для хранения необработанных данных, которые можно преобразовать в соответствии с потребностями.
  • Процессы ETL: реализация процессов извлечения, преобразования и загрузки для перемещения данных из источников в хранилище данных.
  • Механизм аналитики: используйте такие инструменты, как Apache Spark, для распределенной обработки данных.
  • Данные могут переопределить показатели успеха.
  • Богатую информацию можно получить на основе анализа данных.

5. Этап машинного обучения (инновации и оптимизация)

Это этап, на котором вы не просто собираете данные, но и позволяете им вас научить. Ваша система учится на каждом взаимодействии, постоянно обновляя свои рабочие параметры. Если использовать терминологию Agile, думайте об этом как о непрерывном развертывании на стероидах.

Именно здесь алгоритмы могут анализировать огромные данные и предпринимать действия, о которых люди, возможно, даже не задумывались. Однако это не означает устранения человеческих ролей. Люди остаются в курсе проверок качества и надзора.

Вывод:

  • Машинное обучение — это высший уровень, но для его функционирования требуется надежная база.
  • Люди и машины работают лучше всего в тандеме.
  • Разработка функций: выберите и преобразуйте переменные, которые модель будет использовать для прогнозов.
  • Платформы машинного обучения: начните с простых моделей машинного обучения и используйте возможности предварительно обученных API и AutoML для моделей, которые требуют меньше индивидуальной настройки и более быстрого развертывания, а для более сложных индивидуальных случаев используйте TensorFlow, PyTorch или scikit-learn. для моделей ML.
  • ML Ops: интегрируйте модели машинного обучения в производство с помощью инструментов ML Ops, таких как Vertex AI, чтобы оптимизировать конвейер ML от подготовки данных до развертывания модели, включая разработку функций и оценку модели.

Оси дифференциации

Процесс перехода от одного человека ко многим людям и, в конечном итоге, к компьютерной или серверной стойке. От ручного выполнения до автоматизированных сценариев и, в конечном итоге, до моделей машинного обучения, работающих на выделенном оборудовании машинного обучения. Эксплуатационные параметры изначально выбираются на основе гипотез и предположений. Но по мере того, как вы достигаете фазы больших данных, эмпирические данные начинают влиять на этот выбор. От гипотез, основанных на данных, и, в конечном итоге, к параметрам, полученным с помощью машинного обучения. Интеграция обратной связи на начальных этапах обычно осуществляется посредством обучения или ручных проверок кода, а затем автоматизированного тестирования, и, в конечном итоге, цикл обратной связи автоматизируется с использованием моделей обучения с подкреплением.

Заключение

Путь к машинному обучению — это не прямой прыжок, а путешествие через несколько критических этапов. Каждый этап имеет свои преимущества и ограничения. Понимание того, где находится ваша организация на этом пути, может сыграть важную роль в направлении ее в правильном направлении. Независимо от того, являетесь ли вы предпринимателем, бизнес-лидером или специалистом по обработке данных, понимание этого пути является ключом к успешной интеграции машинного обучения в ваши бизнес-процессы.