Умный подход к большим данным в промышленности

У большинства промышленных компаний есть огромные массивы данных, из которых можно извлечь большую пользу с помощью решений искуственного интеллекта (далее — ИИ). Но на практике в таких компаниях пока лишь 15% пилотных проектов по внедрению ИИ дали удовлетворительные результаты, которые можно масштабировать. В данной статье поговорим об умном подходе к большим данным в промышленности.

Преобразование больших данных в «умные»

Для того, чтобы алгоритмы машинного обучения работали успешно, нужно преобразовать большие данные в «умные» (smart data) – проанализировать их, отсеять лишнее и структурировать. Как отмечают в McKinsey, этот процесс включает пять шагов.

1. Составление схемы технологического процесса

PROFI

Это нужно сделать вместе с экспертами и инженерами на объекте. Нужно учесть параметры физических и химических процессов (измельчение, полимеризация и т. д.), определить критически важные датчики и инструменты, выяснить даты планового ТО, степень контроля и прочие технологические аспекты. Здесь пригодится межфункциональная команда из инженеров и дата-сайентистов: первые досконально знают детали производства, а вторые понимают, в каких областях нужно повысить качество данных.

2. Обогащение данных

Качество важнее количества, поэтому стоит удалить данные, не относящиеся к стационарному режиму работы. В случае аномальных значений или отсутствия данных нужно смоделировать недостающие данные на основе показателей критически важных датчиков и восполнить пробелы. Например, в ходе проекта по внедрению машинного обучения одна химическая компания обнаружила неисправности расходомера. Сначала команда разработала виртуальный датчик расхода на основе уравнений баланса массы, а затем аналитики вычислили корректные величины с помощью триангуляции данных. В результате объёмы переработки выросли на 20%.

3. Понижение размерности данных

На современных заводах множество датчиков, и объём выходных данных огромен. Нужно минимизировать количество переменных для обучения модели — например, использовать только переменные, касающиеся физических процессов, и применять к ним детерминированные уравнения. Одна европейская химическая компания заметила бессистемное повышение давления при поступлении сырья в распылительную сушилку, из-за чего нужно было замедлять или останавливать непрерывный процесс. Используя данные о геометрии трубопровода и показания датчиков, специалисты сократили объём входных данных и повысили их качество. В результате точность модели выросла, а объёмы переработки увеличились на 8%.

4. Машинное обучение

В производственных процессах есть как предопределенные, так и труднопредсказуемые элементы; последние эффективнее моделировать на основе машинного обучения. При этом в проработке моделей нужно прежде всего исходить из повышения эффективности производства, а не добиваться максимальной предсказательной точности.

5. Постоянная валидация моделей при участии экспертов

Это значит, например, что нужно проверять соответствие входных данных параметрам физических процессов и обсуждать с производственными специалистами, насколько целесообразно масштабировать полученные результаты. Для внедрения ИИ в тяжелой промышленности нужны межфункциональные команды, включающие инженеров по автоматизации, специалистов по данным и машинному обучению, операторов и экспертов по технологическим процессам. Часто компаниям не хватает последних, либо они без энтузиазма относятся к современным цифровым инструментам, а некоторые неэффективно работают в «цифровых» командах. Стоит наладить сотрудничество с университетами и организовать стажерские программы, чтобы привлекать молодые кадры. Кроме того, важно обучить специалистов agile-принципам и работе с аналитическими инструментами. Тогда они смогут эффективно помогать дата-сайентистам в анализе проблем, повышении качества данных и стресс-тестировании моделей.

P.S. Подписываетесь на канал Women&Money, чтобы узнать о дополнительных возможностях заработкаобоснованности финансовых решенийнедвижимости и инвестициях

GeekBrains

Оставьте комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *