BABOK, DMBOK и еще 3 профессиональных стандарта для Big Data специалиста

Автор Категория , ,
BABOK, DMBOK и еще 3 профессиональных стандарта для Big Data специалиста

Мы уже рассказывали про профессиональный стандарт бизнес-аналитика – руководство BABOK и его значимость в области больших данных. Сегодня рассмотрим еще 3 подобных свода знаний, которые полезны для архитектора, разработчика, менеджера, инженера, исследователя и аналитика Big Data: PMBOK, SWEBOK и DMBOK. А также разберем, что такое EABOK и насколько это применимо в Data Governance.

Еще раз о том, зачем нужен очередной Body Of Knowledge

Практически каждый профессиональный стандарт представляет собой рамочный документ (фреймворк), который регламентирует основные входы, выходы и критерии их оценки, а также инструменты выполнения определенной деятельности. При том, что свод знаний принято называть руководством, он не содержит детального описания процессов решения задач, хотя включает их список и перечень полезных методов, подходов и техник. Поэтому любой Body Of Knowledge (BOK) рассчитан на компетентных специалистов с опытом практической работы, позволяя им структурировать уже имеющиеся знания и навыки с помощью концентрированного изложения основных доменных идей.

Из множества применимых к ИТ-области BOK’ов мы рассмотрим следующие популярные и коррелирующие со сферами Big Data и Data Science своды знаний:

  • BABOK (Business Analysis Body of Knowledge) – по бизнес-анализу;
  • SWEBOK(Software Engineering Body of Knowledge) – по программной инженерии;
  • PMBOK (Project Management Body of Knowledge) – по управлению проектами;
  • DMBOK (Data Management Body of Knowledge) – по управлению данными;
  • EABOK (Enterprise Architecture Body of Knowledge) – по архитектуре предприятия.

Разумеется, это далеко не весь список профессиональных ИТ-стандартов. Некоторые менее известные, но также очень полезные на практике руководства (SEBoK, GISTBoK, CITBOK, ABOK) мы оставим за рамками данной статьи.

BABOK, EABOK и PMBOK для больших данных

BABOK предназначен для профессиональных бизнес-аналитиков. Но изложенные в данном стандарте методы и техники будут полезны Data Scientist’у, Data Analyst’у, Data Steward’у, архитектору, а также руководителю проектов цифровизации и внедрения новых технологий Big Data. В частности, умения понимать главную потребность заказчика и выявлять бизнес-требования позволят избежать фатальных ошибок на этапе проектирования новой системы и неловких ситуаций, когда итоговый результат не соответствует ожиданиям. Например, здесь мы рассказывали о типичных ошибках при реализации Data Science проектов.

С точки зрения ИТ-архитектуры и управления данными в BABOK наиболее интересна перспектива Business Intelligence (BI), которая в т.ч. включает концептуальную схему процессов работы с корпоративным хранилищем данных (Data Warehouse, DWH). Она не содержит детальных технических решений, однако достаточно наглядно показывает прикладной конвейер Big Data, от сбора данных из различных источников до трансформации в бизнес-инсайты c помощью DWH и BI-дэшбордов.

BI BABOK, Data Warehouse, Business Intelligence, business analysis
Концепция BI-решения по BABOK

При том, что BABOK включает также перспективу бизнес-архитектуры, существует отдельный свод знаний по архитектуре предприятия, EABOK. Это руководство разработано Центром инновационных вычислений и информатики MITRE, который финансируется правительственными учреждениями США. EABOK позиционируется как критический обзор проблем архитектуры предприятия в контексте корпоративных потребностей [1]. Текущая версия для печати помечена как черновик (Draft) от 6 февраля 2004 года и одобрена для публичного выпуска [2]. С тех пор новые версии не выпускались, однако официальный сайт проекта дополняется новыми материалами [3]. Данный стандарт включает описание наиболее популярных моделей корпоративных архитектур: Zachman Framework, TOGAF, FEA, DoDAF, MoDAF и т.д. Поэтому он, в первую очередь, предназначен для бизнес-архитектора и генерального руководителя, однако, пригодится также и ИТ-архитектору [4].

Здесь же стоит отметить еще один свод знаний широкого применения – PMBOK, который описывает суть процессов управления проектами в терминах их взаимной интеграции и взаимодействия, а также цели, которым они служат. Применительно к области Big Data, данный стандарт предлагает структурированный набор процессов и инструментов проектного менеджмента: от организационных структур до Agile-практик по внедрению новых технологий [5]. Таким образом, данный свод знаний будет полезен как профессиональному Project Manager’у, так и бизнес-аналитику, аналитику данных и руководителю проектов цифровой трансформации.

SWEBOK и DMBOK в области Big Data

Если основная аудитория BABOK, EABOK и PMBOK – это аналитики, архитекторы и руководители широкого профиля, то SWEBOK и DMBOK в большей степени сфокусированы на технических специалистах. В частности, все 15 областей знаний программной инженерии, изложенные в SWEBOK v3, актуальны для процессов разработки ПО [6]. А потому этот стандарт напрямую коррелирует с ежедневными задачами разработчика Big Data решений и Data Scientist’а, который пишет программный код для ML-алгоритмов.

Аналогичным образом, DMBOK можно назвать настольной книгой Data Scientist’а, Data Steward’a и аналитика данных. Этот свод знаний детально описывает процессы, методы и инструменты Data Governance, включая обеспечение качества и информационной безопасности, а также вопросы моделирования, хранения и использования данных, проектирования DWH и управление НСИ. Темы Big Data и Data Science рассматриваются на протяжении всей книги, в частности, главах, посвященных проектированию DWH, моделированию и аналитике больших данных. Из инструментальных средств упоминается экосистема Apache Hadoop и NoSQL-СУБД для хранения файлов Big Data. Впрочем, DMBOK содержит еще много интересных и по-настоящему прикладных материалов, которые пригодятся аналитику, архитектору, инженеру, стюарду, администратору и разработчику Big Data систем [7].

Data Management Body of Knowledge, DMBOK
Области знаний DMBOK

Подводя итог рассмотренным профессиональным стандартам, сделаем вывод в стиле капитана очевидность: каждый предметный Body Of Knowledge – это действительно полезные и необходимые для специалиста знания. На первый взгляд, изложение материалов в BOK может показаться слишком сухим и скучным. Впрочем, любые руководства – это не самое увлекательное чтиво, а рамочная инструкция по применению определенных инструментов для решения конкретных задач. Поэтому каждому стоит полюбить чтение профессиональных стандартов своей предметной области и периодически перечитывать их.

Другие инструменты управления знаниями в области больших данных и проектов цифровизации рассматриваются на специализированных курсах в нашем лицензированном учебном центре обучения и повышения квалификации для разработчиков, менеджеров, архитекторов, инженеров, администраторов, Data Scientist’ов и аналитиков Big Data в Москве:

Источники

  1. https://en.wikipedia.org/wiki/Enterprise_Architecture_Body_of_Knowledge
  2. https://www.mitre.org/sites/default/files/pdf/04_0104.pdf
  3. https://eabok.org/participate/reviewer-guidelines/
  4. https://habr.com/ru/post/276613/
  5. https://www.pmservices.ru/project-management-news/obzor-shestogo-izdaniya-rukovodstva-k-svodu-znanij-po-upravleniyu-proektami/
  6. https://ru.wikipedia.org/wiki/SWEBOK
  7. https://dama.org/sites/default/files/download/DAMA-DMBOK2-Framework-V2-20140317-FINAL.pdf