Роли данных

Далее перечислены различные роли данных и соответствующие обязанности в рамках общего спектра задач по обнаружению и пониманию данных.

  • Бизнес-аналитик
  • Аналитик данных
  • Инженер данных
  • Специалист по обработке и анализу данных
  • Администратор базы данных

Бизнес-аналитик

Хотя роли аналитика данных и бизнес-аналитика в чем-то схожи, основное различие между ними заключается в том, что они делают с данными. Бизнес-аналитик ближе к бизнесу. Он является специалистом по интерпретации визуализированных данных. Часто обязанности аналитика данных и бизнес-аналитика лежат на одном человеке.

Аналитик данных

Аналитик данных позволяет компаниям повысить ценность своих ресурсов данных с помощью средств визуализации и создания отчетов, таких как Microsoft Power BI. Аналитики данных отвечают за профилирование, очистку и преобразование данных. В их обязанности входит также проектирование и создание масштабируемых и эффективных моделей данных, а также включение и внедрение возможностей расширенной аналитики в отчеты для анализа. Они работают с соответствующими заинтересованными лицами над определением необходимых требований к данным и отчетам, а затем отвечают за преобразование необработанных данных в важные и полезные сведения.

Аналитик данных также отвечает за управление ресурсами Power BI, включая отчеты, панели мониторинга, рабочие области и базовые наборы данных, используемые в отчетах. Он занимается реализацией и настройкой надлежащих процедур обеспечения безопасности с учетом требований заинтересованных лиц, чтобы гарантировать безопасность всех ресурсов Power BI и данных.

Аналитики данных работают с инженерами данных над определением и поиском соответствующих источников данных, отвечающих требованиям заинтересованных лиц. Кроме того, вместе с инженерами данных и администраторами баз данных они обеспечивают надлежащий доступ к необходимым источникам данных. Аналитик данных также работает с инженером данных над выработкой новых или улучшением существующих процессов сбора данных для анализа.

Инженер данных

Специалисты по инжинирингу подготавливают и настраивают локальные и облачные технологии платформы данных. Они управляют потоком структурированных и неструктурированных данных из нескольких источников и обеспечивают его безопасность. Используемые ими платформы данных могут включать реляционные базы данных, нереляционные базы данных, потоки данных и хранилища файлов. Инженеры данных также обеспечивают безопасную и беспроблемную интеграцию служб данных.

В число их основных обязанностей входят прием, передача и преобразование данных из нескольких источников с помощью локальных и облачных служб и средств. Инженеры данных работают совместно с заинтересованными лицами для определения и выполнения требований к данным. Они проектируют и внедряют решения.

Хотя задачи и обязанности инженера данных и администратора базы данных могут в чем-то соприкасаться, область ответственности инженера данных выходит далеко за пределы обслуживания базы данных и сервера, на котором она размещена. Кроме того, в нее, как правило, не входит общее управление операционными данными.

Специалист по инжинирингу данных существенно повышает ценность проектов бизнес-аналитики и обработки и анализа данных. Когда инженер данных выполняет первичную обработку данных, выполнение проектов ускоряется, так как специалисты по анализу и обработке данных могут сосредоточиться на других участках работы.

Аналитик данных тесно сотрудничает с инженером данных над обеспечением доступа к различным структурированным и неструктурированным источникам данных, а также оказывает поддержку при оптимизации моделей данных, которые обычно предоставляются из современного хранилища или озера данных.

Как администратор базы данных, так и специалист по бизнес-аналитике может стать специалистом по инжинирингу данных, изучив средства и технологии, используемые для обработки больших объемов данных.

Специалист по обработке и анализу данных

Специалисты по анализу и обработке данных отвечают за углубленную аналитику, помогающую повысить ценность данных. Их задачи могут варьироваться от описательной до прогнозной аналитики. Описательная аналитика позволяет оценивать данные в рамках процесса разведочного анализа данных (EDA). Прогнозная аналитика применяется в машинном обучении для обнаружения аномалий или закономерностей путем моделирования. Она является важной частью прогнозных моделей.

Описательная и прогнозная аналитика — это далеко не все аспекты работы специалиста по анализу и обработке данных. Она может простираться в область глубокого обучения и предполагать итеративное проведение экспериментов для решения сложных проблем с помощью настраиваемых алгоритмов.

Множество отдельных примеров свидетельствуют, что основная часть работы в рамках проекта обработки и анализа данных приходится на первичную обработку данных и конструирование признаков. Специалисты по анализу и обработке данных ускоряют проведение экспериментов, в то время как специалисты по инжинирингу данных применяют свои навыки для успешной первичной обработки данных.

При поверхностном взгляде может показаться, что работа специалиста по анализу и обработке данных и аналитика данных совершенно разная, но это впечатление обманчиво. Специалист по анализу и обработке данных изучает данные, чтобы определить вопросы, требующие ответа, и часто выдвигает гипотезу или эксперимент, после чего обращается к аналитику данных за помощью в визуализации данных и создании отчетов.

Администратор базы данных

Администратор базы данных реализует и контролирует рабочие аспекты облачных и гибридных решений платформы данных на основе служб данных Microsoft Azure и Microsoft SQL Server. Он отвечает за общую доступность и стабильную производительность, а также оптимизацию решений для баз данных. Он работает с заинтересованными лицами над определением и внедрением политик, средств и процессов для резервного копирования и планов восстановления.

Роль администратора базы данных отличается от роли инженера данных. Администратор базы данных отслеживает и контролирует общую работоспособность базы данных и оборудования, на котором она размещается, в то время как инженер данных участвует в процессе первичной обработки данных, то есть принятии, преобразовании, проверке и очистке данных в соответствии с потребностями бизнеса.

Администратор базы данных также отвечает за управление общей безопасностью данных, предоставление и ограничение доступа пользователей к данным в соответствии с потребностями бизнеса.