Аналитики данных: использование ИИ в профессиональной деятельности

Нейросети и быстрое развитие ИИ в целом, а также постепенное распространение ИИ-агентов в ежедневной работе меняют подход к работе аналитика данных. Однако действительно ли это меняет суть и структуру его работы? В этой статье расскажут о том, какие знания и навыки нужны аналитику, чтобы использовать ИИ для базовых задач без ущерба для качества, и как можно использовать нейросети во внутренних процессах работы. Ключевая мысль для понимания места нейросетей в работе аналитика: ИИ — это не магическая кнопка, а технический инструмент, такой же как Python или Excel. Чтобы он был полезен в работе, аналитику всё равно нужны профессиональные навыки.

Этот раздел — для тех, кто только начинает свой профессиональный путь аналитика данных или ещё думает о том, чтобы сюда прийти. Если вы уже бывалый или поработали хотя бы полгода в этой сфере — можно смело пропустить, вы это и так знаете.

Работа аналитика — это всегда работа с данными в том или ином виде. Звучит интересно, но на старте (особенно когда человек только приходит в профессию) иногда может возникать диссонанс между ожиданиями и реальностью. Нам часто в фильмах рисуют такую картинку: есть большая компания, она занимается серьёзными делами, всё профессионально и все при деле — аналитики, программисты, менеджеры и так далее. И какому-нибудь условному аналитику поручают задачу: изучить данные и найти взаимосвязь между разными событиями или сделать выводы на основе уже произошедших событий. Дальше наш киношный аналитик с задумчивым видом изучает статьи, рисует таблицы маркером на стеклянной перегородке, ходит по кабинету и с прищуром смотрит в окно, крутя в мыслях взаимосвязи и многомерные структуры данных. Потом он случайно замечает какую-то мелочь — и благодаря ей вся картинка тут же срастается в единое целое. Он тут же обводит пару строк в распечатках и победно заходит в кабинет шефа, всем видом показывая, что он разгадал эту загадку. Но в реальности чаще всего всё обстоит иначе. Работа аналитика данных — это не игра в Шерлока Холмса, где всё решает озарение и случайность, а методичная и целенаправленная работа, которая со стороны часто выглядит не так красочно, как в кино. Но именно такой вдумчивый, методичный и временами рутинный подход позволяет аналитикам данных решать поставленные перед ними задачи, а компаниям — достигать бизнес-целей. За это и платят аналитикам — за то, что при правильном подходе и знании своих инструментов они разбираются в том, что происходит сейчас (и почему), и делают выводы о том, что может произойти. На самом деле то, что показывают в кино — это, скорее, работа специалиста аналитического отдела достаточно высокой квалификации. В жизни такие люди тоже есть в компаниях, но они чаще всего как раз опираются на информацию, которую до этого подготовили как раз аналитики данных. И без них им работать было бы во много раз сложнее.

Теперь поговорим о том, какие знания и навыки используют аналитики данных в работе с ИИ чаще всего. Если в них разобраться и освоить на хорошем уровне — эффективность и качество аналитической работы с ИИ повысятся многократно.

Понимание SQL и логики агрегаций.

Аналитик данных работает с данными — это логично и следует из названия профессии. А данные почти всегда хранятся в базах данных, и с вероятностью около 90% это будет что-то SQL-подобное (а зная принципы работы с SQL разобраться в остальных СУБД и запросам к ним не составит труда). Отсюда вытекает первый важный навык: аналитик должен уметь «вытащить» из базы нужные ему данные и знать, как их можно обработать в процессе. Начинающие аналитики часто делают так: делают запрос в нейросеть вида «Напиши мне запрос к базе данных, который отберёт информацию из вот таких таблиц по вот таким признакам». Звучит логично, но это опасный подход. ИИ без проблем может сгенерировать SQL-запрос, но без понимания логики агрегаций аналитик не заметит ошибок: дубликации, неверных группировок, некорректных фильтров. Понимая GROUP BY, JOIN, COUNT, SUM, AVG, аналитик может точно описать задачу модели и быстро проверить результат. И иногда это будет быстрее, чем просить об этом нейросеть, а потом проверять, точно ли она сделала то, что нужно. К примеру, ИИ может посчитать средний чек как AVG(price), не учитывая количество товаров в заказе. А аналитик знает, что ему вместо этого нужно рассчитать SUM(totalprice) / COUNT(orderid). Да, это тоже можно описать в запросе, но из практики скажут, что гораздо быстрее всё это сделать руками и без перепроверки за машиной.

Знание бизнес-метрик и того, как они считаются.

ИИ часто не знает контекста бизнеса или специфики вашего продукта, даже если в него сгрузить всю внутреннюю документацию (чего делать точно не рекомендуется как минимум из соображений корпоративной инфобезопасности). Он, конечно, сможет посчитать метрику и она будет выглядеть правдоподобно, но к реальности это не будет иметь никакого отношения. Классика жанра: если ИИ выдаёт Retention 120%, аналитик даже с базовыми знаниями сразу поймёт, что где-то в логике ошибка, так как удержать людей больше, чем пришло, невозможно. Нейросети не знают ничего о ваших задачах и о том, чем занимается компания, в которой вы работаете. Она часто отталкивается от каких-то своих средних значений, которые были в корпусе знаний, на которых её обучали — но это не означает, что эти средние значения применимы в вашем конкретном случае. Например, в среднем по рынку может считаться, что нормальный ROI в вашем секторе должен быть на уровне 15-30%. Но вы как аналитик знаете, что масштабы операционной деятельности позволяют считать ROI иначе (и они у вас считаются хорошими уже при 5-7%) — а оценка нейросети здесь получается абсолютно неверной.

Навык формулирования чётких запросов

По сути, это навык постановки задачи — неважно кому, коллеге-стажёру или нейросети. Без этого ИИ либо будет давать поверхностные ответы, либо, что хуже, уверенно генерировать некорректные решения и подавать их как что-то общеизвестное. Вообще, относиться к ИИ как к стажёру-первокурснику — хороший подход, сразу отрезвляет и убирает ненужные иллюзии.

Например, плохой промпт звучит расплывчато:

«Посчитай отток пользователей»,

даже если приложены все таблицы с исходными данными. Плохо здесь то, что не даны никакие критерии — и нейросеть начинает отталкиваться или от своих каких-то представлений об оттоке (причём, неизвестно, каких), либо решает эту задачу максимально примитивно. Расплывчатый промпт стимулирует модель делать допущения. Хорошо, если модель об этом хотя бы предупреждает. А если нет? Хороший промпт наоборот максимально конкретизирует задачу:

«Напиши SQL-запрос для PostgreSQL к таблице sessions (user_id, timestamp). Считай пользователем в оттоке того, кто не заходил более 30 дней с момента последнего визита. Исключи тестовые аккаунты с доменом @test.com».

Но даже здесь хорошо бы попросить нейросеть давать свои комментарии по ходу рассуждений и её логики. Главное в этом навыке — никогда сходу не доверять ИИ-ответам и пропускать их через внутренний фильтр своих знаний. Без этого аналитик данных превращается в оператора чат-бота и его ценность как специалиста резко падает.

ИИ как инструмент для «внутренних» процессов аналитика

Сегодня аналитики чаще всего используют ИИ для оптимизации собственных рабочих процессов. Цель такого подхода — сократить время на рутинные и несложные операции, с которыми нейросеть справляется примерно так же, как человек, но значительно быстрее. При этом здравый смысл остаётся ключевым: аналитики поручают ИИ только те задачи, которые способны выполнить сами, чтобы иметь возможность оценить корректность результата и вовремя заметить ошибки.

Понимание, рефакторинг и написание кода

Для аналитика SQL-запросы, Python-скрипты и dbt-модели — неотъемлемая часть его работы. ИИ хорошо справляется с черновиками, подсказками по синтаксису, упрощением сложных конструкций и поиском ошибок. А ещё, поскольку аналитик часто работает с уже существующими процессами и моделями, нейросеть может помочь быстрее разобраться в логике запроса и объяснить, что именно считается и откуда берутся метрики. Это хорошо работает для генерации объяснения сложных SQL-запросов, подсказок по синтаксису (оконные функции, CTE, фильтры), упрощения вложенных запросов, а также поиска опечаток и логических неточностей. ИИ может искать ошибки в конкретном куске кода, а также объяснять общие подходы написания кода.

Но в задачах, требующих глубоких знаний бизнес-логики и связей между таблицами базы данных, ИИ может допускать критичные для бизнеса логические ошибки. Хороший аналитик должен знать эти ограничения и не доверять тут компьютеру что-то сложнее базовых задач.

Автоматизация рутины

Рутина — часть работы аналитика, и вот какую-то её часть вполне можно поручить нейросети. Например, ИИ работает хорошо для написания документации к коду и моделям, описания полей и таблиц — всё это снижает когнитивную нагрузку и экономит время аналитика. Важно отметить: ИИ здесь не заменяет аналитика, а выступает в роли ускорителя для решения стандартных задач (именно стандартных, это важно). Ответственность за корректность логики, интерпретацию результатов и бизнес-контекст по-прежнему остаётся за человеком.