10 октября 2023
Антон Вдовенко — data scientist в компании UCARE.AI в Сингапуре, выпускник бакалавриата ВШМ СПбГУ и индустриальный консультант проекта ВШМ СПбГУ «Как построить карьеру мечты». Data аналитик, data scientist, BI, data инженер или machine learning инженер — Антон помогает студентам Бизнес-школы разобраться в нюансах профессий. В интервью он рассказывает о собственном пути и основных вызовах с которыми сталкиваются покорители Big Data.
«Как построить карьеру мечты» — это интерактивная программа, состоящая из инструментов по самопознанию, карьерного гида и работы с индустриальными консультантами — выпускниками ВШМ СПбГУ, успешно работающими в разных сферах бизнеса. На программе можно узнать диапазон зарплат на той или иной позиции и требования работодателей. Теория подкреплена примерами задач, которые предстоит решать в компаниях.
Антон, расскажите, пожалуйста, чем занимается компания UCARE.AI?
Сейчас наша компания создает медицинский чат GPT для докторов и больниц. Это одно направление, а другое — система оптимизации процессов для больниц, в том числе на основе AI. Например, доктор говорит: — «Выпиши мне такого-то пациента», — и чат делает документы, которые для того нужны. «Сделай мне выжимку по пациенту», — и чат собирает историю болезни. Это такой виртуальный помощник, ассистент и советчик — несколько продуктов, которые можно объединить в один большой пакет.
А именно ваша задача в чем заключается?
У нас в команде пять человек. Я собираю различные данные. Есть базы данных медицинские, есть медицинские журналы. Врачей не интересует, как стандартно лечить болезнь, им нужны новые знания, которые можно почерпнуть из исследований и статей.
Я нахожу эти новые статьи, данные трансформирую, кладу их в embanding store, делаю большое хранилище, а потом – специальный pipeline, который должен будет доставать информацию из этих сторов, когда доктор попросит. Параллельно я помогаю своей команде, мы пробуем разные модели, чтобы давать докторам лучшие ответы. Это главное направление, а еще мы активно экспериментируем.
Ваша должность называется правильно «специалист по работе с данными»?
Моя должность называется data scientist. А если по-русски — это инженер искусственного интеллекта. Конкретно в моей команде я больше занимаю позицию machine learning engineer. То есть data scientist в чистом виде тратит больше времени на то, что делает модели и работает в стол. У нас маленький стартап, поэтому у нас нет такого четкого ограничения, что ты — data scientist, ты — data engineer, а ты — machine learning engineer. Мы все вместе взаимодействуем.
Как вы пришли в профессию?
Я закончил в Питере бакалавриат ВШМ СПбГУ, а потом приехал в Сингапур учиться в магистратуре по финансам. Я ее закончил достаточно успешно, но найти работу в Сингапуре, которая бы меня устроила, не получилось. Я достаточно долго искал и нашел работу помощником менеджера по клиентам. Но эта работа достаточно скучная, не очень сильно интеллектуальная, мне она не нравилась. Параллельно я начал смотреть на позицию data scientist. Очень много было тогда информации о том, что это работа 21 века. Я понял, что хочу в этом разбираться, смотреть, и меня затянуло. Поскольку я не смог найти работу в Сингапуре, я решил поставить все на зеро и пойти во вторую магистратуру в моем же университете в Сингапуре, но уже по искусственному интеллекту, а после окончания я достаточно быстро нашел работу.
Расскажите, пожалуйста, об участии в проекте ВШМ СПбГУ «Как построить карьеру мечты». Как проходили консультации, что полезного узнали студенты?
В целом, в этой индустрии две большие проблемы. Первая — это высокая вариативность работы . То есть я, как data scientist, занимаюсь одним, мои друзья в других компаниях совершенно другим. Это огромное поле, которое подразумевает под собой различные вариативности того, что нужно делать на работе. Если тебя спрашивают: «кто ты? — я профессор, я учу детей математике», — это как бы подразумевает, что все профессора математики в разных школах учат примерно одному и тому же. А data science — это совершенно разное может быть.
Второй момент — это высокий порог входа , потому что джуниор data scientist — это оксюморон. Чтобы попасть на должность data scientist, ты должен знать разработку, ты должен знать математику, ты должен иметь domain knowledge , ты должен знать много всего и сразу. Именно поэтому, когда начальная позиция — может быть 1000 человек на должность, это такая жесткая воронка, кровавая. А уже на мидл и сениор — недостаток. И, казалось бы, если столько народу пытается, почему бы компаниям их не взять и не обучить, чтобы получить своих специалистов? Потому что обучить с нуля — это очень дорого, тяжело. Люди, которые пытаются войти в эту индустрию, потом разочаровываются и не хотят дальше идти. Проще быть data analyst, например, там порог входа ниже.
И поэтому я консультировал двух человек из ВШМ СПбГУ, помогал определиться с тем, чего они хотят. Одна девушка больше хотела стать data analytic, а другой молодой человек хотел стать именно data scientist.
То есть важно определиться, в какую именно сторону двигаться?
Я бы сказал, сначала нужно определиться с должностью. То есть это data аналитик, data scientist, BI, data инженер или machine learning инженер, пять разных должностей. А затем определиться, чем, как data scientist, ты можешь заниматься. Ты можешь заниматься NLP, то, что сейчас популярно — чат GPT, можешь заниматься чем-то более нишевым, например, рекомендательными системами, табличными данными, компьютерным зрением, какой-то аналитикой, финансовыми предсказаниями на рынке Форекс.
Почему вы решили поучаствовать в проекте?
Этот шкурный интерес был, попробовать себя в роли наставника. Потому что когда объясняешь другим людям, сам начинаешь лучше понимать. В свое время я очень сильно страдал, мне пришлось очень много читать, пытаться, набивать шишки. Если бы в прошлом у меня был человек, который помог бы мне хотя бы определиться с направлением, помочь, я бы очень оценил такую помощь. И я решил стать таким человеком. Если не для себя, то для других.
Какие должны быть особенности или умения у человека, чтобы он успешно вошел в профессию? Какие хард и софт скиллы?
Если вы идете в data science только ради денег, то вы очень быстро перегорите. Нужно обладать определенным любопытством и аналитическим складом ума. И самое важное — во многие фирмы data scientists берут не просто как инженеров, а как консультантов. Не все люди обладают инженерными навыками, многим нужно уметь объяснить все простым языком клиенту. Нужны хард скиллы: разработка на языке програмирования питон, знания алгоритмов машинного обучения, знания облачных технологий. Если у вас присутствует комбинация хард и софт скиллов, можно работать data scientist в любой компании.
Что бы вы могли себе в прошлом, когда вы только начинали входить в эту профессию, посоветовать?
Чуть быстрее определиться с нишей, потому что в самом начале сложно быть генералистом (generalist). И второе — при наличии времени я бы дал себе не один год, чтобы получить работу, а три года, наверное, больше фундаментальных знаний по математике. Если ты имеешь знания по математике, тебе проще читать научные статьи, тебе проще переводить научные статьи в код. Именно хорошие математические скиллы — это то, что может выгодно отличить многих data scientists сейчас от других.
При использовании данного сайта Вы подтверждаете свое согласие на использование ВШМ СПбГУ cookie файлов. С подробной информацией Вы можете ознакомиться, перейдя по ссылке.