Рус | Eng
16 Марта 2020

В ВШМ рассказали, как быстро и дешево собирать и повышать качество данных

12 марта на Волховском пер., 3 состоялся практический семинар по краудсорсингу от специалистов команды Яндекс.Толока. Дарья Байдакова, менеджер образовательных проектов, Дмитрий Усталов, исследователь автоматической обработки языка, и Ольга Матвеенко, руководитель новых проектов в управлении краудсорсинга, рассказали, как правильно собирать и размечать данные на платформе Яндекс.Толока. 

 

Краундсорсинг — это методология сбора и разметки данных с помощью привлечения большого количества пользователей. Технология может использоваться большими компаниями, например, для того чтобы понять спрос и удовлетворить потребности покупателей или пользователей. Яндекс. Толока – это краудсорсинговая платформа от Яндекса, которая дает возможность пользователям зарабатывать денежные средства, а разработчикам — быстро и дешево собирать данные и повышать их качество. Исполнители получают вознаграждения за выполнение различных заданий: от поиска данных компаний и оценки качества контента, до анализа веб-ресурсов. Со стороны компаний и разработчиков сервис может использоваться в машинном обучении — работу с данными можно поставить на конвейер, в бизнесе — пользователям можно отдать рутинные задачи, и, тем самым, они сэкономят время и деньги бизнеса, и для анализа данных, т.к. возможности сервиса предоставляют условия для быстрой проверки гипотез и качественных экспериментов. 

 

По мнению Дарьи Байдаковой количество данных будет все время расти, и вместе с этим будет расти необходимость грамотно и быстро эти данные собирать и анализировать, что входит в задачи руководителей компаний, продуктовых менеджеров и маркетологов. Подобные Яндекс.Толока сервисы сокращают время работы с данными, и поэтому интерес к ним будет только увеличиваться.  

 

Студенты ВШМ и факультета прикладной математики СПбГУ приняли участие в практической части семинара, где попробовали реализовать на сервисе интересную задачу по анализу изображений, а теперь смогут с помощью платформы собрать данные для диплома, исследования или улучшить качество данных, с которыми им приходится работать.