Одним из наиболее утомительных аспектов машинного обучения является предоставление набора меток для обучения модели машинного обучения тому, что ей нужно знать. Snorkel AI хочет, чтобы экспертам в данной области было проще применять эти ярлыки программно, и сегодня стартап объявил о серии B на сумму 35 миллионов долларов.
Компания также анонсировала новый инструмент под названием Application Studio, который позволяет создавать стандартные приложения для машинного обучения с использованием шаблонов и предопределенных компонентов.
Lightspeed Venture Partners возглавили раунд с участием предыдущих инвесторов Greylock, GV, In-Q-Tel и Nepenthe Capital. К ним также присоединились новые инвесторы Walden и BlackRock. Стартап сообщает, что в настоящее время он привлек 50 миллионов долларов.
Соучредитель и генеральный директор компании Алекс Ратнер говорит, что маркировка данных остается огромной проблемой и препятствием для продвижения машинного обучения и искусственного интеллекта во многих отраслях, потому что это дорого, трудоемко и сложно для экспертов в этой области. чтобы выкроить время для этого.
«Сегодня не такой уж скрытый секрет ИИ заключается в том, что, несмотря на все технологические и инструментальные достижения, примерно 80-90% стоимости и времени для среднего проекта ИИ уходит только на ручную маркировку, сбор и перемаркировку. эти тренировочные данные», - сказал он.
Он говорит, что его компания разработала решение, упрощающее этот процесс, чтобы экспертам было легче программно добавлять метки. от месяцев до часов или дней, в зависимости от сложности данных.
Поскольку компания разработала эту методологию, клиенты обращались за помощью на следующем этапе процесса машинного обучения, который заключается в использовании данных обучения и модели и создании приложения. Вот где на помощь приходит Application Studio. Это может быть классификатор контрактов в банке или детектор сетевых аномалий в телекоммуникационной компании, и он помогает компаниям сделать следующий шаг после маркировки данных.
«Речь идет не только о том, как вы программно маркируете данные, но и о моделях, препроцессорах, постпроцессорах, и поэтому мы сделали это теперь доступным в своего рода шаблонном и визуальном интерфейсе без кода., - сказал он.
Продукты компании основаны на исследованиях, начатых в Стэнфордской лаборатории искусственного интеллекта в 2015 году. Основатели потратили четыре года на этап исследований, прежде чем запустить Snorkel в 2019 году. Сегодня в стартапе работает 40 сотрудников. Ратнер признает проблемы, с которыми сталкивается технологическая отрасль с точки зрения разнообразия, и говорит, что он приложил сознательные усилия для создания разнообразной и инклюзивной компании.
«Что я могу сказать, так это то, что мы пытались расставить приоритеты на уровне компании, на уровне всей команды и на уровне совета директоров с самого первого дня, а также предприняли соответствующие действия. Таким образом, мы работаем с внешними фирмами для внутреннего обучения и аудита и стратегии вокруг DEI, и мы сделали разнообразие конвейера не подлежащим обсуждению требованием любого из наших контрактов с рекрутинговыми фирмами », - сказал он..
Ратнер также признает, что автоматизация может жестко кодировать предвзятость в моделях машинного обучения, и он надеется, что, упростив процесс маркировки, будет намного легче обнаруживать предвзятость, когда она происходит.
«Если вы начинаете с дюжины или двух десятков функций, которые мы называем маркировкой в Snorkel, вам все равно нужно проявлять бдительность и упреждать попытки обнаружить предвзятость, но легче проверить, чему научилась ваша модель, чтобы изменить ее. просто вернувшись назад и просмотрев пару сотен строк кода».