Российские ученые разработали первую универсальную систему машинного зрения, которая может распознавать трехмерные объекты и результативно работать с любыми тестами. Эта разработка будет иметь применение в таких областях, как робототехника, дополненная реальность и 3D-сканирование.
Ранее исследователи создавали специализированные модели с уникальными настройками для каждого типа задач по распознаванию объектов и для различных наборов данных, что замедляло процесс работы и ограничивало возможности использования моделей. Новая архитектура модели, основанная на трансформере-кодировщике, позволяет избежать этих ограничений.
UniDet3D является первой универсальной моделью, которая демонстрирует высокую эффективность на всех основных бенчмарках для детекции 3D-объектов без необходимости адаптации к каждому набору данных.
Эксперименты подтвердили, что новую модель можно постепенно обучать обрабатывать разнообразные наборы данных и эффективно распознавать объекты в различных типах «облаков точек», а также координат, полученных с использованием лазерных радаров и других трехмерных сканеров. Исследователи надеются, что данный подход сможет ускорить разработку систем трехмерного зрения и повысить качество их функционирования.
Разработка найдет применение в таких областях, как робототехника, дополненная реальность и 3D-сканирование, в том числе при проектировании зданий и создании цифровых копий реальных помещений.
Источник: @vremyavperedrus