На главную страницу AlgoNet В сотрудничестве с ZDNet
АРХИВ СТАТЕЙ 2002-7-4 на главную / новости от 2002-7-4
AlgoNet.ru
поиск

 

Место для Вашей рекламы!

 

Все новости от 4 июля 2002 г.

Чип поможет компьютерам обрести объемное зрение

Мозг человека судит о расстоянии до объектов, сравнивая несколько различающиеся картины, которые видят правый и левый глаз. Tyzx обещает встроить аналогичный механизм стереозрения в видеокамеры.

Компания заложила соответствующий алгоритм обработки изображений в специальную микросхему DeepSea, которая позволяет процессору определять не только цвет каждого элемента изображения, но и расстояние до него от камеры. Эта технология может оказаться очень полезной для систем наблюдения, расширив возможности слежения за посетителями банков, магазинов или аэропортов. Однако стереоскопическое зрение может найти применение и в других областях, помогая сфокусировать внимание компьютера и «вырезать» подлежащие обработке фрагменты данных.

Например, робот-пылесос с системой распознавания образов, пытаясь разглядеть ножку стола, не будет пытаться разобраться в узоре обоев на противоположной стене. А автомобилям эта технология поможет лучше распознавать препятствия, отфильтровывая визуальный шум. «Главное преимущество алгоритма — это сегментация. Она позволяет выделить интересующую вас часть изображения, — говорит Такео Канаде (Takeo Kanade), пионер компьютерного стереозрения из Университета Карнеги-Меллона и член независимого консультативного комитета Tyzx. — Вы получаете картину не только цвета каждого элемента изображения, но и расстояний до него. Это значительно упрощает решение таких задач, как обнаружение и распознавание предметов».

Первые заказчики Tyzx — исследовательские лаборатории, но технологию оценивают и другие потенциальные бизнес-партнеры, сказал в интервью генеральный директор компании Рон Бак (Ron Buck ). В числе покупателей системы Tyzx компания MD Robotics, производитель роботизированного манипулятора для Space Shuttle и — в перспективе — для Международной космической станции. А компания ChevronTexaco использует систему Tyzx для исследований в сфере «расширенной реальности» — дополнения картины, которую видит человек, компьютерным изображением, например при управлении кранами на нефтедобывающих платформах в плохую погоду.

Tyzx надеется найти заказчиков в военной и охранной сферах, а когда снизятся цены распространить свою технологию и на сферу «интеллектуальных зданий», где двери открываются автоматически, а если кто-то остается без движения в течение ненормально долгого времени, система управления сама вызовет «скорую».

Однако на этапе перехода от идеи к работающему продукту Tyzx столкнулась с серьезными трудностями. «Я уверен, что это грандиозная идея, — говорит Канаде. — Концептуально это легко, но вычислительная задача очень сложна». Компанию поддерживает инвестиционная фирма Vulcan Ventures, принадлежащая соучредителю Microsoft Полу Аллену (Paul Allen). В Tyzx работает не более 20 сотрудников, некоторые из них имеют многолетний опыт исследований в этой области. Джон Вудфил (John Woodfill) и Гейл Гордон (Gaile Gordon) основали Tyzx в начале 2001 года, но большую часть работ они провели еще до этого. Основная формула, реализуемая специализированным чипом, восходит к 1990 году, а его прототип Tyzx изготовила примерно год назад. Однако лишь недавно идеи компании стали экономически оправданными.

Видит око...
Между тем стереозрение может дать ощутимый толчок развитию компьютеров, однако машины еще не скоро смогут достичь того совершенства, с которым устроено зрение человека. «Зрение для нас настолько естественно, что трудно себе представить, насколько сложен этот процесс, — говорит специалист по вычислительной нейробиологии Университета Карнеги-Меллона Дэвид Турецки (David Touretzky). — Мы сможем оценить это лишь тогда, когда люди попробуют создать зрячую компьютерную систему».

Под обработку визуальной информации отведена большая часть мозга приматов, утверждает Турецки. Свыше 20 разных специализированных участков мозга занято решением таких задач, как распознавание движения, цветов, форм и пространственного соотношения между объектами. Все эти участки взаимодействуют между собой пока не вполне понятным образом, но вместе они позволяют мозгу отличать край тени от края объекта или компенсировать изменение цветовой гаммы, когда солнце садится.

Система из 60 камер конкурента Tyzx компании ViewPlus Tyzx не единственная компания, старающаяся сделать бизнес на компьютерном стереозрении. Microsoft Research работает над технологией, извлекающей 3D-информацию из двумерных изображений. А Point Grey Research уже выпустила на рынок стереокамеру, однако для выполнения ее алгоритмов требуется полноценный компьютер. Японская фирма ViewPlus, которая сотрудничает с Point Grey Research, объединяет целых 60 камер в сферическую систему, выдающую одновременно 20 потоков видеоинформации.

В одном отношении проекты всех этих компаний существенно отличаются от того, что предлагает Tyzx: их системы сопоставляют более двух изображений. Может показаться, что три изображения сравнивать сложнее, но на самом деле чем больше обрабатывается данных, тем проще задача процессора, поясняет Канаде из Университета Карнеги-Меллона.

Процессор DeepSea
В основе разработки Tyzx лежит специализированный чип, исполняющий так называемый алгоритм census correspondence, который быстро обнаруживает подобие в двух потоках видеоизображений, разбитых на квадраты со стороной 512 пикселов. 33-МГц чип DeepSea способен выполнять такое сравнение над изображениями размером 512 х 512 пикселов 125 раз в секунду, но потребляет при этом гораздо меньше энергии, чем универсальные процессоры вроде Intel Pentium. «Это позволяет производить невероятно интенсивный поиск подобных элементов изображения — очень быстро и по очень низкой цене, благодаря чему мы сможем наделить компьютеры стереозрением», — говорит генеральный директор Бак.

Еще одна важная разработка, необходимая для решения задач Tyzx, — это чувствительные элементы для камеры, выполненные на базе сравнительно недорогой технологии КМОП, применяемой в большинстве компьютерных микросхем. Современные цифровые камеры используют более совершенную, но и более дорогую технологию «приборов с зарядовой связью (ПЗС).

Около 10 лет назад Канаде построил дорогую, но оригинальную систему стереозрения с множеством процессоров, способную определять дальность, сравнивая изображения, поступающие от нескольких камер. С тех пор возможности компьютеров значительно повысили потенциал этой технологии, и Канаде уверен, что стереокамеры станут такими же дешевыми, как обычные современные видеокамеры. «Меня очень воодушевляют различные достижения, которые сделали возможным стереозрение реального времени. Проект Tyzx имеет все шансы стать успешным», — заверил он. 

 Предыдущие публикации:
2001-09-06   Microsoft демонстрирует новые технологии
2001-10-26   Linux-робот сделает первые шаги в Европе
2002-06-24   Робот с характером
 В продолжение темы:
2002-07-08   Casio представила сверхкомпактные цифровые камеры
2002-10-03   За «Клинским» побежит робот-лаптоп
2002-10-04   Эволюция компьютерной мыши
2003-01-01   Наделяя роботов даром зрения
Обсуждение и комментарии
Николай - zavnickrambler.ru
19 Jan 2003 5:47 PM
Мне хотелось бы знать на сколько точно произходит определение растояние до объекта. Каким образом удалось идентифицировать сегмент одного изображения (или даже пиксела на нем) с частью другого изображения, ведь как я знаю чтобы узнать точную координату точки в пространстве нужно знать ее точные координаты на стереоснимках
 

Николай - zavnickrambler.ru
19 Jan 2003 5:50 PM
где я могу найти более подробную информацию по данному проекту, желательно на русском языке?
 

 

← июнь 2002 1  2  3  4  5  6  8  9  10 август 2002 →
Реклама!
 

 

Место для Вашей рекламы!