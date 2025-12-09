ИИ для беспилотных авто научился «читать мысли» пешеходов

Телеканал «Наука»

Разработчики искусственного интеллекта для управления беспилотным автомобилем утверждают, что научили его «читать мысли» пешеходов.

Этот ИИ работает на базе мультимодальной большой языковой модели — такой же, что положена в основу ChatGPT и прочих всем нам хорошо известных сервисов. Только вместо генерации текстов или описания картинок она объединяет визуальные сигналы с контекстной информацией, чтобы в реальном времени предсказывать намерения пешеходов на дороге.

Разработка получила название OmniPredict. Она не пригодна к практическому применению — это пока исследовательский прототип, — но результаты первых тестов уже весьма многообещающие: модель показала исключительно высокую точность даже без специализированного обучения.

«Города непредсказуемы. Пешеходы тоже бывают непредсказуемы. Наша новая модель — это взгляд в будущее, где машины не просто видят, что происходит, но и предвосхищают вероятные действия людей», — говорит профессор Срикант Сарипалли, ведущий исследователь проекта и директор Центра автономных транспортных средств и сенсорных систем Техасского университета A&M.

Новый уровень «уличной сообразительности»

В гонке за безопасность беспилотных автомобилей OmniPredict выводит «уличную смекалку» на новый уровень — приближая ее к человеческой интуиции.

Вместо того чтобы просто реагировать на действия пешеходов, система предугадывает, что они собираются сделать. Такой подход может изменить принципы городской мобильности и движения автономных транспортных средств. Может измениться и психологический ландшафт взаимодействия.

Представьте: вы стоите у пешеходного перехода, и вместо зрительного контакта с водителем-человеком вы знаете, что автомобиль с ИИ отслеживает ваше положение и планирует свои действия, исходя из ваших вероятных следующих шагов.

«Меньше растерянности на переходе, меньше опасных ситуаций. Движение на улицах может даже стать более плавным — и все потому, что транспортные средства понимают не только движение, но, что важнее, мотивы», — объясняет Сарипалли.

Чтение поведения человека в сложных условиях

Возможности OmniPredict выходят далеко за рамки оживленных городских улиц, хаотичных перекрестков и заполненных людьми переходов.

«Мы открываем путь к различным применениям. Например, возможность для машины эффективно обнаруживать, распознавать и прогнозировать действия человека, демонстрирующего угрожающие признаки», — продолжает профессор.

ИИ, способный считывать изменения позы, колебания, ориентацию тела или признаки стресса, может стать прорывом для военных и спасательных служб.

«Он мог бы помогать выявлять ранние индикаторы риска и повышать осведомленность о ситуации», — полагает ученый.

В таких сценариях новый подход мог бы дать специалистам возможность быстро интерпретировать сложную обстановку и принимать более оперативные и обоснованные решения.

«Наша цель в этом проекте — не заменить людей, а дополнить их более умным помощником», — подчеркивает Сарипалли.

Испытание практикой

Традиционные системы автономного вождения полагаются на компьютерные модели зрения, обученные на тысячах наборов данных и изображений. Хотя эти модели мощны, они с трудом адаптируются к меняющимся условиям.

«Погодные изменения, неожиданное поведение людей, редкие события и хаотичные элементы городской улицы могут повлиять даже на самые совершенные системы, основанные на зрении», — констатирует Сарипалли.

OmniPredict использует другой подход. Он не просто видит сцену, а интерпретирует ее и предсказывает, как каждый элемент может переместиться, корректируясь в реальном времени.

Систему протестировали на двух наиболее сложных наборах данных для исследования поведения пешеходов — JAAD и WIDEVIEW, — не проводя никакого предварительного специализированного обучения. Результаты опубликованы в журнале Computers and Electrical Engineering.

Они показали, что OmniPredict достиг впечатляющей точности в 67%, превзойдя новейшие модели на 10%. Эффективность сохраняется даже при добавлении контекстной информации, например, о частично скрытых пешеходах или людях, смотрящих в сторону автомобиля.

Кроме того, ИИ продемонстрировал более высокую скорость реакции, лучшую обобщающую способность в разных дорожных условиях и более надежное принятие решений по сравнению с традиционными системами.

Поворот к автономности и предвидению

Разработчики OmniPredict уверены, что будущее именно за такими средствами, которые меньше основаны на примитивном анализе визуальной информации и больше — на поведенческой логике. Объединяя логические рассуждения с восприятием, система открывает и обеспечивает новый вид коллективного интеллекта — мир, в котором автоматизация становится не просто повсеместной, но и во многом интуитивной.

«OmniPredict не просто видит, что мы делаем, — она понимает, почему мы это делаем, и теперь может предсказать, когда мы, вероятно, совершим действие», — резюмирует Сарипалли.

Если автомобили с ИИ могут прочитать наш следующий шаг, дорога станет намного умнее.