Блог VR Concept
ОБРАЗОВАНИЕ

Оценка алгоритмов машинного обучения для классификации ЭЭГ-сигналов, вызванных визуальной стимуляцией, при просмотре 2D и 3D VR-видео

2025-04-09 01:15
Понимание различий в восприятии двухмерной и трёхмерной виртуальной реальности (VR) на уровне нейронной активности открывает новые горизонты в разработке адаптивных VR-сред. В данной статье мы рассматриваем исследование, в котором применяется машинное обучение для классификации сигналов электроэнцефалографии (ЭЭГ), полученных во время просмотра 2D и 3D VR-видео. Используя два типа признаков — спектральные (PSD) и пространственные (CSP) — исследователи достигают точности классификации выше 95%. Эти результаты демонстрируют потенциал построения нейроадаптивных систем в виртуальных средах и подчеркивают ценность пространственных признаков для анализа ЭЭГ в контексте иммерсивного восприятия.

Введение: виртуальная реальность глазами мозга

Развитие виртуальной реальности происходит стремительно, проникая в медицину, образование, психологию, спорт и другие сферы. Однако, несмотря на технологические достижения, понимание нейрофизиологических эффектов VR остаётся ограниченным. Особенно малоизученным остаётся вопрос: по-разному ли мозг воспринимает 2D и 3D виртуальные среды, и если да — как это можно зафиксировать объективно?
Ответ на этот вопрос открывает дорогу к созданию систем, которые адаптируются под текущее состояние пользователя, повышая эффективность VR-интерфейсов. В данной работе рассматривается подход, основанный на анализе ЭЭГ и использовании машинного обучения для классификации нейронных реакций на разные форматы VR.

Методология: от видеоконтента к мозговым волнам

В исследовании приняли участие 20 здоровых добровольцев, просматривающих VR-видео в двух форматах: 2D (плоское изображение) и 3D (объёмное, стереоскопическое изображение). Для стандартизации условий использовались идентичные видеосцены в обоих форматах (природные и космические пейзажи), а просмотр осуществлялся через смартфон и гарнитуру Google Cardboard.
ЭЭГ-сигналы записывались с помощью 56-канального устройства в соответствии с системой 10–20. Далее данные подвергались очистке от артефактов (включая ICA), фильтрации и сегментации на 2-секундные интервалы.

Извлечение признаков: спектр и пространство

Для последующей классификации из ЭЭГ извлекались два типа признаков:
  • Power Spectral Density (PSD) — частотный анализ, описывающий энергетическое распределение в диапазонах тета, альфа и бета волн. Метод широко используется в когнитивных исследованиях.
  • Common Spatial Patterns (CSP) — метод пространственного анализа, применяемый в brain-computer interfaces (BCI), позволяющий выявлять различия в распределении мозговой активности между двумя условиями.
Комбинирование этих подходов позволило охватить как частотные, так и топографические особенности нейронного отклика на VR-стимулы.

Модели и обучение: машинное обучение на ЭЭГ

Были протестированы восемь алгоритмов:
  • SVM — метод опорных векторов
  • KNN — k-ближайших соседей
  • Random Forest — случайный лес
  • Logistic Regression
  • Naive Bayes
  • Decision Tree
  • AdaBoost
  • Voting Classifier (ансамбль моделей)
Для обучения использовалась 70% выборка, оставшиеся 30% применялись для тестирования. Каждая модель проходила 10 повторных запусков с различными случайными разбиениями. Для оценки применялись: точность, полнота, F1-score и AUC-ROC.

Результаты: CSP как ключ к высокой точности

Алгоритм Признаки Точность
Random Forest + CSP Spatial 95.02%
KNN + CSP Spatial 93.16%
SVM + CSP Spatial 91.39%
Лучший результат с PSD Frequency 83–84%
Анализ показал, что CSP-признаки значительно превосходят PSD в задачах классификации нейронного ответа на VR. Особенно высокую стабильность показал Random Forest, достигший не только лучшей точности, но и наименьшей вариативности между экспериментами.
Дополнительно, визуализация данных методом t-SNE показала чёткое разделение кластеров 2D и 3D в CSP-пространстве, в отличие от PSD, где границы между классами были размыты.

Обсуждение: что нам говорит мозг о погружении

Полученные результаты подтверждают гипотезу о том, что формат VR напрямую влияет на характер нейронной активности, и что этот эффект можно детектировать автоматически. CSP-признаки отражают перераспределение нейронной активности между форматами, что позволяет интерпретировать 3D-восприятие как более пространственно и когнитивно нагруженное.
Эти выводы потенциально значимы для разработки:
  • нейроадаптивных VR-сред (подстраивающихся под восприятие)
  • реабилитационных и терапевтических интерфейсов
  • нейроинтерфейсов следующего поколения (BCI-VR)
  • когнитивной диагностики (например, оценка уровня внимания, утомления или отклика на стимулы)

Выводы

Данное исследование демонстрирует, что машинное обучение, примененное к пространственным признакам ЭЭГ, позволяет с высокой точностью классифицировать нейронную реакцию на различный формат VR. Это не только подтверждает различие в восприятии 2D и 3D на уровне мозга, но и открывает путь к созданию интеллектуальных систем, реагирующих на состояние пользователя в реальном времени.

Перспективы

В будущем такие технологии могут стать основой для:
  • Нейропрофилирования в VR-обучении
  • Мониторинга когнитивной нагрузки в профессиональных тренажёрах
  • Инклюзивных интерфейсов для пользователей с ограниченными возможностями
Наблюдать за активностью мозга становится не только возможным, но и практически применимым. И в этом новая реальность — уже не виртуальная, а нейроинтерактивная.

Заключение

Исследование демонстрирует, что анализ пространственных характеристик ЭЭГ с помощью алгоритмов машинного обучения позволяет с высокой точностью различать мозговую активность, вызванную просмотром 2D и 3D VR-видео. Это не только подтверждает различия в глубине восприятия, но и открывает путь к построению нейроадаптивных виртуальных интерфейсов, в которых мозг — полноправный участник взаимодействия.

Мы движемся к реальности, в которой цифровая среда будет откликаться на нейронную активность так же естественно, как на прикосновение или голос. И этот переход уже начался.

Brain Sciences

Полная версия статьи доступна на сайте MDPI:
https://www.mdpi.com/2076-3425/15/1/75