Читать книгу Искусственный интеллект в здравоохранении онлайн
Проспективная разметка представляет собой сбор элементов в соответствии с поставленной целью, а также проведение дополнительных манипуляций с элементами (постановка меток начала и окончания события, меток обнаружения признаков, обозначений патологий и т. п.). Для проведения такой разметки помимо технических специалистов привлекаются лица, обладающие специальными знаниями, например медицинскими. Разметка проводится путем ручного аннотирования содержания данных или их частей, которое может быть выполнено в графической или текстовой форме либо при их комбинации.
Верификация данных может обеспечиваться:
– внесением дополнительных сведений в набор данных, подготовленный при проспективной разметке (например, дополнение результатами повторных исследований);
– слепым анализом набора данных экспертами с достижением заданного уровня согласованности их решений.
Основные критерии отнесения к верифицированному набору данных:
– данные получены из реальной практики (не допускается получение синтезированных данных, например ЭКГ от генератора физиологических сигналов);
– данные получены в «сыром виде» – без применения фильтров и математических средств постобработки;
– структура набора данных соответствует поставленной цели его формирования (обучение, аналитическая, клиническая валидация);
– количество наблюдений (исследований) достаточно для достижения статистической значимости результата;
– разметка проведена с использованием тезауруса (кодированной библиотеки типовых формулировок, соответствующих рекомендации ассоциации специалистов в данной области по ГОСТ 7.24, ГОСТ 7.25[7]).
В ходе первичной разметки отмечаются все целевые структуры в подготовленном наборе данных. Специалисты, проводящие разметку, должны быть компетентны в области конкретных типов данных (изображения, текстовые или сигнальные (ЭКГ, ЭЭГ, спирометрия), количественные (ЧСС, артериальное давление, спирометрия), бинарные данные (да/нет)). Экспертная разметка осуществляется специалистами с большим опытом работы (не менее трех лет) в областях, соответствующих решаемым задачам.