Результаты Крупного научного проекта
Основные результаты за 2020 год:
- Создан новый подход к проблеме коррекции и анализу робастности систем МО, основанный на представлении образов компактными множествами в пространстве данных. Получены теоремы о стохастической отделимости семейств компактных множеств в больших размерностях и их аналоги для бесконечномерных идеализаций.
- Сформулировано и доказано новое семейство теорем стохастической отделимости для конечных множеств с
явными оценками вероятностей разделения, в том числе, и для зависимых выборок. - На основании новых теорем стохастической отделимости для конечных множеств и семейств компактных множеств получены новые теоремы существования состязательных возмущений, выявляющих негрубость и уязвимость систем.
- Показано, что возможность неитеративной быстрой коррекции систем связано также с их уязвимостью для скрытых атак. Проведено тестирование корректируемости и уязвимости для систем, обученных на модельных и реальных данных.
- Созданы новые алгоритмы получения явных знаний из обучаемых нейронных сетей. Они получены комбинаций (1) алгоритмов сокращения сетей на основе показателей чувствительности первого порядка, (2) взаимообучения нейросетевых агентов, (3) передачи навыков от больших систем ансамблям малых, (4) линейных и нелинейных методов сокращения размерности (главные компоненты, главные многообразия, главные графы и их версии с учителем). Разработаны, и протестированы новые алгоритмы аппроксимации данных графами.
- Разработаны новые версии алгоритмов взаимообучения и коррекции в больших сообществах МО и ИИ систем, основанные на разделении задач между малыми экспертами и на разрешении конфликтов между ними с помощью формализации степени уверенности экспертов в решении.
- Предложена модель многоэтапного решения задач лексикографической многокритериальной оптимизации, разработан алгоритм глобального поиска для решения информационно-связанного множества задач многоэкстремальной оптимизации с нелинейными ограничениями.
- Доказаны условия сходимости разработанного алгоритма. Даны теоретические оценки числа поисковых испытаний.
- Предложены подходы к использованию классических методов машинного обучения и глубокого обучения для построения адаптивных покрытий области поиска при решении задач многоэкстремальной оптимизации.
- Математически формализована проблема генеративного дизайна математических моделей в форме направленных ациклических графов с узлами сложной структуры, представленными в т.ч. в виде дифференциальных уравнений.
- Разработаны программные библиотеки алгоритмов генеративного дизайна композитных моделей, в том числе для суперкомпьютерных реализаций (за счет эффективного распараллеливания или реализации на низкоуровневом языке программирования Си).
- Разработанные алгоритмы апробированы на задачах математической физики из области гидродинамики и термодинамики.
- Собрана библиотека образцов плазмы и сыворотки больных COVID-19 в динамике реконвалесценции. Проведена систематизация клинических данных и характеристика групп больных, предобработка данных для последующего анализа методами МО.
- В дополнение к серийным данным по онкомаркерам рака яичников, поджелудочной железы и прямой кишки, протеомным данным по коронавирусным пациентам, были собраны: данные пациентов с коронавирусом из национального медико-кардиологического центра, данные по прогнозированию тромбоза ушка левого предсердия пациентов с фибрилляцией предсердий.
- Проведен первичный анализ транскриптомных данных при экспериментальной неоплазии. Разработаны основные подходы к анализу транскиптомных данных для дальнейшего анализа.
- Сгенерированы многомерные данные сложной, но известной структуры. Полученные данные скомбинированы с публично доступными медицинскими данными для тестирования алгоритмов МО.
- Методы сетевого анализа применены для предсказания статуса тяжелых пациентов с коронавирусом по данным высокопродуктивного протеомного анализа. Найдены наиболее эффективные топологические индексы сетевого анализа.
- Сгенерированы данные восстановления пиковой амплитуды лазерного импульса.
- Сгенерированы данные для решения вопроса о существовании ФлокеЛиндбладиана в пространстве спектров матриц Чои.
- Получены ряды изображений для различных стадий развития засухи растений пшеницы, данные содержания воды в растениях и в почве.
- Сгенерированы данные для задачи обледенения, задач перемешивания турбулентного течения в закрытом резервуаре.
- Сгенерирована обучающая выборка для турбулентного неньютоновского потока в лотке с защитными дамбами при изменении геометрических параметров.
- Протестированы модели МО для восстановления пиковой амплитуды лазерного импульса.
- Разработаны модели для решения задачи существования Флоке-Линдбладиана.
- Разработана и протестирована модель долговременной сетевой памяти с эффектом обучения.
- Разработаны модели обработки разномасштабных изображений сельскохозяйственных культур.
- Разработан алгоритм для предсказания кристаллической структуры материалов по рентгенодифракционным данным.
- Проведено сопоставление характеристик климатических сетей с данными о тропических циклонах в Индийском океане.
Результаты