на главную Написать письмо карта сайта

 

Рус / Eng

 
 

Новости

Семинары и конференции

Защиты диссертаций

 
 
      

Развитие информационно-коммуникационных технологий и систем, стратегических компьютерных технологий и программ

Научный семинар НИЦ "Курчатовский институт"
Научный руководитель семинара: В.А. Ильин,
заместитель научного руководителя: В.Е. Велихов,

по вопросам работы семинара обращаться к секретарю семинара: Андрею Николаевичу Полякову,

тел: 8(499) 196-71-00 (доб.33-10), e-mail: Polyakov_AN@nrcki.ru

 

 

2017 год

 

 

22 июня (четверг) в 15:00, здание 190 комната 278

Тема: " «XANSONS for COD»: новый небольшой BOINC проект в области кристаллографии"

Докладчик: В.С. Неверов (НИЦ "Курчатовский институт", КЯТК, Отделение физики плазмы)

 

Аннотация:

XANSONS for COD – новый проект добровольных вычислений на платформе BOINC. Целью проекта является создание открытой базы данных модельных рентгеновских и нейтронных порошковых дифрактограмм для нанокристаллических фаз материалов, представленных в Crystallography Open Database (COD). В проекте использована оригинальная программа XaNSoNS с открытым исходным кодом, которая может производить вычисления дифрактограмм как на CPU, так и на GPU. В настоящей работе рассмотрены: научная проблема, которую решает данный проект, внутренняя структура проекта, принципы его работы и принципы организации итоговой базы данных.

 

 

2 февраля

Тема: "Исследование методов и разработка комплекса программных средств управления медицинскими данными в области трансплантации гемопоэтических стволовых клеток" (по материалам подготовленной диссертации на соискание ученой степени доктора технических наук по специальностям: 05.13.11 – Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей и 14.01.21 – Гематология и переливание крови)"

Докладчик:  Ю.В. Старичкова (ФГБУ "ФНКЦ ДГОИ им. Дмитрия Рогачева" Минздрава России)

 

Аннотация:

В докладе представлены результаты исследования международных и российских стандартов и процессов организации и проведения трансплантации гемопоэтических стволовых клеток (ТГСК) и особенности применения информационных систем и технологий в данной области здравоохранения. Буду приведены основные результаты исследования, включая комплексный подход к формализации процессов и требований представления, накопления и обработке медицинских данных ТГСК, разработку и внедрение оригинальных компонент программного комплекса предназначенного для автоматизации процессов ТГСК: «Планирование трансплантаций гемопоэтических стволовых клеток», «Управление клиническими данными трансплантации гемопоэтических стволовых клеток», «Лабораторная информационная система биологии трансплантации гемопоэтических стволовых клеток». Будут приведены основные результаты внедрения компонентов программного комплекса и их применимость в прикладных и научно-клинических исследованиях в подразделениях ФГБУ "ФНКЦ ДГОИ им. Дмитрия Рогачева" Минздрава России.

 

 

12 января

1. Тема: "Методы управления и технологии обработки сверхбольших объемов данных в распределенной гетерогенной компьютерной среде для компьютероемких приложений Ядерной Физики и Физики Высоких Энерги"

Докладчик: А.А. Климентов (начальник лаборатории технологий больших данных для проектов в области мега-сайенс, ОИТиММ, Курчатовский комплекс НБИКС-технологий)

 

Аннотация:

Современная эксперименты класса мегасайнс оперирует объемами данных в пета- и экзабайтном диапазоне.  Управление такими объемами информации стало возможным благодаря развитию информационных технологий обработки, анализа и хранения больших данных, а также системам управления загрузкой. Так, например, в области физики высоких энергий (ФВЭ) и ядерной физики (ЯФ) разработано и успешно функционирует большое количество программно-аппаратных платформ для сопровождения физических экспериментов. Одним из таких комплексов является система управления потоками заданий и управлениям информацией мегаPanDA, созданная для эксперимента ATLAS на Большом Адронном Коллайдера в ЦЕРН. Это большая, сложная вычислительная система, обеспечивающая моделирование, анализ и обработку физических данных современного эксперимента класса мегасайнс. Система использует гетерогенные компьютерные ресурсы (Грид, суперкомпьютеры, академические и коммерческие системы облачных вычислений) географически распределенные более чем в 150 вычислительных центрах по всему миру. Система не имеет мирового аналога по производительности и масштабируемости (до 30М заданий выполняется ежемесячно на более чем 20 тысячах вычислительных узлах), в настоящий момент megaPanDA используется экспериментами на БАК (ATLAS, ALICE), на суперпротонном синхротроне ЦЕРН (эксперимент COMPASS), в астрофизических экспериментах (AMS, LSST) и для приложений биоинформатики в НИЦ КИ, система рассматривается как базовая платформа обработки данных для будущего коллайдера NICA (ОИЯИ, Дубна).

 

На семинаре будут рассмотрены развитие систем управление загрузкой, создание системы мегаPanDA, используемой для приложений ФВЭ, ЯФ и биоинформатики, развитие систем федерирование гетерогенных компьютерных ресурсов. Кроме того, сложность, неоднородность и распределенный характер используемых аппаратно-программных средств требуют своевременного выявления и устранения аномалий в работе системы управления загрузкой. Повышение скорости реакции на сбои системы приведёт к заметному росту производительности обработки научной информации и к более оптимальному использованию вычислительных ресурсов. Созданная платформа для мониторинга обработки и анализа данных эксперимента ATLAS предоставляет комплексную информацию о состоянии системы в виде основанных на веб-технологиях аналитические представлениях, а также диагностику возникающих ошибок и инструменты выявлении причин их появления. Своевременная доставка данной информации конечному пользователю на разных уровнях абстракции позволяет ускорить реакцию на сбои системы. Использование методов “машинного обучения” для предсказания работы сложных распределенных систем будет также рассмотрено в рамках выполненной работы по созданию системы megaPaNDA.

 

2. Тема: "Метод управляемого данными моделирования онтологической структуры текстов для определения тематически схожих документов"

Докладчик: И.А. Молошников (инженер-исследователь лаборатории конвергентных информационных систем, ОИТиММ, Курчатовский комплекс НБИКС-технологий)

 

Аннотация:

В настоящее время накоплен огромный объём текстовой информации в электронном виде, требующий автоматических средств анализа данных на естественном языке. Задача определения тематически схожих документов востребована в ряде областей анализа текстовой информации, где требуется получить максимально полный набор документов по заданной теме, отсортированных по релевантности, для дальнейшего исследования.

 

Таким образом, актуализируется потребность в программных продуктах, где пользователь может предоставить системе коллекцию эталонных документов, описывающих заданную тему, и в ответ получить взвешенный набор документов, максимально полно отражающий заданную область интересов.

 

В работе решены следующие задачи:

- формализована онтологическая структура текстов для задачи определения тематически схожих документов к заданной эталонной выборке текстов по теме;

- формализована процедура определения тематической схожести документов;

- выбраны и реализованы методы для моделирования онтологической структуры текстов на основе вероятностно-энтропийных характеристик слов и словосочетаний;

- выбраны и реализованы методы, алгоритмы, топологии нейронных сетей и методов машинного обучения для определения тематической схожести документов;

- разработан метод математического моделирования процесса определения тематической схожести документов к заданной эталонной выборке текстов по теме;

- разработан метод оценки математической модели определения тематически схожих документов с использованием тематически размеченных корпусов 20 Newsgroups и SCTM-ru

 

В результате комплексного расчетно- экспериментального исследования создан новый метод на основе данных математического моделирования онтологической структуры текстов для определения тематически схожих документов, объединяющий: вероятностно-энтропийные характеристики слов и словосочетаний для построения онтологической структуры текстов и интеллектуальные методы определения тематической схожести текстов.

 

3. Тема: "Метод автоматизированного выделения эмотивно–тональных характеристик авторского текста на основе интеллектуальных моделей, управляемых данными"

Докладчик: Д.В. Гудовских (инженер-исследователь лаборатории конвергентных информационных систем, ОИТиММ, Курчатовский комплекс НБИКС-технологий)

 

Аннотация:

С ростом числа активных интернет-пользователей и все большего переноса социальной активности граждан на различные открытые интернет-площадки растет потребность создания систем автоматизированного анализа текстов способных анализировать эмотивно- тональную реакцию участников интернет сообществ на те или социально значимые события. В частности, для государственного мониторинга реакции пользователей на развитие каких-либо значимых социально-экономических ситуаций или обеспечения безопасности для выявления наиболее агрессивных участников интернет сообществ, с учетом их персональных характеристик, таких как пол, возраст или психологический тип личности. С развитием корпусов текстов, размеченных по тональности высказываний, по возрасту, полу авторов, и по их психологическим особенностям появились базы для создания языковых моделей выделения эмотивно–тональных текстов на основе данных (Data Driven Modelling – DDM).

 

В работе решены следующие задачи:

- Разработан метод   создания языковых моделей выделения тонально-эмотивных авторских текстов с использованием психолингвистических признаков текста, морфосинтаксических признаков, половых и прочих признаках текста. 

- Разработан метод определения пола и возраста авторов текста построенный на основе нейронных сетей глубокого обучения

- Реализован программный комплекс анализа эмотивно- тональной реакции участников интернет сообществ   и определения черт и характеристик их персоналий.

 

Таким образом, в результате комплексного расчетно-экспериментального исследования созданы новые методы определения состояния автора в момент написания текста и характеристик его высказываний, реализованные в виде программного комплекса.

 

4. Тема: "Адаптивные методы и системы информационной поддержки научных исследований в области Физики Высоких Энергий"

Докладчик: Р.Ю. Машинистов (зам. начальника лаборатории технологий больших данных для проектов в области мега-сайенс, ОИТиММ, Курчатовский комплекс НБИКС-технологий)

 

Аннотация:

В последнее время в различных областях науки наблюдается значительное увеличение объемов экспериментальных и моделируемых данных за счет создания новых алгоритмов, повышения качества технических средств и т.д. Например для обработки данных эксперимента ATLAS во время первой фазы работы Большого Адронного Коллайдера (БАК) в 2010-2013 годах были использованы десятки вычислительных центров и хранилищ мульти-петабайтного масштаба (общий объем данных составил 160 Пбайт) по всему миру (в настоящий момент управляемый объем данных эксперимента ATLAS составляет 250 ПБайт). Это привело к повышению требований к вычислительным платформам обработки данных: потребовалось больше оперативной памяти и более мощные процессоры. Решение данной проблемы требует разработку и применения новых подходов к организации вычислений.

 

В работе было проведено исследование возможности применения новых методов и подходов для объединения гетерогенных вычислительных ресурсов в единую вычислительную платформу. Была разработана полномасштабная система управления данными и заданиями на базе вычислительных мощностей Национального исследовательского центра "Курчатовский институт". Было показано, что методы и программные средства, разработанные для задач в области физики высоких энергий, а также эффективное использование суперкомпьютеров могут быть успешно применены в других областях науки.

 

5. Тема: "Классификация дифракционных изображений по типам биомолекул, исследуемых в экспериментах на лазерах на свободных электронах, с помощью методов машинного обучения"

Докладчик:C.А. Бобков (инженер-исследователь группы вычислительных технологий, отдел перспективных компьютерных систем и технологий, Курчатовский комплекс НБИКС-технологий)

 

Аннотация:

Новый подход когерентной рентгеновской дифракционной микроскопии позволяет определять структуру биомолекул через измерение непрерывной дифракционной картины и определять их структуру с субнанометровым разрешением.

 

В экспериментах по когерентной рентгеновской дифракционной микроскопии идентичные образцы исследуемой частицы вводятся в луч лазера. Образцы разрушаются за счет кулоновского взрыва, но благодаря высокой мощности и сверхкороткой длительности импульсов, повреждения образцов не успевают отразиться на дифракционной картине. Набор двумерных дифракционных изображений частицы в случайных ориентациях собирается в единое трехмерное распределение интенсивности и восстанавливается структура изучаемой частицы. Требуемые характеристики излучения достигаются только в экспериментах на лазерах на свободных электронах.

 

Менее 1% получаемых изображений содержат дифракционную картину от одиночного образца. Большинство изображений пустые, а большая часть оставшихся изображений содержит дифракционный вклад от капель воды, нескольких образцов или некоторой примеси. Получаемые наборы изображений необходимо классифицировать для выделения дифракционных изображений одиночных частиц исследуемого типа.

 

В работе представлена методика автоматической классификации, которая позволяет классифицировать наборы изображений, полученные в экспериментах по когерентной рентгеновской дифракционной микроскопии на отдельных частицах. Методика классификации основана на теоретических исследованиях, реализована в виде пакета программ и апробирована на экспериментальных данных.

 

Апробация проведена на наборе дифракционных изображениях, полученных в эксперименте CXIDB ID13 по изучению структуры макромолекулярных частиц на лазере на свободных электронах LCLS (Сан-Франциско).

 

 

Архив семинаров