Журнал "Системы Безопасности" № 4‘2021

К О М П Л Е К С Н А Я Б Е З О П А С Н О С Т Ь , П Е Р И М Е Т Р О В Ы Е С И С Т Е М Ы 102 О дно из определений интеллектуального анализа гласит, что "это направление информационных технологий, охватывающее всю область проблем, связанных с извлечением знаний из массивов данных" 1 . В широком смысле можно поставить знак равенства между интеллектуальным анали- зом и Data Mining (раскопка, разработка данных). Если углубиться в терминологию, то разница будет в объеме вопросов, решае- мых в рамках данных дисциплин. Методы Data Mining сосредоточиваются главным образом на процессах анализа данных и моделировании. Интеллектуальный анализ данных рассматривает весь спектр вопросов, связанных с процессом извлечения знаний из баз данных. В основе данных дисциплин лежит информация (знания). Нет информации – нет анализа. Про- цесс поиска полезных знаний в данных называ- ется Knowledge Discovery in Databases (KDD). KDD занимается вопросами подготовки, крите- риев выбора и интерпретации результатов при переводе "белого шума" данных в информа- цию. Для этого применяется огромное количе- ство математических методов, включая стати- стику. На рис. 1 представлена взаимосвязь областей знаний и их отношение к Data Mining, а вся совокупность методов и есть интеллектуальный анализ данных. Области применения В теории все звучит хорошо, но нас интересует практическое применение. К сожалению, боль- шинство реализаций Data Mining не относится к реальным секторам жизни. Подавляющее количество продуктов работает в сферах про- даж и маркетинга, где они пытаются на основа- нии предпочтений пользователей предло- жить "нужный" товар. В зависимости от того, что является источни- ком данных предпочте- ний, результат получа- ется или плохой, или средний. Из всего многообразия результатов для целей безопасности можно применить следующие: l п р о г н о з ир о в а н и е (нагрузки, времени простоя автоматизи- рованной системы или ключевых элементов); l риск и вероятность (определение точки рав- новесия для рисковых сценариев, назначение вероятностей сценариям, рискам, событиям); l поиск последовательностей (анализ действий пользователей, прогнозирование следующего возможного события); l группировка (разделение событий на класте- ры связанных элементов, анализ и прогнози- рование общих черт). В первом приближении выглядит интригующе, но давайте присмотримся внимательнее. Прогнозирование Прогнозирование – краеугольный камень любой аналитики. Знание, или прогнозирова- ние будущего, – серьезное преимущество во всех сферах человеческой деятельности. Уже очень давно существует мнение о том, что, зная прошлое, можно предсказать будущее. Увы, такие модели не всегда точны, а вернее – всегда не точны. Проблема кроется в недостатке исходных данных, когда существующая модель прогноза не учитывает каких-либо внешних факторов. Здесь плавают "черные лебеди" 2 , то есть непредвиденные и неучтенные события, которые приводят к чудовищному краху. Поэтому предсказательная (или предиктивная) аналитика сейчас хорошо работает только для четко очерченных областей, когда можно учесть все факторы. В первую очередь предиктивная август – сентябрь 2021 www.secuteck.ru Дмитрий Дудко Руководитель отдела проектирования и внедрения департамента информационной безопасности компании "ЛАНИТ" Рис. 1. Взаимосвязь Data Mining и областей знаний www.isg-one.com М етоды Data Mining сосредоточиваются главным образом на процес- сах анализа данных и моделировании. Интеллектуальный анализ дан- ных рассматривает весь спектр вопросов, связанных с процессом извлечения знаний из баз данных Технологии интеллектуального анализа данных для повышения эффективности КСБ В течение последних лет ИТ-лексикон обогатился новыми терминами – "блокчейн", "майнинг", "машинное обучение", "большие данные", "искусственный интеллект" и др. Они так прочно вошли в обиход, что уже сложно найти статью, пресс-релиз, презен- тацию, выступление или коммерческое предложение без упоминания того или иного популярного выражения. Термин "интеллектуальный анализ данных" тоже из их числа. Попробуем разобраться в этом понятии и его применимости к задачам систем безопасности 1 https://cyberleninka.ru/article/n/primenenie-tehnologiy-intellektualnogo-analiza-dannyh-v-estestvennonauchnyh-tehnicheskih-i-gumanitarnyh-oblastyah/viewer 2 Подробнее с явлением "черных лебедей" можно ознакомиться в книге "Черный лебедь. Под знаком непредсказуемости" Нассима Николаса Талеба.

RkJQdWJsaXNoZXIy Mzk4NzYw