Сегодня среда, 24.06.2026, 08:52, ньюсмейкеров: 45117, сайтов: 1203, публикаций: 3596118, просмотров за сутки: 544034
05.04.2026 21:54
Новости.
Просмотров всего: 10412; сегодня: 4.

UDV Group: AI Security — безопасность искусственного интеллекта

Юрий Чернышов, к.ф.-м.н., доцент УНЦ «Искусственный интеллект» УрФУ, руководитель исследовательского центра UDV Group рассказал о сложностях обнаружения причины изменения поведения модели, о методах, которые подходят для анализа безопасности и о том, как оценивается устойчивость модели в условиях реального применения.

Какие индикаторы помогают заметить ранние признаки отравления данных на этапе подготовки датасета?

Почти все, кто имеет практический опыт внедрения и использования проектов, включающих анализ данных и машинное обучение, уже в курсе, что подобные системы очень неустойчивы, чувствительны к внешним помехам. Причина этого не в том, что у разработчиков недостаточная экспертиза (хотя встречаются и такие случаи), а в том, что при обучении модели применяются наборы данных, которые не могут содержать все возможные ситуации при будущей эксплуатации. Да это и невозможно, поскольку всегда на практике имеет место так называемый «сдвиг в данных» (data shift) из-за меняющейся инфраструктуры, условий эксплуатации, поведения пользователей и пр. Поэтому очень сложно при обнаружении изменения поведения модели понять - что же является истинной причиной: сдвиг в данных, сбой датчика, помехи в сети передачи данных, некачественная модель ML, незначительная перегрузка инфраструктуры или это просто «шум» в рамках статистической погрешности. И за этими вариантами всегда сложно разглядеть атаку через отравление данных. Индикаторы для диагностики изменения традиционные: всесторонний статистический анализ характеристик данных, как по параметрам получения и обработки, так и по семантике. Но для принятия мер при обнаружении отклонения в поведении модели на основе данных необходима комплексная инфраструктура, включающая мониторинг оборудования, параметров данных и модели, метрик инференса (промышленного использования).

Какие методы анализа позволяют выявлять бэкдор-активность в уже обученной модели?

Для анализа безопасности модели ИИ подходят все те же методы, применяемые при тестировании безопасности программного обеспечения: мониторинг, фаззинг, анализ взаимодействия с внешними компонентами. Сложность заключается в том, что невозможно понять логику работы модели, как это делается при анализе кода программного обеспечения, поскольку эта логика модели ИИ распределена по миллионам (как в случае с глубоким машинным обучением) или по миллиардам (как в случае с LLM) параметров. Поэтому применяется анализ модели ИИ как «черного ящика», анализируя вход и выход, оценивая параметры работы и потребление ресурсов. Исторический анализ параметров работы модели позволяет сформировать паттерны нормального поведения и анализировать в будущем отклонения от этих паттернов.

Как оценивается устойчивость модели к adversarial-примерам в условиях реального применения?

Самый лучший способ для подобного анализа это red teaming, в том числе и с применением автоматизированных средств проверки: фаззинг, подбор проверяющих сэмплов, создание для модели критических условий для функционирования (ddos атака). Если есть возможность оценивать устойчивость в лабораторных условиях, то эффективным является схема генеративных состязательных сетей (GAN), в которых есть генератор, создающий сэмплы, и дискриминатор, пытающийся различить настоящие сэмплы и созданные генератором. При этом генератор и дискриминатор постоянно конкурируют друг с другом, генератор учится все лучше «обманывать», а дискриминатор – все лучше выявлять факт подделки.

Какие техники усложняют попытки извлечения модели через API (model extraction)?

Для любого интерфейса взаимодействия, и API в том числе, важно настроить как можно более строгие правила доступа к ресурсу: авторизацию, аутентификацию и контроль за ресурсами. При этом необходимо проектировать API таким образом, чтобы минимизировать возможности взаимодействующей стороны, оставлять доступ только к той информации, которая ей предназначена, ограничивать разумными уровнями потребления ресурса, исходящими из технического задания и архитектуры проекта. Например, можно запретить длительные сессии взаимодействия, если проект этого не предполагает. Или ограничить количество запросов к ресурсу от одного источника таким уровнем, который достаточен для нормальной работы, все что аномально выше этого уровня – скорее всего свидетельствует о попытке автоматизированного сканирования или парсинга.

Какие меры повышают защищенность датасетов от подмены, injection-атак и несанкционированных правок?

Наличие защищенных наборов данных - серьезная задача, без которой невозможно создавать качественные, надежные и полезные системы ИИ. Зачастую набор данных ценится даже больше, чем модель, обученная на его основе. Поэтому компании-разработчики систем ИИ так ценят свои наборы данных, защищают их наравне с программным кодом. Меры, защищающие наборы данных (датасеты) от злонамеренного искажения, такие же, как и при защите программного кода: требуется контролировать версионирование и доступ к изменениям, проводить тестирование и анализ характеристик после изменений.

Какие механизмы мониторинга лучше всего подходят для отслеживания аномалий в поведении ИИ-модели?

Существует множество способов мониторить работу сложного устройства или системы, какой из них наиболее эффективен – сильно зависит от самой системы. Можно анализировать низкоуровневые параметры (трафик, потребление ресурсов оборудования), можно анализировать вход и выход модели ИИ (текст промпта и сгенерированный ответ), потребление токенов. Но на мой взгляд наиболее эффективно анализировать влияние применения модели на бизнес-процесс – если в бизнес-процессе появились отклонения (изменилась продолжительность звонков, частота отправки писем, поменялась бизнес-логика процесса, перестал компилироваться код и пр.), то скорее всего случился сбой в работе ИИ-модели и необходимо проводить расследование, в том числе с применением анализа низкоуровневых событий в инфраструктуре и ПО.

Тематические сайты: Безопасность, Информтехнологии, связь, Интернет, Инфраструктура, Искусственный интеллект
Сайты субъектов РФ: Москва, Московская область
Сайты федеральных округов РФ: Центральный федеральный округ
Сайты стран: Россия
Сайты объединений стран: БРИКС (BRICS)

Ньюсмейкер: UDV Group — 60 публикаций
Сайт: udv.group

Интересно:

Как Лев Толстой защищал Севастополь
18.06.2026 9:06 Аналитика
Как Лев Толстой защищал Севастополь
13 сентября 1854 года (25 сентября по н. ст.) началась первая героическая оборона Севастополя. 349 дней русские моряки и солдаты отстаивали город при численном превосходстве противника и продемонстрировали всему миру свой героизм, мужество и отвагу. Среди защитников города был и молодой подпоручик Лев Николаевич Толстой – в будущем знаменитый русский писатель. Почти мировая война 4 октября 1853 года Турция в очередной раз объявила России войну, и вновь Россия ответила тем же. Но в этот раз Турцию поддержали Англия и Франция, которые очень внимательно следили за развитием событием и совсем не были заинтересованы в усилении России на Черном море. В феврале 1854 года они заключили военный союз с Турцией и сразу же выдвинули России ультиматум о выведении войск из Дунайских княжеств. Россия, естественно, не стала выполнять такие требования, и 15 марта союзники объявили ей войну. Англия и Франция попыталась начать боевые действия с...
Любимые игры Екатерины Великой
17.06.2026 9:06 Аналитика
Любимые игры Екатерины Великой
Сегодня мы поговорим о Екатерине II не как об императрице, продолжавшей дела Петра Великого и устроившей российскому дворянству «золотой век», а как о женщине на троне, которой были весьма не чужды и простые житейские утехи. Верхом и с ружьем В отличие от своих предшественниц на троне, императрица-просветительница вместо балов и маскарадов ежедневно занималась рутинной государственной работой. А ее любимые развлечения немного отличались от того, что радовало душу ее предшественницам-императрицам. Одним из любимых занятий Екатерины было катание верхом. Современники рассказывали, что она правила лошадьми как профессиональный наездник. Государыне очень нравилось вырываться из общей кавалькады. В те времена дамы по-мужски не ездили, это было не принято. У Екатерины же было специальное английское седло. С его помощью уже по ходу движения она принимала мужскую посадку и поэтому развивала бешеную скорость, однако нормы приличия при...
Значение Крымской войны 1853-1856 гг. обсудили на конференции в Москве
14.06.2026 0:37 Мероприятия
Значение Крымской войны 1853-1856 гг. обсудили на конференции в Москве
10 июня 2026 года в московском Доме русского зарубежья им. А.И. Солженицына прошла масштабная межрегиональная научно‑практическая конференция, приуроченная к 170‑летию окончания Крымской войны (Восточной) войны 1853–1856 гг. и подписанию Парижского мирного договора (Парижского трактата) «Значение Крымской (Восточной) войны 1853-1856 гг. для России и мира». Инициаторами и организаторами конференции выступило Российское Дворянское Собрание (РДС) во главе с М.Ю. Лермонтовым, Общества потомков участников Отечественной войны 1812 г. и Первой мировой войны (В.И. Алявдин) при поддержке Московского отделения Императорского Православного Палестинского Общества (ИППО).Парижский трактат, подписанный 18(30) марта 1856 г. Российской Империей, с одной стороны, и странами-союзниками по Крымской войне (Османской империей, Британией, Францией, Австрией, Королевством Сардиния и Пруссией), с другой стороны, ознаменовал де-юре официальное...
11.06.2026 15:05 Интервью, мнения
«Гигант — Компьютерные системы»: борьба с кибермошенничеством
Эксперт «Гигант— Компьютерные системы» рассказал, почему 7 часов 48 минут до блокировки не стоит называть прорывом и как антифрод-инфраструктура влияет на защиту граждан.  Минцифры опубликовало отчет о ходе реализации государственной программы «Информационное общество» нацпроекта «Экономика данных» за 2025 год. Один из ключевых показателей - среднее время блокировки фишинговых и мошеннических ресурсов. Фактический результат составил 7 часов 48 минут при плановом ориентире 8 часов. Также в отчете говорится о росте доли предотвращенного кибермошенничества на 53,7% и расширении числа организаций, участвующих в системе противодействия киберпреступлениям. В этот контур входят органы исполнительной власти, операторы связи и финансовые организации. Именно они формируют базовую инфраструктуру реагирования на цифровое мошенничество. О том, как корректно оценивать эти показатели, почему рост предотвращенного мошенничества нельзя...
В строю бессмертных: снайпер Ивченко и его последний бой за Родину
07.06.2026 11:39 Персоны
В строю бессмертных: снайпер Ивченко и его последний бой за Родину
В славной летописи Великой Отечественной войны, написанной кровью и мужеством советских воинов, особое место занимают подвиги гвардейцев-героев. Их имена, как яркие звёзды, озаряют путь грядущим поколениям, служа примером беззаветной преданности Социалистической Родине, народу и Коммунистической партии. В этом бессмертном строю — гвардии ефрейтор Михаил Лаврентьевич Ивченко.  Уроженец деревни Тимонино Красноярского края, он, как и миллионы его сверстников, вышел из трудовой крестьянской семьи. Получив начальное образование, Михаил Ивченко добросовестно трудился в колхозе, пройдя путь от возчика до бригадира, воспитывая в себе качества сознательного строителя социалистического общества. В 1940 году по призыву Родины он был направлен для прохождения службы в стрелковые части, дислоцированные на Крайнем Севере. С первых дней вероломного нападения гитлеровских захватчиков товарищ Ивченко стоял на переднем крае борьбы. В суровых...