Inventory number IRN Number of state registration
0324РК00453 AP19676342-KC-24 0123РК00816
Document type Terms of distribution Availability of implementation
Краткие сведения Gratis Number of implementation: 0
Not implemented
Publications
Native publications: 8
International publications: 1 Publications Web of science: 1 Publications Scopus: 1
Patents Amount of funding Code of the program
0 26695430 AP19676342
Name of work
Мультиклассификация идеологических направлений кибер экстремизма на казахском языке методами искусственного интеллекта
Type of work Source of funding Report authors
Applied Мусиралиева Шынар Женисбековна
0
0
1
0
Customer МНВО РК
Information on the executing organization
Short name of the ministry (establishment) МНВО РК
Full name of the service recipient
Некоммерческое акционерное общество "Казахский национальный университет имени аль-Фараби"
Abbreviated name of the service recipient НАО "КазНУ им. аль-Фараби"
Abstract

выявление текстов на веб-ресурсах, касающихся пропаганды деструктивных религиозных течений, радикализации и вовлечения в экстремистские и террористические организации

веб-ресурстардағы деструктивті діни ағымдарды насихаттау, радикалдандыру және экстремистік және террористік ұйымдарға тартуға қатысты мәтіндерді анықтау

Цель проекта-изучение распространения киберпропаганды деструктивного характера с помощью методов искусственного интеллекта в социальных сетях и мессенджерах, создание моделей мультиклассификации в идеологических направлениях экстремистского содержания в текстовых, аудио-и видео публикациях и создание моделей и методов выявления сообществ, наиболее активной киберпропаганды религиозного контента

Жобаның мақсаты – әлеуметтік желілерде және мессенджерлерде жасанды интеллект әдістері көмегімен деструктивті сипаттағы кибер насихаттың таралуын зерттеу, мәтіндік, аудио және бейне жарияланымдарында экстремистік мазмұнның идеологиялық бағыттарындағы мультиклассификациялау модельдерін құру және діни мазмұнды ең белсенді кибернасихаттауды, қауымдастықтарды анықтаудың үлгілері мен әдістерін құру.

методы машинного и глубокого обучения, методы классификации текстов, методы обработки естественного языка, нейронные сети, методы анализа социальных сетей, методы статистической обработки, методы системного анализа

машиналық және терең оқыту әдістері, мәтіндерді жіктеу әдістері, табиғи тілді өңдеу әдістері, нейрондық желілер, әлеуметтік желілерді талдау әдістері, статистикалық өңдеу әдістері, жүйелік талдау әдістері

Были определены пять основных категорий объектов, которые потенциально могут свидетельствовать об идеологии экстремистского контента, были разработаны правила для определения категорий радикализации, рекрутмента и пропаганды. Текст анализирован с использованием моделей, таких как логистическая регрессия, случайный лес, BERT и LSTM, для классификации по темам идеологии. Разработан анализатор для обработки аудиосигналов через каждую секунду видео с помощью CNN. Для определения идеологической направленности экстремистского содержания в аудио-видео публикациях социальных сетей и мессенджеров с помощью парсера был собран текстовый корпус. Мультиклассифицированная модель была создана на основе гибридных моделей TF-IDF+CNN, BiLSTM+CNN, CNN+LSTM, CNN+GRU, CNN+LSTM+GRU, MLP+CNN, MLP+LSTM. Библиотека stanza использовалась для повышения точности классификации классов религиозного экстремизма, политического экстремизма, ксенофобии, что привело к максимальной точности классификации 0,92 (MLP+CNN).

Экстремистік мазмұн идеологиясын көрсетуі мүмкін объектілердің бес негізгі категориясы анықталды, радикализация, рекрутмент және пропаганда категорияларының анықталуы үшін арнайы ережелер құрастырылды. Мәтін логистикалық регрессия, кездейсоқ орман, BERT және LSTM сияқты модельдерді қолдана отырып, идеологиялық тақырыптар бойынша жіктелді. CNN моделі көмегімен бейненің әр секундында аудио сигналдарды өңдеуге арналған анализатор құрылды. Әлеуметтік желілер мен мессенджерлердің аудио-бейне жарияланымдарындағы экстремистік мазмұнның идеологиялық бағытын анықтау үшін парсер көмегімен мәтіндік корпус жинақталды. Мультиклассификациялық үлгі TF-IDF+CNN, BiLSTM+CNN, CNN+LSTM, CNN+GRU, CNN+LSTM+GRU, MLP+CNN, MLP+LSTM гибридтік үлгілері негізінде құрылды. Діни экстремизм, саяси экстремизм, ксенофобия класстарына жіктеу дәлдігін арттыру үшін stanza кітапханасы қолданылды, нәтижесінде ең жоғарғы жіктеу дәлдігі 0.92-ні құрады (MLP+CNN).

Определяется созданием условий для информационной безопасности в социальных сетях и мессенджерах в интересах национальной безопасности

Ұлттық қауіпсіздік мүддесінде әлеуметтік желілерде және мессенджерлерде ақпараттық қауіпсіздікті қамтамасыз ету үшін жағдай жасаумен айқындалады

нет

жоқ

Эффективность научно-исследовательской работы заключается в возможности использования разработанных моделей и методов для обнаружения деструктивного контента в социальных сетях

Ғылыми-зерттеу жұмысының тиімділігі әзірленген тәсілдер мен үлгілердің әлеуметтік желілердегі деструктивті мазмұнды анықтау үшін қолдану мүмкіндігінде.

Прикладные результаты проекта могут быть использованы уполномоченными органами, ожидается, что фундаментальные результаты в виде эффективных моделей и методов внесут вклад в опережающее развитие отечественной и мировой науки.

Жобаның қолданбалы нәтижелерін уәкілетті органдар пайдалана алады, тиімді модельдер мен әдістер түріндегі іргелі нәтижелер отандық және әлемдік ғылымның озық дамуына үлес қосады деп күтілуде.

UDC indices
004.056
International classifier codes
81.96.00;
Key words in Russian
информационная безопасность; экстремизм; социальные сети; методы машинного обучения; деструктивный контент; вычислительная лингвистика; глубокое обучение;
Key words in Kazakh
ақпараттық қауіпсіздік; экстремизм; әлеуметтік желілер; машиналық оқыту әдістері; деструктивті контент; есептеу лингвистикасы; терең оқыту;
Head of the organization Айтжанова Жамила Нурматовна Доктор экономических наук / ассоциированный профессор (доцент)
Head of work Мусиралиева Шынар Женисбековна Кандидат физико-математических наук / нет