НЕЙРОННЫЕ СЕТИ В РАБОТЕ ДИЗАЙНЕРА
Раздел: Организация обучения и методическое обеспечение дисциплин «Основы искусственного интеллекта», «Системы искусственного интеллекта в профессиональной деятельности педагога»
Журнал: Материалы Всероссийской научно-практической конференции «Искусственный интеллект в образовании. Современные достижения и перспективы применения: в генерации знаний, управлении, обучении, оценке результатов обучения и формировании компетенций обучающихся»
22 мая 2023 г.
Авторы: Коткин Сергей Дмитриевич
Информационно-коммуникационные технологии в педагогическом образовании. http://infed.ru
_______________________________________________________________________
УДК 378
С. Д. Коткин
S. D. Kotkin
Коткин Сергей Дмитриевич, к. п. н., доцент кафедры ИОТД, КГПИ КемГУ, г. Новокузнецк, Россия.
Kotkin Sergey Dmitrievich, Ph.D., Associate Professor, Kuzbass Humanitarian Pedagogical Institute of Kemerovo State University, Novokuznetsk, Russia.
НЕЙРОННЫЕ СЕТИ В РАБОТЕ ДИЗАЙНЕРА
NEURAL NETWORKS IN THE WORK OF A DESIGNER
Аннотация. В статье рассматриваются области применения современных нейронных сетей в обработке изображения. Дается описание принципа работы генеративно-состязательных сетей. Описываются основные этапы дизайн-проектирования. Приводятся прогнозы в изменении требований к дизайнеру.
Annotation. The article discusses the areas of application of modern neural networks in image processing. The description of the principle of operation of generative-adversarial networks is given. The main stages of design-projects are described. Forecasts are given in changing the requirements for the designer.
Ключевые слова: дизайн, нейронная сеть, генеративно-состязательная сеть, дизайн-проект, подготовка дизайнеров.
Keywords: design, neural network, generative adversarial network, design-project, training of designers.
Современные нейронные сети выполняют разнообразные задачи, связанные с обработкой изображения: перенос стиля живописи с одного изображения на другое, ретушь фотографий, включая удаление лишних элементов или добавление утерянных фрагментов, улучшение качества изображения увеличение его разрешения, выделение сложных объектов, коррекция черт лица и т.п. Однако наибольший интерес в последние несколько лет вызывают нейронные сети, способные генерировать изображения по их текстовому описанию, такие как DALL·E 2 [1], Midjourney [2], Stable Diffusion [3]. Все они основаны на генеративно-состязательных нейронных сетях (англ. Generative adversarial network – GAN). Такой тип нейронных сетей был предложен в работе [4] в 2014 году. Генеративные нейронные сети генерируют данные, похожие на те, на которых они обучались.
Идея генеративно-состязательных сетей заключается в том, что нейронная сеть делится на две части: генератор и дискриминатор, которые соревнуются друг с другом.
Генератор – это нейронная сеть, принимающая на входе данные, имеющие случайное распределение, называемое также шумом, и выдающий на выходе данные, имеющие распределение, характерное для генерируемых данных. Дискриминатор оценивает как реальные данные, так и данные, создаваемые генератором, и пытается определить, являются ли данные подлинными (реальные образцы) или поддельными (данные, созданные генератором), то есть, представляет собой двоичный классификатор.
В случае обучения генератора и дискриминатора на изображениях, генератор пытается создать изображения, похожие на изображения из обучающей выборки. А дискриминатор пытается определить, какое изображение ему предъявили: созданное генератором, или изображение из выборки.
Обучение генератора осуществляется путем подачи на его вход размеченных наборов данных из изображений выборки изображений. Как правило, для оценки качества дискриминатора используется функция двоичной перекрестной энтропии (кросс-энтропии) [5, с. 123]. В начале обучения создаваемые генератором данные слабо соответствуют обучающей выборке, и дискриминатор легко обучается распознавать данные, получаемые от генератора, как поддельные. Однако по мере обучения генератора дискриминатор начинает совершать больше ошибок, так как данные генератора становятся все ближе к обучающим данным.
При обучении генератора ему на вход подается шум со случайным распределением и в качестве функции потерь используется результат работы дискриминатора – чем реже дискриминатор может определить, что данные сгенерированы, а не взяты из обучающей выборки – тем лучше. При этом генератор ничего не знает о распределении данных в обучающей выборке, то есть, данные из неё на его вход не подаются – о соответствии им он узнает только от дискриминатора.
Обычно генератор и дискриминатор обучаются по очереди. При этом генератор пытается максимизировать потери дискриминатора, а дискриминатор, наоборот, эти потери минимизировать.
Современные нейронные сети для генерации изображений развиваются настолько быстро, что менее чем за три года некоторые из них научились генерировать изображения на уровне, сопоставимом с тем, что может показать человек. Кроме того, помимо нейронных сетей общего назначения, умеющих создавать произвольные изображения, также существуют и специализированные нейронные сети, например, Looka [6], или Flair [7], позволяющие создать фирменный стиль. Некоторые организации уже используют подобные нейронные сети для решения таких задач, как разработка эмблемы, создание дизайна упаковки, создание дизайна рекламных материалов и т. д. И в связи с этим возникает вопрос о том, насколько будет востребованной и как трансформируется профессия дизайнера в связи с таким бурным развитием данного направления искусственного интеллекта.
Для того чтобы с этим разобраться, необходимо уточнить функции, выполняемые дизайнерами сейчас. Дизайн-проект проходит через следующие этапы: исследование, интерпретация результатов, генерация идей, эксперимент и непосредственно реализация.
На этапе исследования собирается информация по предметной области, в которой делается проект: её история, текущее положение, культурные различия и т.д. По окончании исследований проводится интерпретация их результата: уточняется исходная постановка задачи, упорядочиваются требования, делаются выводы о применимости тех или иных подходов. Далее следует этап генерации идей. На этом этапе применяются различные креативные техники для создания множества вариантов, из которых на этапе реализации будут выбраны наиболее подходящие и, как правило, доработаны с учетом исходных требований, и произведена их оценка.
В настоящее время нейронные генеративные нейронные сети способны помочь только на этапе генерации идей. Специализированные нейронные сети для разработки фирменного стиля также, по сути, решают только задачу генерации некоторого набора вариантов. И даже несмотря на то, что они предлагают законченные решения, они, по сути, не могут соответствовать поставленной задаче, так как их генерация происходит через ассоциации: предпочитаемый цвет, предпочитаемый стиль, направление деятельности и т. д.; но эти инструменты не работают с такими понятиями как техническое задание и т. п. Поэтому полученный результат приемлем только как временное решение.
Таким образом, акцент в деятельности современного дизайнера будет смещен с генерации идей, что составляло значительную долю его работы, на исследование, их интерпретацию и доведение проекта до требуемого состояния, что потребует от него более абстрактного мышления на первых двух этапах и хорошего владения современными инструментами, в том числе, нейронными сетями, на последующих: из художника, способного на бумаге или компьютере излагать свои идеи, он вынужден будет становиться творцом, понимающим истоки этих идей, их смысл и их связь с потребностями заказчика.
Список литературы
- DALL·E 2 / OpenAI : [сайт]. – URL : https://openai.com/dall-e-2 (дата обращения : 01.06.2023). – Текст : электронный.
- Midjourney : [сайт]. – URL : https://www.midjourney.com/home/ (дата обращения : 01.06.2023). – Текст : электронный.
- StableDiffusionAI : [сайт]. – URL : https://stablediffusionai.org/ (дата обращения : 03.06.2023). – Текст : электронный.
- GenerativeAdversarialNetsGenerativeAdversarialNets / I. J. Goodfellow, J. Pouget-Abadie, M. Mirza, B. Xu// arXiv : [сайт]. – URL : https://arxiv.org/pdf/1406.2661.pdf (дата обращения : 03.06.2023). – Дата публикации : 10.06.2014. – Текст : электронный.
- Гудфеллоу, Я. Глубокое обучение / Я. Гудфелоу, И. Бенджио, А. Курвилль; [пер. с анг. А. А. Слинкина]. – 2-е изд., испр. – М. : ДМК-Пресс, 2018. – 652 с. : цв. ил. – Текст : непосредственный.
- Looka : Designyourownbeautifulbrand : [сайт]. – URL : https://looka.com/ (дата обращения : 03.06.2023). – Текст : электронный.
- Flair : The AI design tool for Branded Content : [сайт]. – URL: https://flair.ai/ (датаобращения : 03.06.2023). – Текст : электронный.