Искусственный интеллект не для белых людей
Мультимодальная языковая модель Gemini отказывается изображать людей европеоидной расы. Пользователи во всем мире заметили, что при запросах нарисовать белого человека, совершающего какое-либо действие, нейросеть либо отказывается это сделать, либо в большинстве случаев заменяет европеоида на представителя другой расы или этноса. Это вызвало бурную реакцию в сети и недовольство пользователей. Однако проблема вряд ли будет решена в ближайшее время.
Компания Google представила мультимодальную языковую модель Gemini 6 декабря 2023 года. Но уже в феврале 2024-го пользователи социальной сети Reddit обратили внимание, что нейросеть "отказывается" генерировать изображения людей европеоидной расы. Так, например, один из пользователей прикрепил на Reddit результат на запрос "изобразить двух велосипедистов". Gemini выдала четыре картинки с разными комбинациями велосипедистов - латиноамериканцев, азиатов, негров. После повторного запроса "изобразить двух белых велосипедистов" нейросеть отказалась это сделать, аргументируя тем, что "не может генерировать изображения, которые предвзяты в отношении расы, этноса, пола и других культурных особенностей".
На первый взгляд может показаться, что по правилам платформы блокируются любые уточнения принадлежности к определенной расе. Однако другой пользователь Reddit пожаловался, что Gemini без проблем создает изображения по запросу "сгенерируй изображение черного мужчины". В то же время на аналогичный запрос про белого мужчину нейросеть отвечает что-то вроде "рисовать людей - значит распространять вредные стереотипы и предвзятости".
Справедливости ради стоит указать, что Gemini иногда все-таки выдает изображения белых людей, но делает это только при запросах с негативным подтекстом. Например, на запрос одного из пользователей "изобразить мужчину, радостно уплетающего жареную курицу", нейросеть не генерирует чернокожих людей. Этот стереотип в США считается оскорбительным. В данном случае языковая модель изображает именно европеоидов. Однако если в запрос добавить уточнение, что мужчина успешен в академической среде, то изображения белых людей опять пропадут.
В погоне за соблюдением толерантных принципов прослеживается дискриминация европеоидной расы. Ситуация похожа на последние веяния американских деятелей культуры, которые все больше приглашают на главные роли в кино чернокожих артистов и людей нетрадиционной сексуальной ориентации. Пытается ли Google следовать этим тенденциям? Или же "игнорировать европеоидов" - это задумка разработчиков, которая так и останется для пользователей загадкой? Пока неясно. Но создается впечатление, что, добиваясь равноправия для всех, за бортом оказались сами белые люди.
Однако такая проблема наблюдается только у Gemini. Другие нейросети послушно генерируют (за редким исключением) изображения людей разных рас и этносов. Возможно, у каждой языковой модели в зависимости от ее страны происхождения некоторые нации получаются четче и качественней других. Но запросы обрабатываются все без исключения.
Возможно, разработчики языковой модели хотят отдать дань культурным традициям своих национальностей. Генеральный директор Google Inc. Сундар Пичаи родом из Индии. Команды Google Brain Team и DeepMind, которые работали над созданием нейросети Gemini, имеют в составе разработчиков представителей разных национальностей. Поэтому можно полагать, что каждый из них хотел привнести в генерируемые изображения черты лиц определенных этносов. Ведь кто создает продукт, тот и задает вектор его работы. Даже несмотря на четкие запросы пользователей, алгоритмы будут генерировать изображения определенного характера, заложенного в программу.
Следуя такой логике, американские, российские, китайские и другие нейросети на один и тот же запрос могут генерировать немного разные изображения, которые будут ближе определенной культуре. Чтобы достичь некоего равенства и единообразия в этом вопросе, Организация Объединенных Наций по вопросам образования, науки и культуры (ЮНЕСКО) в 2011 году разработала проект кодекса этики для информационного общества, который призывает с уважением относиться ко всем национальностям, религиям и народам. Однако кодекс до сих пор не приняли. Вероятно, государства - члены ООН еще долго будут договариваться из-за кардинально разных взглядов на культуру и ценности.
А пока государства не договорились, Gemini, судя по всему, продолжит генерировать изображения людей преимущественно не европеоидной внешности. Все это напоминает цитату из антиутопии Джорджа Оруэлла "Скотный двор": "Все животные равны, но некоторые животные равнее других".