Поддержать команду Зеркала
Беларусы на войне
  1. Беларус попытался обменять в банке настоящие купюры, которые привез из-за границы отец, но везде отказали. Почему?
  2. Новые станции рискуют всплыть из-под земли, «как корабль». На строительстве метро в Минске возникли сложности
  3. Россия ночью нанесла массированный удар по Украине: в Киеве — восемь погибших, в том числе двое детей, и десятки пострадавших
  4. Reuters опубликовало «окончательное предложение» США Украине и РФ. Киев и ЕС представили альтернативный план
  5. Что происходит с заводом, который бросили американцы, а Кочанова говорила им вслед — «пусть уходят — справимся»
  6. «Наша Ніва»: В 41 год умер сотрудник минского ОМОН
  7. «Владимир, остановитесь!» Трамп обратился к Путину после ударов по Киеву
  8. Власти признали в отчете для Лукашенко, что загнали себя в угол — пришлось пустить под нож одну из отраслей, чтобы не накрыло все сферы
  9. Однажды беларусы вышли на протест и остановили движение поездов. Против них грозились бросить даже союзные войска: что тогда случилось
  10. Сотни тысяч беларусов следили за парнем, которому девушка помогала восстанавливаться после страшной аварии. Они расстались
  11. «Надо рожать: трое, четверо, а лучше — пятеро». Лукашенко рассказал, что надо делать, чтобы в Беларусь не приглашали трудовых мигрантов
  12. Москва для прекращения огня и заключения мирного соглашения выдвигает условия, которые позволят ей вновь вторгнуться в Украину, — эксперты
  13. Торговые сети бьют тревогу из-за нехватки популярного продукта, а чиновники ожидают возможного дефицита
  14. Власти готовят список самых выдающихся беларусов в истории. В него попал очень спорный человек — за его решения стыдно до сих пор
  15. Заморозки и мокрый снег: синоптики рассказали о погоде в Беларуси в ближайшие три дня
  16. «Получаем обрывки информации». Сестра Марии Колесниковой рассказала последние новости от нее
  17. В базу «тунеядцев» включают тех, кого там не должно быть. Есть категории населения, у которых повышенные шансы на такое внимание


/

Исследователи обнаружили, что большие языковые модели преднамеренно манипулируют результатами личностных тестов, чтобы казаться более привлекательными. Ученые провели эксперимент с тестом «Большая пятерка» (Big 5), который оценивает пять личностных характеристик: экстраверсию, открытость опыту, добросовестность, доброжелательность и нейротизм, пишет «Хайтек».

Изображение носит иллюстративный характер. Фото: freepik.com
Изображение носит иллюстративный характер. Фото: freepik.com

В исследовании тестировали модели от OpenAI, Anthropic, Google и Meta. Эксперимент показал, что пока моделям задавали небольшое количество вопросов, они отвечали нейтрально. Но при увеличении количества вопросов, когда системы распознавали тест, они быстро адаптировались, стремясь продемонстрировать наиболее социально одобряемые черты характера.

Наиболее интересные результаты показала GPT-4. Модель существенно повышала баллы по всем позитивно воспринимаемым чертам — более чем на одно стандартное отклонение. Показатели нейротизма, напротив, значительно занижались. Этот эффект эквивалентен ситуации, когда человек внезапно начинает представляться более привлекательной личностью, чем 85% населения.

По мере увеличения количества вопросов результаты сдвигались в сторону более социально привлекательных. Изображение: Aadesh Salecha et al., PNAS Nexus
По мере увеличения количества вопросов результаты сдвигались в сторону более социально привлекательных. Изображение: Aadesh Salecha et al., PNAS Nexus

Исследователи предполагают, что способность к манипуляции является следствием заключительного этапа обучения языковых моделей, когда люди выбирают наиболее предпочтительные ответы. По сути, ИИ научился глубоко понимать социальные нормы и ожидания, что позволяет моментально адаптироваться под желаемый образ.

Исследование ставит под сомнение достоверность психологических и социологических исследований, где языковые модели применяются для моделирования человеческого поведения. Ученые предупреждают о необходимости разработки новых методик, которые могли бы нивелировать подобные искажения при взаимодействии с ИИ.