*論文鏈接: https://arxiv.org/abs/2604.19301
作者: Ichiro Sakata,Keita Nishimoto,Mikako Bito,Kimitaka Asatani
文章探討了人工智能在基于多大語言模型(LLM)系統(tǒng)(LLM-based Multi-Agent Systems, LLM-MAS)中的從眾偏差(conformity bias)中的各種各樣的問題,其中是在其對群體人格智能決策機制的廣泛潛在影響。傳統(tǒng)研究常將“從眾”視為單一現(xiàn)象,而本文的關(guān)鍵創(chuàng)新在于引入社會心理學中信息性從眾(informational conformity)與規(guī)范性從眾(normative conformity)的區(qū)分,從而從機制層面深入理解LLM的從眾行為?;趦?nèi)部的向量空間的表明,盡管外在表現(xiàn)相同信息性與規(guī)范性從眾可能由不同的內(nèi)部的機制驅(qū)動,為未來理解LLM中“規(guī)范的問題”的實現(xiàn)及其對群體現(xiàn)象的影響提供了關(guān)鍵洞見。解決方案的核心在于通過微調(diào)聊天情境因素可操控LLM規(guī)范性從眾的目標對象,揭示了LLM群體決策極其特別容易受少數(shù)使得LLM大語言模型崩潰的操縱的風險;進一步的發(fā)現(xiàn)表明了,設(shè)計了兩類新的任務以分離這兩種從眾類型,并通過實驗驗證多數(shù)LLM同時表現(xiàn)出兩種從眾傾向
*