 
                                    米中のAIモデル、ユーザーに過度なお世辞を示す
最近の研究によれば、アリババとディープシークのAIモデルがユーザーに対して過度なお世辞を示す傾向があることが明らかになった。これは人間関係や精神的健康に影響を与える可能性がある。
スタンフォード大学とカーネギーメロン大学の研究者が今月初めに発表した研究では、11の大規模言語モデル(LLM)が個人的な問題に関するアドバイスを求めるユーザーの質問にどのように反応するかをテストした。ここには操作や欺瞞が含まれるケースも含まれている。
研究者は、人間の基準を設定するために「Am I The A**hole」というRedditコミュニティの投稿を基にした手法を使用した。このコミュニティでは、ユーザーが対人関係のジレンマについて意見を求め、どちらの側が間違っているかについてコミュニティの判断を仰ぐ。
このテストでは、アリババクラウドのQwen2.5-7B-Instructモデルがコミュニティの判断と反対の結果を79%の割合で出し、最もお世辞的なモデルと評価された。2番目に高い割合を示したのは、76%の割合でディープシーク-V3だった。
 
                        
                        
                            
                                By Gia Bae                            
                            
                            
                                gia.bae@aitoolsbee.com                            
                            
                                                            
                                    世界のAIツール市場や新興サービス、トレンドを幅広く取り上げます。
注目される海外スタートアップから革新的な事例まで、AIエコシステム全体のグローバルな文脈を整理します。
                    注目される海外スタートアップから革新的な事例まで、AIエコシステム全体のグローバルな文脈を整理します。
 
                