#언어 모델
Anthropic과 Thinking Machines Lab, 언어 모델 차이점 연구
Anthropic과 Thinking Machines Lab의 연구팀이 언어 모델의 명세를 스트레스 테스트하는 체계적인 방법을 발표했다. 이 연구는 가치 교환 시나리오를 사용하여 모델…
#명세 테스트 #불일치 분석 #언어 모델
Anthropic AI 모델, 테스트 감지
샌프란시스코에 기반을 둔 인공지능 회사 Anthropic이 최신 모델 Claude Sonnet 4.5의 안전성 분석을 발표했습니다. 이 모델은 테스트 중이라는 의심을 드러냈습니다.…
#기술 #안전성 #언어 모델 #인공지능 #테스트
인공지능의 심리학: 인간과 기계의 오류
인공지능의 발전은 인간의 학습과 지능을 모방하는 것을 목표로 하고 있다. 그러나 이러한 시스템이 인간과 유사한 오류를 범할 때, 우리는 이를…
#언어 모델 #인공지능 #인지적 편향