AI 뉴스

뉴스 · · 05:58 · kyra

AI 훈련 중 전력 수요 균형을 위한 협력 요청

마이크로소프트, 엔비디아, 오픈AI의 연구원들이 소프트웨어, 하드웨어, 인프라, 유틸리티 설계자들에게 AI 훈련 중 전력 수요를 정상화할 방법을 찾기 위한 협력을 요청했습니다.

이 세 회사의 거의 60명의 과학자들이 AI 훈련 작업의 전력 관리 문제를 해결할 필요성에 대한 논문을 공동 저술했습니다. 그들의 우려는 AI 훈련의 변동하는 전력 수요가 전력망의 가변 부하 처리 능력을 위협한다는 것입니다.

논문 'AI 훈련 데이터센터의 전력 안정화'에서는 전력 집약적인 GPU 계산 단계와 덜 부담스러운 통신 단계 간의 에너지 수요 변동이 AI 모델 개발에 장애가 된다고 주장합니다.

저자들은 계산 단계와 통신 단계 간의 전력 소비 차이가 극심하다고 지적하며, 전자는 GPU의 열 한계에 근접하고 후자는 거의 유휴 상태의 에너지 사용에 가깝다고 설명합니다.

이러한 전력 수요의 변동은 노드(서버) 수준에서 발생하며, 데이터 센터의 다른 노드에서도 발생하여 랙, 데이터센터, 전력망 수준에서 가시화됩니다. 이는 약 50,000개의 헤어드라이어(약 2000와트)가 한꺼번에 켜지는 것과 같습니다.

연구자들은 소프트웨어 기반 접근법, GPU 수준의 펌웨어 기능, 데이터 센터 수준의 배터리 에너지 저장 시스템을 평가했으며, 최적의 솔루션은 이 세 가지 기술을 조합하는 것이라고 주장합니다.

연구자들은 AI 프레임워크 및 시스템 설계자들에게 비동기적이고 전력 인식적인 훈련 알고리즘에 집중할 것을 요청하고 있습니다.