AIニュース

ニュース · · 05:58 · kyra

AIトレーニング中の電力需要のバランスに関する協力要請

マイクロソフト、Nvidia、OpenAIの研究者たちは、AIトレーニング中の電力需要を正常化する方法を見つけるために、ソフトウェア、ハードウェア、インフラ、ユーティリティの設計者に協力を呼びかけました。

これら3社の約60人の科学者が、AIトレーニング作業の電力管理の課題に対処する必要性についての論文を共同執筆しました。彼らの懸念は、AIトレーニングの変動する電力需要が、電力網の可変負荷を処理する能力を脅かすことです。

「AIトレーニングデータセンターの電力安定化」という論文では、電力集約型のGPU計算フェーズと、負担の少ない通信フェーズ間のエネルギー需要の変動が、AIモデル開発の障害であると主張しています。

著者たちは、計算フェーズと通信フェーズ間の電力消費の差が極端であり、前者はGPUの熱限界に近づき、後者はほぼアイドル状態のエネルギー使用に近いと指摘しています。

この電力需要の変動は、ノード(サーバー)レベルで発生し、データセンターの他のノードでも発生し、ラック、データセンター、電力網レベルで可視化されます。これは、約50,000台のヘアドライヤー(約2000ワット)が同時にオンになるのと同じです。

研究者たちは、ソフトウェアベースのアプローチ、GPUレベルのファームウェア機能、データセンターレベルのバッテリーエネルギー貯蔵システムを評価し、最適なソリューションはこれら3つの技術を組み合わせることだと主張しています。

彼らは、AIフレームワークとシステム設計者に非同期で電力認識のトレーニングアルゴリズムに焦点を当てるよう求めています。