

- 출시일
- 2018년 6월
- 월간 방문자 수
- 18.1만
- 개발국
- 미국
- 플랫폼
- 웹
- 언어
- 영어
키워드
- ML 실험 관리
- 모델 버전 관리
- ML 배포 플랫폼
- MLflow 사용법
- 머신러닝 플랫폼
- MLOps 도구
- ML 추적 시스템
- 실험 재현성
- 파이토치 로깅
- ML 플랫폼 비교
플랫폼 설명
MLflow는 머신러닝 수명 주기를 포괄적으로 관리하기 위한 오픈소스 플랫폼으로, 실험 관리, 모델 등록 및 배포, 프로젝트 재현성 확보, 모델 서빙을 하나의 통합 워크플로우로 제공한다. 실험 단계에서는 하이퍼파라미터, 메트릭, 아티팩트 등을 자동으로 로깅할 수 있으며, 사용자는 다양한 실험을 비교하고 분석하며 반복할 수 있다. 프로젝트 단계에서는 MLflow 프로젝트 포맷을 기반으로 환경 구성과 실행 명령을 정의할 수 있고, Git 기반 저장소와 연동하여 다양한 팀 내/외부와 협업할 수 있다. 특히 MLflow Model은 다양한 프레임워크(PyTorch, TensorFlow, scikit-learn 등)로 학습된 모델을 하나의 표준 형식으로 래핑해주어 배포 환경과 언어에 상관없이 재사용성과 이식성이 뛰어난 것이 특징이며, REST API 기반 서빙, Azure, SageMaker, Databricks 등 클라우드 플랫폼과의 통합도 원활하다. 엔터프라이즈 조직에서는 MLflow Tracking과 Registry를 내부 MLOps 파이프라인에 연동해 반복적이고 대규모 모델 관리에 사용하며, 오픈소스 기반이라 온프레미스 또는 클라우드 환경에서 유연하게 커스터마이징이 가능하다.
핵심 기능
-
실험 추적 및 시각화
실험별 파라미터, 메트릭, 아티팩트 로깅 및 비교
-
모델 등록 및 버전 관리
모델 레지스트리 기능으로 이름 기반 등록 및 버전 분기 가능
-
모델 서빙
REST API 기반 모델 서빙 지원 및 로컬/원격 배포 연동
-
MLflow Projects
실행 환경 정의 및 자동화 실행을 위한 포맷 구성
-
MLflow Models 포맷
다양한 프레임워크 모델을 하나의 표준 포맷으로 저장
-
클라우드 연동 지원
AWS, Azure, Databricks 등 MLOps 환경과의 통합 가능
-
로컬/온프레미스 설치 지원
오픈소스 기반으로 내부 서버 설치 및 커스터마이징 가능
-
자동화 스크립트 및 CLI
명령어 기반 작업 자동화 가능, DevOps에 용이
활용 사례
- 모델 실험 비교
- 하이퍼파라미터 튜닝
- 모델 배포 자동화
- 모델 재현성 검증
- 팀 기반 ML 협업
- 대시보드 공유
- 데이터 기반 실험 반복
- 모델 서빙
- 레거시 모델 관리
- Git 연동 실험
- 파이썬 로깅
- 클라우드 ML 추적
- 대규모 모델 버전 관리
- 엔터프라이즈 MLOps 구축
- 오픈소스 머신러닝 도구
사용 방법
기본 서버 구동
API를 통해 실험 로깅 시작
실험 결과 비교 및 분석
모델을 Registry에 등록하고 REST API로 서빙
요금제
요금제 | 가격 | 주요 기능 |
---|---|---|
오픈소스 MLflow | $0 | • 실험 추적 • 모델 레지스트리 • 프로젝트 실행 • 모델 저장 및 로딩 • 커스텀 스토리지 설정 • REST 및 Python API 제공 • 로컬 모델 서빙 • 자유로운 배포 환경 • 서버 비용, 스토리지, DB 사용자 부담 |
Databricks MLflow | $0.07-0.95/DBU | • 자동 실험 추적 • 고급 모델 레지스트리 • 원클릭 모델 서빙 • 작업 스케줄링 및 파이프라인 • 서버리스 클러스터 통합 • 보안 및 권한 관리 • 대시보드 및 분석 연동 • 협업 기반 노트북 환경 |
자주 묻는 질문
-
MLflow는 머신러닝 실험과 모델을 관리하는 오픈소스 플랫폼입니다.
ML 모델을 만들 때 발생하는 실험 데이터, 코드 버전, 하이퍼파라미터, 모델 결과, 배포 과정을 하나의 체계 안에서 추적·관리·재현할 수 있게 도와줍니다.
개발자와 데이터 사이언티스트가 ML 프로젝트를 더 체계적이고 협업 친화적으로 진행할 수 있게 해줍니다. -
주요 구성요소는 4가지입니다:
• Tracking – 실험의 파라미터, 메트릭, 결과 파일 등 기록
• Projects – 코드, 환경, 의존성 재현을 위한 구조화된 실행 방식
• Models – 다양한 프레임워크 모델 저장 및 배포 가능
• Registry – 모델을 운영/테스트 버전으로 관리하고 승인 흐름 적용 -
MLflow 자체는 무료입니다.
MLflow는 오픈소스 머신러닝 운영 도구로, Apache 2.0 라이선스 하에 누구나 자유롭게 사용할 수 있습니다. 다만 직접 서버, 스토리지, DB 등을 구성해야 하며 이에 대한 인프라 비용은 본인이 부담해야 합니다. -
Databricks에서 제공하는 MLflow는 14일 무료 체험은 가능하지만, 정식 사용은 유료입니다.
Databricks는 MLflow를 웹 UI, 자동 실험 추적, 모델 서빙 기능 등과 통합하여 제공합니다. 이때는 DBU(Databricks Unit) 기준으로 사용량만큼 과금됩니다. 사용한 만큼만 지불하며, 14일간 무료 체험판이 있습니다. -
아니요. Databricks에서는 따로 DB나 스토리지를 구성할 필요가 없습니다.
Databricks는 서버리스 환경으로, 실험 정보, 모델, 아티팩트 저장을 자동으로 관리합니다. 사용자는 단지 ML 실험을 실행하거나 노트북에 기록만 하면 됩니다.
이 모든 인프라 자원은 DBU 단가에 포함되어 과금됩니다. -
사용량 기준(DBU) 과금입니다.
• CPU 기반: 약 $0.15 ~ $0.40/DBU
• 고급 기능 포함 플랜: $0.55/DBU 이상
• GPU, 모델 서빙, SQL 웨어하우스 등은 별도 단가
체험판은 14일 무료, 이후 결제 수단을 등록해야 계속 사용 가능합니다. -
MLflow는 Apache 2.0 라이선스 하에 단독으로 설치 및 사용 가능한 오픈소스 플랫폼입니다. 로컬 환경, 클라우드 VM, 온프레미스 서버 등에 자유롭게 배포할 수 있습니다. Databricks는 MLflow를 엔터프라이즈 환경에 맞게 통합·확장하여 제공하는 형태입니다.
-
아니요. MLflow 자체 API는 무료입니다. 오픈소스 설치 버전에서 REST API나 Python API를 사용하는 데는 추가 요금이 발생하지 않습니다.
단, Databricks 환경에서는 API 호출에 따른 컴퓨팅 리소스 사용량이 요금으로 반영될 수 있습니다.