MLflow

MLflow는 실험 추적, 모델 배포, 프로젝트 재현성을 통합 지원하는 오픈소스 기반 MLOps 플랫폼입니다.

5.0
Preview Image
출시일
2018년 6월
월간 방문자 수
18.1만
개발국
미국
플랫폼
언어
영어

키워드

  • ML 실험 관리
  • 모델 버전 관리
  • ML 배포 플랫폼
  • MLflow 사용법
  • 머신러닝 플랫폼
  • MLOps 도구
  • ML 추적 시스템
  • 실험 재현성
  • 파이토치 로깅
  • ML 플랫폼 비교

플랫폼 설명

MLflow는 머신러닝 수명 주기를 포괄적으로 관리하기 위한 오픈소스 플랫폼으로, 실험 관리, 모델 등록 및 배포, 프로젝트 재현성 확보, 모델 서빙을 하나의 통합 워크플로우로 제공한다. 실험 단계에서는 하이퍼파라미터, 메트릭, 아티팩트 등을 자동으로 로깅할 수 있으며, 사용자는 다양한 실험을 비교하고 분석하며 반복할 수 있다. 프로젝트 단계에서는 MLflow 프로젝트 포맷을 기반으로 환경 구성과 실행 명령을 정의할 수 있고, Git 기반 저장소와 연동하여 다양한 팀 내/외부와 협업할 수 있다. 특히 MLflow Model은 다양한 프레임워크(PyTorch, TensorFlow, scikit-learn 등)로 학습된 모델을 하나의 표준 형식으로 래핑해주어 배포 환경과 언어에 상관없이 재사용성과 이식성이 뛰어난 것이 특징이며, REST API 기반 서빙, Azure, SageMaker, Databricks 등 클라우드 플랫폼과의 통합도 원활하다. 엔터프라이즈 조직에서는 MLflow Tracking과 Registry를 내부 MLOps 파이프라인에 연동해 반복적이고 대규모 모델 관리에 사용하며, 오픈소스 기반이라 온프레미스 또는 클라우드 환경에서 유연하게 커스터마이징이 가능하다.

핵심 기능

  • 실험 추적 및 시각화

    실험별 파라미터, 메트릭, 아티팩트 로깅 및 비교

  • 모델 등록 및 버전 관리

    모델 레지스트리 기능으로 이름 기반 등록 및 버전 분기 가능

  • 모델 서빙

    REST API 기반 모델 서빙 지원 및 로컬/원격 배포 연동

  • MLflow Projects

    실행 환경 정의 및 자동화 실행을 위한 포맷 구성

  • MLflow Models 포맷

    다양한 프레임워크 모델을 하나의 표준 포맷으로 저장

  • 클라우드 연동 지원

    AWS, Azure, Databricks 등 MLOps 환경과의 통합 가능

  • 로컬/온프레미스 설치 지원

    오픈소스 기반으로 내부 서버 설치 및 커스터마이징 가능

  • 자동화 스크립트 및 CLI

    명령어 기반 작업 자동화 가능, DevOps에 용이

활용 사례

  • 모델 실험 비교
  • 하이퍼파라미터 튜닝
  • 모델 배포 자동화
  • 모델 재현성 검증
  • 팀 기반 ML 협업
  • 대시보드 공유
  • 데이터 기반 실험 반복
  • 모델 서빙
  • 레거시 모델 관리
  • Git 연동 실험
  • 파이썬 로깅
  • 클라우드 ML 추적
  • 대규모 모델 버전 관리
  • 엔터프라이즈 MLOps 구축
  • 오픈소스 머신러닝 도구

사용 방법

1

기본 서버 구동

2

API를 통해 실험 로깅 시작

3

실험 결과 비교 및 분석

4

모델을 Registry에 등록하고 REST API로 서빙

요금제

요금제별 월 요금 및 주요 기능
계획 가격 주요 기능
오픈소스 MLflow $0 • 실험 추적
• 모델 레지스트리
• 프로젝트 실행
• 모델 저장 및 로딩
• 커스텀 스토리지 설정
• REST 및 Python API 제공
• 로컬 모델 서빙
• 자유로운 배포 환경
• 서버 비용, 스토리지, DB 사용자 부담
Databricks MLflow $0.07-0.95/DBU • 자동 실험 추적
• 고급 모델 레지스트리
• 원클릭 모델 서빙
• 작업 스케줄링 및 파이프라인
• 서버리스 클러스터 통합
• 보안 및 권한 관리
• 대시보드 및 분석 연동
• 협업 기반 노트북 환경

자주 묻는 질문

  • MLflow는 머신러닝 실험과 모델을 관리하는 오픈소스 플랫폼입니다.
    ML 모델을 만들 때 발생하는 실험 데이터, 코드 버전, 하이퍼파라미터, 모델 결과, 배포 과정을 하나의 체계 안에서 추적·관리·재현할 수 있게 도와줍니다.
    개발자와 데이터 사이언티스트가 ML 프로젝트를 더 체계적이고 협업 친화적으로 진행할 수 있게 해줍니다.
  • 주요 구성요소는 4가지입니다:
    • Tracking – 실험의 파라미터, 메트릭, 결과 파일 등 기록
    • Projects – 코드, 환경, 의존성 재현을 위한 구조화된 실행 방식
    • Models – 다양한 프레임워크 모델 저장 및 배포 가능
    • Registry – 모델을 운영/테스트 버전으로 관리하고 승인 흐름 적용
  • MLflow 자체는 무료입니다.
    MLflow는 오픈소스 머신러닝 운영 도구로, Apache 2.0 라이선스 하에 누구나 자유롭게 사용할 수 있습니다. 다만 직접 서버, 스토리지, DB 등을 구성해야 하며 이에 대한 인프라 비용은 본인이 부담해야 합니다.
  • Databricks에서 제공하는 MLflow는 14일 무료 체험은 가능하지만, 정식 사용은 유료입니다.
    Databricks는 MLflow를 웹 UI, 자동 실험 추적, 모델 서빙 기능 등과 통합하여 제공합니다. 이때는 DBU(Databricks Unit) 기준으로 사용량만큼 과금됩니다. 사용한 만큼만 지불하며, 14일간 무료 체험판이 있습니다.
  • 아니요. Databricks에서는 따로 DB나 스토리지를 구성할 필요가 없습니다.
    Databricks는 서버리스 환경으로, 실험 정보, 모델, 아티팩트 저장을 자동으로 관리합니다. 사용자는 단지 ML 실험을 실행하거나 노트북에 기록만 하면 됩니다.
    이 모든 인프라 자원은 DBU 단가에 포함되어 과금됩니다.
  • 사용량 기준(DBU) 과금입니다.
    • CPU 기반: 약 $0.15 ~ $0.40/DBU
    • 고급 기능 포함 플랜: $0.55/DBU 이상
    • GPU, 모델 서빙, SQL 웨어하우스 등은 별도 단가
    체험판은 14일 무료, 이후 결제 수단을 등록해야 계속 사용 가능합니다.
  • MLflow는 Apache 2.0 라이선스 하에 단독으로 설치 및 사용 가능한 오픈소스 플랫폼입니다. 로컬 환경, 클라우드 VM, 온프레미스 서버 등에 자유롭게 배포할 수 있습니다. Databricks는 MLflow를 엔터프라이즈 환경에 맞게 통합·확장하여 제공하는 형태입니다.
  • 아니요. MLflow 자체 API는 무료입니다. 오픈소스 설치 버전에서 REST API나 Python API를 사용하는 데는 추가 요금이 발생하지 않습니다.
    단, Databricks 환경에서는 API 호출에 따른 컴퓨팅 리소스 사용량이 요금으로 반영될 수 있습니다.
MLflow 에 대한 등급을 선택합니다.