DagsHub

대그스허브(DagsHub)는 데이터, 코드, 모델, 실험 결과를 하나의 플랫폼에서 관리하고 팀과 함께 협업할 수 있도록 설계된 머신러닝 협업 도구입니다.

5.0
Preview Image
출시일
2020년
월간 방문자 수
73.6만
개발국
미국
플랫폼
언어
영어

키워드

  • DagsHub
  • 데이터 과학 플랫폼
  • DVC
  • Git 통합
  • 실험 추적
  • MLops
  • 데이터 버전 관리
  • 멀티모달 주석
  • 모델 레지스트리
  • Jupyter 노트북 비교
  • 협업 플랫폼
  • 오픈소스 통합
  • 레이블링 자동화
  • 실험 재현성
  • 엔터프라이즈 MLOps

플랫폼 설명

대그스허브(DagsHub)는 AI 모델 개발에 필요한 코드, 데이터, 모델, 실험 기록을 한 곳에서 효율적으로 관리하고 협업할 수 있는 플랫폼입니다. Git과 DVC(Data Version Control)를 기반으로 만들어졌기 때문에, 소프트웨어 개발자들이 사용하는 방식 그대로 데이터 과학 프로젝트를 체계적으로 버전 관리할 수 있습니다. 복잡한 데이터 파이프라인을 다룰 때도 실험 결과를 일관되게 재현할 수 있으며, 팀원 간의 변경 사항과 모델 성능 차이를 투명하게 비교하고 공유할 수 있습니다. 대그스허브(DagsHub)는 Jupyter 노트북, 실험 비교 대시보드, 멀티모달 데이터 주석 기능, 그리고 MLflow, Jenkins, Label Studio 같은 오픈소스 도구와의 통합 기능을 갖추고 있어 전체 MLOps(머신러닝 운영) 워크플로우를 자동화하는 데 유리합니다. 실험 결과에 주석을 달거나, 협업자가 데이터셋에 라벨을 붙이거나, 모델 성능을 팀원들과 시각적으로 비교하는 등 실제 AI 개발 과정에서 필요한 기능들이 웹 인터페이스에 자연스럽게 녹아 있습니다. 무엇보다도 GitHub처럼 오픈소스 프로젝트는 누구나 무료로 이용할 수 있으며, 개인 사용자도 비공개 저장소에서 실험을 최대 100개까지 실행해볼 수 있습니다. 기업용 플랜에서는 협업 인원 수, 저장 용량, SSO 로그인, 온프레미스 설치 등 실무 환경에 맞춘 보안과 확장성도 제공합니다. 따라서 연구팀부터 스타트업, 엔터프라이즈까지 다양한 규모의 조직에서 실제 운영 가능한 AI 협업 환경을 구축하는 데 적합한 플랫폼입니다.

핵심 기능

  • 코드·데이터·모델 통합 버전 관리

    Git + DVC 통해 전체 ML 자산 일관 추적

  • 실험 추적 및 비교 대시보드

    MLflow 기반 실험 기록 및 수치·파라미터 비교

  • 노트북 버전 및 변경 비교

    Jupyter 노트북 diff 및 히스토리 관리 지원

  • 멀티모달 주석 및 자동 라벨링

    이미지, 오디오, 텍스트 데이터 주석 기능 내장

  • 모델 레지스트리 관리

    학습된 모델 저장 및 배포 이력 관리

  • CI/CD 통합

    Git/Jenkins/MLflow 연동으로 실험 재실행 및 파이프라인 자동화

  • 공개/비공개 저장소 관리

    공개 프로젝트 무제한, 비공개 실험 100개 무료 지원

  • 조직용 온프레 설치 및 SSO 지원

    대규모 기업용 보안 및 인증 기능 제공

활용 사례

  • 데이터 버전 관리
  • 코드 버전 관리
  • 실험 추적
  • Jupyter 노트북 비교
  • 멀티모달 데이터 주석
  • 모델 레지스트리
  • DVC 통합
  • MLflow 통합
  • 데이터 파이프라인 자동화
  • 온프레미스 설치
  • 팀 협업
  • 공개 프로젝트 호스팅
  • 실험 재현성
  • Git지원
  • 레이블링 자동화
  • 대시보드 비교

사용 방법

1

프로젝트 생성

2

로컬 Git+DVC 초기화

3

실험 추적 확인 및 비교

4

데이터 셋 주석·코드 리뷰

요금제

요금제별 월 요금 및 주요 기능
계획 가격 주요 기능
Individual $0 • 무제한 공개 저장소 (무제한 협업자 가능)
• 비상업적 사용에 한해 무제한 비공개 저장소
• 공개 저장소용 실험 추적 무제한
• 비공개 저장소에서 최대 100개의 실험 추적
• 비공개 프로젝트에 최대 2명의 협업자
• 20GB의 DagsHub 저장소
• 데이터 버전 관리 및 추적
• 공개 저장소용 주석 작업 공간
• 노트북 버전 관리 및 비교
• CI/CD/CT 통합
• 인터랙티브 파이프라인
• 커뮤니티 지원
Team $119(월) • Individual 플랜의 모든 기능 포함
• 무제한 비공개 저장소
• 멀티모달 주석 및 자동 라벨링 기능
• 사용자 스토리지 연결 기능
• Label Studio 호환
• 팀 RBAC(역할 기반 액세스 제어)
• 우선 순위 기술 지원
• 최대 1TB 데이터 또는 200만 개 파일 저장 가능
Enterprise 문의 • Team 플랜의 모든 기능 포함
• 페타바이트급 데이터 관리
• 클러스터에 직접 모델 배포
• VPC 또는 Air-gapped 온프레미스 설치
• SSO/LDAP/OIDC 기반 RBAC
• OpenShift 호환
• 조직 자원 제어
• SLA 포함된 엔터프라이즈급 지원

자주 묻는 질문

  • DagsHub는 데이터 과학자와 머신러닝 엔지니어를 위한 협업 중심 웹 플랫폼으로, 코드·데이터·모델·실험 결과를 통합해 버전 관리하고 시각적으로 협업할 수 있게 돕습니다.
  • Git은 대용량 파일 버전 관리에 취약하고, 데이터 파이프라인 변경을 추적하지 못합니다. DagsHub는 Git과 DVC를 기반으로 하여 대규모 데이터 및 모델도 효율적으로 버전 관리하고, 파이프라인 변경을 감지해 필요한 작업만 자동으로 업데이트합니다.
  • 네. GitHub와 마찬가지로 리포지토리 관리, PR(풀 리퀘스트), 이슈 추적이 가능하며, GitHub 저장소와 연동해서 양방향 동기화도 할 수 있습니다.
  • Git은 그대로 사용하고, DVC는 Git과 유사한 명령어 체계를 사용합니다. 기존 Git 사용자가라면 쉽게 적응할 수 있고, DagsHub는 시각화 도구를 제공해 CLI에 익숙하지 않은 사용자도 사용할 수 있도록 도와줍니다.
  • 아닙니다. DagsHub는 완전히 언어와 라이브러리에 독립적입니다. Python, R, PyTorch, TensorFlow, Keras 등 어떤 툴을 사용해도 호환됩니다.
  • 가능합니다. GitHub 저장소를 DagsHub와 연결하면 GitHub의 푸시 이벤트에 따라 자동으로 동기화되고, PR 및 이슈도 양방향으로 확인할 수 있어 두 플랫폼을 병행하여 사용할 수 있습니다.
  • DagsHub 튜토리얼을 통해 간단하게 시작할 수 있으며, Git과 DVC 설치 후 프로젝트를 연결하면 됩니다.
  • 오픈소스 프로젝트는 완전히 무료입니다. 개인 저장소도 2명의 협업자를 포함해 무료로 제공되며, 더 많은 기능이나 인원이 필요한 경우 유료 플랜이 준비되어 있습니다. 자세한 내용은 요금제 페이지를 참고하세요.
  • 네, DagsHub는 기업 사용을 위한 보안 옵션도 제공합니다. 자체 스토리지를 이용하거나, 외부 스토리지를 연동하거나, 온프레미스로 완전한 사내 인프라에 설치할 수도 있습니다.
DagsHub 에 대한 등급을 선택합니다.