웹기반 통합 데이터 사이언스 플랫폼, Dataiku 

데이터 준비부터 데이터시각화, 머신 러닝 모델 배포 및 관리, 공유 및 협업까지 제공하는 통합 웹 플랫폼 

웹 기반 통합 데이터 사이언스 플랫폼, Dataiku

효율적인 데이터 분석 및 머신러닝 프로젝트를 위한 웹 기반 통합 데이터 사이언스 플랫폼입니다.
데이터 전처리 및 시각화, 통계와 머신러닝의 모든 과정을 GUI 기반 워크플로우로 구성하여 쉽고 빠르게 프로토타입을 생성하고 예측 모델을 구성하여, 

실시간으로 운영환경에 배포하여 생산성을 크게 향상시킬 수 있습니다.



    • 신속한 분석.예측 과제 파일럿 수행 및 검증
    • 클릭과 드래그앤드랍 방식의 편리한 데이터 전처리 환경
    • 자동화된 피처 엔지니어링을 통한 빠른 머신 러닝 모델 생성
    • 최신형 머신 러닝 라이브러리를  이용한 동시 학습
    • GUI 기반의 간편한 예측 및 분류 모델 생성

    • 조직간 유연한 협업을 통한 생산성 증대
    • 이력관리가 가능한 커뮤니케이션 기능으로 빠른 협업
    • 부서 담당자 별 정확한 작업 할당 가능
    • 위키 페이지 제공으로 체계적인 프로젝트 관리 (자료 공유, 일정 관리 등)

    • 간편하고 빠른 모델 배포 및 관리
    • 특정 지표에 대한 다수 모델 평가 기능
    • Explainable AI를 위한 모델별 성능 지표를 모델별 학습, 속성 순서 이력 제공

    • 간편하고 빠른 모델 배포 및 관리
    • API 자동 배포 기능을 통한 모델의 간편하고 편리한 배포 및 관리
    • API 노트 확장을 통한 머신러닝 모델 서비스 부하 분산을 위한 도커, 쿠버네티스와 연동 모듈 제공



연결클릭 만으로 머신러닝 자동화를 경험하세요
다양한 데이터 소스와 연동 기능
ㆍ하둡 등 30개 이상의 커넥터 자체 제공
ㆍ커스텀 커넥터를 통한 맞춤형 데이터 저장소 연결


머신러닝 모델 생성 및 관리 기능
ㆍ클릭만으로 머신러닝 모델을 생성, 평가
ㆍ머신러닝 모델 개발을 위한 시각적인 단계별 프로세스
ㆍGrid Search 기반 최적 모델 선택 및 편리한 모델 업데이트

 
사용자의 수준에 따른 다양한 전처리 기능
ㆍGUI 기반의 데이터 전처리 기능(조인, 그룹화, 정렬, 피벗등)의 기능을 이용하여 코딩없이 클릭 만으로 데이터 준비 및 Python, R, Scala 등으로 연동하여 분석




플러그인을 통한 코드 재사용 기능
ㆍ파이썬,R,Scala 에서 작성한 코드를 플러인으로 변환하여 재사용(통계 모델, 머신러닝 모델등의 기존 코드 재사용)
ㆍHTML, Javascript, CSS 기반의 웹 어플리케이션을 플러인으로 변환하여 재사용 가능함.


간편한 데이터 분석 기능
ㆍ전체 데이터에 대한 직관적인 뷰
ㆍ드래그앤드랍 방식의 기본 차트 생성 및 통계분석, 상관관계 분석 기능 .






빠르고 정확한 분석 예측 결과를 빠르게 받아볼 수 있습니다


FAQ


자주 묻는 질문 2

Case Study and Customers

(Case 1) 단발성 데이터 사이언스 프로젝트에서의 활용

  • 다양한 기능을 활용한 신속한 프로젝트 수행
  • 개별적 코드 환경 관리 및 Jupyter notebook 지원으로 분석 편의성 제공
  • 대시보드 및 리포트 기능을 활용하여 프로젝트의 결과 정리 및 공유

(Case 2) 자동화 기능 기반으로 데이터 파이프라인 구축에서의 활용

  • 이기종 데이터 소스에서 데이터셋을 구성하는 데이터 파이프라인의 간편한 설계
  • 시나리오 기능을 활용하여 데이터셋 업데이트 및 보고서 생성 자동화

(Case 3) 모델 서비스 제공을 목표로 하는 데이터팀에서의 활용

  • 다양한 프로젝트의 신속한 수행으로 효율적인 데이터 분석 업무 수행
  • 간편한 모델 배포를 기반으로 모델 활용 부서에 신속한 서비스 제공
  • Plug-in, Sample Code 등의 기능으로 코드 재사용성 강화