일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 인공신경망
- Stack
- 30 Day Challenge
- 퍼셉트론
- AI Winter
- Bayes Rule
- 딥러닝
- Bayes Theorem
- LeetCode
- 컴퓨터 조립
- 베이즈 정리
- 인공지능
- 편향
- 통계
- Neural Network
- 확률
- 조건부 확률
- ANOVA
- 분산분석
- 심층학습
- knn
- AI
- 인공지능 겨울
- 컴퓨터
- p 값
- p-value
- Today
- Total
군더더기 없는 기계학습 백과사전
AutoML이란 - CEO의 견해 본문
해당 문서는 Gnosis Data Analysis 사의 CEO Ioannis Tsamardinos 교수의 인터뷰를 토대로 작성되었다. Gnosis Data Analysis 사는 현재 자동화 기계학습 어플리케이션인 JAD(Just Add Data)BIO를 내놓은 상태이다.
AutoML이란?
자동화된 기계학습(Automated Machine Learning)의 줄임말로써 기계학습 파이프라인을 처음부터 끝까지 자동화시키고자 하는 움직임이다. 이를 실제로 구현한 한 형태는 데이터를 입력한 뒤 버튼 하나 누르는 것으로 결과를 얻고 끝나는 과정이다. 당신이 데이터에서 원하는 것이 무엇인지 말하면 시스템은 이를 어떻게 얻어낼 수 있는지 알고 있다.
통상적으로 사람들은 AutoML을 복합 알고리즘 선택 및 초매개변수 최적화인 CASH(Combined Algorithm Selection and Hyperparameter Optimization)이라는 개념으로 알고 있다. CASH는 기계학습 분석과정에서 사용할 알고리즘을 최적화하는 과정만을 일컫는다. 이는 결측값 대체 등을 포함한 데이터 가공부터 모델 구축까지 포함한 과정에 들어가는 최적의 알고리즘을 선택한 뒤 예측 모델(predictive model)을 내놓은 과정까지 포함한다고 보면 된다. 대표적으로 auto-sklearn이 존재한다.
그러나 아이아니스 교수는 진정한 의미의 AutoML에는 분석가의 작업이 곁들여져야 한다고 본다.
이는
- 예측 성능 측정
- 피쳐(feature) 선택
- 최종 모델의 설명
- 유저의 의사선택 가속화
- 실생활 적용 후 성능 관리 - 문제 발생 시 경보
등을 포함한다.
누구를 위한 것인가?
아이아니스 교수는 AutoML이 모두를 위한 것이라고 본다. 현재 다양한 분야의 사람들이 접근할 수 있는 엑셀과 파이썬과 같이 AutoML은 기계학습의 세부사항에 익숙치 않은 초보자부터 회사의 기계학습 분석을 담당하는 전문가 모두가 데이터를 이용해 모델을 만들고 예측을 하는 활동에 참여할 수 있는 기계학습의 민주화를 이뤄야한다는 것이다. 전혀 초보자만을 위한 것이 아니다. AutoML은 수동적으로 코드를 일일히 조정해야 하는 전문가의 작업도 최종 모델의 성능을 유지하면서 가속화시킨다.
AutoML의 성능이 시간이 지나면서 지속적으로 발전하기 때문에 전문가의 수동 작업과 비교해 객관적으로 평가하여 논문을 내놓아 AutoML이 항상 나은 선택임을 증명하기는 힘들다. 그러나 한 예시로 미식품의약청에서 연 뇌종양의 생존 시간 예측하기 대회에서 JADBIO가 몇 분만에 내놓은 작업으로 3등을 한 사실을 참고해볼 수는 있다.
AutoML이 데이터 과학자를 대체할 것인가?
아이아니스 교수는 프로그래밍 주 언어가 어셈블리어에서 파이썬으로 바뀌면서 프로그래머들이 대체가 안된 사례를 언급한다. 아이아니스 교수는 AutoML이 오히려 데이터 과학자의 작업을 더 흥미롭게 만들고, 작업 결과물의 품질을 높이고, 늘어난 데이터 활용도 덕분에 주어지는 과제들이 더 어려워 질 것이라고 보고 있다. 따라서 데이터 과학자를 완전히 대체한다고 보기는 어렵다고 한다. 그러나 현재보다는 데이터 과학자의 지식의 깊이가 더 깊어져야 한다고 예상하고 있다고 한다.
출처: StatQuest. “What is AutoML? A conversation with Gnosis Data Analysis” YouTube, Joshua Starmer, 8 Sept. 2020, youtu.be/SEwxvjfxxmE
'Artificial Intelligence > 기타 이모저모' 카테고리의 다른 글
구글 번역기 수정용 기계학습 알고리즘 개발을 생각하는 사람들을 위한 조언 (0) | 2020.09.21 |
---|---|
기계학습/딥러닝 컴퓨터 마련 대안책 - 외장 그래픽(eGPU) (1) | 2020.07.04 |