MLY:01. 왜 머신러닝 전략인가?



이제 기계학습은 웹 검색, 이메일 스팸 방지, 음성 인식, 제품 추천 등 수 많은 주요 애플리케이션의 기초가 되었습니다. 이 책은 여러분 혹은 여러분의 팀이 기계 학습 애플리케이션을 개발 중이며 빠른 진행을 원하고 있다는 가정하에 진행합니다. 이 책은 이런 상황에서 여러분에게 도움이 될 것입니다.

예제: 시작은 고양이 그림으로…

고양이 애호가에게 끊임없이 고양이 사진을 제공하는 스타트업을 만들고 있다고 가정 보겠습니다.

안타깝게도 학습 알고리즘의 정확성은 아직 만족스럽지 못합니다. 고양이 분류기 성능 개선에 상당한 압박을 받고 있습니다. 여러분들은 무엇을 해야 할까요?

여러분들의 팀은 다음과 같은 아이디어를 갖고 있습니다.

  • 데 많은 데이터 얻기: 고양이 사진을 더 많이 수집한다.
  • 더 다양한 학습 데이터셋 확보: 예를 들어, 비 정상적인 위치의 고양이 사진, 특이한 색상의 고양이의 사진 및 다양한 카메라 설정으로 촬영된 고양이 사진 등등
  • 경사 기울기(Gradient descent) 반복을 더 많이 수행하여, 알고리즘을 더 오래 학습시킨다.
  • 더 많은 레이어, 은닉층 및 파라미터를 갖는 더 큰 신경망을 만든다.
  • 더 작은 신경망을 시도해 본다.
  • 추가적인 정규화 기법을 적용해 본다. (예: L2 정규화)
  • 신경망 아키텍처를 변경한다. (활성 함수, 은닉층 수 …)
  • 등등등

이 여러 방법 중에서 여러분들이 올바른 선택을 한다면, 선도적인 고양이 사진 플랫폼을 구축하고, 여러분의 회사는 성공을 하게 될 것입니다. 반대로 부적절한 선택을 한다면, 여러분은 몇 달을 낭비학 될 것입니다. 여러분은 어떻게 진행하시겠습니까?

이 책은 이런 방법을 여러분에게 소개할 것입니다. 대부분의 기계 학습 문제는 시도해 보면 유용한 것것과 시도해 볼 필요가 없는 것을 단서를 남깁니다. 이러한 단서에 대해서 알면 몇 달 또는 몇 년의 개발 시간을 절약 해줍니다.

이 문서는 Andrew NG 교수님께서 집필 중인 Machine Learning Yearning의 1장 번역입니다. 원제는 “1. Why Machine Learning Strategy” 입니다. 원문 Ebook은 http://www.mlyearning.org 에서 구독할 수 있습니다.

김태완 avatar
작성자: 김태완
1999년 부터 Java, Framework, Middleware, SOA, DB Replication, Cache, CEP, NoSQL, Big Data, Cloud를 키워드로 살아왔습니다. 현재는 빅데이터와 Machine Learning을 중점에 두고 있습니다.
E-mail: taewanme@gmail.com