1. 왜 머신러닝 전략이 필요한가?

1. 왜 머신러닝 전략이 필요한가?

최근에 기계학습은 웹 검색, 이메일 스팸 방지, 음성 인식, 상품 추천 등 수 많은 중요 애플리케이션의 기반 기술이 되었습니다. 이 책은 보시는 여러분 혹은 개발팀은 기계 학습 애플리케이션을 개발 중이며, 빠른 진행을 바란다고 가정합니다. 이 책은 신속한 진행에 도움이 될 것입니다.

예제: 고양이 사진 스타트업 창업

고양이 애호가에게 고양이 사진 스트리밍을 계속 제공하는 스타트업을 만들고 있다고 가정해 보겠습니다.

여러분은 신경망을 사용하여, 사진 속에 고양이를 감지하는 컴퓨터 비전 시스템을 구축하고 있습니다.

안타깝게도 여러분의 학습 알고리즘 정확도는 아직 만족스럽지 못합니다. 또한 개발팀은 고양이 탐지기 성능 개선에 상당한 압박을 받고 있습니다. 여러분들은 무엇을 해야 할까요?

고양이 탐지기 개발팀은 다음과 같은 아이디어를 갖고 있습니다.

  • 더 많은 데이터 확보: 고양이 사진을 더 많이 수집한다.
  • 더 다양한 학습 데이터셋 확보: 예를 들어, 비정상적인 위치의 고양이 사진, 특이한 색상의 고양이 사진 및 다양한 카메라 설정으로 촬영된 고양이 사진 등등
  • 경사 기울기(Gradient descent) 반복을 더 많이 수행하여, 알고리즘을 더 오래 학습시킨다.
  • 더 많은 레이어, 은닉층 및 파라미터를 갖는 더 큰 신경망을 만든다.
  • 더 작은 신경망을 시도해 본다.
  • 정규화 기법(예: L2 정규화)을 추가해 본다.
  • 신경망 아키텍처를 변경한다. (활성 함수, 은닉층 수 …)
  • 등등

이런 여러 방법 중에서 여러분이 올바른 선택을 한다면, 선도적인 고양이 사진 플랫폼을 구축하고, 스타트업은 성공하게 될 것입니다. 반대로 부적절한 선택을 한다면, 개발팀은 몇 달의 시간을 낭비하게 될 것입니다. 여러분은 어떻게 하시겠습니까?

이 책은 이런 상황에서 무엇을 어떻게 해야 하는지를 소개합니다. 대부분의 기계 학습 문제는 시도해 보면 유용한 것과 시도해 볼 필요가 없다는 것을 알리는 단서를 남깁니다. 이런 단서를 파악할 수 있다면 개발팀은 몇 달 또는 몇 년의 개발 시간을 절약할 수 있을 겁니다.

이 문서는 Andrew NG 교수님께서 집필한 Machine Learning Yearning의 1장 번역입니다. 원제는 “1. Why Machine Learning Strategy” 입니다. 원문 Ebook은 http://www.mlyearning.org [↗NW] 에서 내려받을 수 있습니다.

Last updated on 21 Dec 2018 / Published on 21 Dec 2018
김태완 avatar
작성자: 김태완
1999년 부터 Java, Framework, Middleware, SOA, DB Replication, Cache, CEP, NoSQL, Big Data, Cloud를 키워드로 살아왔습니다. 현재는 빅데이터와 Machine Learning을 중점에 두고 있습니다.
E-mail: taewanme@gmail.com

Powered by http://taewan.kim