[2/1000]'실체가 손에 잡히는 딥러닝' 책 후기

[2/1000]'실체가 손에 잡히는 딥러닝' 책 후기
  • 이미지 “책만” 제공

딥러닝 기초를 다지는 신간 리뷰

지난주 ‘실체가 손에 잡히는 딥러닝’ 도서의 베타 리딩에 참여할 기회가 생겨서 책을 읽어본 후기를 공유합니다. 출간이 안된 책의 후기를 쓴다는게 새롭네요.^^ 결론부터 요약하자면 수식이 매우 깔끔하고 수식을 코드로 전환하는 과정이 굉장히 잘 정리되어 있습니다. 수식과 딥러닝 네트워크를 통해서 기본기를 다지고 싶어하시는 분들에게 강추하는 책입니다.

도서 구성

실체가 손에 잡히는 딥러닝‘은 8개 장으로 구성되어 있습니다. 필수 수학 기초와 파이썬 기본 문법으로 시작해서 딥러닝 수식을 이용하여 네트워크의 작동 방식을 소개합니다. 그리고 이 수식을 이용으로 간단한 Neural Net를 시작으로 복잡도 높은 CNN까지 직접 구현하는 흐름으로 진행됩니다.

강조 포인트

실체가 손에 잡히는 딥러닝‘에서 가장 좋았던 부분은 “5장 ~ 7장”입니다. 5장 역전파 에서는 수식으로 Forward Propagation과 Backward Propagation을 정리합니다. 특히 5장에서 인상 깊었던 부분은 “역전파 수식을 추상화하는 과정”입니다. 네트워크의 손실함수와 각 레이어의 활성함수가 결정되지 않은 상태에서는 역전파를 위해 각 레이어의 학습 파라미터를 수정하는 수식(손실함수 편미분)을 완성할 수 없습니다. 따라서 5장에서는 이 부분을 결정되지 않은 함수를 추상화하여 1차 수식을 완성합니다. 그리고 후반부에 네트워크를 모델링하고 손실 함수와 각 레이어의 활성함수를 결정한 후, 앞에서 만든 1차 수식을 완성합니다. 그리고 그 수식을 코드로 전환합니다. 이런 수식 유도와 모델링, 수식완성 그리고 구현 과정이 매끄럽게 정리되어 있습니다. 수식과 코드가 모드 이해하기 쉽고 깔끔합니다.

그 다음으로 인상 깊었던 부분은 7장의 CNN 부분입니다. CNN의 각 구성요소에 대하여 정리하고, 5장에서 만든 수식과 코드를 바탕으로 CNN의 커널과 Classification 레이어를 학습 시키는 코드를 직접 구현하는 예제로 구성되어 있습니다. CNN에 대한 기본 구성 요소에 대한 이해하고 직접 전체 CNN 네트워크를 구현함으로써 CNN 통작 방식에 대한 이해를 상당히 높일 수 있습니다.

책의 느낌과 추천

이 책은 기본 수식으로 시작해서 수식을 추상화하고 단순화한 후, 전체 수식을 완성하는 과정과 이 결과를 파이썬 코드로 전환하는 부분을 어떤 책 보다도 매끄럽고 잘 설명하고 있습니다. 딥러닝에 새로 입문하시거나 기본기를 다지고 싶으신 분 그리고 딥러닝 네트워크를 수식으로 이해하고자 하시는 분과 네트워크 내부(역전파, optimizer) 구현 코드가 궁금하신 분들에게 강추합니다.

도서 정보

김태완 avatar
작성자: 김태완
1999년 부터 Java, Framework, Middleware, SOA, DB Replication, Cache, CEP, NoSQL, Big Data, Cloud를 키워드로 살아왔습니다. 현재는 빅데이터와 Machine Learning을 중점에 두고 있습니다.
E-mail: taewanme@gmail.com