Spark: Collection의 flatMap을 이용한 비정상 패턴 처리

Spark: Collection의 flatMap을 이용한 비정상 패턴 처리

스칼라에서 map과 flatMap의 차이점을 파악하고 이해하는 것은 쉽지 않은것 같습니다. 이상 데이터 처리는 두 함수를 차아점을 구분하는 예제로 적합하다고 생가합니다. 이상 데이터 처리 예젤로 두 함수의 의미를 정리하겠습니다. 스칼라에서 컬렉션을 map함수로 변환시킬 때 어떤 것을 걸러 내야 할 때가 있습니다. val x = List("taewan 45", "minsu 6", "sunny 40&qu ......
'그날,바다' 후기 (노스포)

'그날,바다' 후기 (노스포)

오늘 ‘그날, 바다‘를 관람했습니다. 제 경우, 그날, 바다를 보기 위해서 극장에 들어가는 과정이 정말 어려웠습니다. 빨리 보고 싶다는 마음과 두려움이 함께 했습니다. ‘그날, 바다‘는 저에게 꼭 봐야 할 것 같은 영화지만, 두렵고 용기가 필요한 영화였습니다. 저와 같이 세월호에 대한 무게감에 영화 관람이 꺼려지시는 분들을 위해서 ‘그날, 바다’ 관람 후기를 작성합니다. 여러분들이 ......
뇌는 어떻게 결정하는가?

뇌는 어떻게 결정하는가?

최근에 제가 집중하고 있는 키워드는 인공지능 그중에서도 딥러닝 입니다. 인공지능이란 “인간이 수행하는 지적인 작업의 자동화”하는 것이라고 정의할 수 있습니다. 일반적으로 인공지능 그 중에서도 딥러닝을 소개할 때 인간의 뇌에서 영감을 받아 만든 기술로 데이터를 학습하여 숨겨진 패턴을 찾아내는 기술이라고 설명합니다. 딥러닝 기술을 익히면서 정말 사람의 뇌는 어떻게 움직이는지 궁금해졌습니다. 이런 궁금증으로 읽기 시작한 책이 ......
미래와 추억을 자극하는 'Ready Player One' 관람 후기

미래와 추억을 자극하는 'Ready Player One' 관람 후기

지난 수요일 레디 플레이어 원 시사회에 다녀 왔습니다. 결론부터 말씀 드린다면 이 영화 강추합니다. 특히 다음과 같은 분들에게 추천합니다. 향후 10년쯤 후의 미래가 궁금하신 분 SF 혹은 일본 메카닉 애니메이션 좋아하시는 분 1990 ~ 2000년 대 초반의 멀티미디어를 즐기시고 추억하시는 분 IT 분야에 종사하시는 분 “인디아나 존스”의 21세기 버전을 보고 싶으신 분 정말 이번 레디 플레이어 원은 스티븐 스필버그 ......
구글 vs 오라클 Java 라이센스 전쟁

구글 vs 오라클 Java 라이센스 전쟁

지난 8년간 오라클과 구글의 자바 라이센스 분쟁이 끝났습니다. 재판 과정을 지켜보면서 제가 느낀 감정과 사견을 정리해 보겠습니다. 이 글은 전적으로 저 개인의 사견임을 먼저 밝힙니다. 재심에서 재판부는 구글은 오라클에 라이센스를 지급할 것을 판결했고, 구글의 대법원 상고 요청이 기각되었습니다. 실질적으로 최종 판결인 것으로 판단됩니다. 앞으로 라이센스 규모 산정 및 협상이 이루어질 것입니다. 그림 1: 구글, 지재권 소송서 오라클에 패배…자바 관련기사 링크: 구글, 지재권 소송서 오라클에 패배…자바 오라클 재판 승소 기사를 보면 다음과 같은 내용을 포함합니다.
Machine Learning 용어집

Machine Learning 용어집

머신러닝 관련 용어를 정리합니다. 머신러닝 원문 용어의 한글 맵핑과 관련 정보를 정리합니다. A Accuracy: 정확도 분류 성능 모델 성능 지표 다중 클래스 분류에서 정확도 $\frac{#True Positive}{#Total Examples}$ 이진 분류 정확도 $\frac{#True Positive + #True Negative}{#Total Examples}$ Activation function: 활성화 함수 Adam: A ......
Cloud Native Java:GraalVM (@Oracle Developer Meetup)

Cloud Native Java:GraalVM (@Oracle Developer Meetup)

2019년 2월 16일에 8번째 “Oracle Developer Meetup” 세미나에서 GraalVM을 소개하는 세션을 진행했습니다. GraalVM은 고성능 JIT Compiler, Native 컴파일러 및 여러 언어를 통합하는 Polyglot 특징을 제공하는 새로운 Java 입니다. OpenJDK와 함께 다양성 자바의 시작을 알리는 기술이라고 생각합니다. 여기서 GraalVM을 소개하는 100분 세미나를 진행했습니다. ......
파이썬 데이터 사이언스 Cheat Sheet: NumPy 기초, 기본

파이썬 데이터 사이언스 Cheat Sheet: NumPy 기초, 기본

파이썬 기반 데이터 분석 환경에서 NumPy1는 행렬 연산을 위한 핵심 라이브러리입니다. NumPy는 “Numerical Python“의 약자로 대규모 다차원 배열과 행렬 연산에 필요한 다양한 함수를 제공합니다. 특히 메모리 버퍼에 배열 데이터를 저장하고 처리하는 효율적인 인터페이스를 제공합니다. 파이썬 list 객체를 개선한 NumPy의 ndarray 객체를 사용하면 더 많은 데이터를 더 빠르게 처리할 수 있습니다. Nu ......
[번역] JShell 사용자 가이드

[번역] JShell 사용자 가이드

이 문서는 Java9의 오라클 공식 문서 중 JShell 사용자 가이드의 한글화 문서입니다. 원문 정보는 다음과 같습니다. 원문: https://docs.oracle.com/javase/9/jshell/toc.htm 제목: Java Platform, Standard Edition Java Shell User’s Guide: 1 Introduction to JShell 문서번호: E87478-01 배포: 2017년 09월 라이센스: 원본 ......
CNN, Convolutional Neural Network 요약

CNN, Convolutional Neural Network 요약

Fully Connected Layer1 만으로 구성된 인공 신경망의 입력 데이터는 1차원(배열) 형태로 한정됩니다. 한 장의 컬러 사진은 3차원 데이터입니다. 배치 모드에 사용되는 여러장의 사진은 4차원 데이터입니다. 사진 데이터로 전연결(FC, Fully Connected) 신경망을 학습시켜야 할 경우에, 3차원 사진 데이터를 1차원으로 평면화시켜야 합니다. 사진 데이터를 평면화 시키는 과정에서 공간 정보가 손실될 수밖에 없습니다. 결과적으 ......
[번역]관리형 아파치 카산드라 서비스 소개: Oracle Data Hub Cloud Service

[번역]관리형 아파치 카산드라 서비스 소개: Oracle Data Hub Cloud Service

본문은 blogs.oracle.com에서 운영 중인 Oracle Developer 블로그의 11월 22일자 포스트를 번역한 문서입니다. Oracle Data Hub Cloud Service는 MySQL과 Oracle Database를 제외한 다른 데이터베이스와 NoSQL(MongoDB, Cassandra, Redis)을 일괄 제공하는 것을 목표로 만들어진 클라우드 서비스입니다. 현재 첫 번째 데이터베이스로 카산드라를 제공합니다. 이와 관련한 오 ......
[번역]2017 KubeCon 오라클 발표: Kubernetes와 Serverless

[번역]2017 KubeCon 오라클 발표: Kubernetes와 Serverless

본문은 blogs.oracle.com에서 운영중인 Oracle Developer 블로그의 12월 7일자 포스트를 번역한 문서입니다. 오라클은 최근 KubeCon에서 Serverless 배포와 멀티 클라우드를 관리하는 Kubernetes 툴 2 가지를 공개하였습니다. 이와 관련한 오라클 공식 블로그의 포스트를 번역합니다. 원문 정보는 다음과 같습니다. 출처: 오라클 공식 블로그, blogs.oracle.com 원문: https://blogs. ......
신경망 W 행렬 표기법: 'ij'/'ji' 의 차이점?

신경망 W 행렬 표기법: 'ij'/'ji' 의 차이점?

제가 처음에 딥러닝을 학습할 때 가장 혼란스러웠던 것은 입력 레이어의 데이터와 가중치 W의 합 표현하는 “Z(Weighted Sum)” 수식이 문서마다 다른 것이었습니다. <식 1>. Z(Weighted Sum)을 표현하는 수식 $$ \begin{align} Z^{[l]} & = W^{[l]T}A^{[l-1]} & (1) \\ Z^{[l]} & = W^{[l]}A^{[l-1]} & ......
딥러닝 역전파 수식 행렬의 전치(Transpose) 기준?

딥러닝 역전파 수식 행렬의 전치(Transpose) 기준?

Backpropagation을 직접 구현하는 과정에서 이유 없이 갑자기 발생하는 행렬 전치(Transpose)와 관련된 의문점이 오랜 기간 절 괴롭혔습니다. Backpropagation을 하기 위해서 Cost Function을 해당 계층의 W(가중치)로 편미분 한 후, 현재 W를 수정하는 수식을 유도하는 과정에서 일부 행렬이 전치행렬로 갑자기 변경됩니다. 문제는 제가 행렬이 전치(Transpose)되는 근거와 기준을 이해할 수가 없다는 것입니다 ......