Structuring Your TensorFlow Models

​ 이 글은 저자의 허락을 받아 번역한 글 입니다. 원문 링크 TensorFlow에서 모델을 정의하다보면 어느새 많은 양의 코드가 생성된 경험이 있을 것 입니다. 어떻게 하면 가독성과... »

Data Science inconvenient truth

​ 데이터과학의 불편한 진실 Data is never clean (데이터는 절대 깨끗하지 않다) You will spend most of your time cleaning and preparing data (당신은 분석의 대부분의... »

Deep Learning Programming Style: Symbolic, Imperative

​ TensorFlow 1.5 버전부터 Eager Execution 이라는 기능이 추가되었습니다. 다시 말해서 imperative programming style을 지원한다고 적혀있는데, 기존의 방식과 어떤 차이가 있는지 알아보겠습니다. MXNet의 Deep Learning Programming... »

Spark의 Shuffling 이해하기

​ 효율적인 Spark Application을 개발하기 위해 Shuffling 은 상당히 중요한 개념입니다. 이에 대해 간단히 정리해보았습니다. ​ Spark Architecture: Shuffle Shuffle을 설명하기 전에 한 가지 예시를 들어보겠습니다.... »

Spark groupByKey vs reduceByKey

​ Spark Application 성능 개선을 위한 groupByKey, reduceBykey에 대해 알아보겠습니다. ​ groupByKey vs reduceBykey # reduceByKey spark.textFile("hdfs://...") .flatMap(lambda line: line.split()) .map(lambda word: (word, 1)) .reduceByKey(lambda a,... »