화려한 대시보드와 머신러닝 모델, 그리고 비즈니스를 변화시크는 통찰력 뒤에는 데이터가 있다. = 데이터를 잘 가공해야 한다. 원본 데이터뿐만 아니라 가치를 제공하기 위해 수많은 소스에서 수집되어 정리, 처리 및 결합된 데이터다. 데이터의 진정한 가치는 그것이 정제되어 소비자게에 전달된 후의 잠재력에 있다. = 잘 정제된 데이터가 보기에도 좋다. 데이터 파이프라인이 무엇인지 이야기하고 현대의 데이터 생태계에 어떻게 적용되는지 보여준다. 일괄처리 vs 스트리밍 데이터 수집, 직접 구축하는 것 vs 제품을 구매하는 것 등과 같이 파이프라인을 구현할 때의 일반적인 고려 사항과 주요 결정 사항을 다룬다 = 이부분이 이책에서 배워야 할 핵심 가치일듯. 데이터 파이프라인이란? 데이터 파이프라인은 다양한 소스에서 새로..