decision tree의 원리, Gini index, Entropy, 예제
의사결정나무 (decision tree)의 원리에 대해서 간략하게 알아보기. 머신러닝, 딥러닝은 통계학과 선형대수학(행렬, 벡터 등)을 기반으로 계산하는 기법들이 대다수임. * 머신러닝은 주로 정형화된 데이터를 활용하고, 딥러닝은 비정형화된 데이터 (이미지, 음성, 비디오 등)를 활용 1. 기계학습(machine learning) 중에서 지도학습 (supervised) 중에서 분류 (classifier) 기법에 해당 2. 개요 뿌리(Root) : 최상위에 있는 노드 (node)의 분류가 시작되는 곳 부모(Parent) 노드 : 상위 노드 자식(Children) 노드 : 하위 노드 말단(Leaf) 노드 : 최하위에 있으며, 더 이상 분류되지 않는 노드 3. 원리 뿌리 노드에 전체 데이터가 속해 있으며, 상..