TIL:K-means clustering

K-means clustering 주어진 데이터를 k개의 클러스터로 묶는 알고리즘 각 클러스터의 거리 차이 분산을 최소화 하는 방식으로 동작함 unsupervised learning이기 때문에 라벨이 붙지 않은 데이터에 라벨을 붙여줌 알고리즘 초기 k의 평균값은...

TIL:분류모델 평가-ROC 곡선

ROC 곡선 어떤 확률을 경계로 정해야 좋을지 판단하는 방법 머신러닝에 사용된 알고리즘이 좋은지 아닌지 판단하는데도 사용 True Positive와 False Positive의 관계를 분석하기 위한 도구 민감도 : 1인 케이스에 대해 1이라...

TIL:generative model, discriminative model

패턴 인지에서 분류를 할 때 사용되는 모델은 다음과 같이 2가지의 모델이 있음 Generative Model 데이터를 생성하는 모델 관점 데이터를 기반으로 데이터를 생성하는 모델을 추정 추정한 모델을 기반으로 데이터의 클래스를 판별...

오늘의 문제 정리

networkx import networkx as nx borders = nx.Graph() 그래프는 엣지와 노드로 구성되어 있음 networkx에서 xml, 텍스트, 그래프, 개인화된 해시가 가능한 개체가 노드가 될 수 있음. numpy 수학 및 과학 연산을...

TIL:통계

통계 특정 집단을 대상으로 수행한 조사/실험을 통해 나온 결과에 대한 요약된 형태의 표현 ex) 물가/실업률/GNP, 일기예보. 정당 지지도 등 1. 통계자료 획득 방법 총 조사 : 소요시간이 오래 들어 특별한...