매크로 평균(Macro-Average)과 마이크로 평균(Micro-Average)
·
Math & Statistics
다음과 같은 데이터에서 평균을 구해보자 부서 A B C D 인원 수 3 40 2 5 평균 점수 60 40 80 70 $$ Macro\_Average = \frac{60+40+80+70}{4} = 62.5 $$ $$ Micro\_Average = \frac{(3 \times 60) + (40 \times 40) + (2 \times 80) + (5 \times 70)}{50} = 45.8 $$ 매크로 평균과 마이크로 평균의 차이가 꽤나 크다! 이는 매크로 평균이 B부서에 인원이 몰려있다는 정보를 반영하지 못했기 때문이다.
코사인 유사도 (Cosine Similarity)
·
Math & Statistics
코사인 유사도 의미 코사인 유사도는 두 벡터 간의 코사인 각도를 이용하여 구할 수 있는 두 벡터의 유사도를 의미 두 벡터가 0º의 각을 이루는 경우 (방향이 같을 경우), 코사인 유사도 = 1 두 벡터가 90º의 각을 이루는 경우 (직교할 경우), 코사인 유사도 = 0 두 벡터가 180º의 각을 이루는 경우 (방향이 반대일 경우), 코사인 유사도 = -1 수학적 표현 벡터의 내적 정의식 $$ \mathbf{A} \cdot \mathbf{B} = \lVert \mathbf{A} \rVert \lVert \mathbf{B} \rVert cos \theta $$ 이를 $cos\theta$ 를 중심으로 전개하면 $$ cos\theta = \frac{\mathbf{A} \cdot \mathbf{B}}{\lVert..
Bayes' theorem 베이즈 정리
·
Math & Statistics
기초 결합확률 결합확률 (joint probability) : 사건 A와 B가 동시에 일어날 확률 $$ P(A \cap B)\ or\ P(A,B) $$ 주변확률 주변확률 (marginal probability) : 개별 사건의 확률, 결합확률과 대비되는 개념 $$ P(A),\ P(B) $$ Soccer Badminton Male 0.4 0.2 0.6 Female 0.1 0.3 0.4 0.5 0.5 1 표로 만들어 보면, 가운데에 있는 확률들(0.4, 0.2, 0.1, 0.3)이 결합확률 표의 여백, 가장자리(margin)에 위치한 확률들(0.6, 0.4, 0.5, 0.5)이 주변확률 조건부확률 조건부확률 (conditional probability) : 특정 조건 하에 사건이 일어날 확률 사건 B가 일어..
Markov Chains, 마르코프 체인
·
Math & Statistics
오직 세가지 음식(햄버거🍔, 피자🍕, 핫도그🌭)만을 취급하는 레스토랑이 있다고 가정해보자 이 레스토랑에는 특이한 규칙이 하나 있는데 하루에 단 하나의 음식만을 판매한다는 것이다 그리고 그날 어떤 음식을 판매할지는 그 바로 전날 어떤 음식을 팔았느냐에 달려있다 위와 같이 다이어그램으로 표시하면 화살표가 Current State(🍔)에서 Future State(🍕)를 향하고 있다 이는 오늘 햄버거🍔를 팔았을 때 내일 피자🍕를 팔 확률이 60% 라는 뜻이다 위 다이어그램은 가능한 모든 케이스를 나타낸 것이고, 이것이 하나의 마르코프 체인이라고 할 수 있다 Property of Markov Chains, 마르코프 체인의 성질 첫번째 성질 마르코프 체인의 가장 중요한 성질은 미래의 State는 오직 현재의 Sta..
Taylor series, 테일러 급수
·
Math & Statistics
미분가능함수를 다항함수로 근사시키는 테일러 급수 $y=f(x)$가 $x=a$에서 계속(한없이) 미분가능한 경우 $$ f(x) = f(a) + \frac{f'(a)}{1!}(x-a) + \frac{f''(a)}{2!}(x-a)^{2} + \frac{f'''(a)}{3!}(x-a)^{3} + \cdots $$ 즉, $f(x)$를 무한급수(다항함수)로 나타낼 수 있다. 이 무한급수를 $x=a$에서 함수 $y=f(x)$의 테일러 급수라고 한다. $$ f(x) = \sum_{n=0}^{\infty} \frac{f^{n}(a)}{n!} (x-a)^{n} $$ $$ f(x) = sinx \times e^{3x} \times ln3x \times tan2x = ? $$ $$ g(x) = x^{3} \times 2x^{..
확률과 통계 개념정리
·
Math & Statistics
모집단, 표본집단 사회조사를 실시할 경우 조사대상 전체를 조사하는 전수조사가 이상적이지만 전체를 조사하기에는 시간∙비용∙노력이 많이 소요되므로 전체로부터 추출된 부분인 표본을 관찰∙파악함으로써 유추함 모집단 (population) : 관심의 대상이 되는 집단 전체 모수 (population parameter) : 모집단의 특성을 나타내는 수치 표본 (sample) : 모집단을 대표할 수 있는 모집단의 일부 통계량(statistic) : 표본의 특성을 나타내는 수치 확률의 개념 시행 : 동일한 조건이 유지되고, 여러번 반복 가능하고, 결과가 우연에 지배되는 실험이나 관찰 ex. 주사위 던지기 표본공간 : 시행의 결과들의 집합 사건 : 표본공간의 부분집합 근원 사건 : 원소의 개수가 한 개인 사건 합사건 :..