전체 글

전체 글

    [Anaconda] conda -c 옵션과 conda-forge

    Python 패키지를 설치할 때 일반적으로 pip install [패키지명] 으로 설치해왔지만 이보다는 아나콘다를 이용해서 패키지를 설치하자! 기본적으로 (base)에 설치하기보다는 항상 가상환경을 이용하고 새로 만든 가상환경 속에서도 pip install을 먼저 이용하기보다 conda install을 이용해보자 아나콘다는 생각보다 훨씬 똑똑한 녀석이라서 아래와 같은 명령어를 사용하면 자동으로 해당 환경에 설치되어 있는 패키지들과의 호환성을 체크하여 패키지를 설치해준다! conda install -c conda-forge [패키지명] -c 옵션 -c는 -channel을 의미한다 conda-forge conda-forge는 conda의 channel로써, 여러 기여자들로 구성된 커뮤니티 채널이다. (con..

    [Linux] FFMPEG

    sudo 없이 ffmpeg 설치 conda install -c conda-forge ffmpeg

    Markov Chains, 마르코프 체인

    오직 세가지 음식(햄버거🍔, 피자🍕, 핫도그🌭)만을 취급하는 레스토랑이 있다고 가정해보자 이 레스토랑에는 특이한 규칙이 하나 있는데 하루에 단 하나의 음식만을 판매한다는 것이다 그리고 그날 어떤 음식을 판매할지는 그 바로 전날 어떤 음식을 팔았느냐에 달려있다 위와 같이 다이어그램으로 표시하면 화살표가 Current State(🍔)에서 Future State(🍕)를 향하고 있다 이는 오늘 햄버거🍔를 팔았을 때 내일 피자🍕를 팔 확률이 60% 라는 뜻이다 위 다이어그램은 가능한 모든 케이스를 나타낸 것이고, 이것이 하나의 마르코프 체인이라고 할 수 있다 Property of Markov Chains, 마르코프 체인의 성질 첫번째 성질 마르코프 체인의 가장 중요한 성질은 미래의 State는 오직 현재의 Sta..

    Logit, Sigmoid, Softmax

    Logit에 대한 이해가 먼저 필요! $$ Logit = log_e(\frac{p}{1-p}) $$ 로짓(logit)과 확률(p)은 서로 변환 가능하다! $x$축이 확률이고, $y$축이 로짓인 위의 그래프에서 확률이 0이면, 로짓은 $-\infty$ 확률이 1이면, 로짓은 $+\infty$ 어떤 Multi-class Classification, 다중 클래스 분류 모델이 Input, Hidden Layer를 지나서 각각 4, 2, -2라는 Logit을 출력한 상황 가장 위에 Logit이 4인 부분을 보면, 위의 Logit의 수식을 활용하여 $$ 4 = log_{e}(\frac{p}{1-p}) $$ 양변에 자연지수를 취해주면 $$ e^{4} = e^{log_{e}(\frac{p}{1-p})} $$ $$ e^..

    Odds(오즈) and Logit(로짓)

    머신러닝의 Logistic Regression 딥러닝의 Softmax function 과도 관련이 있는 "Logit"을 알아보기 위해 Odds라는 개념도 알아보자! (통계학에서 나온 개념들) Odds, 오즈 8번의 경기가 치뤄졌는데 그 중 5번 이기고, 3번 졌다면 $$ odds = \frac{5}{3} = 1.667 $$ 유의할 점으로 오즈는 확률이 아니다!! $$ odds \ne probability $$ odds는 단순히 횟수(counts)로도 구할 수 있고, 확률(probability)로도 구할 수 있음 $$ odds = \frac{5}{3} = \frac{\frac{5}{8}}{\frac{3}{8}} = \frac{p}{1-p} $$ 하지만 odds는 크나큰 단점이 존재하는데! 만약 1번 승리하..

    Taylor series, 테일러 급수

    미분가능함수를 다항함수로 근사시키는 테일러 급수 $y=f(x)$가 $x=a$에서 계속(한없이) 미분가능한 경우 $$ f(x) = f(a) + \frac{f'(a)}{1!}(x-a) + \frac{f''(a)}{2!}(x-a)^{2} + \frac{f'''(a)}{3!}(x-a)^{3} + \cdots $$ 즉, $f(x)$를 무한급수(다항함수)로 나타낼 수 있다. 이 무한급수를 $x=a$에서 함수 $y=f(x)$의 테일러 급수라고 한다. $$ f(x) = \sum_{n=0}^{\infty} \frac{f^{n}(a)}{n!} (x-a)^{n} $$ $$ f(x) = sinx \times e^{3x} \times ln3x \times tan2x = ? $$ $$ g(x) = x^{3} \times 2x^{..

    [scikit-learn] fit_transform()과 transform()

    sklearn https://deepinsight.tistory.com/165 [scikit-learn] transform()과 fit_transform()의 차이는 무엇일까? 왜 scikit-learn에서 모델을 학습할 때, train dataset에서만 .fit_transform()메서드를 사용하는 건가요? TL;DR 안녕하세요 steve-lee입니다. 실용 머신러닝 A to Z 첫번 째 시간은 scikit-learn에서 자주 사용.. deepinsight.tistory.com

    [Python] pandas_profiling

    EDA를 코드 한줄로! https://wikidocs.net/47193 5) 판다스 프로파일링(Pandas-Profiling) 좋은 요리를 위해서는 조리 방법도 중요하지만, 그만큼 중요한 것은 갖고있는 재료의 상태입니다. 재료가 상하거나 문제가 있다면 좋은 요리가 나올 수 없습니다. 마찬가지로 좋은 ... wikidocs.net pip install -U pandas-profiling -U 옵션 : 해당 패키지를 최신 버전으로 업그레이드 import pandas_profiling as pp