[Machine Learning] Python 한글 형태소 분석기 - 코엔엘파이(KoNLPy)
Python package for Korean natural language processingi / 네이버 영화리뷰 감성 분석
Posted by
Wonyong Jang
on July 07, 2023 ·
12 mins read
[Machine Learning] 텍스트 분석(Text Analysis)의 Feature Vectorization
텍스트 분석의 이해와 피처 벡터화 유형(BOW, Word2Vec), 희소행렬
Posted by
Wonyong Jang
on May 26, 2023 ·
12 mins read
[Machine Learning] 사이킷런 모델 저장 및 로드
pickle, joblib
Posted by
Wonyong Jang
on October 18, 2022 ·
3 mins read
[Machine Learning] 신용카드 사기 예측 실습
kaggle 분류 예측 실습(불균형 데이터) / SMOTE 오버 샘플링(imblearn), 이상치(Outlier) 데이터 제거, StandardScaler 또는 Log 변환
Posted by
Wonyong Jang
on October 14, 2022 ·
16 mins read
[Machine Learning] 산탄데르 은행 고객 만족 예측
kaggle 분류 예측 실습 / k-fold 방식으로 early stopping 적용
Posted by
Wonyong Jang
on October 13, 2022 ·
17 mins read
[Machine Learning] 베이지안 최적화(Bayesian Optimization)
GridSearchCV 하이퍼 파라미터 튜닝 문제점 / HyperOpt 패키지
Posted by
Wonyong Jang
on October 10, 2022 ·
16 mins read
[Machine Learning] 분류 알고리즘 - 앙상블(Ensemble) 기법의 부스팅(Boosting) / LightGBM
LightGBM을 이용하여 위스콘신 유방암 예측 실습
Posted by
Wonyong Jang
on October 04, 2022 ·
7 mins read
[Machine Learning] 분류 알고리즘 - 앙상블(Ensemble) 기법의 부스팅(Boosting) / XGBoost
XGBoost(eXtra Gradient Boost) / Early Stopping(조기 중단 기능)
Posted by
Wonyong Jang
on October 03, 2022 ·
17 mins read
[Machine Learning] 분류 알고리즘(Classification) - 앙상블(Ensemble) 기법의 Voting과 Bagging
Voting, Bagging(bootstrap aggregation) / Random Forest
Posted by
Wonyong Jang
on September 30, 2022 ·
7 mins read
[Machine Learning] 분류 알고리즘(Classification) - 결정 트리
결정트리(Decision Tree), 결정트리의 하이퍼 파라미터, 피처 중요도의 이해
Posted by
Wonyong Jang
on September 24, 2022 ·
5 mins read
[Machine Learning] 사이킷런으로 수행하는 생존자 예측 실습
데이터 분석 및 전처리 / 교차검증 / 하이퍼 파라미터 최적화 / seaborn을 이용한 시각화
Posted by
Wonyong Jang
on September 19, 2022 ·
7 mins read
[Machine Learning] 사이킷런의 데이터 전처리
데이터 전처리(Preprocessing) / 데이터 클린징, 결손값 처리(Null/NaN처리), 데이터 인코딩(레이블, 원 핫 인코딩), 데이터 스케일링, 이상치 제거
Posted by
Wonyong Jang
on September 15, 2022 ·
4 mins read
[Machine Learning] 사이킷런의 데이터 세트 분리 및 검증
학습 데이터와 테스트 데이터 분리, 교차 검증(Stratified K Fold) 성능 평가, 하이퍼 파라미터 튜닝
Posted by
Wonyong Jang
on September 12, 2022 ·
9 mins read
[Machine Learning] 오버피팅의 개념과 해결
Overfitting(과적합), Data Augmentation
Posted by
Wonyong Jang
on September 04, 2022 ·
5 mins read
[Machine Learning] 분류(Classification) 모델 지표(metrics)의 의미와 계산법
Confusion Matrix / TP, FP, TN, FN / accuracy, precision, recall / ROC AUC
Posted by
Wonyong Jang
on September 01, 2022 ·
13 mins read