분류 전체보기 23

노이즈(noise) 기법

오늘은 노이즈 주는 방법을 가져와봤습니다. 노이즈 기법은 데이터를 확장 및 증강할 때 자주 사용합니다. 데이터의 형태에 따라 노이즈 줄 수 있는 방법이 다양한데, 오늘은 텍스트형 데이터 노이즈 주는 방법과 음성 데이터 노이즈 주는 대표적인 방법을 다뤄보고자 합니다. 주로 노이즈 기법의 경우, 음성 데이터와 이미지 데이터에 자주 사용됩니다. 텍스트형 데이터에 노이즈를 경우는 많이 사용하지 않지만, 궁금해서 정리해봤습니다. (음성 데이터에 노이즈 기법만 보고싶을 경우, 스크롤 하셔서 아래부분만 보시면 됩니다) 텍스트 형태 데이터 노이즈 주는 방법 먼저 텍스트형 데이터에 노이즈를 주는 경우에 유의할 점을 말씀드리고 기법을 설명하도록 하겠습니다. 자연어 문장의 경우 생각보다 어순 변화나 단어의 변화에 민감하기 ..

앙상블 학습(Ensemble Learning)

앙상블 학습(Ensemble Learning) 앙상블 학습: 여러 개의 개별 모델을 조합하여 최적의 모델로 일반화하는 방법 목적: weak classifier 들을 결합하여 strong classifier 를 만드는 것 대표적인 앙상블 기법: 앙상블 기법에는 보팅(voting), 배깅(bagging), 스태킹(stacking), 부스팅(boosting)이 있습니다. Voting Voting 방식은 말 그대로 투표하는 방식이다. Voting은 각각 다른 알고리즘을 이용한 분류기를 결합하는 방식으로 최종 예측 값을 투표하는 방식이다. 투표와 같이 가장 많은 투표를 받는 후보자를 선택하는 방식이라고 생각하면 된다. 크게 하드 보팅과 소프트 보팅으로 나뉘는데, 아래 사진이 이를 표현한 것이다. Bagging B..

AI 개념 2024.02.23