'빅데이터 관련 자료/Machine Learning' 카테고리의 글 목록 (2 Page)
Data Analyst
300x250
300x250

빅데이터 관련 자료/Machine Learning 25

Chat GPT의 친절한 설명 : 비지도학습이란?

비지도 학습(Unsupervised Learning)은 머신러닝의 한 분야로, 라벨 또는 정답 데이터 없이 입력 데이터의 패턴, 구조, 특성 등을 발견하는 데 사용됩니다. 이것은 데이터의 숨겨진 구조를 찾거나 클러스터링(Clustering), 차원 축소(Dimensionality Reduction), 이상치 탐지(Anomaly Detection) 등의 작업을 수행하는 데 활용됩니다. 데이터의 구조 발견을 통한 인사이트 도출 비지도 학습은 데이터에 대한 사전 지식이 없는 상황에서도 유용합니다. 이를 통해 데이터 내에 숨겨진 패턴이나 특징을 발견할 수 있어, 신규한 정보와 인사이트를 얻을 수 있습니다. 예를 들어, 소셜 미디어의 사용자 행동 데이터를 클러스터링하여 비슷한 행동 패턴을 가진 그룹을 발견하거나,..

Chat GPT의 친절한 설명 : 지도학습이란?

지도 학습은 머신러닝의 한 유형으로, 입력 데이터와 그에 대응하는 정답 데이터(라벨 또는 타겟)가 쌍으로 제공되며, 컴퓨터 모델이 입력 데이터로부터 출력을 예측하고 정답과 비교하여 학습하는 방법입니다. 지도 학습은 주어진 입력에 대한 출력을 예측하는 모델을 학습하는 데 사용됩니다. 주로 분류(Classification)와 회귀(Regression) 작업에 적용됩니다. 분류(Classification): 범주형 또는 이산적인 결과를 예측합니다. 예를 들어, 스팸 메일 필터링, 이미지 분류(강아지 vs 고양이), 질병 진단 등이 이에 해당합니다. 이진 분류(두 개의 클래스로 분류)와 다중 클래스 분류(여러 클래스로 분류)로 나뉩니다. 회귀(Regression): 연속적인 값을 예측합니다. 예를 들어, 주택 ..

Chat GPT의 친절한 설명 : 머신러닝이란?

머신러닝은 컴퓨터가 데이터로부터 학습하고 패턴을 인식하여 작업을 수행할 수 있는 인공 지능(AI)의 한 분야입니다. 주어진 데이터를 사용하여 컴퓨터가 규칙이나 명시적인 프로그래밍 없이 학습하고 문제를 해결하도록 하는 기술입니다. 기본적으로 머신러닝은 다음과 같은 세 가지 유형으로 나눌 수 있습니다: 지도 학습 (Supervised Learning): 입력 데이터와 정답 데이터(라벨)가 함께 제공되며, 모델은 입력 데이터와 정답 사이의 매핑을 학습합니다. 분류(Classification)와 회귀(Regression) 문제에 사용됩니다. 비지도 학습 (Unsupervised Learning): 라벨이 없는 입력 데이터만을 이용하여 패턴이나 구조를 발견하거나 데이터를 클러스터링합니다. 군집화(Clusterin..

빅데이터 분석기사 실기 (실전 연습) - 투표기반 앙상블

핵심개념 투표기반 앙상블은 여러 분류기를 학습시킨 후 각각의 분류기가 예측하는 레이블 범주가 가장 많이 나오는 범주를 예측하는 방법입니다. 다수결 원리와 유사하죠. 사용방법은 우선 개별 분류기의 최적 하이퍼파라미터를 찾은 후, 투표기반 앙상블로 모델을 만들어 좀 더 좋은 분류와 회귀 예측을 찾는 것입니다. 로지스틱모델, 서포트벡터머신, 랜덤포레스트 등 여러 머신러닝 분류기를 수행한 후 예측 범주가 많이 나온 것을 최종 범주로 분류합니다. 다만, 각 분류 알고리즘의 결과는 범주를 기반으로 할 수도 있고, 확률을 제시할 수도 있습니다. 범주를 기반으로 둔다는 것은 1, 2와 같이 결과가 범주로 많이 나타난 것을 선택하는 방법이고, 확률에 기반한다는 것은 예측 확률을 제시할 수도 있습니다. 범주를 기반으로 둔..

머신러닝 데이터 분석 7회차

UNIT 7-1 딥러닝의 기초 배워야하는 이유 - 데이터와 문제의 복잡성 - 강력한 비선형성 - 현재도 발전하고 있는 것 UNIT 7-2 Neural Network(ANN) 인공신경망 생물학적 뉴런이 서로간에 신호를 보내는 방식을 모방하여 만든 노드(인공 뉴런)의 연결체 - 기본 구성: 입력 레이어, 히든 레이어, 출력 레이어 Neuron Perceptron Back Propagation Activation Function Cross Entropy UNIT 7-3 이미지에 효과적인 CNN 3-layer NN vs ConvNet Image Classification with ConvNet Convolution Layer Convolution 대표적인 모델 UNIT 7-4 효과적인 학습 방법 Optimize..

머신러닝 데이터 분석 6회차

UNIT 6-1 과적합과 과소적합 머신러닝에서 문제를 해결한다는 것 - 목적함수에 근사하는 것 - 목적함수는 분류 및 예측 등의 문제를 해결하는데 사용 - 목적 함수를 학습할 때 가장 중요한것? 일반화 - 특히 수집된 데이터는 불완전하고 noisy하기 때문에 일반화가 중요 머신러닝의 일반화 - 일반화: 학습한 모델이 학습할 때 볼 수 없었던 특정한 데이터에 대해서 얼마나 잘 작동하는지 - 좋은 머신러닝 모델은 학습 데이터에서 문제 영역의 모든 데이터로 잘 일반화한것 - 심지어 본 적 없는 데이터에 대해서도 예측하기를 바람 - 머신러닝 모델이 새로운 데이터에 대해서 얼마나 잘 일반화하는지를 판단하는 방법? =>과적합과 과소적합 과적합과 과소적합 - 과적합은 학습 데이터를 너무 잘 모델링한 것 - 새로운 데..

300x250
300x250