Lofi Music 10%
Linear Regression _ 선형 회귀
·
Machine-Learning
데이터의 출처와 학습 내용은 [박혜선 혼자 공부하는 머신러닝 + 딥러닝 ],한빛미디어 를 인용했습니다.선형 회귀선형 회귀는 두 변수 간의 선형 관계를 모델링하여 연속적인 값을 예측하는 통계적 기법입니다. 주로 독립 변수(input, XXX)와 종속 변수(output, YYY) 간의 관계를 직선으로 나타내는 방법입니다. 선형 회귀는 예측하고자 하는 변수(종속 변수)와 설명 변수(독립 변수) 간의 선형 관계를 가정합니다. 선형 회귀는 단어 조합 그대로 직선상의 숫자입니다. 이 회귀가 어떤 역할을 하는지 그리고 왜 필요한지 이 게시글에서 실습을 통해 알아보겠습니다. 이전 게시글에서 사용했던 코드들을 그대로 가져오시면 됩니다. 먼저 이전 학습된 모델에서 60cm인 농어를 예측해보겠습니다. 그렇다면 무게를 1,0..
K-NN Regression _ K-최근접 이웃 회귀
·
Machine-Learning
데이터의 출처와 학습 내용은 [박혜선 혼자 공부하는 머신러닝 + 딥러닝 ],한빛미디어 를 인용했습니다. K최근접이웃 회귀 (K-Nearest Neighbors Regression)는 K-NN 알고리즘 을 회귀 문제에 적용한 것입니다. KNN은 기본적으로 분류(classification) 문제에 많이 사용되지만, 회귀 문제에도 적용할 수 있습니다. KNN 회귀는 주어진 데이터 포인트와 가장 가까운 K개의 이웃을 기준으로 예측값을 계산하는 방식입니다. 지도 학습 알고리즘은 크게 분류와 회귀로 분류할 수 있습니다. 이전 게시글에서는 분류(classification)를 다루었습니다.물고기의 크기에 따라 종류를 예측하는 모델을 만들었었죠, 하지만 수치형 데이터 즉 임의의 어떤 숫자를 예측해야 할 경우에는 어떻게 ..
Scaling ? Z-score
·
Machine-Learning
Scaling , Z-score 저번 게시글에서는 왜 도미 데이터를 넣고 빙어 데이터로 인식 했는지에 대해 분석해보려고 했습니다.직관적으로 확인했을 때 가장 가까운 점은 어떤 점이라고 생각하시나요?  직관적으로만 봤을 때 빨간 점 즉 도미데이터에 KNN이 적용될 것이라고 생각합니다.  이를 정확하게 분석해보기 위해서 다른 함수를 소개하겠습니다.  distances, indexes = kn.kneighbors([[25,150]])  kn.kneighbors()는 K-최근접 이웃(KNN, k-nearest neighbors) 알고리즘에서 특정 데이터의 가장 가까운 k개의 이웃을 찾는 역할을 합니다. 이를 활용하게 되면 indexes 에서는 최근접으로 선정된 인덱스가 나오게 됩니다.plt.scatter(tra..
데이터 전처리, 데이터셋 나누기
·
Machine-Learning
사이킷런으로 train_set / test_set 나누기 from sklearn.model_selection import train_test_split 머신러닝 혹은 딥러닝을 한번즘 보셨다면, 이런 코드를 흔히 보셨을 겁니다.sklearn.mode_selection 에서 train_test_split이라는 기능을 소개하며 데이터 전처리의 흐름을 소개하겠습니다. train_set과 test_set으로 올바르게 나누는 것은 매우 중요합니다. 예시를 들겠습니다.bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33..
K-Nearest Neighbors, KNN
·
Machine-Learning
이번 게시글에서는 K-최근접 이웃(KNN, K-Nearest Neighbors) 알고리즘에 대해 다뤄보겠습니다.KNN은 지도 학습(Supervised Learning) 알고리즘 중 하나입니다.간단하지만 강력한 Classification 및 Regression 기법으로 널리 사용됩니다.  KNN은 새로운 데이터 포인트가 주어졌을 때, 가장 가까운 K개의 데이터를 찾아 다수결 혹은 평균을 통해 결과를 예측하는 방식입니다.분류(Classification): 다수결을 통해 가장 많은 클래스를 선택회귀(Regression): K개의 평균을 계산하여 값을 예측  KNN의 핵심 개념:거리를 측정하여 가까운 데이터 포인트(K개)를 찾음분류 문제에서는 가장 많이 등장한 클래스로 예측회귀 문제에서는 K개의 평균 값으로 예..