Lofi Music 10%
단계별로 풀어보기 백준_10813번
·
BaekJoon Reivew
공 바꾸기 문제는 다음과 같습니다.   이전 문제와 매우 비슷한 유형입니다. 참고하시면 좋을 거 같습니다.https://edu-data.tistory.com/78 단계별로 풀어보기 백준_10810번공 넣기문제는 다음과 같습니다.  문제를 요약하자면 바구니를 리스트라고 표현하고, 리스트안에 계속해서 업데이트를 해서 최종적으로 수정 된 리스트가 올바르게 출력되는 프로그램을 작성edu-data.tistory.com  문제를 요약하자면, 1부터N만큼의 바구니를 생성하고 M번 입력을 받습니다. A,B로 입력을 받는다고 하였을 때 입력 받은 바구니 숫자를 서로 바꾸는 것 입니다. 여기서 중요한 개념인 교환 매핑이 나옵니다. 먼저 저의 해답 코드는 다음과 같습니다.L=[]N, M = map(int,input().sp..
모수적 방법, 비모수적 방법
·
ISLR
모수적 방법(Parametric Method)과 비모수적 방법(Non-Parametric Method)머신러닝이나 통계학에서 데이터를 다룰 때, 우리가 사용하는 모델은 크게 모수적 방법과 비모수적 방법으로 나눌 수 있습니다. 두 방법의 차이를 이해하면, 어떤 상황에서 어떤 모델을 선택해야 하는지 보다 명확하게 판단할 수 있습니다. 먼저 간단하게 설명하자면, 모수적 방법은 저번 게시글 처럼 추론의 중점입니다. f를 알아야 할 때 무조건 적으로 모수적 방법을 사용합니다. 이와 반대로 f를 굳이 안알도 될 경우에는 비모수적 방법을 사용하여서 정확도를 올리는 것에만 집중하면 됩니다. 모수적 방법모수적 방법이란, 고정된 개수의 파라미터를 가진 모델을 사용하여 데이터를 설명하는 방법입니다. 즉, 데이터가 주어지면 ..
MSE
·
ISLR
통계 학습은 함수 F를 추정하기 위한 다양한 방법들의 집합입니다. 여기서 는 함수로, 입력값을 받아 결과값을 반환하는 구조를 가집니다. 여기서 말하는 f는 f(X)할 때의 f입니다. 즉 함수입니다. 함수는 어떠한 입력값이 있으면 결과값이 나오는 구조입니다.X를 입력한다고 했을 때, 여기서 X는 입력 변수 혹은 예측변수, 피쳐(feature) 등으로 불립니다. 이에 해당하는 결과값은 Y로 보통 결과변수라고 표현합니다.  또한 이러한 함수들은 아래의 그림과 같이 흔히 저희가 봐왔던 선형적인 관계에 있는 것이 대부분이였습니다. 하지만 실생활에서는 선형적인 그래프 보다는 비선형적임을 띄는 상황이 많습니다.데이터 출처 | https://www.statlearning.com/resources 저희는 이런 선형적인..
단계별로 풀어보기 백준_10810번
·
BaekJoon Reivew
공 넣기문제는 다음과 같습니다.  문제를 요약하자면 바구니를 리스트라고 표현하고, 리스트안에 계속해서 업데이트를 해서 최종적으로 수정 된 리스트가 올바르게 출력되는 프로그램을 작성하는 문제입니다. 이 게시글 부터는 예제 입력 부분에서 입력을 받는 부분은 언급하지 않겠습니다.저의 알고리즘은 다음과 같습니다. 먼저 N만큼의 0으로 채워진 리스트를 생성합니다.이후 M만큼의 반복을 하며 받은 M이라는 리스트에서 M[0], M[1], M[2]를 각각 인덱싱 합니다.이후 단순하게 N만큼 0으로 채워진 L리스트에 그 수만큼 값을 할당 해줍니다. L = []A, B = map(int, input().split())for _ in range(A): L.append(0)for _ in range(B): M = ..
Scaling ? Z-score
·
Machine-Learning
Scaling , Z-score 저번 게시글에서는 왜 도미 데이터를 넣고 빙어 데이터로 인식 했는지에 대해 분석해보려고 했습니다.직관적으로 확인했을 때 가장 가까운 점은 어떤 점이라고 생각하시나요?  직관적으로만 봤을 때 빨간 점 즉 도미데이터에 KNN이 적용될 것이라고 생각합니다.  이를 정확하게 분석해보기 위해서 다른 함수를 소개하겠습니다.  distances, indexes = kn.kneighbors([[25,150]])  kn.kneighbors()는 K-최근접 이웃(KNN, k-nearest neighbors) 알고리즘에서 특정 데이터의 가장 가까운 k개의 이웃을 찾는 역할을 합니다. 이를 활용하게 되면 indexes 에서는 최근접으로 선정된 인덱스가 나오게 됩니다.plt.scatter(tra..
데이터 전처리, 데이터셋 나누기
·
Machine-Learning
사이킷런으로 train_set / test_set 나누기 from sklearn.model_selection import train_test_split 머신러닝 혹은 딥러닝을 한번즘 보셨다면, 이런 코드를 흔히 보셨을 겁니다.sklearn.mode_selection 에서 train_test_split이라는 기능을 소개하며 데이터 전처리의 흐름을 소개하겠습니다. train_set과 test_set으로 올바르게 나누는 것은 매우 중요합니다. 예시를 들겠습니다.bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33..