Lofi Music 10%
모수적 방법, 비모수적 방법
·
ISLR
모수적 방법(Parametric Method)과 비모수적 방법(Non-Parametric Method)머신러닝이나 통계학에서 데이터를 다룰 때, 우리가 사용하는 모델은 크게 모수적 방법과 비모수적 방법으로 나눌 수 있습니다. 두 방법의 차이를 이해하면, 어떤 상황에서 어떤 모델을 선택해야 하는지 보다 명확하게 판단할 수 있습니다. 먼저 간단하게 설명하자면, 모수적 방법은 저번 게시글 처럼 추론의 중점입니다. f를 알아야 할 때 무조건 적으로 모수적 방법을 사용합니다. 이와 반대로 f를 굳이 안알도 될 경우에는 비모수적 방법을 사용하여서 정확도를 올리는 것에만 집중하면 됩니다. 모수적 방법모수적 방법이란, 고정된 개수의 파라미터를 가진 모델을 사용하여 데이터를 설명하는 방법입니다. 즉, 데이터가 주어지면 ..
MSE
·
ISLR
통계 학습은 함수 F를 추정하기 위한 다양한 방법들의 집합입니다. 여기서 는 함수로, 입력값을 받아 결과값을 반환하는 구조를 가집니다. 여기서 말하는 f는 f(X)할 때의 f입니다. 즉 함수입니다. 함수는 어떠한 입력값이 있으면 결과값이 나오는 구조입니다.X를 입력한다고 했을 때, 여기서 X는 입력 변수 혹은 예측변수, 피쳐(feature) 등으로 불립니다. 이에 해당하는 결과값은 Y로 보통 결과변수라고 표현합니다.  또한 이러한 함수들은 아래의 그림과 같이 흔히 저희가 봐왔던 선형적인 관계에 있는 것이 대부분이였습니다. 하지만 실생활에서는 선형적인 그래프 보다는 비선형적임을 띄는 상황이 많습니다.데이터 출처 | https://www.statlearning.com/resources 저희는 이런 선형적인..
ISLR | Basic | 데이터셋 탐색(Smarket_Data,NCI60_data)
·
ISLR
지난 게시글에서는 Wage 데이터셋을 활용하여 연령과 임금의 관계, 교육 수준에 따른 임금 변화를 분석해보았습니다. 이번에는 Smarket과 NCI60 데이터셋을 다루며 동일한 과정으로 탐색적 데이터 분석(EDA)을 진행해보겠습니다. 데이터 로드 및 패키지 불러오기   setwd("your_path")library(ISLR2)library(dplyr) #이전 게시글에서 설명했습니다! 전 게시글을 참고해주세요 Smarker 데이터셋 살펴보기names(Smarket)  Smarket 데이터셋은 주식 시장 데이터를 포함한 데이터셋으로,주가 변화와 관련된 다양한 변수들이 포함되어 있습니다.  데이터셋 안에 변수명들은 year, Lag1~Lag5, volume, Today, Direction 있습니다. 여기서 L..
ISLR | Basic | 데이터셋 탐색(Wage_Data)
·
ISLR
이번 게시글에서는 R과 ISLR2 라이브러리를 활용하여 데이터를 로드하고, 간단한 탐색적 데이터 분석(EDA, Exploratory Data Analysis) 을 진행해보겠습니다. 특히, Wage 데이터셋을 다루며 연령과 임금의 관계, 교육 수준에 따른 임금 변화를 분석해보겠습니다.   데이터 로드 및 패키지 불러오기 먼저 데이터셋과 group_by와 같은 기능을 사용하기 위해 library를 불러오겠습니다.setwd("your_path")library(ISLR2)library(dplyr)  Wage 데이터셋 살펴보기 이번 게시글에서 다룰 데이터는 Wage 데이터 입니다. 말 그대로 임금 데이터셋을 다룰 것 입니다. 차후에 약 3개의 게시글 데이터셋 준비 이후 각 데이터를 주제로 분석해보겠습니다. 임금 ..