
문제 : https://github.com/tjd229/DS/blob/main/Practice/6.ipynb VberEats.csv 데이터 구조 import pandas as pd import numpy as np from sklearn.tree import DecisionTreeRegressor from sklearn.preprocessing import MinMaxScaler df =pd.read_csv("../Dataset/VberEats.csv") print(df.dtypes) print(df.shape) df.head() shape의 출력값으로 (18951, 8)이 나온다. 이번 문제에서는 공통 전처리가 있다. #0-1 : 결제 총 금액(purchases)에 결측값(Null)이 포함된 데이터를 ..

문제 : https://github.com/tjd229/DS/blob/main/Practice/4.ipynb metflix.csv 데이터 구조 import numpy as np import pandas as pd df = pd.read_csv("../Dataset/metflix.csv") print(df.dtypes) print(df.shape) df.head() shape의 출력값으로 (540, 7)이 나온다. 이 문제에서는 공통 전처리가 있다. #0-1 : 가입 기간(period) 컬럼에서 문자 M을 제거한 후 정수형으로 변경하시오 가입 기간 컬럼의 유일값으로 어떤 종류가 있는지 먼저 확인해보자 df['period'].unique() 결과는 아래와 같이 나온다. array(['16M', '10M', ..

문제 : https://github.com/tjd229/DS/blob/main/Practice/3.ipynb real_estate.csv 데이터 구조 import numpy as np import pandas as pd df = pd.read_csv("../Dataset/real_estate.csv") print(df.dtypes) print(df.shape) df.head(10) shape의 출력값으로 (777, 6)이 나온다. Q1 q1= df.copy() #1-1 : 데이터의 첫 번째 행부터 열 번째 행까지의 시공사 코드(apt_code) 리스트를 저장한다. 첫 번째 행의 데이터는 위도, 경도, 평당가, 평수, 시공사 코드, 인근 지하철역과의 거리가 각각 37.125541, 126.913776, 2..

문제 : https://github.com/tjd229/DS/blob/main/Practice/2.ipynb s_mart.csv 데이터 구조 아래와 같이 csv파일을 읽은 후, data type 및 컬럼 상태를 확인할 수 있다. df = pd.read_csv('../Dataset/s_mart.csv') print(df.dtypes) print(df.shape) df.head() shape의 출력값으로 (8043, 5)가 나온다. Q1 q1 = df.copy() 결측값 유무는 isna 함수나 notna 함수를 이용하면 된다. isna와 sum 함수를 이용하여 결측값이 어느 컬럼에 있는지부터 확인해보자. q1.isna().sum() purchases 컬럼에만 1389개의 결측값이 있는 것을 확인해 볼 수 있..

문제 : https://github.com/tjd229/DS/blob/main/Practice/1.ipynb enrollment_info.csv 데이터 구조 아래와 같이 csv파일을 읽은 후, data type 및 컬럼 상태를 확인할 수 있다. import numpy as np import pandas as pd df = pd.read_csv("../Dataset/enrollment_info.csv") print(df.dtypes) print(df.shape) df.head() shape의 출력값으로 (86550, 5)가 나오는데, 86550개의 데이터가 있고 컬럼의 수가 5라는 것을 알 수 있다. Q1 q1 = df.copy() # 1-1 : 각 학생들의 상점(bonus)에서 벌점(penalty)을 뺀..
- Total
- Today
- Yesterday
- DataScience
- ICPC
- Binary Search
- two pointer
- line sweeping
- yaml
- codejam
- ioi
- TensorFlow
- DeepLearning
- LCA
- graph
- oj.uz
- pytorch
- greedy
- RMI
- Codeforces
- Math
- Decorator
- 인터렉티브
- 함수 구현
- Sqrt Decomposition
- Joi
- Book
- 함수컵
- boj
- 구간합
- NERC
- 인터렉션
- Divide and conquer
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |