์คํฌ์ธ ์นด ๊ฐ๊ฒฉ ๋ฐ ์ฑ๋ฅ ์์ธก ๋ชจ๋ธ
์ด ๋ชจ๋ธ์ ์คํฌ์ธ ์นด์ ๋ค์ํ ์คํ(์ ์กฐ์ฌ, ์ฐ์, ์์ง ํฌ๊ธฐ ๋ฑ)์ ๊ธฐ๋ฐ์ผ๋ก ๊ฐ๊ฒฉ, ๋ง๋ ฅ, ์ ๋ก๋ฐฑ์ ์์ธกํ๋ ๋ฅ๋ฌ๋ ๋ฐ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ํฌํจํ๊ณ ์๋ค.
ํ๋ก์ ํธ ๊ฐ์
๋ค์ํ ์คํฌ์ธ ์นด ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ๊ณ , ์ต์ ์ ์์ธก ๋ชจ๋ธ์ ์ฐพ๊ธฐ ์ํด ๋ค์๊ณผ ๊ฐ์ ๊ณผ์ ์ ๊ฑฐ์ณค๋ค.
- ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ๋ฐ ํผ์ฒ ์์ง๋์ด๋ง (GroupBy ํ์ฉ)
- ๋ฅ๋ฌ๋(TensorFlow/Keras) ๋ฐ ๋จธ์ ๋ฌ๋(XGBoost) ๋ชจ๋ธ ๊ตฌ์ถ
- ํ์ดํผํ๋ผ๋ฏธํฐ ํ๋์ ํตํ ๋ชจ๋ธ ์ต์ ํ
- ๋ ๋ชจ๋ธ์ ์ฑ๋ฅ(MSE) ๋น๊ต ๋ฐ ์ต์ข ๋ชจ๋ธ ์ ์
๋ชจ๋ธ (Models)
์ด ํ๋ก์ ํธ๋ ๋ ๊ฐ์ง ์ต์ ํ๋ ๋ชจ๋ธ์ ์ ๊ณตํ๋ค.
| ๋ชจ๋ธ ์ข ๋ฅ | ํ์ผ๋ช | ์ฃผ์ ํน์ง |
|---|---|---|
| ๋ฅ๋ฌ๋ (Keras) | best_model.keras |
ReLU ํ์ฑํ ํจ์์ Dropout์ ์ฌ์ฉํ 3-Layer ์ ๊ฒฝ๋ง |
| ๋จธ์ ๋ฌ๋ (XGBoost) | xgboost-model.skops |
ํ์ดํผํ๋ผ๋ฏธํฐ ํ๋์ผ๋ก ์ต์ ํ๋ Gradient Boosting ๋ชจ๋ธ |
๋ชจ๋ธ ๊ตฌ์กฐ (๋ฅ๋ฌ๋)
๋ฐ์ดํฐ์ (Dataset)
- ๋ฐ์ดํฐ ์ถ์ฒ: Sports Car Price Dataset on Kaggle (์์ ๋งํฌ)
- ํ๊ฒ ๋ณ์ (์์ธก ๋์):
๊ฐ๊ฒฉ(์ํ),๋ง๋ ฅ,์ ๋ก๋ฐฑ (0-100km) - ์ฃผ์ ํผ์ฒ:
์ ์กฐ์ฌ,๋ชจ๋ธ,์ฐ์,์์ง ํฌ๊ธฐ,ํ ํฌ๋ฑ
์ฌ์ฉ ๋ฐฉ๋ฒ
์ด ๋ชจ๋ธ์ ๋ถ๋ฌ์ ์ฌ์ฉํ๋ ค๋ฉด tensorflow, xgboost, scikit-learn, skops ๋ผ์ด๋ธ๋ฌ๋ฆฌ๊ฐ ํ์ํ๋ค.
XGBoost ๋ชจ๋ธ ๋ถ๋ฌ์ค๊ธฐ ๋ฐ ์์ธก
import skops.io as sio
# ์ ์ฅ์์์ ๋ชจ๋ธ์ ์ง์ ๋ถ๋ฌ์ฌ ์ ์๋ค (๋๋ ๋ค์ด๋ก๋ ํ)
# loaded_model = sio.load("hf://your-hf-username/your-repo-name/xgboost-model.skops")
loaded_model = sio.load("xgboost-model.skops")
# ์์ธกํ ๋ฐ์ดํฐ๋ฅผ ์ค๋นํ๋ค (์ ์ฒ๋ฆฌ ๋ฐ ์ค์ผ์ผ๋ง ํ์)
# preprocessed_data = ...
# prediction = loaded_model.predict(preprocessed_data)
# print(prediction)
์ต์ข ์ฑ๋ฅ
ํ์ดํผํ๋ผ๋ฏธํฐ ํ๋ ํ, ๋ ๋ชจ๋ธ์ ํ ์คํธ ๋ฐ์ดํฐ์ ์ ๋ํ ํ๊ท ์ ๊ณฑ ์ค์ฐจ(MSE)๋ ๋ค์๊ณผ ๊ฐ๋ค.
- (ํ๋) ๋ฅ๋ฌ๋ ๋ชจ๋ธ MSE:
0.010617 - (ํ๋) XGBoost ๋ชจ๋ธ MSE:
0.010617
๋ ๋ชจ๋ธ์ด ๊ฑฐ์ ๋์ผํ ์ต๊ณ ์ฑ๋ฅ์ ๊ธฐ๋กํ์ผ๋ฉฐ, ์ด๋ ๋ฐ์ดํฐ์ ํน์ฑ์ ๊ฐ๊ธฐ ๋ค๋ฅธ ๋ฐฉ์์ผ๋ก ์๋ฒฝํ๊ฒ ํ์ตํ์์ ์์ฌํ๋ค.
- Downloads last month
- -
