前言 1.1 賽題背景本次新人賽是Datawhale與天池聯(lián)合發(fā)起的0基礎入門系列賽事第四場 —— 零基礎入門金融風控-貸款違約預測。 賽題以金融風控中的個人信貸為背景,要求...
解決的問題是預測預測用戶貸款是否違約為任務。提交的形式應該是一個二分類形式(2個字段,一個是id,一個是違約的可能性),目前提交第一名結(jié)果是0.749。該結(jié)果是競賽采用AUC...
背景介紹: 公共自行車低碳、環(huán)保、健康,并且解決了交通中“最后一公里”的痛點,在全國各個城市越來越受歡迎。本練習賽的數(shù)據(jù)取自于兩個城市某街道上的幾處公共自行車停車樁。我們希望...
背景介紹: 公共自行車低碳、環(huán)保、健康,并且解決了交通中“最后一公里”的痛點,在全國各個城市越來越受歡迎。本練習賽的數(shù)據(jù)取自于兩個城市某街道上的幾處公共自行車停車樁。我們希望...
解決的問題是預測兩個城市某街道上的幾處公共自行車停車樁。我們希望根據(jù)時間、天氣等信息,預測出該街區(qū)在一小時內(nèi)的被借取的公共自行車的數(shù)量。數(shù)據(jù)下載地址:http://sofas...
關(guān)于比賽的基本操作描述,參考簡書[http://www.itdecent.cn/p/6066bf12be98]。學習了比賽中排行第三(rank3)的源碼kernal,參考鏈...
我是神醫(yī):
1."利用特征Age提取新特征AgeBand,目的是根據(jù)AgeBand的區(qū)間重新賦予Age處理值"這一步驟中,賦值時最后一行代碼“dataset.loc[ dataset['Age'] > 64, 'Age']”只是一個條件篩選,沒有進行任何賦值或操作,應該改寫為“dataset.loc[ dataset['Age'] > 64, 'Age'] = 4 # 將年齡大于 64 的乘客劃分為第 5 組”
2.數(shù)據(jù)清洗結(jié)束后,數(shù)據(jù)集中存在非數(shù)值型(字符串類型)的特征列“Title”,簡單的,可以在跑模型之前進行獨熱編碼,“X_train = pd.get_dummies(X_train)“、”X_test = pd.get_dummies(X_test)”。
kaggle——泰坦尼克之災2關(guān)于比賽的基本操作描述,參考簡書[http://www.itdecent.cn/p/6066bf12be98]。學習了比賽中排行第三(rank3)的源碼kernal,參考鏈...
andyham[http://www.itdecent.cn/u/50a582498997] kaggle——泰坦尼克之災1[https://www.jianshu.co...
標題 一級標題 二級標題 三級標題 四級標題 五級標題 六級標題 列表無序列表 文本1 文本2 文本3 有序列表 文本1 文本2 文本3 插入鏈接,使用 顯示文本[%E9%9...
泰坦尼克之災是kaggle的一個入門案例,以下是這個比賽的一些記錄: 1、jupyter notebook的安裝 相比之前使用的pycharm,jupyter noteboo...