なんやブログ|データ分析格闘記

データ分析を生業に、分析ナレッジや読書感想などを書くブログ。ミナミのデータ分析格闘ブログ

【Python】kaggle で submit の結果をブレンディングする

f:id:bee5boo5bee:20210206180617p:plain

アンサンブル学習の方法として、かなり簡易に使える方法をお伝えします。

submit を単純に平均して算出

import pandas as pd

# 読み込み
lgbm_sub_df = pd.read_csv('./submit/lgbm_sub.csv')
rf_sub_df = pd.read_csv('./submit/rf_sub.csv')

# 平均を算出
submit_merge_df = (lgbm_sub_df + rf_sub_df) / 2
submit_merge_df.to_csv('./submit/merge_sub.csv'), index=False)


もちろん、input の数を増やすことはできますし、数十になったときにもっと良い方法もありますが、まずは基本を理解ということで。

プライバシーポリシー | 趣味のページ