mi7mi のデータ分析格闘ブログ

データ分析を生業に、分析ナレッジや読書感想などを書くブログ。ミナミのデータ分析格闘ブログ

【要約まとめ】コンサルタントの「質問力」:野口吉昭

本ページは、筆者の個人的な備忘録として読書感想を残しておくためのものです。 なので、私が大切だと思ったポイントを箇条書きでアウトプットしています。 今回の書籍は下記の本です。みなさんのご参考になれば嬉しく感じます。 コンサルタントの「質問力」…

【要約まとめ】 入門『地頭力を鍛える』 32のキーワードで学ぶ思考法 : 細谷功

本ページは、筆者の個人的な備忘録として読書感想を残しておくためのものです。 なので、私が大切だと思ったポイントを箇条書きでアウトプットしています。 今回の書籍は下記の本です。みなさんのご参考になれば嬉しく感じます。 入門『地頭力を鍛える』 3…

【要約まとめ】イシューからはじめよ 知的生産の「シンプルな本質」:安宅和人

本ページは、筆者の個人的な備忘録として読書感想を残しておくためのものです。 なので、私が大切だと思ったポイントを箇条書きでアウトプットしています。 今回の書籍は下記の本です。みなさんのご参考になれば嬉しく感じます。 イシューからはじめよ ― 知…

【要約まとめ】コンサル一年目が学ぶこと:大石哲之

本ページは、筆者の個人的な備忘録として読書感想を残しておくためのものです。 なので、私が大切だと思ったポイントを箇条書きでアウトプットしています。 今回の書籍は下記の本です。みなさんのご参考になれば嬉しく感じます。 コンサル一年目が学ぶこと …

【SQL】 データ分析で覚えておくと便利な関数まとめ

SQL

普段のデータ分析の中で、筆者はSQLを使う機会が多いのですが、関数を知っていないと遠回りをしてしまい、かつコードが長くなってしまうことがあります。 今回は、SQLで覚えておくと便利そうな関数をピックアップしてみました。PostgreSQL、MySQL、SQL Serve…

【要約まとめ】データ分析人材になる。目指すは「ビジネストランスレーター:木田浩理, 伊藤豪, 高階勇人, 山田紘史

本ページは、筆者の個人的な備忘録として読書感想を残しておくためのものです。 なので、私が大切だと思ったポイントを箇条書きでアウトプットしています。 今回の書籍は下記の本です。みなさんのご参考になれば嬉しく感じます。 データ分析人材になる。 目…

【AWS Lambda】S3 の PDF をダウンロードするAPIを開発(API gateway や CloudFrontが必要)。

aws

S3に保存したPDFファイルをダウンロードするAPIを、Lambdaで作りました。テキスト表示までは簡単にできたのですが、PDFなどのファイルダウンロードとなると結構設定の変更が必要だったりしてハマりポイントがたくさんあったので、備忘録として残しておきます…

【要約まとめ】新規事業の実践論:麻生要一(News Picks Publishing)

本ページは、筆者の個人的な備忘録として読書感想を残しておくためのものです。 なので、私が大切だと思ったポイントを箇条書きでアウトプットしています。 今回の書籍は下記の本です。みなさんのご参考になれば嬉しく感じます。 新規事業の実践論 (NewsPick…

【要約まとめ】仮説思考―BCG流 問題発見・解決の発想法:著 内田和成

本ページは、筆者の個人的な備忘録として読書感想を残しておくためのものです。なので、私が大切だと思ったポイントを箇条書きでアウトプットしています。今回の書籍は下記の本です。みなさんのご参考になれば嬉しく感じます。 仮説思考―BCG流 問題発見・…

【要約まとめ】メモの魔力:前田裕二

本ページは、筆者の個人的な備忘録として読書感想を残しておくためのものです。 なので、私が大切だと思ったポイントを箇条書きでアウトプットしています。 今回の書籍は下記の本です。みなさんのご参考になれば嬉しく感じます。 メモの魔力 -The Magic of M…

【データ分析】共通的なデータ加工の考察

本記事に来られた方は、kaggle や atmaCup などでコンペティションに参加されている方も多いかもしれませんね。 また、お仕事でデータ分析をされている方も多いでしょう。 本記事では、共通的に使えそうな特徴量について列挙してみたいと思います。 日付に関…

【Python】kaggle で submit の結果をブレンディングする

アンサンブル学習の方法として、かなり簡易に使える方法をお伝えします。 submit を単純に平均して算出 import pandas as pd # 読み込み lgbm_sub_df = pd.read_csv('./submit/lgbm_sub.csv') rf_sub_df = pd.read_csv('./submit/rf_sub.csv') # 平均を算出 …

【Python】print() で表示できる行数を変更する

行数の設定変更 Pythonで行数が長い場合に「・・・」の表示となってしまいますが、設定を変更することができます。 # 現在の設定確認 print(pd.get_option("display.max_rows")) # 150行まで伸ばす場合 pd.set_option('display.max_rows', 150) pandasで行列…

【Python】XGBoost の使い方

train_df と test_df を用意して、関数に入れる。 #------------------------- # 関数定義 #------------------------- import xgboost as xgb def run_xgb_kfold(train_df,test_df,features,target,folds,params): oof_preds = np.zeros(train_df.shape[0])…

【Python】matplotlib で日本語の文字化けが出るときの対応

日本語でタイトルなどに文字化けが出るときにには、「japanize_matplotlib」をimportしてみると良い なんらかの方法で japanize-matplotlib をインストール !pip install japanize-matplotlib 日本語でグラフを描く import pandas as pd import matplotlib.p…

プライバシーポリシー | mi7miの趣味