ギークなエンジニアを目指す男

SIerが機械学習系の知識を蓄えようとするブログ

MENU

機械学習

機械学習初心者が約10ヶ月でメダルより大切なものを獲得できた話【kaggle Advent Calendar 17日目】

本記事は、kaggle Advent Calendar 2018の17日目の記事です。 qiita.com 何を書くか直前まで悩んでいましたが、16日に参加したAIもくもく会の中で、 機械学習に興味はあるけど、どのような手順で、何から勉強していったら良いかわからない という方が数名い…

GCI 社会人向け Data Science Online Course 4週目の感想

第3期社会人向け Data Science Online Courseコースの4週目を終えました。 今週学んだことをアウトプットしていきます。 スケジュール 第1回(11/5): Numpy、Scipy、Pandas、Matplotlibの基礎 第2回(11/12):記述統計学と単回帰分析 第3回(11/19):確率…

GCI 社会人向け Data Science Online Course 2週目の感想

第3期社会人向け Data Science Online Courseコースの2週目を終えました。 今週学んだことをアウトプットしていきます。 スケジュール 第1回(11/5): Numpy、Scipy、Pandas、Matplotlibの基礎 第2回(11/12):記述統計学と単回帰分析 ← Now!! 第3回(11/19…

GCI 社会人向け Data Science Online Course 1週目の感想

現在、11月5日より開講されました東京大学グローバル消費インテリジェンス寄附講座の 第3期社会人向け Data Science Online Courseコースを受講しています。 そこでの所感や学びなどを書いてみようと思います。 現段階では1週間毎(課題が提出される頻度に合…

Google Colaboratory内で画像やCSVファイルにアクセスしてみた

今日は新宿のもくもく会に参加しております。 Kaggle-jaのInClassコンペ CSV読み込みするぞー Kaggle-jaのInClassコンペ 来週の月曜日から、Kaggle-jaでInClassコンペが開催されます。 (主催者の方、準備など本当にありがとうございます) 課題は画像認識の…

線形回帰とリッジ回帰をPythonで比べてみた

本日は回帰で頻出の線形回帰とリッジ回帰についてです。 線形回帰とは リッジ回帰 L1正規化とか、L2正規化ってなんだよ スコアを比較してみる リッジ回帰のalpha値をいろいろ変更してみる 線形回帰とリッジ回帰の係数の大きさをプロットしてみる 線形回帰と…

k-最近傍法でアイリスのクラス分類問題を解く(python)

こんばんは。 本日は、機械学習の定番とも言える、アイリスの花のクラス分類問題をk-最近傍法を用いて解いてみようと思います。 実際、アイリスの花を分類したいというモチベーションがビジネス上役に立つかと問われると微妙ですが、学習だと割り切っていき…

ゼロから作るDeepLearning 5章を学ぶ 〜誤差逆伝播法〜

本日から5章に入りました。 余談ですが、現在仕事の関係で、電車で1時間ほどかかる場所へよく出張に行っています。 普段の通勤は電車に乗る時間が15分ほどなため、ゆっくり読書などはできないのですが(もちろん、時間だけが原因でなく、混雑しているのも原…

ゼロから作るDeepLearning 4章を学ぶ その3 ニューラルネットワーク構築編

前回に引き続き、4章で学んだことを残しておきます。 今回は、MNISTデータセットを使用して、手書き数字を学習するニューラルネットワークを構築してみます。 前回までの記事はこちら taxa-program.hatenablog.com taxa-program.hatenablog.com 2層ニューラ…

ゼロから作るDeepLearning 4章を学ぶ その2

前回に引き続き、4章で学んだことを残しておきます。 前回記事 taxa-program.hatenablog.com ニューラルネットワークでの勾配 ニューラルネットワークの学習手順を復習 ニューラルネットワークでの勾配 ニューラルネットワークでも勾配を求める必要がありま…

ゼロから作るDeepLearning 4章を学ぶ その1

前回までの学んだことはこちら taxa-program.hatenablog.com taxa-program.hatenablog.com ミニバッチ学習 1に微分、2に微分、3に(ry 微分の復習 勾配 勾配法 参考サイト ミニバッチ学習 機械学習は、膨大がデータセットがないと行うことはできません。 しか…

ニューラルネットワークの構築 〜活性化関数と実際の構築〜

前回の続きです。 本日はconnpassで募集していた新宿のもくもく会で勉強しています。 集中できて素晴らしい。(主催者の方、ありがとうございます) また参加しようと思います。(コーヒーとお菓子食べれるし。笑) 前回記事はこちら taxa-program.hatenablo…

Pythonで決定木とRandomForestを比較してみる。その2(タイタニック生存者予測)

本日はタイタニック生存者予測をRandomForestを用いて行なってみたいと思います。 決定木で行なった記事はこちら taxa-program.hatenablog.com コード Kaggleに提出してみる コード モデルを使用するまでの部分は前回と一緒です import pandas as pd import …

Pythonで決定木とRandomForestを比較してみる。その1(タイタニック生存者予測)

今回は、Kaggle初心者向けに公開されているデータセットを使って「タイタニックの生存者予測」をPythonを使って行います。 データセットは下記Kaggleサイトからダウンロードをお願いします。 https://www.kaggle.com/c/titanic/data データを傍観してみる デ…

重回帰分析を行なってみたことのまとめ。その2(Python)

前回に引き続き、重回帰分析を行なっていきます。 今回は実際にモデルを作成し、そのモデルを使って訓練→検証をおこないます。 前回記事はこちら taxa-program.hatenablog.com モデルの構築と検証 訓練データと検証データに分割 家賃の予測 学習して感じたこ…

KaggleにJOINしました。

最近、機械学習のことをWEBで調べることが多くなりましたが、その中で「Kaggle」というキーワードがちらほらあったので、本格的に調べてみました。 Kaggleとは 以下、引用です。 まず呼び方ですが、Kaggleと書いて「カグル」と読みます。日本でも最近は定着…

重回帰分析を行なってみたことのまとめ。その1(Python)

今回は重回帰分析で得た知識をつらつら書いていこうと思う。 私、機械学習初心者のため「何言ってんだこいつ」という箇所があるかもしれないが、そこはスルーせずにコメントいただけるととても嬉しい。 今回は賃貸データから家賃を導きだす、ということをモ…