プログラミング

【Python】欠測データへの対処方法(pandas)

久しぶりの投稿になります。今回はPythonでデータ解析やる前に必ず必要となるデータの前処理の一つである、欠測データへの対処方法をご紹介します。今回参考にしたのは、以下の参考書です。
プログラミング

【Python】決定木によるIrisデータ分類・非線形分類

今回は決定木を用いた非線形のIrisデータ/非線形分類問題をPythonを用いて実装します。今回参考にしたのは、以下の参考書です。
プログラミング

【Python】カーネルSVMによる非線形分類問題

今回はSVM(サポートベクトルマシン)を用いた非線形の分類問題をPythonを用いて実装します。今回参考にしたのは、以下の参考書です。
その他

驚愕!機械学習の求人は超高収入(Indeedによる仕事ランキング)

機械学習エンジニアは、需要の増大と高い給与のため、2019年の最高の仕事になりそうです。昨年2018年には、344%の成長率で、146085ドルの平均給与にまでなりました。今回は、Indeed(米)による仕事ランキングをご紹介したいと思います。ちなみに、今回は以下の記事の和訳になります。
プログラミング

機械学習を勉強するためのオススメ参考書(理論・Python・Webアプリ)

統計・機械学習に関しては授業で習ったところありますが、結構忘れてしまっています(。また、Rの演習の授業はありましたが、Pythonは学生のころには使っていません。機械学習・データサイエンスを勉強するにあたり、私が参考にしている参考書を一挙ご紹介したいと思います。
プログラミング

【Python】XGBoostのパラメータの意味・効果(地震データで)

XGBoostには分析者が決める必要があるパラメータがいろいろあります。今回はその中でも特に、モデルの複雑さを表すパラメータの意味と効果に関して検証してみます。今回扱うパラメータは以下の2つです。
その他

イチロー引退会見で話題になった「AIポン」を作った企業LASSIC

そんなイチローですが、先日、引退を発表しました。その引退会見のAbema TVでの生放送にて、オンライン字幕がひどいというのが話題になっています。このオンライン字幕ですが、鳥取県のIT企業 LASSICが「AIポン」という名前のサービスで提供しているものです。今回はこの「AIポン」と「LASSIC」を調査してみました!
コンピュータ

【随時更新】データサイエンス・機械学習まわりの専門用語の読み方一覧(tensorflow・sklearnなど)

今回は全く毛色の異なる記事になります!機械学習・データサイエンスまわりのことを勉強していると、ライブラリの名前やツールの名前など横文字が多々出てきます。大勢の前で間違った読み方をして、恥ずかしい思いをしないよう、読み方一覧をまとめました!ちなみに、この記事は随時更新していく予定です。
機械学習

【Python】XGBoostとディープラーニングの比較(タイタニック号データで)

Kaggleで人気のXGBoostと、もう知らない人はいないほどのディープラーニング。ぶっちゃけ、どっちがいいのか、どのケースにはどっちを使うかってみなさん分かります?少なくとも、私はよく分かりませんでしたので、自分なりに比較をしてみます。
機械学習

【Python】英語ーベトナム語のseq2seq機械翻訳を試してみる

これまた試したみただけの記事ですが、今回はPythonを用いて機械翻訳を試してみます。参考にしたの(使ってみただけ)以下のGitHubに上がっているNeural Machinie Translation(seq2seq)です。 ...