「Attacking Optical Character Recognition (OCR) Systems with Adversarial Watermarks」という論文を読んだ。 概要 OCRシステムを騙すための […]
カテゴリー: python
外れ値処理の一手法:Winsorizingについて
機械学習や統計の分野における外れ値処理の手法の一つとしてWinsorizingと呼ばれる手法がある。日本語の解説が少なかったので書いてみる。 手法自体は非常に簡単で、外れ値を外れ値以外の最大値・最小値で置き換えるというも […]
Kerasで転移学習をする際にはpreprocess_input()を呼ぼう
画像に関するタスクを扱っている際に、事前学習済みの重みを利用した転移学習を行うことは良い精度を出すことが多く広く使われています。Kearsには学習済みのいくつかのモデルが用意されており簡単に転移学習を行うことが出来ます。 […]
大規模データのクラスタリングには Mini Batch K-Means を使うべきという話
タイトルの通りですが、大規模データをクラスタリングする際には単純なK-Means法ではなく、Mini Batch K-Means法を使うべきという話です。 とある大規模データ(150万件ほどの文章ベクトル)をクラスタリン […]
RNNのDropoutはどこに入れるべきか?:Where to Apply Dropout in Recurrent Neural Networks for Handwriting Recognition?
タイトルの通り、RNNに対してDropout層を追加する場合、どこに入れるのが適切なのか?と思い少し調べてみました。 ことの発端は、KerasにあるLSTMとGRUの、GPUによる高速化版であるCuDNNLSTMとCuD […]
CNNによるセグメンテーション論文:「U-Net Convolutional Networks for Biomedical Image Segmentation」を読んだ
タイトルの通り、CNNを用いて医療画像をセグメンテーションするU-Netというネットワーク構造の論文を読んだ。 2015年に発表されたネットワーク構造だが、その後セグメンテーションでは古典的な内容になっており、いくつか発 […]
Pythonでデータ整形まわりをまとめた本:「Python for Data Analysis (第2版)」を読んだ
最近、Pythonを使って機械学習を勉強しているがnumpyやpandas, グラフ作成辺りの体系的な知識が足りない気がしていたので、この辺りをまとめた本「Python for Data Analysis (第2版)」を […]
PythonでOpenCV
以下のページを参考にしてMacにOpenCVを入れてPythonで動かしてみた。Macでpython+opencvを使う 画像マッチングの例はなぜかFlannBasedMatcherを使うとエラーが出て失敗するので、 こ […]