Sony製 Deep Learning Framework: Neural Network Consoleを試してみた

ソニーがGUIでDeep Learningアプリケーションを作成するツールを公開しました。

ソニー、ニューラルネットをGUIで設計できる深層学習の統合開発ツールを無償公開

 

ネットワークを構築する部分がGUIで書けるようで、どれくらい便利なのかを試してみることにしました。
個人的にはKerasやTensorflowを使ったとしても、ネットワーク構築の部分は積み木のような感覚なのでそれほど難しいとは思わないので、GUIで出来るというのがどれほどメリットがあるのか懐疑的でした。

実際に試してみると、直感的に使えるので試行錯誤の段階には意外と便利かもしれないと感じました。

ダウンロード

以下のページからダウンロードをします。まずはメールアドレスを登録すると、ダウンロード先のリンクが送られてきます。

https://dl.sony.com/

ファイルサイズは900MBほどあります。ちなみに現時点ではWindowsのみ対応しています。

ディレクトリ構造

ディレクトリ構造は以下の通りです。

実行

neural_network_console.exeをダブルクリックで実行できる。

最初にライセンス規約が表示されるので、同意する。

すると以下のような画面が表示される。色々とサンプルが用意されているようだ。

 

とりあえず、2番目のMNISTサンプル(手書き数字認識)をクリックしてみるとMNISTデータのダウンロードが始まります。

ダウンロードが終わるとサンプルのネットワークが表示されます。このサンプルは画像が9かどうかを判定するサンプルのようです。

直感的に分かりやすい。ConvolutionとMaxPoolingを2回やって、Affine変換を2回やって、最後はBinaryCrossEntropyで評価ね、と分かります。

F5を押すとトレーニングが始まる。トレーニング中はエポックごとに評価関数の推移がグラフで表示される。TrainingErrorとValidationErrorが表示されるので、テストセットの分離は勝手にやってくれているのだろうか?

 

せっかくなので、ネットワークを少しいじってみようと思います。色々と試してみましたが、In/Outの行列サイズが表示されるのが便利だと感じました。

ここでは単純に活性化関数をtanhからReLUにしてみました。

左側のツールボックスからブロックを選択して繋ぎかえるだけなので、直感的に操作できます。

(ちなみに畳み込み層を1層追加しようとしたのですが、デフォルトのフィルターサイズが5×5だったためサイズが合わないという警告がグラフ上に出て初心者には分かりやすいと思いました)

過去の試行錯誤結果は保存されているため、色々なネットワークで試して一番良いものを使うことが出来ます。

Validation結果が一番良かったものを使って、テストデータを動かしてみます。F6でテストデータの評価が始まります。

各テスト画像に対しての結果とConfusion Matrixが作成されます。

Presicision, Recall, F値が表示されて分かりやすいです。

結論

ドキュメントを読まなくても結構直感的に使えて、機械学習初心者に向いているのではないかと感じました。

GUI部分もよく出来ていてストレスを感じることなく使えます。ネットワーク作成に使う要素も、一通りのものが揃っているので手軽にやりたいことを始めるのには良いのでないかと思います。

 

現実的にはユーザー数の規模では、世界的に見たら既存のフレームワークが圧倒している状況だと思います。

今後、他のDeep LearningフレームワークでもGUIでネットワーク構築を行うツールが出てくるかと思うので、差別化できる部分を実装して頑張って欲しいです。

データサイエンス関係のpodcastをまとめてみた

最近盛り上がりを見せるデータサイエンス界隈。
様々なpodcastが存在しているが、あまり言及されることが無いようなのでここでまとめておく。
割と更新頻度が高いものを中心に選んだつもりなので、これらを購読すれば聞くものが無いという状態にはなかなかならないかと思う。

言語は英語なので、データサイエンスの最新動向を知るのとともに英語の勉強にも使えるかと思う。
日本の機械学習エンジニアと研究者が世界と戦うための一助になれば幸いです。

  • Super Data Science
番組ホストのKirill Eremenkoが毎週インタビュー形式のメインエピソードと、Tips的なショートエピソードを配信している。
英語は聞きやすいので、英語に自信が無い人はまずはショートエピソードから入ってみるのも良いかもしれない。
  • The AI Podcast

https://blogs.nvidia.com/ai-podcast/
 ご存知NVIDIAの提供で行われるPodcast。
Andrew NgとかIan Goodfellowなどのスーパースターがゲストで登場していたりしているので、それだけでも聞く価値はあるかと思う。

  • Linear Digressions

http://lineardigressions.com/
機械学習に関連するトピックを実例をもとに紹介する。
ディスカッション形式のポッドキャスト。

  • This Week in Machine Learning

 https://twimlai.com/

毎週、機械学習に関連する研究者や企業関係者へのインタビュー形式で配信されるポッドキャスト。
実際の応用事例が豊富に聞ける。
  • O’Reilly Data Show
ご存知O’Reillyの提供で行われるPodcast。
企業の研究者などへのインタビュー形式。
最新のエピソードではFacebookの研究者へのインタビューが行われた。
 
  • Not So Standard Deviation

 https://soundcloud.com/nssd-podcast

2人のホストが機械学習や統計に関連したトピックを話す形式のポッドキャスト。
 
  • Data Skeptic
技術的なトピックについて話し合うポッドキャスト。
MINIシリーズという形式の回は20分程度なので聞きやすい。

Character-level Convolutional Networks for Text Classification を読んだ

Character-level Convolutional Networks for Text Classification を読んだ。
テキストの分類を文字単位のCNNで行うと、大規模なデータセットでは従来の手法よりも良い結果が得られたという論文。

テキスト関連の処理は形態素単位でのRNNを使うのがセオリーなのだと思っていたが、文字単位でCNNを行った際に良い結果が出たというのは驚き。
論文中にも書かれていたが、テキストというのは文字単位の信号処理ととらえることが出来るのかもしれない。