「Attacking Optical Character Recognition (OCR) Systems with Adversarial Watermarks」という論文を読んだ。 概要 OCRシステムを騙すための […]
カテゴリー: 機械学習
論文読み:Squeeze-and-Excitation Networks
元論文:Squeeze-and-Excitation Networks 最近良くCNN関連のタスクでよく使われる手法なので、論文を読んでみたときのメモ。 ググると他にも詳しい解説記事があるので、あくまでも個人的なメモとし […]
小規模データセットに対するニューラルネットの汎化性能の理由に迫る論文:Modern Neural Networks Generalize on Small Data Sets
NeurIPS 2018の論文で「Modern Neural Networks Generalize on Small Data Sets」という論文があったので読んでみた。 ニューラルネットは大規模データで成功を収めて […]
Attentionによるニュース推薦の論文「NPA: Neural News Recommendation with Personalized Attention」
KDD2019のApplied Data Science Track Paperからピックアップして「NPA: Neural News Recommendation with Personalized Attention […]
Microsoftでの時系列データ異常検知手法の論文:「Time-Series Anomaly Detection Service at Microsoft」
KDD2019の論文を少しずつ読んでいってる。特にApplied Data Science Track Paperの方は、企業で実際に機械学習を運用している際の話が書かれているので面白く読める。 今回はMicrosoft […]
書評:The Data Science Design Manual
少し前に「The Data Science Design Manual」という本を読んだので紹介します。 この本の著者はAlgorithm Design Manualを書いた、Steven S. Skiena先生であり内 […]
「欠測データ処理」を読んだ
データ分析の前処理における重要なポイントの一つとして、欠測データをどのように扱うかがある。 入門向けの記事だと単純に平均値や0埋めなどを施して、そのまま機械学習モデルに投入する例が多いが統計学的にはこのような単一代入法と […]
外れ値処理の一手法:Winsorizingについて
機械学習や統計の分野における外れ値処理の手法の一つとしてWinsorizingと呼ばれる手法がある。日本語の解説が少なかったので書いてみる。 手法自体は非常に簡単で、外れ値を外れ値以外の最大値・最小値で置き換えるというも […]
機械学習による化合物テストツールの論文:「PrePeP – A Tool for the Identification and Characterization of Pan Assay Interference Compounds」
PrePeP – A Tool for the Identification and Characterization of Pan Assay Interference Compounds Maksim Koptelo […]
機械学習によるユーザ離脱率の予測論文:「I Know You’ll Be Back: Interpretable New User Clustering and Churn Prediction on a Mobile Social Application」
I Know You’ll Be Back: Interpretable New User Clustering and Churn Prediction on a Mobile Social Application C […]