Hiro | 10001 ideas

Microsoftでの時系列データ異常検知手法の論文：「Time-Series Anomaly Detection Service at Microsoft」

KDD2019の論文を少しずつ読んでいってる。特にApplied Data Science Track Paperの方は、企業で実際に機械学習を運用している際の話が書かれているので面白く読める。今回はMicrosoft […]

少し前に「The Data Science Design Manual」という本を読んだので紹介します。この本の著者はAlgorithm Design Manualを書いた、Steven S. Skiena先生であり内 […]

「Time-series clustering – A decade review」という論文を読んだ。過去10年間の時系列クラスタリングの研究動向についてサーベイした論文。クラスタ手法のみではなく、効率や品 […]

2019年7月20日By Hiro 論文コメントする

データ分析の前処理における重要なポイントの一つとして、欠測データをどのように扱うかがある。入門向けの記事だと単純に平均値や0埋めなどを施して、そのまま機械学習モデルに投入する例が多いが統計学的にはこのような単一代入法と […]

機械学習や統計の分野における外れ値処理の手法の一つとしてWinsorizingと呼ばれる手法がある。日本語の解説が少なかったので書いてみる。手法自体は非常に簡単で、外れ値を外れ値以外の最大値・最小値で置き換えるというも […]

PrePeP – A Tool for the Identification and Characterization of Pan Assay Interference Compounds Maksim Koptelo […]

I Know You’ll Be Back: Interpretable New User Clustering and Churn Prediction on a Mobile Social Application C […]