読者です 読者をやめる 読者になる 読者になる

人工知能伝習所

〜 AI x Big Data x IoTなトピックを、非エンジニアにも分かりやすくお届け 〜

Yahoo!がアダルトコンテンツを検閲する深層学習モデルをオープンソース化

Deep Learning

Yahoo! Engineeringブログによると、ポルノやアダルトコンテンツなど、「職場に不適切な(NSFW: Not Suitable/Safe For Work)」コンテンツを識別できるようにトレーニングされたディープラーニングの学習モデルがオープンソース化されたそうです。

Chupacabra the Pornographer

学習モデルはCaffeOnSparkの上でトレーニングされており、BSD 2-Clauseライセンスの下で配布されます。これは、オープンソースディープラーニングフレームワークの一つであるCaffeをSpark/Hadoopクラスタ上で実行できる、分散型の深層学習技術です。

昔からマンパワーでインターネットのコンテンツを分類してきたYahoo!らしいディープラーニングの使い方といったところでしょうか。きっと、過去に積み上げられた大量の学習用データと、共同作業で有害コンテンツを分類するために標準化されたルールがあるからでしょうね。ブログやSNSなどに対する不適切投稿を監視するサービスや、有害サイトフィルタの作成に使えそうです。

ただし、何がアダルトで何がセーフかという基準は主観的で文脈にもよるため、精度の保証はないとのこと。オープンソース化することで、カスタマイズや拡張ができるようになることを期待しているようです。

人工知能学会のワークショップ「機械学習の社会実装に向けて」で取りあげられていた「学習済みモデル」の権利や流通、再利用といったトピックの一例としても興味深いですね。