AIプログラム「ディープペイシャント」は統合失調症を正確に予測する 佐々木俊尚の未来地図レポート vol.473

AIプログラム「ディープペイシャント」は統合失調症を正確に予測する 佐々木俊尚の未来地図レポート vol.473

2017年11月06日発行

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
佐々木俊尚の未来地図レポート     2017.11.6 Vol.473
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
http://www.pressa.jp/


【今週のコンテンツ】

特集
AIプログラム「ディープペイシャント」は統合失調症を正確に予測する

〜〜ビッグデータの偏見について改めて考える(前編)

未来地図キュレーション

未来地図レビュー

佐々木俊尚からひとこと

EPUBファイル,Kindleファイルのダウンロード先は
メルマガ最後に掲載中
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
■特集

AIプログラム「ディープペイシャント」は統合失調症を正確に予測する

〜〜ビッグデータの偏見について改めて考える(前編)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━


 SNSにおけるフェイクニュース問題への対策として、投稿や記事の紹介がアップロードされた段階でSNS運営会社がフィルタリングし、明らかなフェイクについては遮断して人々の目に触れないようにする、という方法が一般的に採用されています。ただ問題は、利用者が10億人を超えるフェイスブックのようなプラットフォームの場合、日々膨大なテキストがアップロードされており、人力でフィルタリングするのには限界があるということ。



 そこでAIを使ってアルゴリズムによってフィルタリングするという話になるわけですが、これはこれで問題があるよねという指摘が出てきています。



◆フェイクニュースより恐ろしい、アルゴリズムの「偏見」とは何か?

http://bit.ly/2yEPUx3


 アルゴリズムが偏っていた場合に、果たしてその偏見を修正することは可能なのか?

 特にAIのディープラーニングの場合、特徴点を抽出する計算もAIが独自に行うため、その計算の逐一を人間側が把握することはほぼ不可能です。つまりディープラーニングのアルゴリズムのロジックは、人間が理解できないのです。



 フェイクニュースではありませんが、上記の記事ではCOMPASという米国の「再犯予測ソフト」が紹介されています。これは人々の行動パターンなどから、犯罪が起きそうな場所や時間を予測したり、あるいは元受刑者の再犯率も計算してしまおうというもの。トム・クルーズの映画「マイノリティ・リポート」で描かれた、ある人物が犯罪を起こすかどうかを正確に予想し、予防拘禁する「未来警察」のような話ですね。これがすでに現実になってきている。



 このCOMPASについて、政治系メディアのプロパブリカが検証したそうです。引用します。



 ”COMPASが再犯予測を評価した1万人以上のデータを独自に検証しました。その結果、再犯予測の判定に黒人が白人よりも不当に危険度が高くなる傾向があったことが指摘されました。再犯予測全般では大きな差はないものの、再犯予測後の2年間で再犯しなかった人物の中で高い再犯評価を受けていたのは、黒人が45%なのに対して白人は23%との結果が出ています。”


 つまりここには「黒人は危険だ」という偏りが生じてしまっている。なぜこのような偏りが出ているのでしょうか? COMPASがどのようなアプローチで分析しているのかは定かではないのですが、アルゴリズムではなく、そもそもがベースとなるビッグデータの問題なのではないかとも思えます。

 ディープラーニングのベーシックな手法である「教師あり学習」では、まず人間が正解を教えます。例えば膨大な写真の中からネコとイヌの写真を抽出する場合、まず「この写真はイヌ」「この写真はネコ」という正解のデータをディープラーニングに覚えさせる。そのうちにディープラーニングは、「何を特徴としてネコと見るか」「何の特徴があればイヌと判断していいのか」という特徴点の抽出を行い、人間が正解を教えなくてもイヌネコ判断を高い正答率で行えるようになります。



 この教師データにそもそもバイアスがある場合には、いくらディープラーニングであっても正確な抽出は行えません。



◆ビッグデータの不都合な真実
http://bit.ly/2lp5Hf2


 上記は翻訳家yomoyomoさんの2014年の記事です。



 この中で、2012年の巨大ハリケーン・サンディ被害について、2000万以上のTwitterツイートについての分析の話が紹介されています。膨大な数のビッグデータですが、これを分析したらサンディの被害の全体像が現れるかというと、実はそうではない。たとえばサンディの被害についてのツイートが最も多かったのはマンハッタンだったのですが、だからと...

このコンテンツの続きは有料です

購入済みの場合はログイン
ページの先頭へ戻る