第三回アドバイザリーボード
第三回のアジェンダは、TCAとして注力する案件の方向性と個別事例の振返りについて。
TCAの人材課題に対する取り組み<アドバイザリーボードVol.5> の続きです。
データ活用のリスク
- TCA西 浦
-
それでは最後のポイント、データ活用のマネジメントについてです。TCAはデータを活用する会社ですので、やはりデータそのものやデータサイエンスで生み出したアルゴリズムから生じるリスクもしっかりと考なければならないと思っています。
例えば、世の中には、委託先への提供や共同利用という形で、他社に自社の保有するデータを渡している事例もあると認識しています。
どこかのツールを使うことによって、預け入れたデータの寡占化やロックインが生じるという話もあります。
TCAは中部電力グループ内の会社なので、基本的に提供いただいたデータは案件が終われば返還しますし、グループ外へのロックインが起こらないようにノウハウを貯めていこうとしています。
上手なデータ活用の方法やデータガバナンス(データを効率的に活用するための、プロセス、役割、ポリシー、監視体制など)の方法を考えていかないと、今後このような問題が肥大化してしまう懸念があります。
この辺りについて、他社がどのような取り扱いをしているのかについて、ぜひアドバイスをお願いしたいです。
他社事例から見るデータ活用の問題点
- ACN保 科
-
この問題は非常に幅広い要素を含んでいます。Google、Apple、MicrosoftといったいわゆるAI活用の先進企業でも、学習データに含まれるバイアスが顕在化するなど、苦労しているのが事実です。
人が作ったデータを扱う限り、その中に必ずバイアスは入ります。仮にデータそのものにバイアスが無かったとしても、開発者のバイアスというのは多かれ少なかれ入るものです。
例えば、コンサルタントが何らかの仮説を立て、それを検証するためにデータを利用し、そこに相関があったのでこの仮説はこのデータで証明されていますとやってしまうことがありますが、実際は擬似相関だったという事例も多く目にします。
データそのものに含まれるバイアス、データを収集するところのサンプリングバイアス、さらに開発者のバイアスのようなものが存在します。データ分析には落とし穴が多くあり、機械学習の要素が入るとさらにもう一段難しくなります。そういうものを見極めながらコントロールすることが大事ですし、委託先へのデータ提供や共同利用のような話が絡むとさらに複雑になります。
まだ日本はそこまでデータに関する規制は強くないですが、EUではデータに関する法令や規制が次々と出来始めています。その法律では、AIを開発した企業だけでなく、ユーザーの責任も問うと言っています。
出元がどこであれ、データを使っている企業、そして最終顧客に接している企業が責任を持ちましょうという中で、外から取得したデータを使用する、もしくは外にデータを出すときには、守るべきことやチェックが必要なポイント、データの生成の部分やサンプリング部分、あるいは分析モデルの部分で何が起きているのかを含めてしっかりと設計・管理・監視する必要があります。
AIを使っていなくても、大量のデータを扱ってビジネスをする際には気をつけなければなりません。
- CE 増 田
-
データの利活用や提供の問題について通信関連の会社の方と話をした際にも、自社の個人データ活用にはかなりセンシティブになっていると言っていました。
利用規約にはデータの提供先が羅列されていたとしても、情報銀行的にお客さんに自らのデータをコントロールしてもらうように変えていかなければならないと思います。オプトアウト(本人が「個人データの第三者提供を止めてください」と求めたときに第三者提供をやめる、という形で個人データを第三者に提供する形のこと)にも仕組み作りが必要であるという話があり、中部電力が保有するデータについても同様の取り扱いが必要ではないかと思っています。
第三回アドバイザリーボード