流沙河鎮

情報技術系のこと書きます。

銀行が持つ「顧客ビッグデータ」はそれほどビッグではない

イギリス四大銀行の1つ、NatWestのセッションで言及されていた銀行がサービスのパーソナライズを進める上での顧客データ量の壁の話が面白かったのでメモしておく。登壇したのはNatWest のChief Data and Analytics OfficerのZacheryと、Head of Data ScienceのDr.Greig。以降の記載は主にセッションの内容を基にしている。

www.youtube.com en.wikipedia.org

National Westminster Bank

NatWestことNational Westminster Bankはスコットランドに本拠を置く銀行で、世界に6万人の従業員、1,900万人の顧客を擁し、英国における決済取引の四分の一、世界におけるポンド建て取引の多くを処理しており、イギリス四大銀行の1つと言われている。事業はリテールとコマーシャルが半々である。 パーソナライズによる顧客体験向上に注力していて、モバイルアプリやメールで送信するメッセージを出来るだけ「役に立つ」内容にして、純粋な営業メッセージを出来るだけ減らしていこうとしているらしい。役に立つメッセージというのは、例えば英国では手数料無料のATMが全国共通で提供されているのだが、それとは別に有料の現金自動預け払い機というのもあって、統計的に低所得者層の顧客ほど割高な機械を頻繁に使う傾向がある。そこでモバイルアプリから「最近30日間で、手数料に300ポンド(約4万円)使っているようですが、1.5km以内に手数料無料のATMがありますよ」という感じで提案してあげるわけだ。これで年間5億ポンドの顧客の支出を節約できたそうだ。他の取り組み例として、英国ではAmazon詐欺というのが流行っており、「荷物が遅れているので、ここをクリックして支払い情報を教えてください」といった偽のテキストメッセージや電子メールを送りつける詐欺が横行している。そこでNatWestは顧客データから詐欺の被害に遭いやすい人物像をモデル化して、騙されやすそうな人に先回りして注意喚起や詐欺の見分け方を発信することで被害防止に貢献している。現在では純粋な営業メッセージは全体の40%程度に留まっており、将来的には10%まで減らしていこうとしている。こうした取り組みは直接的に銀行の利益になるわけではないが、NatWestのアプリを利用する顧客が増え、エンゲージメントが深まり、信頼に繋がり、結果として住宅ローン購入や借り入れの際にNatWestを思い浮かべてもらえるようになる。それが結果としてNatWestの利益を導く、というのが同社のビジネスモデルだそうだ。これを実現するにはデータの力が不可欠で、NatWestは2022までの2年間で500人以上のデータサインティスト、MLエンジニアを採用している。

Personalizing banking at scale with machine learning on AWS

セッションの主題はMLOpsであり、金融業界のような規制の厳しい業界で開発者が如何に素早く新しいアイデアを実装し、世に出し、改善していけるかについての議論にフォーカスしている。恐るべきことにNatWestでは数年前まで基本的なPython環境を立ち上げるだけで10のチームと会話して、数日から数週間に渡る煩雑な作業を経る必要があった。ましてや本番環境へのデプロイには気が遠くなるような時間がかかり、MLモデルを1つ世に出すだけで1年以上のリードタイムを要することも珍しくなかったということだ。

例えば、「うちのお客さんの間ではAmazon詐欺が一番多いから、それを解決しよう」というような素晴らしいアイディアがあったんです。「よし、グレイグ、チームを立ち上げて取り組んでくれ」と伝えました。そして、1週間後に「もう始めたか?コードは書けているか?結果を見せてください。」と聞くと、「いえいえ、まだ環境は整っていません。まだプライバシーを調べているところです。」 更に1週間後にまた来て、「もう始めたのか、どうなっているんだ」と聞く...

そんな状況を如何に改善していったかというのがセッションの主題で、それ自体非常に刺激的で面白いのだが、このエントリではその話はしない。ぜひ本編を見て感想を聞かせて欲しい。需要があればこれはこれで纏めようと思う。

銀行が持つ「顧客ビッグデータ」はそれほどビッグではない

今日書き留めておきたいのは、セッションの最後、38分あたりから言及される組織を超えたデータ共有の議論だ。個人的には銀行は多数の顧客データを保有しており、データサイエンスの観点では最高の学習データが揃っている印象があった。しかしNatWestのZacheryによれば、銀行が持つ顧客データの量は他の業界に比べてそれほど多くないのだという。

私が興味深かったのは、銀行業は私が以前働いていた業界に比べて、実はそれほど多くの顧客を持っていないことです。私はビデオゲーム会社のElectronic Artsで15年ほど働きましたが、そこでは毎月何億ものユニークレコードと何十億もの顧客がデータセットに含まれていました。その結果、多くの洞察を得ることができ、非常に高いレベルでパーソナライズでき、非常に大規模なテストコントロールを実行することができました。しかし銀行業では、何億人もの顧客を持つ銀行はありませんし、ゲームのように多くのインタラクションがあるわけでもありません。そのため、テストして学習する能力は限られています。

国内に目を向けると、トップ行の1つである三菱UFJ銀行の国内個人口座数は4,000万口座である。*1 海外は数字が見つからなかったが、国内の口座数を大幅に上回ることは考えづらいので多くても+数千万という感じだろう。これをざっくり他の事業者と比べると、NTTドコモの携帯電話契約数が約8,600万*2ニンテンドーアカウントの登録数が2億5,000万*3、LINEの月間ユーザ数が9,400万人*4なので、なるほど銀行のユーザベースが他の業界に比べて顕著に多いとは言えなさそうだ。またZacheryも言及している通り、銀行口座からはLINEアカウントや携帯電話ほど多様なインタラクションは得られづらそうだ。同じ金融でもキャピタルマーケットは1秒間に数万回の取引を行うようなHFTが行われる世界で激烈なデータ量を抱えているので、これはリテール/コマーシャル領域特有の課題なのだと思う。確かに個人的な経験としても、銀行のデータ活用は個人口座の顧客データというよりは、機関投資家/銀行間のトレーディングなどキャピタルマーケット領域が先行しがちな印象がある。(データ活用が収益に直結しやすい分野であることも大きそうだが)データ分析やMLはデータ量が物を言う世界なので、より良いパーソナライズを実現する上では業界に普遍的な課題になりそうだ。 そこでNatWestが目指しているのが、金融機関が横断的にデータやモデル、インサイトを共有していけるプラットフォームの枠組み作りだ。

私たち銀行や金融サービス機関がクラスターに集まって、その洞察を全体で共有することができるようになることが、私たちにとってのチャンスだと思います。幸運なことに、クリーンルーム・テクノロジーと、その他の共有方法によって、個人情報を共有する必要はなく、プライバシーの問題に直面することもなく、私たち全員が生成した洞察やテスト、モデルから学ぶことができます。

私たちは今、これに参加できるパートナーを探す旅に出ています。世界中の多くの銀行と話をしていますが、顧客インサイトや取引データを共有し、顧客に異なるレベルのサービスを提供できるようにするための提携に興味がある方は、ぜひご連絡ください。

金融機関が扱うデータは一般にセンシティブなものが多く外部との共有は難しいテーマだが、データクリーンルームなどのプラクティスを実践してセキュリティ/ガバナンスを維持しつつデータを融通できるよう金融機関が集合することでより良いインサイトやサービスの改善に繋げていくことを狙っているわけだ。特にクラウド時代であれば、各社のシステムが同じクラウド上にあればその境界は論理的なものにすぎないので、大掛かりな専用線の敷設などをせずとも企業間ネットワークを構築していくことが出来る。企業間のデータ共有(データクリーンルーム)の議論は広告業界などで聞くことが多く、なんとなく金融業では縁遠いイメージを持っていたが、このような形で繋がっていくのだという発見があった。 digiday.com

その他雑感

個人的には、古典的な日本の金融機関で企業間でのデータやモデル共有を実現するのは、純粋な技術論というよりは組織的なしがらみやポリシー、セキュリティに対する「信仰心」の問題で極めて難しいと思う。そもそも企業内でのデータ共有、データマネジメントすら道半ばというのが現状ではありそうだ。とはいえNatWestのようなグローバル金融機関が新たなステージを目指して枠組みを模索している中、日本だけが何もしないままでは決定的に置いて行かれてしまうのではないか。