banner
ニュース センター
営業から生産まで幅広い知識

生成 AI による不正検出の強化

Jun 01, 2023

ここ数週間、生成 AI の応用可能性が多くの人によって検討されてきましたが、十分に検討されていない主要なトピックの 1 つは、生成 AI によって作成されたデータを不正検出戦略の強化および改善にどのように使用できるか、および合成を使用することの影響です。データを活用して不正モデルをトレーニングし、検出率を向上させます。

データ サイエンスの分野では、機械学習モデルに提示されるデータの品質が最終結果を左右することはよく知られており、これは特に不正検出に当てはまります。 不正検出に適用される機械学習ツールの多くは、強力な不正シグナル (通常はデータの 0.5% 未満) に依存しているため、モデルを効果的にトレーニングすることが困難になります。 理想的なデータ サイエンスの実践では、AI モデルのトレーニングに使用されるデータには、不正サンプルと非不正サンプルが 50/50 の割合で混在していることになりますが、これを達成するのは難しいため、多くの人にとって非現実的かもしれません。 この(クラス)不均衡に対処する方法はクラスタリング、フィルタリング、オーバーサンプリングなど数多くありますが、それらは本物のレコードと不正なレコードの間の極端なデータの不均衡を完全に補うことはできません。

OpenAI の ChatGPT などのトランスフォーマー ディープ ニューラル ネットワークのアプリケーションである生成 AI は、一連のデータを出力として生成するように設計されており、文章や支払い履歴などの連続データを使用してトレーニングする必要があります。 これは、提示された入力データとトレーニング データに基づいて単一の「分類」 (不正か不正ではないか) を生成する他の多くの手法とは異なります。これらは任意の順序でモデルに提示できます。 生成 AI の出力は無限に継続することができますが、分類手法は単一の出力を生成する傾向があります。

したがって、生成 AI は、実際のデータに基づいてデータを合成するための理想的なツールであり、このテクノロジーの進化は、以前に強調したように、実行可能な不正サンプルの量が非常に少なく、機械学習にとって効果的に学習するのは困難です。 生成 AI を使用すると、モデルは既存のパターンを使用して、「本物の」不正サンプルに似た新しい合成サンプルを生成し、コア不正検出機械学習ツールの不正シグナルを強化できます。

典型的な不正シグナルは、本物のデータと不正なデータの組み合わせです。 本物のデータは(通常)一連のイベントの中で最初に出現し、カード所有者の実際の行動活動が含まれます。たとえば、カードや他の支払い方法が侵害された場合には、不正な支払いが混入します。 生成 AI は同様の支払いシーケンスを生成し、カードに対する不正攻撃をシミュレートします。これをトレーニング データに追加して、不正検出機械学習ツールを支援し、パフォーマンスを向上させることができます。

OpenAI の ChatGPT に対する最大の批判の 1 つは、今日のモデルが不正確または「幻覚性」の出力を生成する可能性があるということです。これは、顧客サービス チャットボットなどの公開ツールを望まない決済および詐欺業界の多くが懸念している欠陥です。虚偽または捏造された情報。 ただし、合成された出力の合成変動により完全に固有の不正パターンが生成され、最終的な不正防御モデルの不正検出パフォーマンスが強化されるため、この「欠陥」を合成不正データの生成に利用できます。

多くの人が知っているように、ほとんどの機械学習手法では学習に必要なそれぞれのインスタンスが非常に少ないため、同じ不正信号の例を繰り返しても検出は効果的に向上しません。 生成モデルから生成される出力の変化により、最終不正モデルに堅牢性が加わり、データ内に存在する不正パターンを検出できるだけでなく、従来のプロセスでは簡単に見逃してしまうような同様の攻撃も発見できるようになります。

これは、カード所有者や不正行為管理者にとっては少々憂慮すべきことかもしれません。でっちあげのデータに基づいてトレーニングされた不正行為モデルが不正行為検出の向上にどのように役立つのか、また、そうすることでどのようなメリットがあるのか​​を尋ねるのは当然のことです。 彼らは気づいていないかもしれませんが、モデルはライブ決済で使用される前に、期待されるパフォーマンスを確保するために厳格な評価演習を経ているということです。 モデルが期待される非常に高い基準を満たしていない場合、そのモデルは破棄され、適切なモデルが見つかるまで代替モデルがトレーニングされます。 これは標準的なプロセスであり、作成されたすべての機械学習モデルで実行されます。本物のデータでトレーニングされたモデルであっても、評価段階では標準以下の結果が得られる可能性があるためです。

生成 AI は、さまざまな業界で多くのアプリケーションが利用できる魅力的なツールですが、今日の反復には、どれほど賢明であっても問題があります。 幸いなことに、一部の業界では非常に深刻な問題とみなされている特性が、他の業界では重要な特徴ですが、厳格な規制とガバナンスの要件は依然として残っています。 将来の生成 AI の使用には、部分的に生成されたデータでトレーニングされたモデルの使用方法を完全に見直す必要があり、ツールの必要な動作とパフォーマンスが常に満たされるように、それに応じてガバナンス プロセスを強化する必要があります。

オリバー ティアルは、オンライン決済詐欺防止の専門家である AI コーポレーション (ai) のイノベーション テクノロジー責任者です。 AI は、顧客が予測可能な成功を生み出し、利益を上げて成長できるようにする革新的な詐欺および決済テクノロジーの開発で世界中で信頼されています。

フィンテック、銀行、金融サービスの主要イベントである FinTech LIVE London が、一流の講演者とアクション満載の議題とともに戻ってきます。

FinTech Magazine は、投資家への売り込みに磨きをかけることと、スタートアップにとって資金調達環境がどのように変化しているかについて、Techstars のグローリー エロモセレと対談します。

スターリング銀行の創設者兼最高経営責任者(CEO)のアン・ボーデンは、利益相反の懸念を避けるためにCEOの職を辞任した。