AIがロマンス詐欺プロフを見抜く！

Automatically Dismantling Online Dating Fraud（オンライン・デーティング詐欺の自動解体）
Suarez-Tangil, G. Edwards, M., Peersman, C., Stringhini, G., Rashid, A., Whitty, M.

要約
研究方法
何が分かった？
社会への貢献
1. 被害者支援と社会全体の理解促進に向けて
2. 結びに

要約

イギリス・King’s College LondonのGuillermo Suarez-Tangil先生らによる研究論文”Automatically Dismantling Online Dating Fraud” は、甚大な心理的・経済的被害をもたらすオンライン上の国際ロマンス詐欺を、自動検知するシステムを構築した初の研究です。ロマンス詐欺は、詐欺師が魅力的な偽プロフィールを作成し、手作業で被害者との関係を深めていくため、従来のスパム対策等では発見が困難でした。本研究では、詐欺師と一般ユーザーのプロフィール（基本情報、画像、自己紹介文）を比較分析し、詐欺師の戦略を解明しました。さらに、機械学習を用いてこれら複数の要素を総合的に評価する検出システムを開発し、ユーザーがプロフィールの一部を空欄にしているような不完全なデータであっても、97%という極めて高い精度で詐欺アカウントを特定することに成功しました。被害が深刻化する前に詐欺師を排除する画期的なアプローチとして注目されています。

研究方法

この論文はIMDEA NetworksのSuarez-Tangil先生らのグループによる研究です。本研究が狙ったのは「メッセージ内容」ではなく、詐欺の出発点であるプロフィールそのものからの早期検知です。データは、出会い系サイト datingnmore.com の一般プロフィールと、詐欺師として公開リスト化された scamdigger.com のプロフィールを収集し、合計で一般14,720件・詐欺師5,402件（2017年3月時点）を分析対象にしました（論文中ではプライバシー配慮のため個人特定情報は出しません）。

特徴量（AIに食べさせる“手がかり”）は3系統です。

属性（デモグラ）：年齢、性別、民族、婚姻、職業、居住地（緯度経度・国）など。欠けている項目が多い現実を踏まえ、全部そろっている場合は精度の出やすいランダムフォレスト、欠損がある場合は欠損に強いナイーブベイズ、という“使い分け”をします。
画像：写真そのものを直接分類するのではなく、まず深層学習の画像キャプション生成（写真を「○○している男性」のような文章にする）で画像の意味を取り出し、名詞（人物・物）、動詞（行動）、形容詞・副詞（修飾）に分解して特徴化します。
自己紹介文：短文でも効くように、単語の並び（特に単語2つの組＝バイグラム）をTF-IDFで重み付けし、SVM（文章分類で定番の機械学習）で判定します。

学習はデータを訓練60%・テスト20%・検証20%に分け、3分類器の出力（詐欺確率）を最後に重み付き投票（アンサンブル）**で統合します。要するに、「属性だけだと怪しいけど文章は自然」「写真がテンプレっぽい」など、片方だけでは迷うケースを“多数決＋重み”で最終判断する設計です。

何が分かった？

本研究からは、詐欺師がターゲットの心理的な隙に付け込むために、いかに巧妙な罠を仕掛けているかが明らかになりました。

理想のパートナー像」を演出する基本情報

男性を装う詐欺師は「軍人」や「エンジニア」といった、頼りがいがあり社会的地位が高いとされる職業を名乗る傾向が顕著でした。これは、被害者が無意識に抱く「理想の相手」像を悪用するものです。また、同情を引き、心の壁を取り払うために「死別した（配偶者を亡くした）」というステータスを非常に頻繁に使用しています。一方で、女性を装う詐欺師は「学生」や「介護者」を名乗り、若くて経済的な支援を必要としている弱い立場を演出する傾向がありました。いずれも、後にお金を要求するための自然な「理由づけ」として機能しています。

画像や自己紹介文に潜む過剰なアピールと心理操作

詐欺師の自己紹介文は、一般のユーザーよりも圧倒的に長く（平均で約2倍の単語数）、非常に多弁であることがわかりました。文章中には、「愛」や「家族」「友情」といった言葉や、強い感情表現が多用されていました。また、プロフィール画像については、単なる顔写真だけでなく、乗馬やヨットといった優雅な趣味をアピールするものや、医療現場などの特定のシチュエーション、さらには信頼感を演出するためにあえて「グループ写真」や「子供との写真」を用いる割合が高いことも判明しました。

不完全な情報からも詐欺を見抜く高いシステム精度

研究で開発された「アンサンブル学習」による自動検知システムは、97%という極めて高い精度で詐欺アカウントを見抜くことに成功しました。オンラインでの自己紹介は、必ずしもすべての項目が埋まっているわけではありませんが、このシステムは一部の情報が空欄でも高い精度を維持できる強みを持っています。

社会への貢献

プラットフォーム側での「被害の未然防止」

ロマンス詐欺は、一度やり取りが始まると巧妙な手口でマインドコントロール状態に陥らされ、金銭だけでなく心にも深い傷を負う深刻な犯罪です。この研究が開発した自動検知システムは、出会い系サイトやSNSの運営者が導入することで、詐欺師が被害者と接触する「前」の段階でアカウントを凍結・排除できる可能性を提示しました。

被害者支援と社会全体の理解促進に向けて

この研究は、詐欺師の用いる戦術が極めて戦略的かつ心理学に基づいたものであることを科学的に証明しています。ロマンス詐欺に遭われた方は、「なぜ騙されてしまったのか」とご自身を強く責め、周囲からの非難（スティグマ）を恐れて誰にも相談できないことが少なくありません。しかし、詐欺師は人間の普遍的な愛情や思いやりの心を、データに基づく冷酷な戦略で狙い撃ちにしています。被害に遭うのは決して「ご本人が悪いから」ではありません。

結びに

この論文で示された知見は、プラットフォーム企業によるシステム上の安全対策に直結するだけでなく、警察や行政による注意喚起、さらには被害者支援団体やカウンセラーの方々が手口の巧妙さを理解し、被害者に寄り添うための重要なエビデンスとなります。出会いを求める誰もが、悪意ある操作から守られ、安心してコミュニケーションを楽しめる社会を作るための、大きな一歩となる研究です。

タイトル	Automatically Dismantling Online Dating Fraud
類別	Journal Article
筆者	Suarez-Tangil, G. Assistant Professor, IMDEA Networks Institute Edwards, M., University of Bristol Peersman, C., Research Fellow, University of Bristol Stringhini, G., Associate Professor at Boston University Rashid, A., Professor, Department of Computer Science, University of Bristol, UK Whitty, M. Maureen Brunt Fellow, Professor of Human Factors in Cyber Security
雑誌名	IEEE Transactions on Information Forensics and Security
発行者	IEEE
発行日	2019
巻数・ページ	15巻 pp1128-1137
言語	英語
URL	https://doi.org/10.1109/tifs.2019.2930479
Cite	Suarez-Tangil, G., Edwards, M., Peersman, C., Stringhini, G., Rashid, A., & Whitty, M. (2020). Automatically dismantling online dating fraud. IEEE Transactions on Information Forensics and Security, 15, 1128–1137. https://doi.org/10.1109/TIFS.2019.2930479