2025-11-16T13:49:12.700878

A Data-Centric Approach to Detecting and Mitigating Demographic Bias in Pediatric Mental Health Text: A Case Study in Anxiety Detection

Ive, Bondaronek, Yadav et al.

Introduction: Healthcare AI models often inherit biases from their training data. While efforts have primarily targeted bias in structured data, mental health heavily depends on unstructured data. This study aims to detect and mitigate linguistic differences related to non-biological differences in the training data of AI models designed to assist in pediatric mental health screening. Our objectives are: (1) to assess the presence of bias by evaluating outcome parity across sex subgroups, (2) to identify bias sources through textual distribution analysis, and (3) to develop a de-biasing method for mental health text data. Methods: We examined classification parity across demographic groups and assessed how gendered language influences model predictions. A data-centric de-biasing method was applied, focusing on neutralizing biased terms while retaining salient clinical information. This methodology was tested on a model for automatic anxiety detection in pediatric patients. Results: Our findings revealed a systematic under-diagnosis of female adolescent patients, with a 4% lower accuracy and a 9% higher False Negative Rate (FNR) compared to male patients, likely due to disparities in information density and linguistic differences in patient notes. Notes for male patients were on average 500 words longer, and linguistic similarity metrics indicated distinct word distributions between genders. Implementing our de-biasing approach reduced diagnostic bias by up to 27%, demonstrating its effectiveness in enhancing equity across demographic groups. Discussion: We developed a data-centric de-biasing framework to address gender-based content disparities within clinical text. By neutralizing biased language and enhancing focus on clinically essential information, our approach demonstrates an effective strategy for mitigating bias in AI healthcare models trained on text.

academic

小児精神保健テキストにおける人口統計学的バイアスの検出と軽減に関するデータ中心的アプローチ：不安症検出のケーススタディ

基本情報

論文ID: 2501.00129
タイトル: A Data-Centric Approach to Detecting and Mitigating Demographic Bias in Pediatric Mental Health Text: A Case Study in Anxiety Detection
著者: Julia Ive、Paulina Bondaronek、Vishal Yadav、Daniel Santel、Tracy Glauser、Tina Cheng、Jeffrey R. Strawn、Greeshma Agasthya、Jordan Tschida、Sanghyun Choo、Mayanka Chandrashekar、Anuj J. Kapadia、John Pestian
分類: cs.CL cs.AI
所属機関: ロンドン大学ユニバーシティ・カレッジ、ロンドン大学クイーン・メアリー校、シンシナティ・チルドレンズ・ホスピタル・メディカル・センター、オークリッジ国立研究所など
論文タイプ: 研究論文

要旨

本研究は、小児精神保健AIモデルにおける人口統計学的バイアスの問題に対処するため、データ中心的なバイアス軽減アプローチを提案しています。研究では、女性青少年患者に対する体系的な診断過少の問題を発見し、男性患者と比較して精度が4%低く、偽陰性率が9%高いことが明らかになりました。情報密度フィルタリングと性別中立的な語句置換によるバイアス軽減方法を通じて、診断バイアスを27%削減することに成功し、医療AI公平性に対する有効なソリューションを提供しています。

研究背景と動機

問題の識別

AIバイアスの普遍性: 医療AIモデルは訓練データからバイアスを継承することが多く、特に少数派集団に対する医療不公平を悪化させる可能性がある
精神保健の特殊性: 精神保健は非構造化テキストデータ（臨床ノート）に大きく依存しており、既存のバイアス軽減研究は主に構造化データに焦点を当てている
小児精神保健危機: COVID-19後、小児不安症状の有病率が倍増し、特に女性青少年集団に影響を与えている

重要性

小児精神保健スクリーニングの複雑性と課題性
精神保健診断拡大におけるAIの巨大な可能性
異なる人口集団全体でAIツールが公平かつ効果的であることを確保する緊急の必要性

既存方法の限界

従来のバイアス軽減技術（単語埋め込みバイアス軽減、敵対的訓練など）は医療分野には適用できない
医療データの異質性（異なる医療機関からのデータ）は十分に考慮されていない
医療テキスト専用のバイアス軽減フレームワークが不足している

核心的貢献

体系的バイアスの識別: 小児不安症検出における性別バイアスを初めて発見・定量化し、女性患者の偽陰性率が著しく高いことを明らかにした
データ中心的バイアス軽減フレームワーク: 医療テキストに特別に適用可能なバイアス軽減方法を提案し、情報密度フィルタリングと性別語の中立化を含む
有効性の検証: 実際の臨床データで方法の有効性を検証し、診断バイアスを最大27%削減した
解釈可能性分析: LIME技術を使用してモデル決定に依存する語彙を分析し、バイアスの源泉を明らかにした

方法の詳細

タスク定義

入力: 小児患者の臨床ノートテキストシーケンス出力: 二値分類予測（不安症/非不安症）目標: 予測精度を維持しながら、異なる性別集団間のパフォーマンス差を削減する

バイアス検出フレームワーク

1. 分類公平性評価

複数の指標を使用してモデルバイアスを評価：

平衡誤り率 (BER): $BER = \frac{(\frac{FP}{FP+TN}) + (\frac{FN}{FN+TP})}{2}$
偽陰性率 (FNR): 見落とし率を測定
偽陽性率 (FPR): 誤診率を測定
BER比率: 非特権集団と特権集団のBER比、>1.25は顕著なバイアスを示す

2. テキスト分布分析

人口集団間のテキスト特性の差異を分析：

平均ノート長
医学用語の割合
性別バイアス語彙の割合
Jaccard距離と親密度スコア

バイアス軽減方法

1. 情報密度フィルタリング (tf-idf_filt)

TF-IDFスコアを使用して文の重要性を計算
情報量が最も低い20%の文を削除
異なる集団間の情報密度のバランスを取る

2. 性別語バイアス軽減 (gen_sub)

姓名と代名詞などの性別バイアス語彙を自動検出
Stanzaツールを使用して固有名詞を抽出
性別特定の語彙を中立的な代替語に置換
- 姓名 → "person1"、"person2"など
- 代名詞 → "he/she" → "they"

3. 組合方法 (tf-idf_filt+gen_sub)

情報密度フィルタリングと性別語置換を組み合わせ、相乗効果を発揮

モデルアーキテクチャ

Clinical-BigBirdベースのTransformerモデル
臨床テキストで事前訓練
長いシーケンス入力をサポート（最大4,096トークン）
微調整パラメータ：2エポック、学習率1e-5、バッチサイズ8

実験設定

データセット

出典: シンシナティ・チルドレンズ・ホスピタル・メディカル・センター
規模: 130万患者、6,300万臨床ノート
時間範囲: 2009年1月～2022年3月
不安症例: スクリーニング基準を通過した84,426例
最終データ: 73,288患者、781万ノート

年齢グループ化戦略

5つの年齢グループに分類：5歳、8歳、10歳、12歳、15歳
各グループ3,700～5,064の訓練サンプル
852～1,278のテストサンプル
1:1症例対照マッチング（年齢と性別による）

データ前処理

重複排除：コサイン類似度≥0.8のノート
最新25件のノートを選択
入力長を1,000トークンに制限

評価指標

精度 (Accuracy)
偽陰性率 (FNR) - 主要な関心指標
偽陽性率 (FPR)
平衡誤り率 (BER)
不確実な予測の割合（確率が0.4, 0.6区間）

実験結果

主要な発見

1. 体系的な性別バイアス

指標	男性	女性	差異
精度	-	-4%	女性がより低い
FNR	-	+9%	女性がより高い
不確実な予測	-	+5%	女性がより高い
ノート長	ベースライン	-500語	女性がより短い

2. テキスト分布の差異

語彙類似性: Jaccard指数0.54（男女間）
用語分布: Jaccard指数0.34（顕著な差異）
最低類似性: 5歳と15歳グループ（Jaccard 0.43）

3. バイアス軽減効果

最適方法 (tf-idf_filt):

FNR差削減0.024（27%改善）
Bin 5: FNR差が0.13から0.02に低下
Bin 15: FNR差が0.13から0.07に低下
BER比が1.33から0.98に低下（Bin 10）

アブレーション実験

方法	FNR改善	パフォーマンス維持	不確実性削減
rnd_filt	一貫した効果なし	✓	-
tf-idf_filt	-0.024	✓	-4%
gen_sub	+0.008	✓	-3%
組合方法	-0.022	✓	-12%

解釈可能性分析

LIME分析を使用してモデルが依存する語彙を分析：

元のモデル: ケースの10%がバイアス語彙に依存する予測
tf-idf_filt: 3%に削減
組合方法: バイアス語彙の頻度が50%低下

人種間検証

その他の人種集団のFNR平均が0.05高い
組合方法がFNR差を0.034削減
方法の普遍性を証明

結論と考察

主要な結論

バイアスの普遍性: 小児不安症検出モデルは女性患者に対する体系的な診断過少を示す
テキスト差異が根本原因: 異なる性別の患者ノートの情報密度と言語分布に顕著な差異がある
データ中心的方法の有効性: 情報密度のバランスと言語の中立化により、バイアスを著しく削減できる
臨床的意義: 27%のバイアス削減は女性患者の診断改善に重要な価値がある

限界

データ品質への依存: 方法の効果はEHRテキストの品質と一貫性に制限される
単一バイアスタイプ: 性別バイアスのみに焦点を当て、他の人口統計学的特性は対象外
汎化能力: 異なる臨床環境での汎化能力はさらなる検証が必要
生物学的差異: 生物学的差異と社会文化的差異を完全に区別することは困難

今後の方向性

他の精神保健疾患と人口集団への拡張
より精密なバイアス検出と軽減技術の開発
マルチモーダルデータ（テキスト+構造化データ）の統合
医療AI公平性評価の標準化フレームワークの構築

深層的評価

利点

問題の重要性: 小児精神保健という重要な分野に焦点を当て、重大な社会的価値を持つ
方法の革新性: 医療テキストに特別に適用可能なデータ中心的バイアス軽減フレームワークを提案
実験の充実性: 大規模な実際の臨床データで検証、多次元的なバイアス分析
実用的価値: 方法が単純で効果的、臨床環境での導入が容易
解釈可能性: LIMEなどの技術を使用してモデル決定の解釈可能な分析を提供

不足点

理論的深さ: バイアス発生メカニズムの深層的理論分析が不足
方法の限界: バイアス軽減方法が比較的単純で、過度な単純化の可能性がある
評価の単一性: 分類公平性に主に焦点を当て、キャリブレーションなど他の公平性次元が不足
長期的影響: バイアス軽減がモデルの長期パフォーマンスと汎化能力に与える影響を評価していない

影響力

学術的貢献: 医療NLPバイアス研究に重要なケーススタディと方法論的参考を提供
実践的価値: 臨床AI システムの公平性改善に具体的なソリューションを提供
政策的意義: 医療AI規制と標準設定に技術的支援を提供
再現性: 方法の説明が詳細で、良好な再現性を持つ

適用シーン

臨床意思決定支援: 精神保健スクリーニングと診断補助システム
医療品質改善: 既存医療AIシステムにおけるバイアスの識別と軽減
規制遵守: 医療AI公平性と倫理要件への適合
研究ツール: 他の医療AIバイアス研究に方法論的基礎を提供

参考文献

本論文は公平性機械学習、NLPバイアス軽減、医療AIなど複数分野の重要な文献を引用しており、以下を含む：

Feldman et al. (2015) - 公平性測定基準
Bolukbasi et al. (2016) - 単語埋め込みバイアス軽減
Obermeyer et al. (2019) - 医療アルゴリズムの人種バイアス
Ribeiro et al. (2016) - LIME解釈可能性方法

総合評価: これは医療AI公平性分野において重要な価値を持つ研究論文です。小児精神保健AIにおける性別バイアスの問題を識別するだけでなく、実用的なソリューションを提案しています。理論的深さと方法の複雑性の面ではさらなる改善の余地がありますが、その実用的価値と社会的意義により、本分野における重要な貢献となっています。