2025-11-13T11:58:11.146801

RedDino: A foundation model for red blood cell analysis

Zedda, Loddo, Di Ruberto et al.
Red blood cells (RBCs) are essential to human health, and their precise morphological analysis is important for diagnosing hematological disorders. Despite the promise of foundation models in medical diagnostics, comprehensive AI solutions for RBC analysis remain scarce. We present RedDino, a self-supervised foundation model designed for RBC image analysis. RedDino uses an RBC-specific adaptation of the DINOv2 self-supervised learning framework and is trained on a curated dataset of 1.25 million RBC images from diverse acquisition modalities and sources. Extensive evaluations show that RedDino outperforms existing state-of-the-art models on RBC shape classification. Through assessments including linear probing and nearest neighbor classification, we confirm its strong feature representations and generalization ability. Our main contributions are: (1) a foundation model tailored for RBC analysis, (2) ablation studies exploring DINOv2 configurations for RBC modeling, and (3) a detailed evaluation of generalization performance. RedDino addresses key challenges in computational hematology by capturing nuanced morphological features, advancing the development of reliable diagnostic tools. The source code and pretrained models for RedDino are available at https://github.com/Snarci/RedDino, and the pretrained models can be downloaded from our Hugging Face collection at https://huggingface.co/collections/Snarcy/reddino-689a13e29241d2e5690202fc
academic

RedDino: 赤血球分析のための基礎モデル

基本情報

  • 論文ID: 2508.08180
  • タイトル: RedDino: A foundation model for red blood cell analysis
  • 著者: Luca Zedda, Andrea Loddo, Cecilia Di Ruberto, Carsten Marr
  • 分類: eess.IV cs.AI cs.CV
  • 発表日時: 2025年8月22日 (arXiv v2)
  • 論文リンク: https://arxiv.org/abs/2508.08180

要約

赤血球(RBC)は人体の健康に不可欠であり、正確な形態学的分析は血液学的疾患の診断に重要な意義を持ちます。基礎モデルは医学診断において大きな可能性を示していますが、RBC分析のための包括的なAIソリューションはまだ不足しています。本論文ではRedDinoを提案します。これはRBC画像分析専用に設計された自己教師あり基礎モデルです。RedDinoはRBC特化型のDINOv2自己教師あり学習フレームワークを採用し、異なる取得モード及び供給源から得た125万枚のRBC画像を含む厳選されたデータセット上で訓練されています。広範な評価により、RedDinoはRBC形状分類タスクにおいて既存の最先端モデルを大幅に上回ることが示されました。線形プローブと最近傍分類などの評価方法を通じて、モデルの強力な特徴表現と汎化能力が検証されました。

研究背景と動機

問題定義

赤血球形態学的分析は血液学的診断の基礎ですが、以下の重要な課題に直面しています:

  1. 染色および画像化の変動性: 異なる染色プロトコルと画像化装置がバイアスを導入し、分析の複雑性を増加させます
  2. バッチ効果: 複数供給源、複数患者シナリオにおいて顕著な系統的差異が存在します
  3. 専門家育成の必要性: 従来の分析には大量の専門的訓練が必要です
  4. 専門的なAIツールの欠如: 白血球分析と比較して、赤血球分析は成熟した基礎モデルが不足しています

研究動機

基礎モデルは白血球分析において既に顕著な優位性を示しており、臨床結果の効果的な予測とバッチ効果の問題解決が可能ですが、赤血球分析分野ではこれらの先進技術の可能性がまだ十分に探索されていません。本研究はこのギャップを埋め、RBC分析専用の基礎モデルを開発することを目指しています。

核心的貢献

  1. 専門的な基礎モデル: RedDinoを提案します。これはRBC分析最適化のための初の自己教師あり基礎モデルファミリーです
  2. 詳細な構成研究: RBC形態学的モデリングにおけるDINOv2の構成について厳密な比較分析を実施
  3. 包括的なパフォーマンス評価: 複数のRBCデータセット上で広範なベンチマークを実施し、既存の最先端モデルに対する優位性を実証
  4. 強力な汎化能力: バッチ効果による課題を効果的に緩和し、優れたクロスドメイン汎化性能を実証

方法論の詳細

タスク定義

RedDinoは、下流のRBC形状分類、異常検出、形態学的分析タスクをサポートする汎用的なRBC特徴表現を学習することを目的としています。入力はRBC顕微鏡画像であり、出力は様々なRBC分析タスクに使用可能な高次元特徴ベクトルです。

モデルアーキテクチャ

基本フレームワーク

RedDinoはDINOv2自己教師あり学習フレームワークに基づいて構築され、Vision Transformer (ViT)をバックボーンネットワークとして採用しています。モデルファミリーは3つのバージョンを含みます:

  • RedDino Small: 特徴次元384、バッチサイズ512、2,200万パラメータ
  • RedDino Base: 特徴次元768、バッチサイズ384、8,600万パラメータ
  • RedDino Large: 特徴次元1024、バッチサイズ256、3.04億パラメータ

主要な技術的改善

  1. Koleo正則化器の削除: 元のDINOv2はKoleo正則化を使用して特徴の崩壊を防ぎますが、RBCシナリオでは、RBC形状と色の自然な一貫性のため、この正則化器は病理学的および異常なRBCの特徴表現を過度に抑制します
  2. Sinkhorn-Knopp中心化: 移動平均中心化を置き換え、表現品質を向上させます
  3. カスタマイズされたデータ拡張: DINOv2の元の拡張戦略をAlbumentationsライブラリの32種類のピクセルレベル拡張に置き換えます

データ処理戦略

訓練データの構築

  • データ規模: 18個のデータセットから得た56,712枚の元画像。420人以上の個人をカバーしています
  • データ抽出: 2つの方法を採用
    1. 改良されたCellPoseを使用した細胞分割により、3,076,269個の分割細胞を生成
    2. 224×224ピクセルの非重複画像パッチを抽出し、1,250,781個の画像パッチを生成
  • データバランシング: 赤血球と白血球の自然な不均衡を緩和するため、白血球画像データセットを組み込みました

訓練戦略の最適化

系統的な実験を通じて以下を発見:

  1. 画像パッチを使用した訓練は単一細胞訓練より効果的です
  2. ローカルクロップの削除はパフォーマンスを大幅に向上させます
  3. カスタマイズされた拡張パイプラインはさらに特徴品質を向上させます

実験設定

データセット

訓練データ: 18個の公開RBCデータセット。異なる画像化モード、解像度、染色技術を含みます テストデータ:

  • Elsaftyデータセット: 240,000枚の画像、9カテゴリ、4つの異なる供給源から
  • Chulaデータセット: 20,875枚の画像、12個のRBCカテゴリ
  • DSEデータセット: 5,659枚の画像、8カテゴリ

評価指標

  • 精度(Acc)
  • バランス精度(bAcc)
  • 加重F1スコア(wF1)

比較方法

  • ResNet50
  • DINOv2 (Small/Base/Large)
  • DinoBloom (Small/Base/Large) - 現在の血液学データにおける最先端の特徴抽出器

評価方法

  1. 線形プローブ: 特徴が下流タスクに適応する能力を評価
  2. K近傍分類(1-NN, 20-NN): バッチ効果下での特徴の堅牢性を評価
  3. クロスソース評価: リーブワンソース検証戦略を使用
  4. 5分割交差検証: 不均衡なデータセット用

実験結果

主要な結果

Elsaftyデータセットのクロスソース評価

最も挑戦的なクロスソース評価において、RedDinoは顕著な優位性を達成しました:

モデル線形プローブwF11-NN wF120-NN wF1
ResNet5077.6±8.164.3±4.866.2±4.9
DinoBloom-L85.4±5.274.1±5.077.0±4.5
DINOv2 large86.0±5.673.7±6.276.4±7.0
RedDino base88.1±4.978.8±3.682.6±2.8
RedDino large88.5±5.578.5±4.681.6±4.7

主要な発見:

  • RedDinoは最良のベースライン方法と比較して2.1%以上(線形プローブ)および3.0%(近傍分類)の改善を達成
  • 平均改善幅は4.0-6.5%に達し、一貫したパフォーマンス優位性を示しています

その他のデータセットでのパフォーマンス

ChulaおよびDSEデータセットの5分割交差検証では、RedDinoは同様に優れたパフォーマンスを示し、ほぼすべての指標でベースライン方法を上回りました。

アブレーション実験

主要な構成改善の影響:

  1. Koleo正則化器の削除: パフォーマンスを大幅に向上させ、病理学的RBC特徴の過度な抑制を回避
  2. Sinkhorn-Knopp中心化: 移動平均中心化を置き換えた後、パフォーマンスがさらに向上
  3. 画像パッチ対単一細胞訓練: 画像パッチ訓練戦略は単一細胞訓練より優れています
  4. カスタマイズされた拡張パイプライン: 元のDINOv2拡張戦略と比較して明らかな改善

可視化分析

PCA可視化

3成分PCA可視化を通じてRedDino特徴の有効性を検証:

  • 背景、細胞、膜構造および寄生虫を区別できます
  • マラリア感染RBCおよび棘細胞などの異常形態に対して優れた区別能力を示します

UMAP可視化

ElsaftyデータセットのUMAP投影を使用して表示:

  • 異なるカテゴリは明確なクラスタを形成し、明らかなバッチ効果がありません
  • 臨床的に区別しにくいカテゴリ(円形RBC、楕円細胞など)は特徴空間で実際に重複しています
  • 細胞クラスタは独特のクラスタを形成し、モデルが単一細胞と集合体を区別できることを証明しています

関連研究

血液学AI分析の現状

  • 白血球分析: DinoBloomなどの成熟した基礎モデルが既に存在し、臨床結果予測において優れたパフォーマンスを示しています
  • 赤血球分析: 相対的に発展が遅れており、専門的な基礎モデルが不足しています
  • コンピュータ支援診断: 血液学における重要な診断課題を解決するための重要なツールとして徐々に成長しています

医学画像における自己教師あり学習の応用

DINOv2などの自己教師あり方法は自然画像で大きな成功を収めていますが、医学画像、特にRBC分析での応用はまだ十分に探索されていません。

結論と考察

主要な結論

  1. パフォーマンスの突破: RedDinoはRBC分類タスクにおいて新しい最先端パフォーマンスを実現しました
  2. 強力な汎化能力: バッチ効果を効果的に緩和し、クロスソースシナリオで優れたパフォーマンスを示します
  3. 高い実用価値: 自動化された血液学的診断のための信頼できる基礎ツールを提供します

制限事項

  1. 訓練データの制限: データセット規模は比較的大きいですが、稀なRBC形態の代表性が不足している可能性があります
  2. 計算リソースの要件: 大規模モデルバージョンは高い計算リソースを必要とします
  3. 注釈付きデータへの依存: 下流タスクは微調整のためにある程度の注釈付きデータが必要です

今後の方向性

  1. 応用シナリオの拡張: 他の血液学的タスクでの応用を探索
  2. モデル圧縮: リソース制限環境に適応するためのより軽量なバージョンの開発
  3. マルチモーダル融合: 他の種類の医学データを組み込んで診断精度を向上させます

深い評価

利点

  1. 問題への高い針対性: RBC分析というこの重要だが見落とされている分野に特に対応
  2. 合理的な方法設計: RBCの特性に対してDINOv2に対象を絞った改善を実施
  3. 厳密な実験設計: クロスソース検証などの厳密な評価方法を採用し、結果の信頼性を確保
  4. 大きなデータセット貢献: これまでで最大のRBC画像訓練セットを構築
  5. オープンソースフレンドリー: 完全なコードと事前訓練済みモデルを提供

不足点

  1. 限定的な理論分析: Koleo正則化器の削除が有効である理由についての理論的説明が不十分です
  2. 計算コスト分析の不足: 異なるモデルバージョン間の計算効率のトレードオフについて詳細な分析がありません
  3. 臨床検証の欠如: 実際の臨床環境での検証結果が不足しています

影響力

  1. 学術的価値: RBC分析分野に重要な基礎ツールとベンチマークを提供
  2. 実用的価値: 血液学的診断の自動化レベルを大幅に向上させる可能性があります
  3. 再現性: 完全なオープンソース実装を提供し、研究コミュニティによる使用と改善を容易にします

適用シナリオ

  • 血液病理学的診断支援
  • 大規模血液スクリーニング
  • RBC形態学的研究
  • 血液学教育訓練ツール開発

技術革新の要約

RedDinoの核心的な革新は、汎用的な自己教師あり学習フレームワークを専門的な医学分野に成功裏に適応させることにあります。不適切な正則化制約を削除し、訓練戦略を最適化することで、顕著なパフォーマンス向上を実現しました。これは他の医学画像分析タスクの基礎モデル開発に価値のある参考を提供します。


環境影響声明: 論文は実験の炭素排出量を4.15 kg CO2eqと報告しており、環境責任への関心を示しています。