2025-11-20T03:28:13.599904

Provable Watermarking for Data Poisoning Attacks

Zhu, Yu, Gao

In recent years, data poisoning attacks have been increasingly designed to appear harmless and even beneficial, often with the intention of verifying dataset ownership or safeguarding private data from unauthorized use. However, these developments have the potential to cause misunderstandings and conflicts, as data poisoning has traditionally been regarded as a security threat to machine learning systems. To address this issue, it is imperative for harmless poisoning generators to claim ownership of their generated datasets, enabling users to identify potential poisoning to prevent misuse. In this paper, we propose the deployment of watermarking schemes as a solution to this challenge. We introduce two provable and practical watermarking approaches for data poisoning: {\em post-poisoning watermarking} and {\em poisoning-concurrent watermarking}. Our analyses demonstrate that when the watermarking length is $Î(\sqrt{d}/Îµ_w)$ for post-poisoning watermarking, and falls within the range of $Î(1/Îµ_w^2)$ to $O(\sqrt{d}/Îµ_p)$ for poisoning-concurrent watermarking, the watermarked poisoning dataset provably ensures both watermarking detectability and poisoning utility, certifying the practicality of watermarking under data poisoning attacks. We validate our theoretical findings through experiments on several attacks, models, and datasets.

academic

ডেটা পয়জনিং আক্রমণের জন্য প্রমাণযোগ্য ওয়াটারমার্কিং

মৌলিক তথ্য

পেপার আইডি: 2510.09210
শিরোনাম: ডেটা পয়জনিং আক্রমণের জন্য প্রমাণযোগ্য ওয়াটারমার্কিং
লেখক: ইফান ঝু, লিজিয়া ইউ, জিয়াও-শান গাও
শ্রেণীবিভাগ: cs.CR (ক্রিপ্টোগ্রাফি এবং নিরাপত্তা), cs.LG (মেশিন লার্নিং)
প্রকাশনা সম্মেলন: NeurIPS 2025 (39তম নিউরাল ইনফরমেশন প্রসেসিং সিস্টেম সম্মেলন)
পেপার লিংক: https://arxiv.org/abs/2510.09210

সারসংক্ষেপ

সম্প্রতি, ডেটা পয়জনিং আক্রমণগুলি ক্রমবর্ধমানভাবে নিরীহ এবং এমনকি উপকারী আকারে ডিজাইন করা হচ্ছে, যা সাধারণত ডেটাসেট মালিকানা যাচাইকরণ বা ব্যক্তিগত ডেটা অননুমোদিত ব্যবহার থেকে রক্ষা করার জন্য ব্যবহৃত হয়। তবে এই উন্নয়নগুলি ভুল বোঝাপড়া এবং দ্বন্দ্ব সৃষ্টি করতে পারে, কারণ ডেটা পয়জনিং ঐতিহ্যগতভাবে মেশিন লার্নিং সিস্টেমের নিরাপত্তা হুমকি হিসাবে বিবেচিত হয়। এই সমস্যার সমাধানের জন্য, নিরীহ পয়জনিং জেনারেটরকে অবশ্যই তার উৎপাদিত ডেটাসেটের মালিকানা ঘোষণা করতে হবে, যা ব্যবহারকারীদের সম্ভাব্য পয়জনিং সনাক্ত করতে এবং অপব্যবহার প্রতিরোধ করতে সক্ষম করে। এই পেপারটি এই চ্যালেঞ্জের সমাধান হিসাবে ওয়াটারমার্কিং স্কিম স্থাপনের প্রস্তাব দেয়, দুটি প্রমাণযোগ্য এবং ব্যবহারিক ডেটা পয়জনিং ওয়াটারমার্কিং পদ্ধতি প্রবর্তন করে: পোস্ট-পয়জনিং ওয়াটারমার্কিং এবং পয়জনিং-সমসাময়িক ওয়াটারমার্কিং। বিশ্লেষণ দেখায় যে যখন ওয়াটারমার্ক দৈর্ঘ্য Θ(√d/ε_w) (পোস্ট-পয়জনিং ওয়াটারমার্কিং) এবং Θ(1/ε_w²) থেকে O(√d/ε_p) পরিসরে থাকে (পয়জনিং-সমসাময়িক ওয়াটারমার্কিং), ওয়াটারমার্ক পয়জনড ডেটাসেট প্রমাণযোগ্যভাবে ওয়াটারমার্ক সনাক্তকরণযোগ্যতা এবং পয়জনিং কার্যকারিতা নিশ্চিত করে।

গবেষণা পটভূমি এবং প্রেরণা

সমস্যা সংজ্ঞা

ঐতিহ্যবাহী ধারণার পরিবর্তন: ডেটা পয়জনিং আক্রমণগুলি ঐতিহ্যবাহী দূষ্ট হুমকি থেকে "সদিচ্ছাপূর্ণ" প্রয়োগে পরিণত হচ্ছে, যেমন ডেটাসেট মালিকানা যাচাইকরণ, অননুমোদিত ব্যবহার প্রতিরোধ ইত্যাদি
স্বচ্ছতার সমস্যা: যখন পয়জনিং সুরক্ষা উদ্দেশ্যে ব্যবহৃত হয়, অনুমোদিত ব্যবহারকারীরা অনিচ্ছাকৃতভাবে পয়জনড ডেটা ব্যবহার করতে পারে, যা ভুল বোঝাপড়া এবং দ্বন্দ্ব সৃষ্টি করে
জবাবদিহিতার অভাব: বিদ্যমান সনাক্তকরণ পদ্ধতিগুলি একীভূত কাঠামো এবং প্রমাণযোগ্য ঘোষণা প্রক্রিয়ার অভাব রাখে

গুরুত্ব

বড় আকারের মডেল প্রশিক্ষণ ক্রমবর্ধমানভাবে ওয়েব স্ক্র্যাপিং বা সংশ্লেষিত ডেটার উপর নির্ভর করার সাথে সাথে ডেটা পয়জনিংয়ের প্রভাব ক্রমবর্ধমান হচ্ছে
শিল্পী এবং ডেটা নির্মাতাদের তাদের বৌদ্ধিক সম্পত্তি জেনারেটিভ এআইয়ের অননুমোদিত ব্যবহার থেকে রক্ষা করতে হবে
ডেটা সুরক্ষা এবং স্বচ্ছতার মধ্যে ভারসাম্য স্থাপনের প্রয়োজন

বিদ্যমান পদ্ধতির সীমাবদ্ধতা

সনাক্তকরণ পদ্ধতি আক্রমণের ধরন অনুযায়ী পরিবর্তিত হয়, একীভূত করা কঠিন
হিউরিস্টিক প্রশিক্ষণ অ্যালগরিদমের উপর ভিত্তি করে, প্রমাণযোগ্য প্রক্রিয়ার অভাব
পয়জনড ডেটাসেটের জন্য স্পষ্ট, যাচাইযোগ্য ঘোষণা প্রদান করতে পারে না

মূল অবদান

ডেটা পয়জনিং ওয়াটারমার্কিংয়ের প্রথম কাঠামো প্রস্তাব: ওয়াটারমার্কিং প্রযুক্তি ডেটা পয়জনিং পরিস্থিতিতে প্রয়োগ করে, স্বচ্ছতা এবং জবাবদিহিতা প্রদান করে
দুটি ওয়াটারমার্কিং স্কিম:
- পোস্ট-পয়জনিং ওয়াটারমার্কিং: তৃতীয় পক্ষের সত্তা ইতিমধ্যে পয়জনড ডেটাসেটের জন্য ওয়াটারমার্ক তৈরি করে
- পয়জনিং-সমসাময়িক ওয়াটারমার্কিং: পয়জনিং জেনারেটর একযোগে ওয়াটারমার্ক এবং পয়জনিং তৈরি করে
তাত্ত্বিক গ্যারান্টি: ওয়াটারমার্ক সনাক্তকরণযোগ্যতা এবং পয়জনিং কার্যকারিতার কঠোর তাত্ত্বিক বিশ্লেষণ প্রদান করে
ব্যবহারিকতা যাচাইকরণ: একাধিক আক্রমণ, মডেল এবং ডেটাসেটে তাত্ত্বিক অনুসন্ধান যাচাই করে

পদ্ধতির বিস্তারিত ব্যাখ্যা

কাজের সংজ্ঞা

ইনপুট: মূল ডেটাসেট D, পয়জনিং বাজেট ε_p, ওয়াটারমার্ক বাজেট ε_w
আউটপুট: ওয়াটারমার্ক পয়জনড ডেটাসেট, সনাক্তকরণ কী ζ
সীমাবদ্ধতা: পয়জনিং কার্যকারিতা বজায় রেখে ওয়াটারমার্ক সনাক্তকরণযোগ্যতা নিশ্চিত করা

মডেল আর্কিটেকচার

1. পোস্ট-পয়জনিং ওয়াটারমার্কিং

মূল ডেটা x → পয়জনিং δ_p → পয়জনড ডেটা x' → ওয়াটারমার্ক δ_w → চূড়ান্ত ডেটা x' + δ_w

তৃতীয় পক্ষের সত্তা ইতিমধ্যে পয়জনড ডেটায় ওয়াটারমার্ক যোগ করে
মোট বিঘ্ন বাজেট: ε_p + ε_w
ওয়াটারমার্ক দৈর্ঘ্যের প্রয়োজনীয়তা: Θ(√d/ε_w)

2. পয়জনিং-সমসাময়িক ওয়াটারমার্কিং

মূল ডেটা x → একযোগে পয়জনিং এবং ওয়াটারমার্ক প্রয়োগ → চূড়ান্ত ডেটা x + δ_p + δ_w

পয়জনিং জেনারেটর একযোগে পয়জনিং এবং ওয়াটারমার্ক নিয়ন্ত্রণ করে
মাত্রা বিভাজন: ওয়াটারমার্ক মাত্রা W, পয়জনিং মাত্রা P = d\W
মোট বিঘ্ন বাজেট: max{ε_p, ε_w}
ওয়াটারমার্ক দৈর্ঘ্যের প্রয়োজনীয়তা: Θ(1/ε_w²) থেকে O(√d/ε_p)

3. সনাক্তকরণ প্রক্রিয়া

কী: d-মাত্রিক ভেক্টর ζ
সনাক্তকরণ: অভ্যন্তরীণ গুণফল ζᵀx গণনা করুন, থ্রেশহোল্ডের সাথে তুলনা করুন
সিদ্ধান্ত: ζᵀ(পয়জনড ডেটা) > থ্রেশহোল্ড > ζᵀ(সাধারণ ডেটা)

প্রযুক্তিগত উদ্ভাবনী পয়েন্ট

1. তাত্ত্বিক কাঠামোর উদ্ভাবন

নমুনা-স্তরের বিশ্লেষণ: প্রতিটি ডেটা পয়েন্ট স্বাধীনভাবে ওয়াটারমার্ক এবং কী
সাধারণ সংস্করণ: একক কী সমস্ত নমুনার জন্য প্রযোজ্য
বিতরণ সাধারণীকরণ: সীমিত নমুনা থেকে সামগ্রিক বিতরণে সম্প্রসারণ

2. গাণিতিক গ্যারান্টি

McDiarmid অসমতা এবং VC মাত্রা তত্ত্ব ব্যবহার করে প্রমাণ করুন:

সনাক্তকরণযোগ্যতা: উচ্চ সম্ভাবনায় পয়জনড এবং সাধারণ ডেটা পার্থক্য করুন
কার্যকারিতা সংরক্ষণ: ওয়াটারমার্ক পয়জনিং প্রভাব নিয়ন্ত্রণযোগ্য
সাধারণীকরণ কর্মক্ষমতা: সীমিত নমুনা ফলাফল বিতরণে সম্প্রসারণ

3. মাত্রা বিভাজন কৌশল

পয়জনিং-সমসাময়িক ওয়াটারমার্কিং মাত্রা বিভাজনের মাধ্যমে হস্তক্ষেপ এড়ায়:

ওয়াটারমার্ক মাত্রা ব্যবহার করে W = {d₁, d₂, ..., d_q}
পয়জনিং মাত্রা ব্যবহার করে P = d\W
পারস্পরিক প্রভাব হ্রাস করুন, কর্মক্ষমতা উন্নত করুন

পরীক্ষামূলক সেটআপ

ডেটাসেট

CIFAR-10/CIFAR-100: ক্লাসিক ইমেজ শ্রেণীবিভাগ ডেটাসেট
Tiny-ImageNet: ছোট আকারের ImageNet
SST-2: পাঠ্য অনুভূতি বিশ্লেষণ ডেটাসেট

আক্রমণ পদ্ধতি

ব্যাকডোর আক্রমণ

Narcissus: পরিষ্কার-লেবেল ব্যাকডোর আক্রমণ
AdvSc: প্রতিকূল ব্যাকডোর আক্রমণ

প্রাপ্যতা আক্রমণ

UE (শিখতে অক্ষম উদাহরণ): অশিক্ষণীয় নমুনা
AP (প্রতিকূল পয়জনিং): প্রতিকূল পয়জনিং

মডেল আর্কিটেকচার

ResNet-18/50, VGG-19, DenseNet121
WRN34-10, MobileNet v2, ViT-B
BERT-base (পাঠ্য কাজ)

মূল্যায়ন মেট্রিক্স

নির্ভুলতা (Acc): পরীক্ষা সেটে মডেলের কর্মক্ষমতা
আক্রমণ সাফল্যের হার (ASR): ব্যাকডোর আক্রমণের কার্যকারিতা
AUROC: ওয়াটারমার্ক সনাক্তকরণ কর্মক্ষমতা
গণনা ওভারহেড: সময় খরচ বিশ্লেষণ

বাস্তবায়ন বিবরণ

ওয়াটারমার্ক/পয়জনিং বাজেট: 4/255 থেকে 32/255
ওয়াটারমার্ক দৈর্ঘ্য: 100 থেকে 3000
প্রশিক্ষণ: 200 যুগ, কোসাইন শিক্ষার হার সময়সূচী
অপ্টিমাইজার: SGD, গতিবেগ 0.9, ওজন ক্ষয় 10⁻⁴

পরীক্ষামূলক ফলাফল

প্রধান ফলাফল

1. ওয়াটারমার্ক সনাক্তকরণ কর্মক্ষমতা

ওয়াটারমার্ক দৈর্ঘ্য	Narcissus (পোস্ট-পয়জনিং)	Narcissus (সমসাময়িক)	AdvSc (পোস্ট-পয়জনিং)	AdvSc (সমসাময়িক)
500	0.9509	0.9968	0.9218	0.9986
1000	0.9974	0.9992	0.9809	0.9995
2000	1.0000	1.0000	0.9994	1.0000

2. পয়জনিং কার্যকারিতা সংরক্ষণ

পোস্ট-পয়জনিং ওয়াটারমার্কিং: সমস্ত ওয়াটারমার্ক দৈর্ঘ্যে ভাল আক্রমণ কর্মক্ষমতা বজায় রাখে
পয়জনিং-সমসাময়িক ওয়াটারমার্কিং: ওয়াটারমার্ক দৈর্ঘ্য খুব বেশি হলে আক্রমণ প্রভাব উল্লেখযোগ্যভাবে হ্রাস পায়

3. তাত্ত্বিক যাচাইকরণ

পরীক্ষামূলক ফলাফল তাত্ত্বিক পূর্বাভাস যাচাই করে:

পয়জনিং-সমসাময়িক ওয়াটারমার্কিং একই সনাক্তকরণ কর্মক্ষমতা অর্জনের জন্য ছোট ওয়াটারমার্ক দৈর্ঘ্যের প্রয়োজন
পোস্ট-পয়জনিং ওয়াটারমার্কিং পয়জনিং কার্যকারিতায় কম প্রভাব ফেলে
ওয়াটারমার্ক দৈর্ঘ্য এবং সনাক্তকরণ কর্মক্ষমতা ইতিবাচক সম্পর্ক দেখায়

বিলোপন পরীক্ষা

1. ওয়াটারমার্ক বাজেট প্রভাব

ε_w বৃদ্ধির সাথে:

সনাক্তকরণ কর্মক্ষমতা (AUROC) উন্নতি
পয়জনিং প্রভাব হ্রাস
তত্ত্বে ট্রেড-অফ সম্পর্ক যাচাই করুন

2. ওয়াটারমার্ক অবস্থান বিশ্লেষণ

বিভিন্ন ইমেজ অঞ্চল পরীক্ষা করুন (উপরের বাম, নিচের বাম, উপরের ডান, নিচের ডান):

অবস্থান কর্মক্ষমতায় ন্যূনতম প্রভাব ফেলে
তত্ত্বে অবস্থান স্বাধীনতা যাচাই করুন

3. মডেল স্থানান্তরযোগ্যতা

বিভিন্ন আর্কিটেকচার জুড়ে ভাল স্থানান্তরযোগ্যতা প্রদর্শন করুন:

উচ্চ AUROC স্কোর (>0.95)
ক্রস-আর্কিটেকচার সনাক্তকরণ স্থিতিশীল

শক্তিশালীতা বিশ্লেষণ

1. ডেটা বর্ধন প্রতিরোধ

Random Flip, Cutout, Color Jitter ইত্যাদি পরীক্ষা করুন:

AUROC 1.0000 বজায় রাখে
শক্তিশালী শক্তিশালীতা প্রদর্শন করুন

2. প্রতিরক্ষা পদ্ধতি

ডিফারেনশিয়াল গোপনীয়তা: গুরুতর শব্দ প্রশিক্ষণ ব্যর্থতার দিকে পরিচালিত করে
ডিফিউশন পরিশোধন: ওয়াটারমার্ক এবং পয়জনিং উভয়ই ক্ষতি করে
প্রতিকূল ডিনোইজিং: পয়জনিং কার্যকারিতা প্রভাবিত করে

উপসংহার এবং আলোচনা

প্রধান উপসংহার

তাত্ত্বিক অবদান: ডেটা পয়জনিং ওয়াটারমার্কিংয়ের তাত্ত্বিক কাঠামো প্রতিষ্ঠা করুন
ব্যবহারিক সমাধান: দুটি স্থাপনাযোগ্য ওয়াটারমার্কিং পদ্ধতি প্রদান করুন
কর্মক্ষমতা যাচাইকরণ: পরীক্ষা তাত্ত্বিক পূর্বাভাসের নির্ভুলতা যাচাই করে
প্রয়োগ মূল্য: "সদিচ্ছাপূর্ণ" পয়জনিংয়ের জন্য স্বচ্ছতা এবং জবাবদিহিতা প্রদান করে

সীমাবদ্ধতা

প্রয়োজনীয় শর্ত অজানা: শুধুমাত্র পর্যাপ্ত শর্ত প্রদান করে, প্রয়োজনীয় শর্ত গবেষণার অপেক্ষায়
প্রতিরক্ষা দুর্বলতা: শক্তিশালী প্রতিরক্ষা পদ্ধতির বিরুদ্ধে কর্মক্ষমতা হ্রাস
গণনা ওভারহেড: পয়জনিং-সমসাময়িক ওয়াটারমার্কিং অতিরিক্ত গণনা সময় প্রয়োজন
প্রযোজ্য পরিসীমা: প্রধানত অপ্রতিরোধ্য পয়জনিং আক্রমণের জন্য লক্ষ্য করা

ভবিষ্যত দিকনির্দেশনা

শক্তিশালী শক্তিশালীতা: প্রতিরক্ষা-প্রতিরোধী ওয়াটারমার্কিং স্কিম ডিজাইন করুন
প্রয়োজনীয় শর্ত: ওয়াটারমার্ক সনাক্তকরণযোগ্যতার প্রয়োজনীয় শর্ত অন্বেষণ করুন
দক্ষতা অপ্টিমাইজেশন: গণনা এবং স্টোরেজ ওভারহেড হ্রাস করুন
প্রয়োগ সম্প্রসারণ: আরও পয়জনিং ধরন এবং ডোমেইনে সম্প্রসারণ করুন

গভীর মূল্যায়ন

সুবিধা

সমস্যার গুরুত্ব: ডেটা পয়জনিং স্বচ্ছতার বাস্তব চাহিদা সমাধান করে
তাত্ত্বিক কঠোরতা: সম্পূর্ণ গাণিতিক বিশ্লেষণ এবং প্রমাণ প্রদান করে
পদ্ধতি উদ্ভাবন: প্রথমবারের মতো ওয়াটারমার্কিং এবং পয়জনিং প্রযুক্তি সিস্টেমেটিকভাবে একত্রিত করে
পরীক্ষা সম্পূর্ণ: একাধিক ডেটাসেট, মডেল, আক্রমণের ব্যাপক যাচাইকরণ
ব্যবহারিক মূল্য: স্থাপনাযোগ্য সমাধান প্রদান করে

অপূর্ণতা

প্রতিরক্ষা বিবেচনা অপর্যাপ্ত: শক্তিশালী প্রতিরক্ষা পদ্ধতির প্রতি শক্তিশালীতা সীমিত
তাত্ত্বিক সম্পূর্ণতা: প্রয়োজনীয় শর্ত বিশ্লেষণ অনুপস্থিত
প্রযোজ্য পরিসীমা সীমাবদ্ধতা: প্রধানত অপ্রতিরোধ্য আক্রমণের জন্য প্রযোজ্য
গণনা দক্ষতা: কিছু পরিস্থিতিতে ওভারহেড তুলনামূলকভাবে বেশি

প্রভাব

একাডেমিক অবদান: দুটি গুরুত্বপূর্ণ নিরাপত্তা ক্ষেত্র সৃজনশীলভাবে একত্রিত করে
ব্যবহারিক মূল্য: এআই নিরাপত্তা এবং ডেটা সুরক্ষার জন্য নতুন সরঞ্জাম প্রদান করে
তাত্ত্বিক তাৎপর্য: নতুন তাত্ত্বিক বিশ্লেষণ কাঠামো প্রতিষ্ঠা করে
শিল্প প্রয়োগ: ডেটাসেট কপিরাইট সুরক্ষা ইত্যাদি পরিস্থিতিতে প্রযোজ্য

প্রযোজ্য পরিস্থিতি

ডেটাসেট প্রকাশনা: ওপেন সোর্স ডেটাসেটের কপিরাইট সুরক্ষা
শিল্পকর্ম সুরক্ষা: জেনারেটিভ এআইয়ের অননুমোদিত ব্যবহার প্রতিরোধ
এন্টারপ্রাইজ ডেটা শেয়ারিং: অভ্যন্তরীণ ডেটা ব্যবহার ট্র্যাকিং
একাডেমিক গবেষণা: গবেষণা ডেটার উৎস যাচাইকরণ

প্রযুক্তিগত বাস্তবায়ন বিবরণ

অ্যালগরিদম প্রবাহ

পোস্ট-পয়জনিং ওয়াটারমার্কিং অ্যালগরিদম

def post_poisoning_watermark(poisoned_data, key, watermark_dims, budget):
    watermark = budget * sign(key[watermark_dims])
    watermarked_data = poisoned_data + watermark
    return watermarked_data

সনাক্তকরণ অ্যালগরিদম

def detect_watermark(suspect_data, key, threshold):
    detection_value = key.T @ suspect_data
    return 1 if detection_value > threshold else 0

তাত্ত্বিক গ্যারান্টি

McDiarmid অসমতার উপর ভিত্তি করে, পোস্ট-পয়জনিং ওয়াটারমার্কিংয়ের জন্য:

যখন q > (2/ε_w)√(2d log(1/ω))
P(ζᵀ(x₁ + δ₁) > ζᵀx₂) > 1 - 2ω

বাস্তব স্থাপনা বিবেচনা

কী ব্যবস্থাপনা: কী রোটেশন এবং HMAC প্রমাণীকরণ সমর্থন করে
সম্পূর্ণতা যাচাইকরণ: SHA256 হ্যাশ ডেটা সম্পূর্ণতা নিশ্চিত করে
অ্যাক্সেস নিয়ন্ত্রণ: HTTPS-ভিত্তিক নিরাপদ কী বিতরণ
স্কেলেবিলিটি: বড় আকারের ডেটাসেট প্রক্রিয়াকরণ সমর্থন করে

সারসংক্ষেপ: এই পেপারটি ডেটা পয়জনিং এবং ওয়াটারমার্কিং প্রযুক্তির ছেদবিন্দুতে সৃজনশীল অবদান রাখে, শুধুমাত্র কঠোর তাত্ত্বিক বিশ্লেষণ প্রদান করে না বরং ব্যবহারিক সমাধানও প্রদান করে। যদিও প্রতিরক্ষা শক্তিশালীতা এবং তাত্ত্বিক সম্পূর্ণতার দিক থেকে উন্নতির অবকাশ রয়েছে, তবে এটি যে সমস্যার সমাধান করে তার বাস্তব তাৎপর্য উল্লেখযোগ্য, এআই নিরাপত্তা এবং ডেটা সুরক্ষা ক্ষেত্রে নতুন গবেষণা দিকনির্দেশনা এবং সরঞ্জাম প্রদান করে।