もし自分の描いたイラストへのAI学習を対策するなら、どうするのが効果的かを考察する。
筆者は画像生成AI利用者であり、どちらかというとAI推進派。
自分の考えでは、イラストの公開範囲を限定し、データベースとなりえる転載画像は削除要求をし続ける、というのが一番対策になりそう。
もくじ
前提
大前提として、他人が閲覧できる状態であればネット上のどこにどう投稿してもAI学習自体を防ぐことはできない。
インターネットにアップロードされたあらゆるデータは転載・拡散・利用されるのがネットの本質である。
なので、比較的AI学習されにくいという意味での対策を書く。
公開範囲を絞る
AI学習のためには大量の学習用データを用意する必要があり、一括処理によってネットからデータを集める(クローリングする)必要がある。
自分のイラストをクロールされにくい状況にすれば、自ずとAI学習はされにくくなる。
ネットに公開しない
無断転載やAI学習を一切されたくないのなら、まず第一にインターネット上に画像をあげないことが最も強い対策となる。
有料サイトや完全会員制サイト・鍵垢などでのみ公開する
AI学習には大規模なデータほど有用であり、ログインせず閲覧できる全体公開のサイトほどクロールの敷居が低い。
そのため、単純に公開範囲が狭い場所でのみ公開することが対策となる。
有料サイトや完全会員制サイト・鍵垢などでのみ公開すれば、クロールの的になりにくい。
AI学習禁止サイトや可否オプションがあるサイトを利用する
AI学習禁止を標榜しているサイトや、AI学習の可否をオプションで設定できるサイトを利用する。
どのサイトであってもクロール対象になりえるが、少なくともクロールされる側の意思が尊重されやすいサイトに投稿するべき。
社会的責任の薄い個人や中小には無視してクロールされるだろうが、大企業にはそれなりの社会的責任を要求されるので学習はされにくいと思われる。
具体例
- SNSのMisskey
- アカウント設定でAI学習拒否を設定できる。
- SNSのタイッツー
- AI学習のクローラーを一律禁止している。
- ポートフォリオサイトのXfolio
- 作品ごとにBot対策を設定できる。
- 海外のポートフォリオサイトのArtStation
- NoAIタグによってアカウントや作品ごとに学習の可否を設定できる。
AI学習利用を標榜しているサイトを利用/投稿しない・投稿済み画像は削除する
「投稿された画像はAI学習利用される」と明言しているサイトには投稿しない。
投稿済みの画像は削除する。
すでに学習済みの画像は止められないが、今後の学習はされなくなる。
他のサイトからも徹底的に消す
投稿済み画像の削除までを行う場合、他のクロールしやすいサイトに残っていては消す意味がない。
あらゆる無断転載サイトからも必ず徹底的に削除する必要がある点には注意。
明言していなければ学習されないというわけではない
そのサイトがAI学習利用を明言しようがしまいが、外部や他者からはクロールされうるということには注意。
原本を置いておくサイトは用意しておく
すべての自分の投稿画像をネットから削除してしまうと、今度は無断転載への削除要求や自作発言への対処が難しくなる。
それを考慮するなら、信用のおけるサイトに自分の絵を残しておくとよい。
全体公開する場合は低品質版を公開する
全体公開サイトにも絵を公開したい場合は、そちらでは濃いウォーターマークなどを付けてあえて質を下げた画像を公開する。
もしウォーターマーク付きをクロールされても、完全な状態の原本の方は学習させないということは期待できる。
低解像度化やトリミング・モザイク版だけを公開するというやり方でも同様の運用ができる。
運用の注意点
- ウォーターマークを使う場合、目視で邪魔なくらいはっきりと付けること。
- 薄いと意味がない。
- 原本は公開範囲を限定した場所でのみ公開すること。
- 別のクロールしやすい場所に原本を配置しては意味がない。
- 限定公開サイトの方ではウォーターマークを外す。
- WM付きを原本として扱う運用ならWMの意味がない。
食品サンプルだけ用意して客にも食品サンプルを食わせるのと同義。
- WM付きを原本として扱う運用ならWMの意味がない。
下記の検証結果では、「ある程度の大きさ、複雑さ、余白があれば、ウォーターマーク除去もされづらい」とのこと。
画像生成AIにとって一番嫌なノイズを探す -調査編(4)- #StableDiffusion - Qiita
無断転載や標的型生成AIには削除要求をする
無断転載サイトに対して徹底的に削除要求をする
絵のAI学習には、danbooruのようなイラスト無断転載サイトが利用されやすい。
(あらかじめ絵の情報がタグ付けで整理されているので、データとして使いやすいため)
このようなサイトに無断でアップロードされた自分のイラストを、削除するように要求し続ける。
今ある学習済みモデルは止められないが、今後のモデルが作りにくくなる。
類似サイトが多いのでかなり骨が折れる行為だが、これを徹底的に行うことが最も現実的かつ効果的なAI学習対策に思う。
さらに、徒党を組んで大規模かつ長期的に行えばかなりの効果が期待できそう。
原本の方をクロールされないように、限定公開の場所だけで公開するというのも合わせて必要。
自分の画風・キャラを模倣した絵やLoRAに削除要求をする
自分の画風や自分のオリキャラを再現することだけを目的とした生成AIモデル(LoRAなど)は、自分への依拠性が高いので削除を要求することができる。
出力画像が酷似しているならその画像は削除要求可能
AIによって出力された絵は、他の著作物と同様に著作権の影響を受ける。
明らかに自分の描いた絵と酷似している絵やオリキャラを描写した出力物は、著作権侵害で訴えられる。
(画風が似ているだけでは無理な点には注意)
効果が疑問な対策
画像自体に何かを書き込むことは根本的な対策にはならないと思う。
サイン
サインは、無断転載や自作発言への対策としては有用だが、AI学習を阻害する効果はない。
サイン付きの絵をAI学習に利用されたとしても、そもそも生成AIの中には元絵がなく、元絵との依拠性が証明できない。
「AI学習禁止」の注意書き
AI学習のためのクロールは一括で行われるので、個人単位で主張しても実際にAI学習しようとしている相手にはそもそも読まれない。
また、サイン同様、AI学習に利用されても元絵との依拠性は証明できない。
クロールする側がAI学習可否を判定しやすいように、AI学習を一律禁止しているサイトか、AI学習可否オプションがある投稿サイトに投稿するべき。
ウォーターマーク付き画像自体がAI学習対策になるかは疑問
絵の特徴を学習するのが生成AIなので、いずれウォーターマークの特徴を学習してそれだけ生成時に弾けば除去できそう。
イタチごっこ的なことになりうる。
学習前にウォーターマークを除去されることもありえる。
(NovelAIのデグラッター機能のように、そこそこ高精度に除去できる模様)
ただ、現状濃くて複雑なウォーターマークであれば除去されにくい模様なので、ひとまずの意味はある?
薄いウォーターマーク
薄ければそもそも学習結果への影響すらない。
目視ですら邪魔なくらいはっきりと付けること。
学習妨害ノイズ
「元絵の絵柄やキャラの特徴の再現を阻害させるほどの強い効力があった」とする検証結果が見つけられない。
効力があるのか疑問。
その他、目視で汚く見えるほどノイズをかけてそれが影響しているなら、結果正しく学習できているだけでは?(ウォーターマークと同程度の意味しかない)