魚好きが知っておくべき、画像生成AIのやさしい基礎基本

昨今話題の生成AI。

近年の技術進歩は目覚ましく、「写真の事実性」を容易に揺るがしうる存在として、魚類学の分野においてもその危うさが深刻に議論されています。

一方で、魚を愛する人ほど、「こんな姿の魚がいたら」「この種の別の色彩型が見てみたい」と、まだ見ぬ姿を想像したこともあるはずです。

「現実にはありえない光景」を視覚化できることもまた、生成AIが持つ大きな側面です。

例えば、潜水服を着たハムスターとルリヨシノボリが水中で戯れるような、空想の世界。

潜水服を着たハムスターとルリヨシノボリが水中で戯れる画像。絶対に現実ではありえない画像を作れるのも生成AIの特徴です。

あるいは、市販されていない「推し魚種」の専用グッズ制作。

ビワヨシノボリ&オウミヨシノボリのマグカップ
シマヒレヨシノボリのTシャツ

マイナーな魚種はグッズ化されないのが常ですが、これまでは絵心がなければ諦めていた理想も、AIという道具を正しく扱えば実現可能な時代になりつつあります。

しかし魚類は、形態差が微妙で、記録性が重視される分野でもあります。
だからこそ、使い方を誤ると誤情報の温床にもなり得ます。

ここでは魚類の描画を中心に、AI画像生成の仕組みと限界、そして倫理的な扱い方をわかりやすく整理・紹介します。

AIは「個々の画像」を覚えているわけではない

まず重要なのは、AIは特定の魚の写真や図鑑、イラストなどを一つ一つ個別に記憶しているわけではないという点です。

AIが学習しているのは、主に以下。

  • 魚は横に細長いことが多い
  • 目はこの位置に来やすい
  • 背鰭・臀鰭・尾鰭はだいたいこの配置

・・・といった、見た目の傾向の集合です。
AIは『魚』という言葉と『細長い形』などの特徴を結びつけた、巨大な連想マップを持っているようなものです。

生成時には、砂嵐のような画像の中から、

「この条件なら、確率統計的に(=過去の膨大なデータから推測して)このような特徴を持つ魚を描写することがもっともらしいだろう」

という形を少しずつ浮かび上がらせていくようです。

たとえ鱗や鰭条の描写が対象魚種とは異なるものであったとしても、生物学的な正確性よりは絵としての完成度を重視する傾向があります。

これは人間の魚類学的な理解(骨格・筋肉・進化・生態)とは、まったく別のアプローチから画像を生成しているといえるでしょう。

t2i(文章から画像生成)について

文章からをもとに画像を生成する技術をt2i(Text to Image)と言います。
この時に入力する文章(テキスト)は、プロンプトと呼ばれます。
「呪文」と呼ぶ人もいます。

魚種によっては、t2iでも高品質な画像を生成できるものがいます。
一方で、種名、学名を正確に入力しているにも関わらず、全く違う魚が出力されてしまうものもいます。

マアジのイラスト での生成結果 ちゃんとマアジが生成されました。ゼイゴもばっちり描けています。
実際のマアジ。佐渡島で釣った個体。
同様にルリヨシノボリのイラストでの生成結果。なんじゃこの魚は!?
こちらが実際のルリヨシノボリ。

魚の画像生成では、「マアジ」「ルリヨシノボリ」など、種名をそのまま入力するケースが非常に多いと思いでしょう。しかし、ここには明確な差があります。

以下は単純に魚の名前を入れてイラストを生成して という単純なプロンプトではなく、魚のイラスト用に私が最適化したプロンプトでの出力結果になりますが、参考までに紹介します。

種名が反映されやすい魚

  • 食用・釣り対象として有名な魚
  • 写真・商品画像・図鑑が非常に多い魚
  • 特徴的な形態を持ち、それが比較的安定している魚

例:マアジ、ヤマメ、金魚など

マアジ
ヤマメ
琉金(更紗)

AIの中に「この魚種名=この姿」という強い平均像があるため、流通量の多い食用魚や観賞魚は、比較的高精度で出力されやすい傾向があるようです。

とはいえ、魚種ごとの細部の特徴に詳しい人であれば詳しい人であるほど、気になる描写は見つかります。

例えば、このマサバ。

パッと見合ってるけど、小離鰭が4つのちょっと変なサバ。でも相当形態を細かく見ないと気付かないレベル。

一見すると完璧に見えますが、よく見ると小離鰭の数が、本来は5つあるはずのところ4つしかありません。

マサバをスーパーで見かけたことがある人は多いと思いますが、小離鰭をまじまじと眺めたことがある人はあんまりいないのではないかと思います。

このように、形態に精通していなければ見逃してしまうレベルの「もっともらしい嘘」が混入することがあるのです。

種名が反映されにくい魚

  • 似た近縁種が多い
  • 地域差・個体差が大きい
  • 一般的に知名度が低い
  • 参照できる画像が少ない

例:ハゼ類、スズメダイ類、チョウチョウウオ類 など

「ルリヨシノボリ」で
生成された変な魚
「ミヤコキセンスズメダイ」で
生成された変な魚
「フウライチョウチョウウオ」で
生成された変な魚

AIは種名を見ても、「どれを指しているのか曖昧」な状態になります。

結果として、別属・別種が混ざる、有名な近縁種に寄る、そもそも“典型的な小魚”になる

という現象が起きます。

例えばルリヨシノボリの例では、ルリヨシノボリとウロハゼを混ぜたような変な魚に。
ミヤコキセンスズメダイの例では、どっちかっていうとシリキルリスズメのような変な魚に。
フウライチョウチョウウオの例では、トゲチョウチョウウオとニセフウライチョウチョウウオを混ぜたような変な魚が出力されました。

ただし出力される画像は、魚種の特徴を抑えているかどうかはともかくとして、それなりに丁寧な描写であることが多いです。

このため、魚を見慣れていない人にとっては、「へーそうなんだ」と思ってしまう仕上がりであることも多いです。

一方で、見慣れている人ほど「これは違う」と違和感を覚えやすい部分でもあります。

特徴AIが得意(マアジ・金魚など)AIが苦手(ヨシノボリなど)
データの量食卓やペットショップで誰もが見るマニアックで写真が少ない
見た目誰が見ても「アジだ」とわかる姿似た種類が多く、専門家でも迷う
出力結果おおよそ正確「惜しいけど違う」魚になりがち

i2i(画像から画像生成)について

テキストだけでなく、写真やスケッチなどの画像をアップロードして、その画像を元に画像を生成する技術をi2i(Image to Image)と言います。
提供した写真を下書きとして、指示された画像を描いていくイメージが近いです。

アップロードした画像をもとに画像生成を行うため、t2iに比べると狙った画像を出力しやすくなります。

元画像:コウライオヤニラミ
コウライオヤニラミ i2iでの出力結果
コウライオヤニラミ t2iでの出力結果
概ね合っているがi2iに比べると精度が落ちる

しかしながらi2iした場合でも、魚種によっては魚の見た目がうまく反映されないことがあります。

その理由は以下の通りです。

AIは「重要形質」を理解しない

魚類同定で重要な、

  • 体高
  • 鰭条数
  • 口の向き
  • 背鰭の位置

・・・といった形質は、AIにとっては誤差の範囲にすぎません。
冒頭にも述べた通り、描画の際のアプローチが人間とは根本的に異なるのです。

項目人間の同定(分類学)AIの描画(確率統計)
重視する点鰭条数、側線鱗数、骨格全体の色彩、質感、配置の「それらしさ」
得意なことわずかな形態差の判別欠損箇所の自然な補完
弱点時間がかかる生物学的正確性の軽視

裏を返せば、重要形質はプロンプトで指定すると反映されやすくなる特性があります。

元画像

共通プロンプト:イラストにして 真横に配置 背景は白

カマツカ
名前なしで生成

追加プロンプトなし

カマツカ
名前+学名で生成

この魚はカマツカ(Pseudogobio esocinus)です

カマツカ
特徴で生成

特徴
頭の長いコイ科の顔つき。
コイ科の底生魚。
ハゼの仲間ではない。
口元に一対の短いヒゲがある
黄褐色の体色に黒い斑模様
尾鰭は開くと二叉

名前なしの例では、底生魚ということでハゼの要素が一部反映されたようです。
名前指定すると緻密な描写になりました。

特徴を指定すると、緻密さは落ちましたが特徴的な形質はほぼ反映されました。

名前+学名+特徴 での生成結果
ほぼ、パーフェクトカマツカ?

プロンプトの「魚」の有無で生成結果が変わる

AIはまず「これは魚」と判断し、学習データが少ない魚種の場合はその後で、平均的な魚の姿を当てはめる傾向があるようです。

このためか、プロンプトに「この魚を」と指定すると、出力画像に平均的な魚の姿を当てはめられてしまうことがあります。

元画像 トウヨシノボリ♂ 千葉県産
イラストにして の生成結果
この魚をイラストにして の生成結果

AIの学習データにおいて「魚」の大多数は一般的な魚(コイや食用魚など)が占めています。
そのため、マイナーな種を生成しようとしても、AIが持つ「一般的な魚」のイメージに引っ張られ、特徴が中和されてしまう現象が起きます。

よって、「この魚を」と入れないほうが、元の画像から忠実に描写しやすい傾向があるようです。

今回の生成では、「この魚を」と入れると描写は緻密になりましたが、AIが学習している基本的な魚種(今回の例ではハゼ)像に姿形が寄りやすくなるようでした。

「この画像を」と指定するか、あるいは単に「●●して」と加工方針だけ指示すると、平均的な魚に姿形が寄る挙動を避けやすくなります。

写真条件の影響が大きい

  • 横見でない
  • ブレている
  • 水の濁りがある

といったような、人間でも参考写真としては難しい条件下では、AIは細部を無視して補完します。
この時の補完の基準は、「正確さ」ではなく「無難さ」です。

先ほどと同個体のブレた写真。
生成結果

ブレたりピンボケしたりしている写真でも、意外とそこそこ変換できるようです。
昔の失敗写真が活用できる場面があるかもしれません。

ただ、第二背鰭の模様などは縞模様が補完されてしまっているようです。

画像生成モデルの選定基準

​それでは早速画像生成をしてみましょう……と言いたいところですが、画像生成ができるAIモデルは、今やヨシノボリ類やドジョウ類の種類数をも凌駕する勢いで増え続けています。

この「AIモデル」は、「絵描きさん」に相当します。
どの絵描きさんに頼むのか、といったイメージで選ぶと良いでしょう。

​どのモデルが一番良いかは使用目的によって異なります。
モデルごとに得意分野が異なるため、一概にこれが一番!というモデルはありません。

ただ、特に「魚類」という形態の正確性が問われるジャンルにおいては、単に綺麗に描けること以上に、以下の3つの基準を重視してモデルを選定することをおすすめです。

​ 指示(プロンプト)への理解度の高さ

​魚類には、体型や鰭の形状、模様など、言語化が難しい細かな特徴があります。

単に「魚」として処理するのではなく、「細長い」「底生」「背鰭が二つ」といった詳細な指示をどれだけ忠実に反映できるか。

この理解度が高いモデルほど、意図に近い「魚像」に近づけます。

​ 可視的なウォーターマークの表示

特にフォトリアルな画像では、生成された画像に自動で「AI生成であること」を示すマークが入るモデルは、公開時のリスク管理に非常に有効です。

一手間加えなくても、第三者が一目で「これは記録写真ではなく生成物である」と識別できることは、学術的・生態的な誤解を招かないための最低限のマナー(誠実さ)を担保してくれます。

また、もしウォーターマークが自動付与されないモデルを利用していたとしても、後から自分で加工により追加するのも有効です。

そのほかにも、加工元の画像を一緒に添えるという運用も有効でしょう。

​不可視の電子透かしによる保護

​画像生成モデルの中には、目に見えるマークを消したとしても、データの中に「AI製であること」を検出可能な特殊な標識を埋め込む技術が採用されているものがあります。
ただし、すべてのモデルに採用されているわけではない点は、注意が必要です。

強固な電子透かしが実装されているモデルの場合では、トリミングや加工で画像からウォーターマークを消したとしても、後から客観的な証明が可能です。

また例えば、電子透かしが埋め込まれているモデルAで生成した画像を、電子透かし埋め込み機能がないモデルBを用いてi2iした場合でも、電子透かしは一部引き継がれます。
このため、検出は可能です。

もし仮に他者に無断利用された場合でも、生成により埋め込まれた特殊なパターンを消すことは極めて困難です。

もし、無断利用された画像が電子透かしが埋め込まれるモデルで生成した画像であるならば、後から証明できる可能性があります。

実際に生成してみよう

それでは、実際に生成AIを用いて魚の画像を加工してみましょう。
使用するモデルは、画像を添付して生成ができるものなら何でも構いません。

無料で画像生成が可能なモデルも数多く存在しますので、先述の特徴を踏まえながら、お好みのモデルを選ぶと良いでしょう。

まずは、適当な手持ちの魚の写真を1枚用意するのがおすすめです。

準備ができたら、試しに手持ちの魚の写真1枚を、水彩画のアート風に加工するごく簡単な変換を体験してみましょう。

  1. 生成AIにログイン
  2. 画像をアップロード
  3. 「水彩画風にして 背景は白」と指示
元画像 クロヨシノボリ♂ 和歌山県産
水彩画風に変換

尾鰭が閉じているのが気になります。
尾鰭を開いて と指示してみましょう。

尾鰭を開いてくれました。

すると、こんな感じになりました。

ある程度写真映りの良い画像なら、概ね一発で変換できるはずです。

全体的に何か違うと感じる場合は、同じプロンプトで再試行するか、もしくは出力結果を見ながら追加指示を与えると良いでしょう。

むしろ納得いく画像が一発で生成されることは少ないです。
何回か修正指示を加えていくことで、だんだん納得いく仕上がりになっていくことでしょう。

画像生成時の注意

魚の画像を生成する場合でも、入力するプロンプトにはいくつかの注意が必要です。

作家名・有名IPを入れない

プロンプトに、特定の(現役・存命の)画家名・有名作品・キャラクター名を入れることは避けるべきです。

理由としては、著作権・二次創作問題のリスクが生じるため。

これだと出力が「創作」ではなく、「模倣」になってしまいます。

結果として、せっかく高品質な画像を生成できたとしても、公開しづらくなります。
グッズ化や展示利用も制限される場面が多く予想されるでしょう。

その代わりに、「博物画風」「水彩画調」など、表現の特徴だけをプロンプトで指定するのが安全です。

なお例外として、著作権保護期間が終了している歴史上の巨匠に関しては、指定は有効です。

例えば印象派のモネ、浮世絵の葛飾北斎といったような、パブリックドメイン化している画家が対象ならほぼ問題はありません。(元の作品からほとんど変えずに酷似した画像を出力したものや、余程の悪意を持った改変などは問題になる場合があります。)

ルリヨシノボリが滝に登る浮世絵。葛飾北斎風。

参照画像は原則「自分で撮ったもの」を使う

魚類は特に、写真の扱いがシビアです。

原則、自分で釣った・撮影した魚や自分で描いたスケッチを使うのが基本です。

他人の写真を使ってはいけない理由として、写真そのものに著作権があります。

いわゆる「拾い画像」には、基本的に誰かの著作権があると考えるべきです。

i2iは「加工」に相当するので、これを画像参照することは、無断利用に他なりません。

なお、フリー素材は、提供元の規約によっては利用できる場合があります。
画像参照からのi2iは、「加工」に相当します。

提供元の規約に改変可能な素材であるか、またクレジット表記の必要性の有無を確認しておきましょう。

また、もし生成画像をグッズとして販売したい場合には、商用利用可能かどうかも確認すべきです。

商用利用も可能だが被写体がグッズの中心になる場合は、別途販売ライセンスが必要になるというケースもあります。

フォトリアル指定は慎重に

生物学的文脈において、非常に問題視されている画像生成はこの分野になります。

プロンプトに「photo realistic」を付けたり、写真を画像参照しても、アート化する指示を与えなければ、まさに写真そっくり、フォトリアルな画像が生成できます。できてしまいます。

しかし、当然ながらフォトリアルな魚画像は「記録」に使えません。

写真と見分けがつかない魚画像は、第三者には事実の記録に見えます。

例えば、採集した個体をアルビノ個体に変更するように指示を与えると・・・

これは福井県で採れたカワヨシノボリ。
アルビノ化するよう指示を与えた生成結果。

このように、ぱっと見本当にアルビノ個体が採れたかのように偽装できてしまいます。

このような使用法は、完全に捏造です。
偽の「分布」「形態」「生態」情報を拡散してしまうリスクがあり、将来の魚類学に混乱を生み出しかねません。

そのため、フォトリアルな画像を生成、公開する場合には、

  • AI生成であることを明記する
  • 証拠写真の文脈で絶対に使わない

という姿勢が不可欠です。

AI画像は、どれほど精巧でも標本でも生態写真でもありません。

geminiで作成した画像の場合の分析例。
仮にウォーターマークを消したとしても、google製の場合は画像をAIに分析させることでAI製であるか否かを検出可能です。
元画像の分析結果。

​「体験」を通じて技術的特性を知る

​画像生成を体験するとわかりやすいと思いますが、生成AI自体は非常に強力な新技術です。
リスクを恐れて一律に忌避、というわけにはいかない と私は考えています。

今はまだ忌避できるかもしれませんが、時代が進むにすれそれを拒むことはどんどん難しくなるでしょう。この流れはおそらく、不可逆的かつ不可避です。

なので、遅かれ早かれいずれは向かい合わなければならない技術と考えています。
そしていずれにせよ向かい合うなら、早いほうが良いと思います。

まずは複数のモデルで同じ魚種を生成し、それぞれの「描き方の癖」を体験してみてください。

単一のモデルだけを利用するのでなく、あるモデルで出力させた画像を、別のモデルでi2i加工するなど、複数のモデルを横断して利用することが有用な場面も中にはあるでしょう。

どのモデルが自分の「描きたい魚像」をより正確に、あるいはより魅力的に表現してくれるのか。

その技術特性を理解した上で使い分けることこそが、AI時代に求められる「観察眼」と言えます。

破滅と創造を同時にもたらしうる技術

魚のAI画像生成は、魚の特徴をアートとして拡張・具現化を民主化した一方で、使い方を誤ると生物学的文脈において、証拠写真としての信用を失墜させるリスクを同時に併せ持っています。

イラスト・デザインの領域では、魚に対する造詣の深さを存分に活用し、自由に遊んでみてください。

一方で、フォトリアルな領域の画像を生成する場合では、生物学に携わる者としての誠実さが問われます。

この線引きを理解していれば、AIは魚類の知識を破壊するものではなく、表現力を拡張する有能なアシスタントになりえます。

魚を見慣れており、造詣が深い人ほど、AIの違和感を見逃しません。
そして的確に指示を与えれば、AIは即時修整が可能です。

魚類の特徴を理解している人だからこそ、AIはあなたの観察眼を補完する道具となりえます。

最終的にAIを利用するかどうかは個人の自由ですが、その道具が持つ技術的特性については、誰もが知っておくべきでしょう。

魚好きの私たちが守るべきは、その場所で、その魚が、その姿でいたという事実です。
AIは表現を豊かにしてくれますが、事実に勝るものはありません。

アートとして楽しむことと、記録として残すことは、異産地の同種サンプル管理のように、明確に分けましょう。

最先端技術を正しく利用し、学術的混乱を招かない運用を常に心がける姿勢が、AI時代という環境変化への適応にあたり、有利な形質となるのかもしれません。 

コメント

タイトルとURLをコピーしました