自動生成のプロセスができたので植物図鑑作成に取り掛かるが…
一応、公開まではしたんですが、いろいろと生成AIならではの問題がありました。
花図鑑 ~英語名と発音の学習~
https://apps.aries67.com/picture_dictionary/flowers
※まだ、PWA化もしていません。
LLMは外人と心得よ!
基本的にLLMは英語で学習し、そこから他の言語を学習するプロセスを通るのでしょう。思考は外人と考えた方がよいでしょう。それは論理的思考に限定すれば大差ないので、運用でカバーもできます。
しかし、学習データも外国がベースになるため、日本固有の文化や地域特性い根ざした情報についてはかなり希薄と考えるのが当然です。然るに、今回トライした花の名前のように、英名と和名が明らかに異なる類のものでは、相当の無理がきます。結果、外国の花辞典のようなものが出来上がったわけです。
仕掛りに、代表的な花をピックアップしてくれとLLMに依頼したところ、50ものリストの中に、桜も梅もたんぽぽすら入っていなくて驚きました。
この特性を理解したうえで利用すればいいのですが、なかなか日本人向けの図鑑を作成するには限界があるなと思った次第。
画像生成AIも外国の写真学習による影響
日本っぽい絵を求めるのがかなり難しいのは、学習データの起源によるものでしょう。プロンプトに”asia”を含めると、中華圏の文化を色濃く反映した雰囲気を感じさせるものになります。素のデータではガラパゴス日本らしさを表現する絵を求めることは、本質的に無理であることを確信しました。
それ以前に、日本固有の名称を英語に翻訳することができないようなシーンに度々出くわすので、幼児向けの図鑑にでてくるような、万国共通のイメージを持つ簡単なワードを意識して対象を選定する必要がありますね。
画像生成AIには合成という逃げ道もあるが…
個別に画像を生成するならば、日本の風景と対象の写真を合成することで、かなりそれらしい表現も可能なことは分かっています。しかし、いまのところ、AIの連続自動処理による有用性を検討中なので、いまずぐそこに向かう訳にもいきません。
LLMの本性は言語モデルであり、知識を求めるものではない
Gemma3との会話によると、彼の情報の最終アップデートは2021年9月(うろ覚え)とのことでした。最新のGeminiであれば、かなり直近の情報までを保持している可能性はあります。
つまり、人間がAIに仕事を奪われないためには、その僅かな時間的ギャップを埋めることに重要なヒントがあるのだと実感しました。例えば、ニュースメディアは当面AIに職を追われる心配はないということでしょうね。

