ほんの数年前までは、本当にAIが世の中を変えることなんてできるのか、とほとんどの人が懐疑的でした。しかしながら、ここ数年で決定的なブレイクスルーが起き、人工知能は各分野で人類の能力を凌駕しつつあります。今回は、その中から画像生成AIを取りあげてみましょう。画像生成AIがなぜここ数年で成長を遂げたのか、その仕組みはどうなっているのかといったことを解説していきます。
画像生成AIの歴史
人工知能研究自体は70年ほど前から行われてきました。とはいえ、はじめの50年ほどはあまり有意義な進歩は見込めなかったと言わざるを得ません。
人々はそもそも、どうすれば高性能な人工知能ができるのか、といった方法論から考えなくてはいけなかったのです。その中で、これを使えばうまくいくのではないかという方法が発見されたのは、今からほんの20年ほど前のことでした。研究者はディープラーニングという方法を開発し、人工知能自体に人間と同じ思考の仕方で考えさせる方法を編み出したのです。
これによって、人工知能研究が急速に進歩し、さまざまな方面での応用も見込めるようになりました。たとえば、将棋や囲碁などといったボードゲームは、AIにとって能力が発揮しやすい分野であり、あっという間に人間を超える能力を有するようになったのです。
もしかしたらAIがいよいよ人間を凌駕するかもしれないという展望が見え始めてきた頃、画像生成AIの開発もスタートします。はじめの頃の画像生成AIは不出来なものと言わざるを得ませんでした。どれだけ細心の注意を凝らしてAIを作り上げたとしても、質の低い画像しかできなかったのです。
しかしながら、時間が経つにつれて徐々に研究が軌道に乗り、AIは高いクオリティの画像を生成できるようになっていきます。たとえば、半導体で知られるNVDIAが開発したStyle Gunは、2018年に発表されると大きな話題を呼びました。まるで本物の人間がそこにいるかのような画像を生成して見せたからです。
参照URL:https://newsdig.tbs.co.jp/articles/-/876327
それ以外にも、現在の写真をダ・ヴィンチやフェルメールなどといった過去の名匠の画風に似せるAIなどが開発されたのもこの頃です。とはいえ、画像生成AIが一気に人々の注目を集めたのは2022年でしょう。アメリカのAI研究会社OpenAIがディープラーニング用のプログラムを公開したため、それをもとにしたクオリティの高い画像生成AIが続々と登場したのです。
たとえば、Stable DiffusionやMidjourneyなどは、詳しくない人でも名前を聞いたことくらいはある画像生成AIの代表例でしょう。こうした画像生成AIが画期的なのは誰でも無料で使えるという点です。これによって、人々は気軽にAIをもとに画像を作り出せるようになったのでした。
画像生成AIはどうやって画像を作成している?
画像生成AIの仕組みを理解するためには、私たち人間の認識プロセスを参考にするのがわかりやすいです。たとえば、赤ちゃんに対してキーボードの絵を描いて、と言われても何も書けるはずがありません。それはなぜかといえば、赤ちゃんはそもそもキーボードがなんなのか理解できていないからです。
キーボードとは何かを理解するためには、家にあるキーボードだったり、学校にあるキーボードだったり、カタログにあるキーボードだったりを見ながら、「キーボードとはこういうもの」という認識を身につけなければいけません。そうした過程を経て、ようやく人はキーボードの絵を描いてと言われてキーボードが描けるようになるのです。実は、画像生成AIを作るプロセスもこれと変わりありません。
先程も述べたように、近年作られたAIのほとんどはディープラーニングという方法で成り立っているものです。ディープラーニングとは、簡単にいえば膨大なデータをもとに知能を育んでいく学習方法です。
ディープラーニングをもとに作られた画像生成AIを仕上げるためには、たくさんの画像データを学習させなければいけません。たとえば、スマートフォンの画像を学習させるのならば、人間が無数のスマートフォンの画像を読み込ませ、AIに「スマホとはこういうもの」という認識を植え付けなければいけないのです。この結果、AIに対して「スマホを描いて」と指示するとスマホを生成できるようになります。
画像生成AIのメリットは?
画像生成AIは、これまでの常識を変える存在として期待されていますが、一体どのようなメリットがあるのでしょうか。最初に挙げられるメリットとして、画像作成の手間が大幅に省略できるという点があります。たとえば、あなたがイラストレーターで、こういった画像を作ろうと思い立ったとしましょう。
あなたがどれだけ優秀なイラストレーターでも、クオリティの高い画像を仕上げようと思ったのならば、相当な時間をかけなければいけないはずです。一方で、画像生成AIにこういった画像を作ってと指示すれば、瞬時に画像を生成してくれます。
もちろん、すぐにお望み通りの画像が手に入るわけではありません。現在のAIの生成技術はまだまだ未熟で、人間の指示通りに動いてくれることは少なく、時にヘンテコな画像を生成してしまうこともざらにあります。
お望み通りの画像を手に入れるためには、入力する文字列を工夫しなければいけません。その結果、画像を手に入れるために時間がかかってしまう可能性も否めませんが、とはいえ手作業で画像を作るよりは格段に手間を省略することができるでしょう。
それだけでなく、これによってコストを削減することだってできます。
もしあなたに絵心がないにもかかわらず、画像が必要となったらどうするでしょうか。プロのイラストレーターに依頼する人がほとんどでしょう。そうすると、相当な依頼料を支払わなければいけません。クオリティの高いイラストを描ける人ほど依頼料は高くなる傾向にあります。
一方で、現在利用できる画像生成AIのほとんどは無料で商用利用できるものばかりです。生成AIの開発者の方針によっては、商用利用するにあたっていくつかの条件をクリアしなければいけないことがたまにありますが、いずれにしてもお金をかける手間に比べれば些細なことでしょう。最後に挙げられるメリットとして、人間では到底思いつかないようなアイディアで画像を生成してくれるという点があります。
先ほど、AIは時にヘンテコな画像を生成することがあるという話をしました。だからといって、ヘンテコな画像に利用価値がないと断定するのは早計です。ヘンテコな画像は、逆にいえば人間にインパクトを与えられる可能性を秘めています。実際、画像生成AIが流行り出した頃、素手でラーメンを食べる女の子の絵が生成されることが話題になりました。
人々はまだまだAIは未熟なんだと感じつつも、そのおかしさがクセになり、AIを真似して女の子に素手でラーメンを食べさせる絵を描くというブームまで起きてしまったほどです。このように、AIには、人間には思いつかない絵を描くことで、多大な影響力を与える可能性を秘めています。
画像生成AIにはデメリットもあることを忘れてはいけない
画像生成AIは、画期的な開発ですが、まだまだ限界があります。まずは、画像生成AIで作られた画像は似たような絵柄になりがちなのを見逃してはいけません。どれだけAIに画像生成させる時に使う言葉を工夫しても、絵柄まで改変するのは難しいです。
その結果、何度やってもどこかで見た画像にならざるを得ないということになりがちです。特に、2022年にMidjourneyやStable Diffusionが発表されて以来、多くの人々が数多くの画像を生成してきました。
そのため、AI画像を受け取る側としてはすっかり慣れてしまい、最初の頃は面白がっていたものの、最近ではAIの画像に飽きつつあるのが実情です。AIで生成した画像を利用する際は、この点を注意しなければいけません。また、現在主流になっている画像生成AIは外国で開発されたものばかりです。
ということは、AIに画像を生成させる時は日本語ではなく英語で指示しなければいけません。この時に、英語に詳しくなければ望み通りの画像は生成されないということに気を付けなければいけないでしょう。もちろん、基本的な単語ならば英語で指示するのもそこまで難しくありません。
画像生成AIと同時に翻訳AIも発展してきているので、基本的な単語で指示する言葉を決めていけばいいでしょう。とはいえ、英語には日本人にはわからない微妙なニュアンスを伴う言葉があるのも事実です。
たとえば、聴衆の前で話している人間の画像がほしいとしましょう。その時、あなたはTalkerで指示しますか、それともSpeakerで指示するでしょうか。こういった微妙な違いでも生成される画像は変わってきます。現状画像生成AIを利用する際には、英語の能力も求められるということを踏まえておきましょう。
もちろん、最近では日本語に対応している日本製のAIも普及しつつあるので、それを待つという方法もあります。また、人間にとっては当たり前のことがAIの生成した画像には反映されないというデメリットも否めません。画像生成AIをさっそく利用してみた人々は、そのクオリティに感嘆すると同時に、細かな点で違和感を覚えることが多々ありました。
代表例として挙げられるのが人間の指です。我々は人間の指は5本と知っているので、それをもとに絵を描くのですが、なぜかAIが生成する絵は指が6本だったり、4本だったりと安定しないのです。これは、AIが大まかなポイントは学習できるものの、細部はうまく学習できないということを示しています。
もしかしたら今後こういった課題がクリアされる可能性も無きにしも非ずですが、現在流通しているAIを使う際は、生成された画像をそのまま使う前にしっかりとチェックする過程を挟まなければいけません。
画像生成AIに潜むリスク
デメリットは否めないとはいえ、画像生成AIのクオリティは高く、我々の仕事を助けてくれる存在であることは確かです。もっとも、現在のAIにはある重大な危険性が指摘されています。
それは著作権の問題です。先ほども説明したように、AIは膨大な画像をもとに学習をし、自分なりの絵柄を確立していきます。
その過程で人間の絵も当然使われるのですが、この点が今議論の対象になっているのです。当然ながら人間の絵を作者に無断で利用するのは著作権違反です。
ならば、人間の絵をAIの学習の材料にするのも違反なのではないでしょうか。この辺りはまだまだ法整備が行き届いておらず、グレーゾーンであると言わざるを得ません。
また、学習の過程ならまだしも、完成したAIで画像を生成した結果、意図せず誰かの絵と似た画像が生成されてしまったという可能性も否定できないでしょう。これらのリスクを踏まえないまま、無神経に画像生成AIを利用するのは危険です。
人間とAIをうまく共存させながら社会を作らなければいけない
著作権のリスクだけでなく、AIによって人間の仕事が奪われるという可能性も取りあげなくてはいけません。先ほど、AIに任せればプロのイラストレーターにわざわざ依頼しなくても仕事ができるようになるという話をしました。
これは、同時にイラストレーターの仕事自体がなくなりかねないということも意味します。実際に、2022年に画像生成AIが登場した結果、自分の存在意義がなくなるのではないかと危機感を覚えているイラストレーターは少なくありません。
もっとも、人間のイラストレーターにできることはまだまだ残されています。先ほども見たように、AIには細かい作業が苦手であることや人間の思うように画像を作れないという課題があります。この点、人間のイラストレーターは細かい作業が得意ですし、こういう絵を描いてほしいと言われれば要望通りの仕事を仕上げられるでしょう。
このように、AIにはAIならではの仕事を、人間には人間ならではの仕事を、といった具合に共存させながら社会を作ることがこれからの時代には求められるはずです。
AIで画像生成についてのまとめ
画像生成AIは、さまざまな意味で破壊力を秘めた存在であると言えるでしょう。これからの我々の仕事をより楽にしてくれる一方で、一部の人間の生活を脅かす存在であることを忘れずに今後の発展を見守らなくてはいけません。
やりたいことを上手く伝える自信がない!
聞いてみたいけど営業がしつこかったらどうしよう?
ファーストステップにお任せください。
じっくり相談でも、お任せスタイルでも、ご予算に無理のない範囲で最大限の成果を。
メールやSNSで気軽に質問、時間や場所に囚われないオンラインビデオ会議、貴社ご訪問で打ち合わせ…ファーストステップは柔軟に、あなたの「やりたい」にお応えします。
主な訪問エリア
名古屋市、あま市、津島市、大治町、蟹江町、清須市、稲沢市、弥富市、一宮市、北名古屋市、愛西市、尾張旭市、飛島村(その他の地域、都道府県もまずはご相談ください)
Contact
無料相談
Webサイト制作のご相談やご質問、ご不明点などございましたらこちらよりお問い合わせください。まずは、お気軽にお電話、ご相談・無料でお見積もりを作成いたします。
コメント