北海道 印刷|東洋株式会社

コラムCOLUMN

画像生成AI「Stable Diffusion 2.0」が無料で試せるおすすめサイト・使い方

Stable Diffusion 2.0
イギリスのスタートアップ企業「Stability AI」社が2022年11月24日(英現地時間)に画像生成AIのStable Diffusionの最新バージョンとなる「Stable Diffusion 2.0」をリリースしました。
Stable Diffusion V1から改良されたのは「解像度向上」や「Depth-to-Imageで画像を生成」等だそうです。

今回は、登録等は不要で「Stable Diffusion 2.0」を簡単に試せるWebサイトがあったので、実際に使ってみました。

「Stable Diffusion」とは?

深層学習の「text to image」モデル、任意のテキストを入力することで、そのテキストに見合った画像を短時間で生成してくれる画像生成AIサービスです。
実際にどういった画像がAIによって生成されるのか、「Stable Diffusion 2.0」を試せるWebサイトはこちらです。
https://app.baseten.co/apps/VBlnMVP/operator_views/nBrd8zP

Stable Diffusion 2.0
Webサイトを開き、赤枠部分に作成したい画像の説明テキストを英語で入力する必要があります。
この為、日本語を英語に変換する必要があります。
 

翻訳精度が高い翻訳ツール「DeepL」

翻訳におすすめするのが「DeepL翻訳」。高性能なことで有名な機械翻訳サービスです。
AI精度の向上により、Google翻訳をはじめ様々な翻訳サービスがありますが、DeepL翻訳はその中でも群を抜いていると言われています。
「DeepL翻訳」の最大の特徴は「高い翻訳精度」です。
AI技術を駆使した高品質な自動翻訳は、10億人以上から利用されている実績があり、単純に文章を翻訳するのではなく、細かなニュアンスまで読み取ることができます。
同じ英文をGoogle翻訳とDeepL翻訳にかけると、DeepL翻訳の方がより自然な流れで翻訳されると評価されています。
■DeepL翻訳:https://www.deepl.com/translator
 
赤枠部分に日本語を入れるだけで、数秒で英語に変換してくれます。
Stable Diffusion 2.0
「都会を走る未来の電車」と入力してみました。
Stable Diffusion 2.0
これを「Stable Diffusion 2.0」に入力して画像生成してみたいと思います。
 

画像生成の結果は?

英語に変換した「Train of the future running in the city」を入力し[Generate]をクリックすると、約1分程度で下画像が生成されました。
Stable Diffusion 2.0
撮影したかのような綺麗な仕上がりです。
ちなみに同じ「Train of the future running in the city」で再度クリックすると別バージョンが出来上がります。
Stable Diffusion 2.0
その他に「雪の中でキャンプをする」というプロンプトで生成された画像はこちらです。
Stable Diffusion 2.0
テントの外にシュラフ等が転がっていたりと、不自然な画像が生成されてしまいました。
これは、より詳しく丁寧な説明文章を入力することで、イメージ通りの画像に近づいていくと思います。
近年世界的に話題を呼んでいる「プロンプトエンジニア(※)」が注目されている理由がわかります。(※画像生成AIや文章生成AIといったコンテンツ生成AIに命令する役割担い、実際にコンテンツを生成したり、生成の質を改善したりするための職種)
 

画像生成AIの活用方法

「Stable Diffusion 2.0」ではこの世にただ一つの画像素材を作成できので、例えばWebサイトやポスター制作の際に「こんな画を使ってデザインを作りたい」と思っても、なかなか「イメージ通りの素材が見つからない!」といった時なんかにも、素材作成として活用できそうです。

 

DXに関するご相談はこちら