OpenAIは、画像生成AIの最新版「DALL-E 3」を発表した。テキストに忠実な画像を生成する能力が飛躍的に向上している。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
OpenAIは2023年9月21日(米国時間)、自然言語で記述された文章から画像を生成するAI(人工知能)の最新版「DALL-E 3」を発表した。
DALL-E 3は、従来のシステムよりもニュアンスやディテールを理解し、ユーザーのアイデアを忠実に再現する画像を生成する。9月21日の発表時点でリサーチプレビュー段階にあり、OpenAIが提供するChatGPTの有料プラン「ChatGPT Plus」と「ChatGPT Enterprise」のユーザーに、2023年10月からAPI経由で提供される予定だ。
OpenAIは、「最近登場した画像生成AIは、入力された単語や説明を無視する傾向があり、ユーザーはプロンプトエンジニアリングを学ぶ必要があった。だが、DALL-E 3は、与えられたテキストに忠実な画像を生成する能力が飛躍的に向上している」と述べている。
同じプロンプトでも、DALL-E 3が生成する画像は、DALL-E 2よりも大幅に改善されているとしている。

「An expressive oil painting of a basketball player dunking, depicted as an explosion of a nebula(ダンクシュートするバスケットボール選手を星雲の爆発として描いた油絵)」というプロンプトに対してDALL-E 2で生成された画像(左)とDALL-E 3で生成された画像(右)(提供:OpenAI)DALL-E 3はChatGPT上でネイティブに構築されており、ユーザーはChatGPTをブレインストーミングのパートナーとして、あるいはプロンプトを改善するために利用できる。
ChatGPTにアイデアを伝えると、DALL-E 3は画像に変換させるための詳しいプロンプトを自動生成する。またDALL-E 3が生成した画像が自分の意図したものと少し違う場合、ChatGPTにごく短い指示で微調整を依頼することもできる。
なお、DALL-E 2の場合と同様、DALL-E 3で作成した画像はユーザーのものであり、転載、販売、商品化に当たってOpenAIの許可は不要だという。
DALL-E 3は従来のバージョンと同様に、暴力的、アダルト、憎悪的なコンテンツの生成を制限する措置が講じられている。OpenAIは、画像がAIで作成されたものであることを人々が識別するのに役立つ方法も研究している。
DALL-E 3は、現存するアーティストのスタイルの画像を求めるリクエストを拒否するように設計されている。クリエイターは、OpenAIの将来の画像生成モデルのトレーニングに、制作した画像が利用されることを拒否することもできる。
OpenAI、企業用のAIアシスタント「ChatGPT Enterprise」を提供開始
OpenAIがWebクローラー「GPTBot」の文書を公開、クロールを禁止するには?
「Azure OpenAI Service」は1日100の新規顧客を獲得――Microsoft、AIビジネスの現在地はCopyright © ITmedia, Inc. All Rights Reserved.