By Decrypt – 2023/08/02 02:44:55 (JST)
Nvidiaの研究者たちは、Perfusionと呼ばれる新しいテキストから画像への個別化手法を開発しました。Perfusionは、フロッピーディスクに収まるコンパクトなAI画像生成ツールであり、トレーニングにはわずか4分しかかかりません。その小さなサイズにも関わらず、Perfusionは効率の面で大型のAI画像生成ツールを凌駕しています。Perfusionの主なイノベーションは、「Key-Locking」と呼ばれるもので、画像生成中に新しい概念をより一般的なカテゴリーに結び付けることで、過学習を回避します。これにより、AIは柔軟に個別化された概念を描写することができ、その核となるアイデンティティを維持します。Perfusionはまた、複数の個別化された概念を自然な相互作用を持つ単一の画像に組み合わせることも可能です。ユーザーは、100KBのモデルを調整することで、視覚的な忠実度とテキストの整合性のバランスを制御することができます。NvidiaのPerfusionモデルは、生成型AIの成長する分野で同社に優位性をもたらす可能性があります。
※これは引用元記事をもとにAIが書いた要約です (画像の権利は引用元記事に記載のクレジットに帰属します)
類似記事
- AI画像生成ツールが文章作成と数えることに苦戦する理由 (類似度: 86.8%)