画像生成AIで商品撮影コストをゼロに。ECサイト運営者が実践した完全ガイド

画像生成AIで商品撮影コストをゼロに。ECサイト運営者が実践した完全ガイド
シェア:

「また今月も撮影費が飛んだ」——ECサイト運営者が抱えていた慢性的なコスト地獄

ハンドメイドアクセサリーのECサイトを始めたのは3年前のことだ。最初は趣味の延長で、月に数十個売れれば十分だと思っていた。ところが口コミとSNSが重なって、今では月商300万円規模まで成長してしまった。嬉しい悲鳴のはずが、規模が大きくなるにつれて「商品撮影」というコストの塊が経営を圧迫し始めた。

毎月新作を20〜30点リリースするたびに、フォトグラファーへの外注費が発生する。相場は1カット3,000〜5,000円。背景違いや角度違いを含めると1商品あたり10〜15カット撮影するので、1商品あたり3〜7万円。これが月に20商品ともなれば、フォトグラファー費用だけで月15万円に達していた。さらに撮影のための小道具(ドライフラワー、キャンドル、テーブルクロスなど)や背景紙の購入・レンタルで月3万円。合計月18万円が「商品を見せるためだけ」に消えていた。

年間にすると216万円。利益率が高いビジネスとはいえ、この数字は毎月眺めるたびに胃が痛くなった。しかも撮影は「納期」との戦いでもあった。新作のリリースに合わせてフォトグラファーのスケジュールを押さえる必要があり、急な商品追加には対応できない。「この商品、今すぐ出したいのに撮影が2週間後まで埋まってる」という状況が何度もあった。

そこで2023年末から、画像生成AIの本格活用を始めた。結論として、月18万円のコストを月1.5万円まで圧縮することに成功した。この記事では、その具体的なプロセスを——失敗談も含めて——包み隠さず書く。

AI導入前夜:「プロに任せるのが一番」という思い込みの崩壊

正直に言うと、最初は画像生成AIに懐疑的だった。「アクセサリーのような繊細なデザインをAIが再現できるわけがない」「商品画像はプロが撮るべき」という思い込みがあった。実際、2023年の春ごろにMidjourneyを少し触ってみたことがあったが、指輪を生成させたら「なんとなく指輪っぽい何か」が出てきただけで、自分の商品とは似ても似つかなかった。その時点で「やっぱり無理だ」と諦めた。

転機は2023年10月。Adobe MAX(Adobeの年次カンファレンス)の配信を見ていて、Adobe Fireflyの「生成塗りつぶし(Generative Fill)」のデモに衝撃を受けた。商品写真の背景だけを選択して、テキストで「秋の森の中のウッドテーブル」と入力すると、商品はそのままに背景だけがリアルに変わっていく。これを見た瞬間、「商品をAIで生成するんじゃなく、背景をAIで作ればいいんだ」という発想の転換が起きた。

この「商品は実撮影、背景はAI生成」という組み合わせアプローチが、後に自分のワークフローの核心になる。

ツール選定:なぜAdobe FireflyとMidjourneyを選んだか

画像生成AIのツールは山ほどある。DALL-E 3、Stable Diffusion、Canva AI、Leonardo.AI……。それぞれ試した上で、最終的にAdobe FireflyとMidjourneyの2本立てに落ち着いた理由を説明する。

Adobe Firefly:商業利用の安心感と既存ワークフローへの統合

ECサイトで使う画像は商業目的だ。Stable DiffusionやMidjourneyは学習データの著作権問題がグレーゾーンとして指摘されることがある(特に2023年時点では)。Adobe Fireflyは「Adobe Stockの画像や著作権切れのパブリックドメイン素材のみで学習した」と明言しており、商業利用に関するリスクが最も低い。これは個人事業主として非常に重要な判断基準だった。

また、Adobe Creative Cloudをすでに契約していたため、Photoshopに統合されたFireflyの「生成塗りつぶし」機能をそのまま使えた。追加コストゼロで利用できる点も大きかった(Adobe Creative Cloudは月6,248円)。

Midjourney:背景シーンのクオリティが圧倒的

「カフェのテーブルの上に置かれたアクセサリー」「北欧スタイルのインテリアの中のジュエリー」といった「シーン画像」を単体で生成する用途では、Midjourneyのクオリティが他を圧倒していた。特にv6以降の写実的な描写力は、ECサイトの商品画像として使えるレベルに達している。

月額プランはBasicプラン(10ドル/月)からあるが、商用利用するならStandardプラン(30ドル/月、約4,500円)以上が必要。私はStandardプランを契約した。

DALL-E 3(ChatGPT Plus経由)も試したが、写実的なシーン画像の生成においてはMidjourneyに軍配が上がった。DALL-E 3はテキスト生成との連携や簡単な操作性では優れているが、「プロカメラマンが撮ったような写真」を目指すならMidjourneyが現時点では最適解だ。

具体的なワークフロー:5ステップで商品画像を完成させる

実際の作業手順を、シルバーリングの商品画像を作る例で説明する。

Step 1:スマートフォンで白背景の商品写真を撮影(所要時間:5〜10分)

まず商品の「素材写真」を自分で撮影する。使うのはiPhone 14 Pro。白い画用紙を机に敷き、自然光の当たる窓際に置いて撮影するだけだ。三脚は100均で買った簡易なものを使っている。

このステップで重要なのは「完璧に撮ろうとしない」こと。背景が白くてピントが合っていれば十分。後でAIが背景を差し替えるので、背景の質は問わない。ただし商品自体にピントが合っていることと、影が極端に強くないことは守る。

Step 2:Photoshopで商品を切り抜く(所要時間:2〜3分)

PhotoshopのAI機能「被写体を選択」を使えば、ほぼワンクリックで商品だけを選択できる。白背景なのでさらに精度が高い。選択範囲を確認して微調整し、レイヤーマスクを作成する。

Step 3:Adobe Fireflyの「生成塗りつぶし」で背景を生成(所要時間:5〜10分)

切り抜いた商品写真をPhotoshopで開き、背景レイヤーを選択した状態で「生成塗りつぶし」を起動する。テキストボックスに背景のイメージを入力する。

実際に使ったプロンプトの例を挙げる:

「Rustic wooden table with dried flowers and soft autumn light, shallow depth of field, lifestyle photography」

「Minimalist white marble surface with small green plants, natural morning light, clean and elegant」

「Dark moody background with bokeh lights, luxury jewelry photography style, black velvet surface」

日本語でも動作するが、英語の方が圧倒的にクオリティが高い結果が出る。各プロンプトで3〜4バリエーションが自動生成されるので、最も自然に見えるものを選ぶ。

Step 4:Midjourneyでシーン画像を生成し、合成(所要時間:15〜20分)

Adobe Fireflyだけでは対応しきれない「複雑なシーン」——例えばカフェのテーブルに複数の小道具を配置したようなシーン——はMidjourneyで生成する。

Midjourneyで使ったプロンプト例:

「Cozy cafe table scene, wooden table, small coffee cup, dried rose petals, soft warm light from window, top-down view, empty space in center for product placement, photorealistic, --ar 1:1 --v 6」

「Scandinavian interior flat lay, white linen fabric, eucalyptus leaves, small candle, empty center space, overhead shot, natural light, --ar 4:5 --v 6」

ここで重要なのが「empty space in center for product placement」というフレーズ。商品を後から合成するための「空白スペース」をあらかじめ画像の中に作っておく指示だ。これがないと商品を置く場所がなくなる。

生成したシーン画像をPhotoshopで開き、先ほど切り抜いた商品をレイヤーとして配置。サイズ・角度・影を調整して自然に見えるよう合成する。影はPhotoshopの「ドロップシャドウ」ではなく、商品の元写真から影を作り直す方が自然に見える。

Step 5:色調・光源の統一(所要時間:5分)

合成した画像は、商品と背景の光源・色温度が微妙にずれていることがある。Photoshopの「色相・彩度」「カーブ」「Camera Raw フィルター」を使って統一感を出す。特に意識するのは「商品の影の方向と背景の光源方向が一致しているか」という点。ここがずれると一気に合成感が出てしまう。

ぶつかった壁:最初の2週間は失敗の連続だった

理論は理解できても、実際にやってみると壁だらけだった。

失敗1:商品の細部がAIに変えられてしまう問題

最初、「商品ごとAIに生成させよう」と試みた時期があった。「Silver ring with delicate floral engraving, on wooden table」といったプロンプトを書いても、出てきたのは「それっぽい指輪」であって、自分の商品ではない。刻まれた模様が全然違う、石の色が変わっている、全体のシルエットが微妙に異なる……。

当然といえば当然だ。AIは「指輪らしい何か」を生成するのであって、「私のこの商品」を再現する能力はない(少なくとも現時点では)。この失敗で「商品はあくまで実写、AIは背景だけ」という原則が確立した。

失敗2:合成の「浮き感」が消えない

背景を生成して商品を合成しても、最初の頃は明らかに「切り貼り感」が出ていた。原因を調べると、主に3つの要因があることがわかった。

  • 光源の方向が一致していない:背景は左から光が当たっているのに、商品は正面から光が当たっている
  • 解像度の差:Midjourneyで生成した背景が1024×1024pxなのに、商品写真が4032×3024pxで、縮小時に質感が変わる
  • 商品の輪郭が硬すぎる:切り抜きが完璧すぎて、現実の「空気感」がない

特に3つ目が厄介だった。プロの写真でも、被写体の輪郭はわずかにボケていたり、背景の光が滲んでいたりする。AIで切り抜いた商品は輪郭が「完璧にシャープ」で、それが逆に不自然さを生んでいた。

失敗3:Midjourneyのプロンプトが思い通りにならない

最初はプロンプトを日本語で書いていた。「秋の森の中のウッドテーブル、ドライフラワー、柔らかな光」——これでも一応生成されるが、クオリティが英語に比べて明らかに落ちる。また「empty space in center」を指定しても、中央に物体が生成されてしまうことが多かった。

試行錯誤の末、「中央に空白を作る」ための有効なプロンプトパターンを発見した:

「flat lay photography, items arranged around the edges, large empty center area, negative space composition」

「negative space(ネガティブスペース)」という写真用語を使うことで、AIが「意図的な空白」として認識してくれるようになった。

失敗を乗り越えた改善策:3つのテクニック

改善1:「エッジをぼかす」処理を必ず入れる

商品レイヤーの輪郭に対して、Photoshopの「フィルター → ぼかし → ガウス」を0.3〜0.5px程度かけるだけで、輪郭の「硬さ」が劇的に改善した。わずかな数値だが、これがあるとないとでは合成のリアリティが大きく変わる。

改善2:商品の下に「反射・影」を手動で追加する

テーブルに置いた商品には、必ず「テーブルへの反射」や「テーブルに落ちる影」が生まれる。これをPhotoshopで手動で作成する。商品レイヤーを複製→垂直方向に反転→不透明度を20〜30%に下げ、「乗算」モードにする。これだけで「ちゃんと物理的にテーブルに置いてある感」が出る。

改善3:Camera Raw フィルターで「フィルム感」を足す

デジタル合成の「クリーンすぎる感」を消すため、最終的な画像全体にCamera Rawフィルターをかけ、「粒子(グレイン)」を5〜8程度追加する。これにより商品と背景が同じ「質感」に統一され、一枚の写真として撮影されたような自然さが生まれる。

実際のコスト比較:導入6カ月後のデータ

AI導入から6カ月が経過した時点での実績を数字で示す。

  • フォトグラファー外注費:月15万円 → 0円(年間180万円削減)
  • 小道具・背景紙費用:月3万円 → 0円(年間36万円削減)
  • Adobe Creative Cloud:月6,248円(導入前から契約済みのため実質追加コストゼロ)
  • Midjourney Standardプラン:月約4,500円
  • 合計AIツール費用:月約1万円(Adobe CC含めると約1.5万円)
  • 純削減額:月約16.5万円(年間約198万円)

さらに数字に表れない効果もあった。撮影のスケジュール調整が不要になったため、新商品のリリースサイクルが「月2回」から「週1〜2回」に変わった。商品が完成してから最短で翌日にはECサイトに掲載できる。これによるコンバージョン率への影響は計測が難しいが、直感的には売上への貢献度は高い。

また、同じ商品に対して複数の「シーンバリエーション」を簡単に作れるようになった。「春らしいパステルカラーの背景バージョン」「クリスマスシーズン向けのバージョン」「シンプルなミニマリスト向けバージョン」を1商品あたり3〜5パターン用意し、SNSやメルマガで使い回している。以前は1商品1〜2カットだったのが、今は5〜10カット持てるようになった。

商品画像のクオリティは下がったか?——購入者の反応

「AIで作った画像は、購入者に見抜かれないか?」という疑問は当然あると思う。

結論から言うと、6カ月間でAI生成背景について購入者からクレームが来たことは一度もない。むしろ「商品写真がおしゃれになった」「雰囲気が伝わりやすくなった」というコメントが増えた。レビュー欄に「写真通りの商品が届いた」という記述も増えており、商品と画像の乖離(詐欺的な印象)も起きていない。

これは「商品はあくまで実写」という原則を守っているからだと思う。商品の色・形・質感は実物通りに撮影された写真を使っており、背景はあくまで「世界観を演出するもの」として機能している。消費者が商品を選ぶ際に見ているのは商品本体であり、背景がAI生成かどうかは購買判断に影響しない。

法的・倫理的な注意点:商業利用で見落としがちなこと

画像生成AIを商業目的で使う場合、いくつか確認しておくべき点がある。

Adobe Fireflyは商業利用を明示的に許可しており、生成した画像の著作権はユーザーに帰属する(Adobe Creative Cloud利用規約に基づく)。これは商業利用において最も安心できる選択肢の一つだ。

Midjourneyは有料プラン(Basic以上)であれば商業利用が可能。ただし、生成された画像の著作権についてはやや複雑な議論があり、完全な「著作権所有」を主張できるかは法的にグレーな部分もある。現時点では「商業利用の許諾はある」が「完全な著作権所有は不明確」という理解が現実的だ。

また、生成した画像に他者の商標・キャラクター・著名人の顔などが含まれていないか確認することも必要だ。プロンプトに固有名詞(ブランド名など)を含めると、その要素が混入するリスクがある。

同じ悩みを持つEC運営者へ:今すぐ始めるための最小ステップ

月18万円のコストを抱えていた自分が、今では月1.5万円のツール費用だけで同等以上の商品画像を作れている。ただし「すぐに完璧にできる」とは言わない。最初の1カ月は試行錯誤で、「プロに頼んだ方がマシだ」と思う瞬間も正直あった。

それでも続けた理由は単純で、「学習コストは一度払えば終わり、外注費は永遠に続く」という計算だ。

今から始めるなら、最小ステップはこうだ:

  • Week 1:Adobe Creative Cloudを契約してPhotoshopのFirefly「生成塗りつぶし」だけを試す。既存の商品写真の背景を変えるだけでいい。
  • Week 2〜3:Midjourneyの無料トライアルでシーン画像の生成を練習する。プロンプトのパターンを10〜20個作ってストックする。
  • Week 4:実際の商品画像に適用して、ECサイトに掲載してみる。購入者の反応を見る。

「完璧な画像が作れるようになってから本番に使おう」と思っているといつまでも始められない。80点の画像を今週出す方が、100点の画像を3カ月後に出すより価値がある。ECサイトは常に動いており、掲載されていない商品は売れないのだから。

画像生成AIは「プロカメラマンの代替」ではなく「商品の世界観を低コストで表現するツール」だ。この位置づけを間違えなければ、EC運営者にとって今最も費用対効果の高いAI活用の一つになり得る。

シェア: