株式会社ユー・エス・エス/上田写真製版所 ブログ

■デザイン印刷百科

【実録】Gemini 2.5 Proで顔検出プログラムを作ってみた!AIで、ここまでできる!

Adobe Stockの集合写真サンプル。顔検出プログラムで使用。
Gemini 2.5 Proを試してみた!AIに指示するだけでプログラミングができる時代



こんにちは。
東京・文京区 護国寺で、機関紙や広報誌の企画・編集・デザインを手がけている株式会社ユー・エス・エスです。

最近話題のAI、今回は、Googleの最新AI「Gemini 2.5 Pro」を実際に使ってみた結果をご紹介いたします。
(現在、無料ユーザーでも1日あたり100万トークンを利用できます)

●顔検出プログラムをAIに作成させてみた

Gemini 2.5 Proは、プログラム生成の精度が高いと話題になっています。
今回は、集合写真から顔を検出し、個別画像に切り出すプログラムを作成させてみました。

使用したのはAdobe Stockの集合写真。
以下の画像を元に、AIがどこまで対応できるかを検証します。

Adobe Stockの集合写真サンプル。顔検出プログラムで使用
Adobe Stockの集合写真サンプル。今回の顔検出プログラムで使用します


●Geminiへの指示と出力結果

まず、Google AI Studioでプロンプトを入力。

Google AI Studioで入力したプロンプトの画面。顔検出プログラムの指示文
Google AI Studioで入力したプロンプトの画面。顔検出プログラムの指示文

数十秒で、Mac上で動作するPythonコードが生成されました。

Gemini 2.5 Proが生成した顔検出用のPythonコードの一部。
Gemini 2.5 Proが生成した顔検出用のPythonコードの一部


早速実行してみたところ…


最初に出力された顔画像。意図と異なる結果になった例。
最初に出力された顔画像。意図と異なる結果になった例。

意図とは少し違う結果に。
そこで、すぐに修正指示を出しました。

AIへの修正依頼を行ったプロンプト内容
AIへの修正依頼を行ったプロンプト内容


すると、わずか数十秒で修正プログラムが完成
今度はイメージ通りの画像が完成しました。

修正後に出力された顔画像。意図通りの結果に
修正後に出力された顔画像。意図通りの結果に


以前のAIでは、プログラムを作成させてもエラーが発生し、修正を指示しても解決しないことが多かったのですが、Gemini 2.5 Proはわずか2回のやりとりで実用レベルの処理が可能になるほど、実用性の高いAIに!
より複雑なプログラムでは難易度が上がるかもしれませんが、専門的な知識がなくても、AIに指示を出すだけで簡単な業務改善ツールを作成できる時代になったと実感しました。


●おまけ:顔写真を一覧にまとめてみた

さらに応用として、切り出した顔写真を1枚の一覧画像として並べるプログラムも試しました。
集合写真をそのまま掲載するスペースがないときに、こうした加工はとても便利です。


Gemini 2.5 Proに以下のプロンプトを入力しました。

顔画像を一覧に並べるプログラムの指示文(プロンプト)
顔画像を一覧に並べるプログラムの指示文(プロンプト)

生成にかかった時間は約50秒。
1回の指示で問題なく動作するプログラムが作成されました。

顔画像を一覧に並べるプログラムを実行中の画面。
顔画像を一覧に並べるプログラムを実行中の画面
出力された顔写真の一覧画像。シート状に整列された状態。
出力された顔写真の一覧画像。シート状に整列された状態

●Gemini 2.5 Proは広報の味方?

AIの進化により、以前は外注や専門知識が必要だった作業も、簡単なプロンプトだけで完了できる時代が来ています。

  • 広報誌の画像加工に手間がかかっている
  • 集合写真の扱い方に悩んでいる
  • 紙とデジタルの連携を工夫したい

そんな広報担当者の皆さまへ。
私たちユー・エス・エスは、創業71年のノウハウとツールの活用を組み合わせ、一歩先の広報誌・機関紙づくりをご提案しています。

お問い合わせはこちらから

「ちょっと相談したいかも、、」と感じた方は、ぜひお気軽にご連絡ください。

👉 お問い合わせはこちら
📞 お電話でもどうぞ:03-3941-0530(平日 9:00〜17:00)

広報のお悩み、私たちと一緒に解決しませんか?

pagetop