Pythonで画像を認識してクリックするには？

2022年10月7日

「PyAutoGUI」を使っていると、ある画像が表示されるまで待機して、表示されたらクリックしたい、というケースに出くわします。
公式ドキュメントを読むと、びっくりするくらい簡単な方法が書かれていたので、それをまとめました。

画像をクリックするには？

完全一致であれば、「pyautogui.click()」の引数に検索したい画像ファイルのパスを指定するだけです。

import pyautogui
 
# pyファイルと同じフォルダに保存した「a.png」と完全一致した所をクリックする
pyautogui.click('a.png')

上記のコードは、内部でこのような処理を行っているそうです。

import pyautogui
 
# 画像の角4つの座標を取得する
img_location = pyautogui.locateOnScreen('a.png')
 
# 見つかった画像の中央の座標に変換する
img_x, img_y = pyautogui.center(img_location)
 
# 変換した座標をクリックする
pyautogui.click(img_x, img_y)

「pyautogui.locateOnScreen()」のオプションに「confidence」というものがあり、画像を見つける精度を指定できます。
つまり、似た画像もクリック対象にしたい場合は、「pyautogui.locateOnScreen()」で座標を見つけて、中央の座標に変換し、「pyautogui.click()」する流れです。
なお、「confidence」を使うには外部ライブラリ「OpenCV」がインストールされている必要があります。また指定する数値は何でも良いものの、「0 < n < 1」が実効のある範囲です。

import pyautogui
 
# 画像ファイルと似た所の座標を取得する
img_location = pyautogui.locateOnScreen('a.png',confidence=0.9)
 
# 見つかった画像の中央の座標に変換する
img_x, img_y = pyautogui.center(img_location)
 
# 変換した座標をクリックする
pyautogui.click(img_x, img_y)

画像が表示されるまで待つには？

「pyautogui.locateOnScreen()」は、画像が見つからなかった時に「None」を返します。
ゆえに、「while」と組み合わせることで画像が表示されるまで待つことができます。

import pyautogui
import time
 
while pyautogui.locateOnScreen('a.png',confidence=0.9) == None:
    time.sleep(1)

複数の画像を認識したい場合は？

「pyautogui.locateOnScreen()」に代えて、「pyautogui.locateAllOnScreen()」を使います。

import pyautogui
 
for a in pyautogui.locateAllOnScreen('a.png',confidence=0.8):
    print(a)
# ⇒ Box(left=〇, top=〇, width=〇, height=〇)

2番目に見つけた画像だけに処理をするには？

「pyautogui.locateAllOnScreen()」の戻り値に「list()」を使い、配列に変換すると可能です。

import pyautogui
 
a = pyautogui.locateAllOnScreen('a.png',confidence=0.7)
print(list(a)[1])
# ⇒ 2番目に見つかった画像の座標が取得できる

まとめ

Pythonで画像をクリックしたい場合は、「pyautogui.click('【画像ファイル名】')」の1行でできます。
似た画像は「pyautogui.locateOnScreen('【画像ファイル名】',confidence=)」で、認識できますし、複数の画像は「pyautogui.locateAllOnScreen()」を使えば操作できます。
画像ファイルの作成でつまづいたところがあって、スクリーンショットを切り抜いて作ったのに完全一致しないのはどういうことだ？と、悩んでいたら、使っていた画像編集ソフトが保存時に自動で圧縮をかけていたのが原因だった、というオチでした。

Pythonでパソコンを操作する【目次】

-Python
-.center(), .locateAllOnScreen(), .locateOnScreen(), click(), confidence, None, OpenCV, PyAutoGUI, Python, while, 画像認識

コメントコメントをキャンセル

: Python

「Python + Selenium」でウィンドウサイズを変えるには？

あるサイトをPythonで自動化しようとしたら、要素が取れないことがありました。原因は、レスポンシブwebデザイン。サイズによって要素が変わるため、エラーになっていたのです。それなら、ウィンドウ ...

: Python

Pythonで選択したウィンドウのスクリーンショットを撮るには？

Pythonでスクリーンショットを撮ることができることは分かりました。ただ、できるのは、全体だったり、領域を座標で指定したり。ショートカットキー「Alt + PrintScreen」の、選択したウ ...

: Python

Pythonのinput関数で改行を扱うには?

前回までで、画像編集に関して1通りやりたいことは終わりました。最後に、汎用性を持たせるため、画像に入れたい文字列を「input関数」で入力することに……したところで、問題発生です。「input関数 ...

: Python

「Python + Selenium」でブラウザを操作したら、エラーが出た話

いつものように、「Python + Selenium」でブラウザを操作したら、途中で止まりました。エラーメッセージには、「unknown」と、あります。いやいや、パソコン君、君が分からなければ、私 ...

: Python

画像にも透け感を!Pythonで半透明の図形を描くには？

前回、画像に文字入れをするにあたり、四角い下地を作って文字を見やすくしました。しかし、せっかくの画像が見えないのも、なんかもったいないなぁ。文字を目立たせつつ、画像も見える、半透明の図形を描き方を ...

Pythonでタイトルと部分一致したウィンドウを取得するには？

ファミリーマートでAmazonギフト券が還元率10%以上で購入できるというので試してみた

サイト内検索

執筆者

ISAO KUBO

オンライン将棋教室香の講師です。
免状は三段、将棋ウォーズは四段、81dojoは五段で指しています。

好き：将棋/コンピューター/プログラミング/健康/効率/蕎麦/コーヒー/日向坂46/自然の摂理
嫌い：不健康/タバコ/ジャンクフード/固定観念

教室ページはこちら

最近の投稿

パソコン・スマホ

片手でも撮れる!! iPhone SEでスクリーンショットを撮る方法3つ

iPhone SE（第3世代）を買って約1年経ちますが、いまだ新しい発見があって面白いです。今回はスクリーンショット。どうやって撮るんだろう？と、撮り方を調べていたら、私には逆立ちしても思いつかない方法があったので、書いてみます。基本の撮影方法「サイドボタン + ホームボタン」で撮影します。 ※引用：Apple公式アップル公式によると、「Touch ID」（いわゆる指紋認証できるタイプ）はホームボタンを使い、「Face ID」（顔認証タイプ）は音量を上げるボタンを使います。 &nb ...

JavaScript

JavaScriptでiframe内の要素を取得・操作するには？

いつものようにJavaScriptでHTML要素を取得しようとしたら、エラーが出ました。なんで？と、思って、Webページのソースを見たら、iframeで作られています。じゃあ、「.getElementsByTagName('iframe')」でiframe要素を取得して「.getElementsBy～」でアクセスすればいいじゃん？と、思ったら、これまたエラー。これに、ある単語を書き加えると正しく動くので、その構文を書き留めておきます。コードの書き方は？ iframe要素に対して「co ...

キャッシュレス

Revolutのチャージ手数料導入が延期になりました

以前、Revolutへのクレジットカードチャージで手数料がかかるようになると、投稿しましたが、導入日の4月17日に延期のメールが届きました。しばらくは手数料無料で使えるようです。いずれ手数料が導入されると予想されるので、いつでも別の決済手段に移れるように準備しておくのが良いでしょう。

Python

Python+Seleniumでブラウザをスクロールさせるには？

最近は遅延読み込みを採用するサイトが多くなってきました。参照したい要素が画面外にある場合、読み込んでいないので取得できません。つまり、要素が画面内に入るまでスクロールする必要があるのです。では、「Python + Selenium」でブラウザをスクロールさせるにはどうするのか？その方法をまとめます。コードの書き方は？ JavaScriptの「window.scrollTo()」をPythonの「execute_script()」で実行します。 driver.execute_scri ...

キャッシュレス

今までの使い方では損!? Revolutへのクレジットカードチャージで手数料がかかるようになります

Revolut（レボリュート）の発表によると、2023年4月17日（月）からクレジットカードチャージした際に1.7%の手数料がかかるようになります。例えば、1.0%還元のクレジットカードでチャージしても、Revolutで1.7%取られると、0.7%分損するわけですね。今まで国内でお得に使っていたけれど、使い方を変えなくてはいけません。どう変えようか、現時点での考えをまとめてみます。 ※4月18日更新　チャージ手数料の導入が延期されています。公共料金の支払いはどうするか？公共料金の支 ...