
Python + SeleniumでWebスクレイピングを始めよう
1. Seleniumとは?
SeleniumはWebブラウザを自動操作できるPythonライブラリです。
フォームの入力やクリック操作なども可能なので、通常のスクレイピングライブラリ(requests + BeautifulSoup)では対応が難しいJavaScriptで動的に生成されるページの取得もできます。
2. 環境準備
-
Pythonのインストール
3.8以上を推奨します。 -
Seleniumのインストール
-
WebDriverの準備
-
Chromeを使う場合は ChromeDriver をダウンロード。
-
バージョンはChromeブラウザと一致させてください。
-
3. サンプルコード:Google検索を自動化
以下のコードは、Google検索ページにアクセスし、「abc」というキーワードを自動入力 → 検索 → 結果ページを表示する例です。
4. ポイント解説
-
WebDriverWaitを使うことで、要素が表示されるまで待機できます。 -
By.NAMEやBy.IDでHTML要素を特定します。 -
JavaScriptレンダリングが完了するまで待てるので、動的ページにも対応可能です。
5. 応用例
-
ログインが必要なページでのフォーム自動入力
-
特定データの定期取得(Task Schedulerやcronで自動化)
-
データ取得後、Pandasで分析