PADアクション:Webからデータを抽出する

PAD アクション説明
<span class="red"><span class="blue">Robo2号</span></span>
Robo2号

今回は、「Webからデータを抽出する」のアクションを説明していきます。
このアクションは、Webページの各種データを変数に取り込むことができます。
Webからデータを抽出する」を使用する場合、下記のようにアクションを開いてみましょう。

アクションの位置

アクションの展開はアクション名をダブルクリックするか、フローエディタへのドラッグで可能です。

アクション設定画面

赤枠には、データを取得したいWebブラウザーインスタンスを選択します。本アクションの前に事前に対象のWebページをインスタンスに紐付けて開いておいてください。

青枠には、データ取得のタイムアウト時間が設定できます。

緑枠は、Webから取得したデータを保管する場所を指定します。「変数」または「Excelスプレッドシート」いずれかを選択します。「変数」を指定した場合、Datatable形式で保存され、「Excelスプレッドシート」を指定した場合、抽出したデータを含むエクセルインスタンスに設定されます。

上記3か所のほかに、下記の通り、データの抽出が必要です。

詳細なデータの抽出方法は次項に記載します。

Webヘルパー画面の使用方法

「Webページからデータを取得する」アクション設定画面を開いた状態で、別のウインドでデータを取得するWebページを開いておきます。このWebページは、アクション実行時は、赤枠のブラウザーインスタンスに紐付けておくことが必要です。。

データを取得する際は、以下の「ライブWebヘルパー-Webページからデータを抽出」が画面に表示されていることを確認します。

Webページの中から、データを取得する場所にマウスを合わせると、データが赤枠で認識されるので、取得したいデータであることを確認し、マウスを右クリックします。
(下記の場合21℃となります)

要素の値を抽出を選択すると、取得したいデータ種類が複数、赤枠のように表示されるので希望するデータを選択してください。最上段のテキストを選択(クリック)した場合は、「最高気温21℃」が抽出できることが示されています。

抽出が成功すると「ライブWebヘルパー-Webページからデータを抽出」のウインドに、抽出データが表示されているので、データに間違いがないことを確認してから、右下の終了ボタンをクリックして要素の抽出を終了します。

画面上、今回の事例の場合「最高気温21℃」となっていますが、毎回このテキストが取得されるのではなく、動的なWebページの場合、この位置に表示されているデータが取得できます。

別日は、最高温度15℃と表示されているかもしれません。

Webページには、複数ページで区切られ、表示されている場合があります。
この場合は、「次へ」など次ページに移動するリンクを「要素はページャーとして設定」を選択することで複数ページのデータを同時に取り出すことができます。

Robo1号の感想

<span class="red">Robo1号</span>
Robo1号

これがWebスクレイピングって言うんだね。これでWebページから自由にデータが自動で取得できるね。ただ、スクレイピングはWebによっては禁止されている場合もあるらしので、各サイトの規約に従ってデータ取得してね。


タイトルとURLをコピーしました