前回までのあらすじ
Yahoo!JAPANのサイトEdgeで開いて、「明日の天気」をクリックしYahoo!JAPAN 天気・災害のページまで移動が完了した。
データの読み取り

博士この表示の中に明日の0時の天気が書かれているよ。
この0時のこの部分が知りたい天気だよね。PADでどうやって文字を読み取るの?


Webサイトから文字列を探すので「ブラウザ自動化」-「Webページからデータを抽出する」のアクションを使ってみよう。
いつものようにアクションを追加するためダブルクリックしてね。

ダブルクリックするとこのような表示が出ているね。
抽出のためのデータが指定されていませんと書かれているので、これから天気のデータを選択します。ではEdgeでYahoo!JAPAN 天気・災害のサイトを表示させてみよう。UI要素の選択のように、マウスの近くに赤枠が表示されているはずだよ。

今回の場合、「晴れ」の文字の上にマウスを合わせて、右クリックして「要則値を抽出」-「テキスト:(’晴れ’)」を選択すると、ライブWebヘルパーに「晴れ」が選択できている状態になるよ。

以下のようになればテキストが抽出できていることになるので「終了」ボタンを押してPADのアクション画面に戻ろう。

取得したテキスト「晴れ」は実行すると「DataFormWebPage」変数にデータが取り込まれるよ。保存すれば今回のデータ抽出のアクションは終了だよ。


Yahoo!JAPANのサイトEdgeで開いて、天気の文字を取得するところまでを一連で動作させてみよう。
以下の表示になっているはずなので、再生ボタンをClickして起動してみよう。

しばらくして、PADのフロー画面にもどって、変数の値の結果に天気が表示されれば、操作成功だよ。

これでWebサイトから天気のテキストデータがPADに取得ができたね。これで2番目のシナリオの「Yahoo!JAPANサイトの中の天気を見る」は完成だね。

前回のUI要素のと似ているけど、UI要素の取得よりは今回のデータ抽出のほうが簡単に感じたよ。これで、Webサイトからデータが抽出できるのは、いろいろ使い道がありそうで楽しいね。これがよく言われる「Webスクレイピング」なんだね。
他にもいろいろデータを取ってみよう!!(^^♪
次回のあらすじ
天気データの取得が完了したので次のシナリオである。「Excelを立ち上げて、セルに書き込む」を学んでいこう。