植生調査の凡例一覧をRSelemiumとrvestでスクレイピングしてxlsxデータにする

最新の凡例一覧をデータで公開してもらえれば済む話ですが、凡例Q&Aここのエクセルは更新されていないようなので、統一凡例一覧表スクレイピングしてみます。

ただ、凡例のサイトは生データのtableでなくて、javascriptで生成されており、rvestだけではスクレイピングできないのでSelemiumも利用します。

スクレイピングした凡例も、公開されているshpの属性中の凡例をすべては網羅していないのでご注意ください。

Selemiumの準備

以下のサイトを参考にしました。C:\seleniumに必要なファイルを入れてパスも通しておきます。javaが入っていない場合は、javaもインストールしておきます。
qiita.com

Rでスクレイピングする準備

RでRSeleniumとrvestとtydiverseのパッケージをインストールしておきます。

スクレイピングの実行

seleniumのサーバーを起動します。コマンドプロンプト

cd C:\
java -jar selenium-server-standalone-3.141.59.jar

以下のコードをRで実行すると、凡例一覧をエクセルで保存できます。10ページ目が空になっているので、そこだけ後から修正してください。

gist.github.com