今日はWebページ内のtableやul部分の内容を一瞬で取得するスプレッドシートの"超"便利関数について見ていきたいと思います。これは覚えるのはとても簡単で、しかもめっっっっっちゃくちゃ便利なので絶対に覚えて置くのがよいです。もうWebサイトからデータをこつこつコピペしていく作業から開放されていきます。
※ この関数はGoogleスプレッドシートでのみ有効でExcelでは使用できないのでご注意ください。
IMPORTHTML関数の使い方
今回はまず下の数式をスプレッドシートのセルにいれてみてください。まずはこの関数の便利さを知っていただきたいです。
1 2 3 |
=IMPORTHTML("https://ja.wikipedia.org/wiki/%E6%97%A5%E6%9C%AC%E3%81%AE%E5%B8%82%E3%81%AE%E4%BA%BA%E5%8F%A3%E9%A0%86%E4%BD%8D","table",3) |
入力いただけましたか?日本の都市のリストがばーっと表示されたんじゃないかと思います。これはウィキペディアの日本の都市一覧ページの都市一覧が表になっている部分を取得しています。
都市マスタなどを作るときにはこれをやれば一瞬で完了します。便利ですよね。
では関数についての説明を加えていきたいと思います。まず公式は以下です。
1 2 3 |
=IMPORTHTML("URL","tabelかlistどちらか","何番目のtabel(もしくはlistか)") |
「URL」はそのままWebページのURLです。ただし注意なのはこの関数はページ内のtableタグかulタグの中身しか取れないのでそれらのタグがあることを確認してください。調べ方は簡単で、調べたいWebページの空白のところを右クリックして「ページのソースを表示」をクリック。HTMLのソースが表示されるので「