内容説明
インターネットにたくさんあるデータ。利用したいと思ってみても、いちいち手でコピペしてたのでは効率的ではありません。そこで使われるのがクローリングという自動巡回と、スクレイピングというデータ抜き出しの手法です。本書は、ExcelとVBAを駆使し、簡単かつ実用的にデータ収集を行う方法を解説していきます。
目次
第1章 クローリングとスクレイピングに必要な基礎知識
第2章 Excel VBAでInternet Explorerを制御する
第3章 Excel VBAでHTMLタグを制御する
第4章 さまざまなファイルを解析する
第5章 クローリング/スクレイピングの運用について
6章 プログラムが文章を理解するために
7章 robots.txtを考慮したクローリングサンプル
Appendix
著者等紹介
五十嵐貴之[イカラシタカユキ]
1975年2月生まれ。新潟県長岡市(旧越路町)出身。東京情報大学経営情報学部情報学科卒業。Vectorから20万回以上ダウンロードされている「かんたん画像サイズ変更」などのフリーソフトの開発者。2019年5月より、東京情報大学校友会信越ブロック支部長に就任予定(本データはこの書籍が刊行された当時に掲載されていたものです)