購入価格:2178円
評価:
この記事は約1分11秒で読めます
現代の仕事は、地道に手を動かせばいいってもんじゃないことを再認識させられる一冊。
データ収集に限らず、何か新しい仕事をする時には、既存の知識で手を動かす前に、もっと効率的なより良い方法がないかを調査する。これがとにかく重要。
ネット上にはいろいろな情報が公開されていて、プログラムを使うと自動で集めることができます。この「ネット上に公開されているデータをかき集めること」を「クローリング」といいます。ただし、集めたデータはそのまま使えるとは限りません。多くの場合は、データを解析して必要なデータを取り出すことが必要になります。この「収集したデータを解析して、必要なデータを取得すること」を「スクレイピング」といいます。
Web APIとは、「Web上の他のコンピュータの機能を、HTTPを使って利用できるしくみ」のことです。例えば、GoogleのWebAPIを使えば、あなたのプログラムから検索やマップの機能を利用することができます。Amazonや楽天などのWeb APIを使えば、あなたのプログラムから商品検索の機能を利用することができます。
CSVとは、Comma(カンマ)Separated(区切られた)Value(値)の略です。基本的にカンマで区切られたデータですが、タブで区切られることもあります。タブで区切ったものをTSV(Tab-SeparatedValues)と呼ぶこともあります。