ビッグデータ時代を生き抜くために――一生もののデジタルデータ解析解説書

レビュー

1
  • このエントリーをはてなブックマークに追加

ビット・バイ・ビット

『ビット・バイ・ビット』

著者
マシュー・ サルガニック [著]/瀧川 裕貴 [訳]/常松 淳 [訳]/阪本 拓人 [訳]/大林 真也 [訳]
出版社
有斐閣
ジャンル
社会科学/社会
ISBN
9784641174481
発売日
2019/05/13
価格
4,400円(税込)

書籍情報:版元ドットコム

ビッグデータ時代を生き抜くために――一生もののデジタルデータ解析解説書

[レビュアー] 佐藤嘉倫(東北大学大学院文学研究科教授)

ビッグデータをめぐる期待と恐れ

 現代では新しいテクノロジーが次から次へと社会に導入されている。いま大きく話題になっているテクノロジーは人工知能とビッグデータである。これらに対する人々の反応は、どちらも実像を把握しにくいことから生じる過剰な期待と恐れである。

 人工知能については、より効率的な社会を実現してくれるのではないかという期待とともに、人工知能が人々の仕事を奪う可能性や人工知能による人々の選別問題、人工知能が人間の知性を超えるシンギュラリティ問題など、さまざまな恐れに満ちた言説が流布している。

 ビッグデータをめぐる言説も同様である。ビッグデータによる効率的なマーケティングや人間行動の非常に詳細な解析の可能性が語られるとともに、プライバシーの侵害やデータの独り歩きを懸念する言説も多くみられる。

 このような社会状況において、本書はビッグデータを含むデジタルデータとその収集・解析方法の実像を読者に提示してくれる。しかも重要なことは、本書が細かい技術的なことを扱っているのではなく、デジタルデータを用いた研究の根本的な考え方を丁寧に解説していることである。根本的な考え方を身に着ければ、新しい技術が出てきても、その本質を理解し使いこなすことができる。その意味で、本書は正に「一生もののデジタルデータ解析解説書」である。以下では、簡単に本書の構成を紹介し、本書の特徴を述べ、最後に本書の意義を検討する。

本書の構成

 本書は7章構成からなる。「第1章 イントロダクション」では、本書が質問紙調査のような従来型社会調査を行ってきた社会科学者とビッグデータのようなデジタルデータを扱うデータサイエンティストを結びつける意図を持っていることを明確に述べている。そして、企業や政府のような他者が作ったレディメイドのデータ(典型例は企業の保有するビッグデータである)と研究者が自ら作成したカスタムメイドのデータ(典型例は社会科学者が質問紙調査で収集した調査データである)の長所と短所を理解して、両者を組み合わせることの有効性を示唆する。

 「第2章 行動を観察する」では、まず社会調査データとは異なり、ビッグデータは企業や政府などが研究以外の目的で収集していることに読者の注意を喚起し、ビッグデータの10の特徴を述べている。これらの特徴には社会科学者にとって有益なものもあればそうでないものもある。これらの特徴を理解することで、ビッグデータの等身大の実像を把握できる。

 第3章から第5章まではデジタルデータを用いた社会科学的研究の具体例を示しながら、いかに研究を推進するかを分かりやすく解説している。「第3章 質問をする」では、従来型の社会調査の長所と(デジタル時代における)限界を述べ、ウェブ調査のようなデジタル調査の有効性を提示している。とりわけ興味深いのは「3.6 ビッグデータにサーベイを結びつける」で、この節では両者を結びつけることでデータ解析のさまざまな可能性が広がることを示している。

 「第4章 実験を行う」では、一般的な実験について解説した後、適切な実験計画に基づいたデジタルな実験ならば、低コストで大人数の被験者を対象として実験を行えることを示している。確かにデジタルデータにはサンプルのゆがみが伴う。しかし適切な実験計画で統制群と実験群を構築すれば、大人数の被験者を用いた厳密な実験を行うことができる。

 「第5章 マスコラボレーションを生み出す」では、オンライン上で多くの人々(専門家のみならず一般市民も)に自分の研究に参加してもらう方法を提示している。市民参加型のオープンサイエンスの可能性を感じさせる章である。

 「第6章 倫理」は必読の章である。私はかねてからビッグデータ解析における研究倫理について関心を持っていた。本章では、ビッグデータを含むデジタルデータを扱う際に生じうる倫理的問題を詳細に検討し、それらを解決する方策を提案している。

 「第7章 未来」は、タイトルどおり今後のデジタルデータ解析の未来について述べている。それは、レディメイドデータとカスタムメイドデータのブレンド、参加者中心のデータ収集、倫理の中心問題化である。そして「社会調査の未来は、社会科学とデータサイエンスのコンビネーションになるだろう」(367頁)という本書の最も重要なメッセージで終わる。

本書の特徴

 本書の特徴は大きく5つある。第1に、社会科学者とデータサイエンティストの両方をターゲットとしている。社会科学者にはデジタルデータの解析方法やその有用性を語り、データサイエンティストには社会科学的に意味のあるデジタルデータ解析の進め方を説いている。

 第2に、読者の興味を引くような豊富な具体例を駆使して読者の理解を促進している。重要なことは、架空の例ではなく、既に出版されている社会科学の論文や著作を紹介しているので、現場の「ライブ感」を感じられることである。また本書で取り上げられている例に関心があれば、元の論文や著作を読んで理解を深めることができる。

 第3に、ほとんどの章に読書案内、問題、数学ノートが付いている。したがって、あるテーマに関心を持ったならば、読書案内に沿ってさらにそのテーマを深く探究することができるし、問題に取り組むことで理解を深めることができる。また本書を読みやすくするために、あえて本文中には数式を使っていない。そのために数学ノートが付いているので、数学的な背景を知りたい読者はそれらを読むことで厳密な理解をすることができる。

 第4に、読者に語りかけるような、とても分かりやすい文体で書かれている。非常に広い範囲にわたる高度な内容を平易な文章で書かれていることに著者のサルガニック氏の文才と本書の内容を読者に伝えたいという強い意志を感じることができる。また翻訳も非常に読みやすい。原著の雰囲気を壊さずにこなれた日本語に翻訳してくれた翻訳者の皆さんに敬意を払いたい。

 第5に、先にも述べたが、デジタルデータを用いた研究に関する倫理的問題を詳細に検討している。データ収集技術を修得すれば、従来型社会調査データよりもはるかに容易に、かつ低コストで大量のデジタルデータを収集することができる。このため、ともすればデータ収集、データ解析、研究成果の公表に関する倫理の問題が見過ごされる傾向がある。

 しかし実際は、本書も指摘しているように、多くの顕在的、潜在的問題が存在する。第6章ではそれらの問題を丁寧に検討している。

 ここで重要なことは、本書は「倫理原理主義」には立脚していないことである。あまり倫理的問題に拘りすぎると、研究自体を行うことができなくなってしまう。研究の現場にいるサルガニック氏は研究成果がもたらすプラスの効用と倫理的問題のバランスを考慮する、プラグマティックな立場に立っている。同じく研究の現場にいる私にとって共感できる態度である。

本書の意義

 再三述べてきたように、本書は社会科学者とデータサイエンティストの両方を読者として想定し、両者を架橋する意図を持っている。従来型の社会調査に従事してきた者として、私は本書を通じてデジタルデータ活用の可能性に大きな期待を抱くようになった。私を含めて従来型社会調査に携わってきた人の中にはデジタルデータに対して懐疑的な人も多いだろう。とりわけ無作為標本抽出されていないデータに対するアレルギーは大きい。

 しかし本書は、従来型社会調査データでもデータの歪みから免れられないこと、デジタルデータといえども適切に活用すれば従来型社会調査データ以上のことができることを示している。さらに、ビッグデータと従来型社会調査データを結びつける方法は今後の社会科学におけるデータ解析の新たな方向性を示している。

 本書で取り上げられている具体的な研究例や読書案内を見れば分かるように、世界ではデジタルデータを用いた研究が爆発的に増えている。しかし日本の社会科学、とりわけ私の専攻する社会学ではデジタルデータの利点をフルに生かした研究はそれほど進んでいない。

 その理由は大きく2つあるだろう。1つは(私も含めて)日本の社会学者の多くがデジタルデータに対する懐疑を持っているからであり、もう1つはデジタルデータを収集し解析する技術を有していないからである。そして懐疑を持っているから技術を修得する誘因を持たない。

 本書の翻訳が刊行されたことは、この状況を打破する可能性を有している。日本の多くの社会科学者が本書を読んで、デジタルデータ活用に関心を持ってくれることを期待する。

ごく個人的な感想

 私は2000年夏から1年間客員研究員としてコーネル大学社会学部に滞在した。コンピュータ・シミュレーションの一種であるエージェント・ベースト・モデル研究の第一人者のマイケル・メイシー教授と共同研究をするためである。

 そして、そこで当時大学院生だったサルガニック氏と出会った。気さくで人懐こい好青年の彼と私はすぐに仲良くなった。また学部時代に数学を専攻していた彼は、私の数理社会学の論文草稿を読んで数学面での有益なアドバイスをしてくれた。本書裏表紙カバーにある彼の写真にはそのような彼の温かい人柄がにじみ出ている。当時大学院生だった彼が今やデジタルデータ解析で世界の第一人者となり、本書のような優れた書物を世に問うようになったことを誇りに思う。

有斐閣 書斎の窓
2019年9月号 掲載
※この記事の内容は掲載当時のものです

有斐閣

  • このエントリーをはてなブックマークに追加