戦略的データサイエンス入門(7)

第13章 データサイエンスとビジネス戦略 

  • データ分析的思考
    • そもそも受け入れてくれる・評価してくれるためには、理解のある経営陣の存在が必要
    • 十分な投資への理解(設備・人材)
  • データサイエンスによる競合優位
    • 独自の知的財産となる。
      • 適用されなくても、次に活かせる可能性がある
      • 可能性を試せる環境にある
    • 限られた資源の有効手段の選択
      • 競合他社には持たない情報
      • 優位にたつことで好循環。さらに競合が持たざる情報をもち、好循環
  • 優れたデータサイエンティスト
    • すごい人達はいっぱいいる。そういう人たちの知見を得る事が大事、
    • マネージメント力も評価のうち
      • ビジネス/サイエンスサイドで活発なコミュニケーション
        • 郷に入って郷に従っている
      • ビジネスの正確な理解(簡単な事柄に翻訳できるか)
      • 成果について明確に見当つけられる
        • データサイエンスは成果がみえづらい
        • 過去に成功したか否かが重要な指標になっている
        • ほんの小さな隙間にある眠っている情報から引き出している。時には莫大なコストがかかっているかもしれないし。。。
    • 彼らを惹きつける経営陣
      • 成長性のある企業か、環境があるか
  • データサイエンス事例の評価
    • ビジネス上の問題が明確か。あいまいではないか
    • 結果を評価する、有効性の基準が明確か
    • 大きな投資をする、その有効性の証明はできるのか
    • データ資産は揃っている
    • データを揃えるための投資の準備はあるのか
  • 企業体のデータサイエンス習熟度
    • 企業体の習熟度によって、取り組みの仕方は変わってきてしまう。
      • レベル相応の解決しかできない
    • ソフトウェア開発における能力習熟モデルと同様の理論

まとめ

  • 本書における「14章まとめ」はおいおいやる
  • Summary
    • 分析者視点よりもビジネス視点で見たデータサイエンスに関する本
      • 下流(前処理方法, 分類機の種類, etc..)よりも上流工程(分類器の評価方法, ビジネス上の目的に沿った目的関数の設定, etc…)に注目している
    • どのようにすれば、チームとしてデータ分析をいかすことができ、好循環に回すことができるか
    • データ分析に関する技術的な内容を網羅的かつ大雑把に記載している。
      • 初心者向きに作られているため、用語は多く出てくるが、数式は非常にsimpleに丸められている。
      • (想像できるが)昨今盛り上がりを見せている画像認識については一切触れていない
      • データサイエンス関して、一番最初に手に取る本の一つとしてカウントできると思う。
  • Good
    • ビジネス側の事情を理解できる。自分のような「プログラム書きます!やってみました!」のような考え方を、この本を読むことである程度排除できる。
      • 分析作業に特化した本ではない(この点は、先日園田くんが紹介した本が典型例)
      • モデル評価とデータ準備に関しては、かなりのページを割いている。この点は自分も疎いため、非常に勉強になった
    • 現実的な事例を多数あげたうえで、データ分析における重要なポイントを解説している
      • 本書では「データ収集に対して投資をすること」を要所要所で力説している
        • 「投資」「コスト」という言葉が非常に頻出する
    • ビジネス上の課題を分解して、ゴールを明確にし、作業に落とし込むことことの重要性を解説している。
    • データ分析は無限に続けられる可能性があるが、成果を上げなければ(意思決定者に理解させなければ)意味がない。