ライアン・H・リンドリスバッハー
ビッグデータはデータマイニングの分野では大流行していますが、通常は大企業のみに限られています。スモールデータは一般にビッグデータのサブセットと考えられています。たとえば、Google は検索に使用される何兆ものレコードを保持していますが、それ自体は役に立ちません。Google で何かを検索すると、通常、最初のページに表示される結果は 10 件から 15 件だけです。これを実現するために、Google はビッグデータからスモールデータを生成しました。真の価値はスモールデータのサブセットにあります。ただし、スモールデータはビッグデータのサブセットであるという考えは、スモールデータの唯一の定義ではありません。スモールデータのみを生成する中小企業も、データマイニングの実践から恩恵を受けることができます。スモールデータのみを見ると、どのような問題が生じますか?