抄録
D-016
サンプリングを応用したビッグデータの新処理方式
◎高柳健太・山浦恒央(東海大)
現在ビッグデータが注目されている.インターネットにつながる様々なコンピュータから生み出されるビッグデータは,合計すると数百テラ(1テラは約1兆)バイト以上とされており,2020年には40ゼタ(1ゼタは1兆の10億倍)バイトになると予測されるほど,データ量が膨大なため処理時間の長期化,処理のオーバーフローなど様々な懸念も指摘されている.本稿では,ビッグデータをサンプリングによりスモールデータ化,全件処理の結果が出るよりも早い段階で実用的な精度を持った「選挙速報」を出す処理方式を提案する.