トレンドニュースサイト STRAIGHT PRESS【 ストレートプレス 】

株式会社truestar

データの前処理ゼロへ。分析者のための加工済みオープンデータをクラウド共有。

このエントリーをはてなブックマークに追加

株式会社truestar(本社:東京都渋谷区、代表取締役社長:藤 俊久仁、以下truestar)は、データ分析者が即座に分析に取り組めるように加工したオープンデータをデータ代無料で共有するサービス「Prepper Open Data Bank」を、2021年7月30日より開始致します。

データ分析のボトルネックである “データプレパレーション”

昨今の技術革新により、RPA(Robotic Process Automation)、MA(Marketing Automation)、BI(Business Intelligence)ツールにとどまらず、AIや機械学習をノーコードで行える分析ツールも数多く存在するようになりました。もはやデータ分析は一部のデータサイエンティストだけが行う業務ではありません。

これらのツールに不可欠であるデータに関しては、公的な人口統計などの他、オルタナティブデータと呼ばれる外部調査データ、twitterなどのSNSデータ、IOT端末から取得されるデータなど、自社のPOSデータや顧客データ以外にも比較的簡単に入手できるようになってきています。

その一方で、近年は『データ分析の8割は前処理』といったフレーズを日本でも見聞きすることが増えました。データの前処理(データプレパレーション)がデータ分析の課題として顕在化し、分析者の負担になっているのです。有償か無償かを問わず、多くのデータにおいて、分析を行うための前処理としてデータの抽出・変換・加工・書き出し(いわゆる『ETL』)を求められ、本来行うべきデータ分析に入るまでに何時間も費やしているのが実状です。

前処理の例

ウェブサイトからCSVで多数のファイルをダウンロード
メールで送られてきたパスワード付のZipファイルの解凍
APIの仕様やデータの定義を確認・理解
不要なヘッダ行、使わない行(総計や小計など)や列の削除
分析基盤のDWHにアップロード
データ更新時のデータ入れ替え

など

データ分析者の後方支援サービス『Prepper』

truestarは創業以来、データ分析やBIツールの実装を国内外合わせて延べ50社以上に提供しており(※事業承継前の実績含む)、お客様に代わってデータ分析の前処理を日常的に実施しています。その中で蓄積された知見やスキルを活用し、データ分析者の後方支援のために展開しているサービスが『Prepper』です。

様々なデータと様々なデータ分析ソリューションをシームレスにつないだデータ分析エコシステムを構築するには、正確でわかりやすく、すぐに使えるデータが求められます。truestarは複数のデータプロバイダーとのパートナーシップを軸に、分析者にとって最適な形でのデータ提供を目指しています。

Prepper Open Data Bankはデータ分析者ためのオープンデータ共有サービス

今回はその取り組みの一つとして、オープンデータに特化した『Prepper Open Data Bank』をローンチ致しました。

国内のオープンデータとして有名な政府統計の総合窓口e-Statでは、国勢調査、人口推計、消費動向調査、犯罪統計など673調査155万超のデータセットが公開されています(2021年7月時点)。ビジネスにおいて有益なデータセットも多数ありますが、データの共有形式はAPI、Excel、CSV、PDFなど様々ですぐにデータ分析できる形では提供されていないものも多く、利用の際には分析者が前処理を余儀なくされます。

truestarはその課題を解決すべく、商用・二次利用可能なオープンデータを前処理不要ですぐに分析できるよう抽出・加工し、クラウド上でデータ代無料にて共有することに致しました。

公開第一弾は国勢調査の加工データ

第一弾として、国勢調査の社会・人口統計と国土数値情報の行政区域のデータを対象に、都道府県、市区町村、町丁目のそれぞれの粒度で分析できるよう抽出・加工・統合したデータを多数公開致しました。

Tableauを用いた可視化事例

対象データはSnowflakeデータマーケットプレイスにてデータ代無料共有

Prepper Open Data Bankで取り扱う加工済みのオープンデータは、スノーフレイク(所在地:東京都渋谷区、カントリーマネージャー:東條 英俊)が展開するグローバルなデータプラットフォーム「Snowflakeデータマーケットプレイス」で共有します。
SnowflakeはクラウドネイティブなDWH(データウェアハウス)であり、AWS、MS Azure、GCPといった特定のクラウドベンダーにロックインされず、いずれの環境からでもシームレスな接続が可能で、データ利用者にとって利便性が高い環境です。

Prepper Open Data BankではSnowflakeのグローバルで実績のあるデータ基盤を活用することで、高いセキュリティやスケーラブルな環境を保持したサービス提供とともに、TableauやAlteryxのようなデータ分析ツールとのシームレスな連携を実現します。

今後の展開

Prepper Open Data Bankでは、e-Statや国土数値情報のみならず、国内外の商用・二次利用可能なオープンデータのラインナップを拡充していきます。
また、今秋にはPrepper Data POIという、POI(Point of Interest:施設や商圏など関心のある位置情報)やそれに紐づけた統計データをお客様のビジネス環境にカスタマイズした分析用データセットを提供するサービスをローンチ予定です。

truestarでは、今後もデータ分析者を支援する取り組みを行ってまいります。

本件に関するお問い合わせ先
担当:小海老澤
連絡先:info@truestar.co.jp

株式会社truestar
URL:https://truestar.co.jp/
所在地:東京都渋谷区恵比寿1-19-19 恵比寿ビジネスタワー4F
代表者名:代表取締役社長 藤 俊久仁

企業プレスリリース詳細へ
PR TIMESトップへ

最新情報をTwitterで受け取ろう!
最新情報をFacebookで受け取ろう!
前の記事
一覧へ戻る