Amazon Redshiftによる医療業界向けデータウェアハウス(DWH)の刷新
システム/プロジェクト概要
医療関連のデータを加工・分析し、医療等ビジネスに役立てるためのシステム。
個人情報、特に要配慮個人情報であるため、特に厳しいセキュリティが求められる。
お客様の課題/要望
お客様は既にAmazon
RedshiftによるDWH(データウェアハウス)を構築し活用していたが、ロジックが実態とそぐわないところがある、決まった構造のデータしか取り込めない、データの分析はSQLを考えて書く必要があり非ITエンジニア職にはハードルが高い、といった課題があった。
整理すると、大きく以下の3つの課題があった。
- これまで既定のデータ構造のファイルしか取り込めずアンケート等の非構造化データの分析をしにくい
- 営業担当者でも、ある程度必要なデータを参照/分析して提案活動に役立てたい
- 処理ロジックの改修/開発
Tech Funが実施したソリューション
まず、これまでAmazon Redshiftである程度のDWHを実現していたことから、これを最大限活用する方針とした。
そのうえで、課題を解決するための実現方式は、出来る限り特に既存のシステムと親和性の高いものとなるようにした。
これまで既定のデータ構造のファイルしか取り込めずアンケート等の非構造化データの分析をしにくい
Amazon Redshift内の既存のデータと非構造化データを結び付けて分析する仕組みを実現するため、CSVやJSONなどのファイルをそのまま参照・分析できる機能である、Amazon Redshift
Spectrumを活用した。
新たな非構造化データを取り込みたい場合も、これを容易に実現できるような仕組み・手順を整備した。
営業担当者でも、ある程度必要なデータを参照/分析して提案活動に役立てたい
AWSから提供されるBIツールであるAmazon QuickSightを利用して、データ分析基盤上のデータを容易に参照できるような仕組み・手順を整備した。
また、SQLに慣れているデータサイエンティストに向けて、Amazon Athenaでもデータ分析できるよう仕組みを整えた。
処理ロジックの改修/開発
運用している処理ロジックが新しい制度に対応できておらず古い、考慮漏れがあるため直したい、新しい観点で分析するために新規機能が必要、という状況であった。
要件を丁寧にヒアリングし、お客様と都度相談・検証しながら開発を進め、精度の高いものを作り上げた。
プロジェクト情報
対応工程 | 要件定義、基本設計、詳細設計、実装/構築、テスト |
チーム規模 | 2~7名 |
工数 | 20人月 |
主要技術要素 |
Amazon Redshift, SQL, AWS Glue, S3, Python Amazon Athena, Amazon QuickSight |
アーキテクチャ図

リリース後の効果/お客様の声
お客様のビジネス上、データをうまく管理・分析・活用していくことはコアコンピテンシーとなるものであり、それが改善されたということは事業の発展にダイレクトにつながるということで、大変喜ばれた。