内容説明
BigQuery徹底活用。分析ニーズの変化に合わせて発展したデータ基盤の要件とGoogle Cloudの各種サービスをこの1冊で体系的に学ぶ。
目次
第1章 データ基盤の概要
第2章 データウェアハウスの概念とBigQueryの利用方法
第3章 データウェアハウスの構築
第4章 レイクハウスの構築
第5章 ETL/ELT処理
第6章 ワークフロー管理とデータ統合
第7章 データ分析基盤におけるセキュリティとコスト管理の設計
第8章 BigQueryへのデータ集約
第9章 ビジネスインテリジェンス
第10章 リアルタイム分析
第11章 発展的な分析―地理情報分析と機械学習、非構造データ分析
著者等紹介
饗庭秀一郎[アイバシュウイチロウ]
Google CloudのCustomer Engineer。モビリティ系ベンチャー企業でBigQueryを用いた分析基盤の構築と運用や分析業務に携わった後、2020年より現職。自分の興味が技術の仕組みや中身からいかにビジネスに活かすかに移るにつれ、キャリアも研究開発からシステム開発、データ分析、プリセールス技術支援へと変わってきました。現在は、特にデータ分析の領域に特化してお客様のビジネスを加速するクラウド活用のお手伝いをしています
下田倫大[シモダノリヒロ]
Google CloudのAI/ML事業開発担当。Web系企業の研究開発職、データ分析企業のエンジニアマネジャーを経て2017年よりGoogle Cloudに参画。テクノロジーを活用したデータの価値創出に興味があり、興味の赴くままに仕事をしていると、気づいたらクラウドプラットフォーマーに所属していた。現在は、Vertex AIを中心としたGoogle CloudのAI/ML領域の事業開発を担当していて、生成AIの荒波に飲み込まれないように日々悪戦苦闘している
西村哲徳[ニシムラテツノリ]
Google CloudのCustomer Engineer。外資系ソフトウェアベンダーでデータベース関連の技術営業としてソリューション開発、国内大手企業のDB移行プロジェクト、パフォーマンスベンチマーク専門のチームでのPoCなどに従事。また、国内SIerでのDWHプロジェクトやCDPベンダーでのマーケティング領域におけるデータ活用の提案など、製品からデータ活用までの様々な領域を経験。Google CloudではData Analytics Specialを経て、現在はより守備範囲の広いCustomer Engineerとして日々お客様のビジネスに貢献できるよう活動しています
寳野雄太[ホウノユウタ]
Google Cloudの統括技術本部長。日経通信会社でPdMとして意思決定のためのデータ基盤を作ったり、エンジニアとしてさまざまなサービスのマイグレーションをしているうち、データ活用の魅力に惹かれ入社。東京リージョン立ち上げからさまざまなお客様のデータ基盤構築立案、構築支援、BigQuery東京リージョンのローンチなどに携わる。2019年より現職。管理職となった現在も毎日適当なタテヨコデカテーブルを作っても淡々と結果が返ってくるBigQueryに助けられながら奮闘中
山田雄[ヤマダユウ]
Google CloudのCustomer Engineer Data Analytics Specialist。国内大手企業にてHadoopやBigQueryを使ったデータ基盤の開発/運用に従事したのち、BigQueryの魅力に惹かれ2022年GoogleCloudに参画。データの価値をいかに効率よく上げられるかを日々考えている。好きなプロダクトはBigQueryとDataplex。データマネジメントとデータガバナンスの話が大好き。生成AI活用のためにも、さらにDataplexの活用を広げていきたいと思っている(本データはこの書籍が刊行された当時に掲載されていたものです)
出版社内容情報
2021年2月に刊行した「Google Cloudではじめる実践データエンジニアリング入門」の改訂版です。改訂版の刊行までにデータ基盤に求められる要件は変化し、本書ではその間に進化を続けたGoogle Cloudの各サービスの情報をまとめています。
- Google Cloudの新サービスの反映:Dataform、Dataplex、BigLake、Datastream、Vertex AI、Geminiなど
- 各種Google Cloudの新機能のアーキテクチャへの反映:BigQuery、Dataflow、Pub/Sub、Cloud Coposer、Lookerなど
また非常に広い概念を含む「データ基盤」に求められる要件を明らかにしつつ、以下のような方々を主な対象として体系だったデータ基盤についての理解を整理できるように構成してあります。
- すでにソフトウェアコードはある程度かけるが、実践的にデータエンジニアリングへの入門をしたい方
- SQL を利用した分析を行っているが、データ基盤がどういう形なのか興味がある方
- すでにGoogle Cloud をデータ基盤として利用しているが、自社の設計について体系的に理解したい方、より良くする方法を探している方
データエンジニアリングの業務について一般的な知識を整理しつつ、Google Cloud 上でどのように構築するのかを、実践経験豊富な著者陣の現場のノウハウとともに説明します。