いよいよ技術書典13が始まりますね!
以前の記事でも軽く告知していましたが、この度、脱稿&審査が通過しまして、「はじめてのBigQuery データ基盤・データ分析の第一歩」という技術同人誌を頒布します!
私個人のサークル活動としては、第5回技術書同人誌博覧会 以来の新作です。
どんな本?
コンセプトは以前の記事と同じです。
本書は、Google Cloudが提供しているデータウェアハウスサービス「BigQuery」をメイントピックとして扱います。BigQueryやデータ基盤について知らない方でも最初の一歩として手にとっていただけるように執筆しました。
データ基盤と聞くと、データエンジニアやデータサイエンティスト、機械学習エンジニア、会社によってはITインフラエンジニア・SREが関わることが多いと思いますが、Webエンジニアはクエリ実行することはあれどデータ基盤の構築まで踏み込むことは少ないと思います。
本書は本格的なデータ基盤の構築までは踏み込みませんが、BigQueryへのデータの投入からクエリ実行、ダッシュボードによる可視化をひととおり学べるという本です。
本の構成
本書は全5章で構成されています。A5版、50ページ程度なので読むだけならサクッと読めるはずです。
- 第1章 BigQueryをつかってみよう
- 1-1 BigQueryの料金体系
- 1-2 クエリを実行する
- 1-3 クエリを保存する
- 第2章 データを取り込んでみよう
- 2-1 BigQueryへのデータ取り込み方法
- 2-2 オープンデータを取り込む
- 2-3 効率的なクエリの書き方
- 第3章 ログを集計・可視化しよう
- 3-1 サンプルアプリケーションの構築
- 3-2 BigQueryデータセットの作成
- 3-3 Cloud Loggingシンクの設定
- 3-4 ログを集計する
- 3-5 DBデータを取り込む
- 第4章 可視化しよう
- 4-1 データポータルとは
- 4-2 COVID-19の感染者数を可視化する
- 4-3 Geo Vizで地理空間データを可視化する
- 4-4 商品カタログ別のアクセス数を可視化する
- 4-5 商品カタログ別の注文数を可視化する
- 4-6 ダッシュボードをブラッシュアップする
- 4-7 料金について
- 4-8 BigQuery BI Engine
- 第5章 GCPのコストを可視化しよう
- 5-1 Cloud Billingとは
- 5-2 エクスポートできるコストデータの種類
- 5-3 請求データをBigQueryにエクスポートする
- 5-4 よく使うカラム
- 5-5 クエリ例
- 5-6 GCPサービス別に前月比を可視化する
本書で得られること
- BigQueryの料金体系、クエリ実行、テーブル作成に関する基礎知識
- CSVなどのデータファイルの取り込み
- デモアプリをGKEクラスタで構築、アプリケーションログの取り込み
- ダッシュボード作成、データの可視化
- GCPコストの集計・コスト分析について
本書で得られないこと
本書では、次の内容について取り扱っていません。次回作で書きたいな~
- ETL処理
- データパイプライン、ワークフロー管理
- リアルタイム分析
- BigQuery、データ基盤のセキュリティ
- 機械学習(BigQuery ML)
対象読者
- BigQueryについて聞いたことがある程度の人、初心者
- データ基盤、ログ基盤の構築を任されたけど何をすればいいのかわからない人
サンプル版について
BOOTHで販売開始していまして、サンプル版も置いています。
オフライン参加について
技術書典13はオンライン・オフライン両方の参加となります。9月11日(日)のオフライン参加では、「か08」にいますのでお気軽にお声おかけください。
さいごに
本書のあとがきにも書いたのですが、私の執筆した書籍はいずれも業務から得た知識・知見をベースにして技術同人誌に還元しています。私がデータ基盤構築に携わったのが2021年8月頃で、それまではAWS/GCPインフラやCI/CD基盤の構築やコスト管理をやっていました。BigQueryは存在を知っていた程度でデータ基盤を作っていくことになるとは思ってもみませんでした。私のデータ基盤やデータ分析に関する経験とスキルがまだまだ足りないことがあり、データ基盤本として書いていいのか、何を書こうか締め切りギリギリまでずっと悩んでいました。
8月後半に夏季休暇をもらい、急ピッチで執筆開始してなんとかこぎつけました。皆さんに読んでもらえればとても嬉しいです。