[本/雑誌]/Vision AI実装プログラミング キーポイント検出・姿勢制御・画像セグメンテーション・キャプショニング入門 ViT/ViTPos/Segmenter/MaskFormer

チーム・カルポ/著/Vision AI実装プログラミング キーポイント検出・姿勢制御・画像セグメンテーション・キャプショニング入門 ViT/ViTPos/Segmenter/MaskFormerを活用した最新AIプログラミング、メディア:BOOK、発売日:2026/01、重量:340g、商品コード:NEOBK-3176991、JANコード/ISBNコード:9784798075617
※ご注文前に以下必ずご確認ください※

※メール便不可商品



書籍商品の購入に関するご注意

関連人物・出版社
発売日
2026/01
商品説明
本書は、キーポイント検出・姿勢制御・画像セグメンテーション・キャプショニングを、Transformerを軸に横断して学べる実装書です。単なるAPI呼び出しではなく、いちから(フルスクラッチで)コードを組み立てることを基本に、データ前処理、Dataset/Collate、学習ループ、損失と評価指標、学習率スケジューラまで、内部の仕組みが見える最小実装から丁寧に積み上げていきます。併せて実務での活用を重視し、一部は事前学習済みモデルを用いたファインチューニング(timmのViTやHugging Face Hubの重み、凍結・段階的解凍など)も扱います。これにより、「仕組みの理解」と「現場での応用力」を目指します。
収録内容
  1. 1章 開発環境について
  2. 2章 キーポイント検出(Keras)
  3. 3章 キーポイント検出(PyTorch)
  4. 4章 ViTPoseスタイルモデルによるキーポイント検出
  5. 5章 ViTPoseスタイルモデルによる姿勢推定
  6. 6章 セマンティックセグメンテーション(Semantic Segmentation)
  7. 7章 インスタンスセグメンテーション(Instance Segmentation)
  8. 8章 パノプティックセグメンテーション(ファインチューニング版)
  9. 9章 画像キャプショニング