[本/雑誌]/Vision AI実装プログラミング キーポイント検出・姿勢制御・画像セグメンテーション・キャプショニング入門 ViT/ViTPos/Segmenter/MaskFormer
チーム・カルポ/著/Vision AI実装プログラミング キーポイント検出・姿勢制御・画像セグメンテーション・キャプショニング入門 ViT/ViTPos/Segmenter/MaskFormerを活用した最新AIプログラミング、メディア:BOOK、発売日:2026/01、重量:340g、商品コード:NEOBK-3176991、JANコード/ISBNコード:9784798075617
※ご注文前に以下必ずご確認ください※※メール便不可商品

※
書籍商品の購入に関するご注意※
| 関連人物・出版社 |
|
| 発売日 |
| 2026/01 |
| 商品説明 |
| 本書は、キーポイント検出・姿勢制御・画像セグメンテーション・キャプショニングを、Transformerを軸に横断して学べる実装書です。単なるAPI呼び出しではなく、いちから(フルスクラッチで)コードを組み立てることを基本に、データ前処理、Dataset/Collate、学習ループ、損失と評価指標、学習率スケジューラまで、内部の仕組みが見える最小実装から丁寧に積み上げていきます。併せて実務での活用を重視し、一部は事前学習済みモデルを用いたファインチューニング(timmのViTやHugging Face Hubの重み、凍結・段階的解凍など)も扱います。これにより、「仕組みの理解」と「現場での応用力」を目指します。 |
| 収録内容 |
- 1章 開発環境について
- 2章 キーポイント検出(Keras)
- 3章 キーポイント検出(PyTorch)
- 4章 ViTPoseスタイルモデルによるキーポイント検出
- 5章 ViTPoseスタイルモデルによる姿勢推定
- 6章 セマンティックセグメンテーション(Semantic Segmentation)
- 7章 インスタンスセグメンテーション(Instance Segmentation)
- 8章 パノプティックセグメンテーション(ファインチューニング版)
- 9章 画像キャプショニング
|