[本/雑誌]/Vision AI実装プログラミングキーポイント検出・姿勢制御・画像セグメンテーション・キャプショニング入門 ViT/ViTPos/Segmenter/MaskFormer

4,180

チーム・カルポ/著/Vision AI実装プログラミングキーポイント検出・姿勢制御・画像セグメンテーション・キャプショニング入門 ViT/ViTPos/Segmenter/MaskFormerを活用した最新AIプログラミング、メディア：BOOK、発売日：2026/01、重量：340g、商品コード：NEOBK-3176991、JANコード/ISBNコード：9784798075617

※ご注文前に以下必ずご確認ください※

※メール便不可商品

※書籍商品の購入に関するご注意※

関連人物・出版社

発売日

2026/01

商品説明

本書は、キーポイント検出・姿勢制御・画像セグメンテーション・キャプショニングを、Transformerを軸に横断して学べる実装書です。単なるAPI呼び出しではなく、いちから(フルスクラッチで)コードを組み立てることを基本に、データ前処理、Dataset/Collate、学習ループ、損失と評価指標、学習率スケジューラまで、内部の仕組みが見える最小実装から丁寧に積み上げていきます。併せて実務での活用を重視し、一部は事前学習済みモデルを用いたファインチューニング(timmのViTやHugging Face Hubの重み、凍結・段階的解凍など)も扱います。これにより、「仕組みの理解」と「現場での応用力」を目指します。

収録内容

1章開発環境について
2章キーポイント検出(Keras)
3章キーポイント検出(PyTorch)
4章 ViTPoseスタイルモデルによるキーポイント検出
5章 ViTPoseスタイルモデルによる姿勢推定
6章セマンティックセグメンテーション(Semantic Segmentation)
7章インスタンスセグメンテーション(Instance Segmentation)
8章パノプティックセグメンテーション(ファインチューニング版)
9章画像キャプショニング

販売サイトへ移動

[本/雑誌]/Vision AI実装プログラミング キーポイント検出・姿勢制御・画像セグメンテーション・キャプショニング入門 ViT/ViTPos/Segmenter/MaskFormer

4,180

[本/雑誌]/Vision AI実装プログラミングキーポイント検出・姿勢制御・画像セグメンテーション・キャプショニング入門 ViT/ViTPos/Segmenter/MaskFormer