大規模言語モデル入門 2/山田育矢/著鈴木正敏

監修:山田育矢 ほか著:著鈴木正敏
出版社:技術評論社
発売日:2024年09月
キーワード:大規模言語モデル入門2山田育矢著鈴木正敏 だいきぼげんごもでるにゆうもん2 ダイキボゲンゴモデルニユウモン2 やまだ いくや すずき まさと ヤマダ イクヤ スズキ マサト



著者名:山田育矢  著鈴木正敏 
出版社名:技術評論社

「大規模言語モデル入門」の続編です。「大規模言語モデル入門」は理論と実装のバランスをとって構成しましたが、本書では実装部分で扱い切れなかった話題を取り上げ、特に大規模言語モデルの評価と生成LLMに関連する解説を充実させます。「大規模言語モデル入門」の9章に続き、10章から始まります。

10章では、後続する章で行う言語モデルの評価方法について解説します。自動評価と人手評価の2つの側面から、ベンチマーク、評価指標、具体的な評価ツールやデータセットなどを取り上げます。11から13章では、主に大規模言語モデルの性能を上げるためのトピックとして、指示チューニング、人間のフィードバックからの学習、RAGに焦点を当て、それぞれの実装方法、利用するデータセット、評価の方法について解説します。14章では大規模言語モデルの学習における並列・分散処理について詳しく解説します。大規模なデータを限られた計算資源で学習させるノウハウは多くのエンジニアにとって有益な情報となるでしょう。

大規模言語モデルの性能を高めるための各トピックの実装とともに、それぞれの評価について理解できる一冊です。

※本データはこの商品が発売された時点の情報です。