ChatGPTの全貌 何がすごくて、何が危険なのか? (光文社新書 1267)
もはや後戻りは不可能… 上手に付き合う方法を学び、 その能力を最大限引き出すには? 基礎知識から今後の進化、人類の未来への影響までわかりやすく解説 GPT-4 のすごさはさまざまに語られているが、私はモデルとデータセットの途方もないでかさを実現した点がこのシステムの白眉だと思う。 ・ データセットはスクレイピング(Webを自動巡回して情報を拾ってくる)で集めてるだけでしょ? ・モデルは機械学習で自動的に育つんでしょ? ・だったら金に糸目をつけなければ、GPT-4 を作れるでしょ? という評価はフェアではない。モデルがどんなに優秀でも、学習させるデータセットが汚染されていれば、AIは容易に差別をするし、著作権侵害をする。GPT-4 がそれに十全に対応しているとは言わないけれど、世界的なAI懐疑やポリティカルコレクトネスの潮流にさらされる中で、やれる範囲の対策を惜しんではいない。(本文より)