実践 Rによるテキストマイニング:センチメント分析・単語分散表現・機械学習・Pythonラッパー
【商品概要】
【商品説明】
今やテキストマイニングは、文章を単語に切り分けて、単語の出現頻度を数えるだけにはとどまりません。
商品やイベントに対するSNS上の意見をポジティブ・ネガティブに分ければ、何が評価されて、どこを改善すべきかが一目瞭然。
政治家の演説のトピックが、時代とともにどう移り変わってきたかを解析すると、社会の変化を見て取ることもできます。 小説の話題展開の流れや、登場人物とキーワードの結びつきも、自動で分析可能です。
文書解析で本当にやりたかったこれらのことは、 Rで手軽に実現できます。
テキストマイニング定番書の著者による、次の一歩のためのやさしい手引きです。
[もっと基本的なことから学びたい方は、同著者による「Rによるテキストマイニング入門[第2版](森北出版)」もご覧ください]
〈本書で扱う主な内容〉
●センチメント分析
日本語極性辞書を用いて、単語の極性からテキスト全体がポジティブかネガティブか判断。
●単語分散表現
単語の頻度だけでなく、出現位置に注目し、単語どうしの意味の関連性を数値化。
●機械学習、ディープラーニング
【当店からの連絡】
【商品概要】
【商品説明】
今やテキストマイニングは、文章を単語に切り分けて、単語の出現頻度を数えるだけにはとどまりません。
商品やイベントに対するSNS上の意見をポジティブ・ネガティブに分ければ、何が評価されて、どこを改善すべきかが一目瞭然。
政治家の演説のトピックが、時代とともにどう移り変わってきたかを解析すると、社会の変化を見て取ることもできます。 小説の話題展開の流れや、登場人物とキーワードの結びつきも、自動で分析可能です。
文書解析で本当にやりたかったこれらのことは、 Rで手軽に実現できます。
テキストマイニング定番書の著者による、次の一歩のためのやさしい手引きです。
[もっと基本的なことから学びたい方は、同著者による「Rによるテキストマイニング入門[第2版](森北出版)」もご覧ください]
〈本書で扱う主な内容〉
●センチメント分析
日本語極性辞書を用いて、単語の極性からテキスト全体がポジティブかネガティブか判断。
●単語分散表現
単語の頻度だけでなく、出現位置に注目し、単語どうしの意味の関連性を数値化。
●機械学習、ディープラーニング
機械学習を用いて、より高度な解析も実現。Pythonを前提とした訓練済みモデルやディープラーニングのフレームワークも、 RStudioから簡単に利用可能。
◆電子版が発行されました
◆詳細は、森北出版Webサイトにて
【目次】
第1章 Rによる日本語テキスト解析の基礎
1.1 ファイルのダウンロードと読み込み
1.2 日本語形態素解析
1.3 ワードクラウド
1.4 ネットワークグラフ
第2章 センチメント分析
2.1 日本語極性辞書
2.2 テキストを文で区切る
2.3 感情極性値辞書の適用
2.4 感情極性値の時系列
第3章 構造的トピックモデル
3.1 トピックの分析方法
3.2 総理大臣所信表明演説の解析
3.3 ストップワードの削除
3.4 stmパッケージのためのデータ変換
3.5 stmパッケージによるトピック数の推定
3.6 トピックモデルの実行
3.7 夏目漱石『こころ』の解析
3.8 topicmodelsパッケージによるトピックモデル
3.9 ldatuningパッケージによるトピック数の推定
3.10 stm パッケージによるトピックモデル
第4章 Twitter投稿テキストの評価
4.1 API とは
4.2 Twitter APIの利用
4.3 ツイートの取得と前処理
4.4 形態素解析の実行
4.5 ggwordcloudパッケージによるワードクラウドの作図
4.6 ネットワークグラフ
4.7 ツイートの内容判定
4.8 ユーザーのグループ化
4.9 投稿者のプロフィールの極性比較
第5章 機械学習による予測
5.1 Twitter日本語評判分析データセット
5.2 ツイートの収集
5.3 ツイートの内容を予測するモデル
5.4 正則
5.5 glmnetパッケージによる回帰分析
5.6 機械学習の作業ルーティン
5.7 ランダムフォレスト
第6章 単語分散表現
6.1 単語ベクトル
6.2 単語分散表現
第7章 RからPythonライブラリを実行
7.1 訓練済み単語分散表現
7.2 PythonをRから利用するためのreticulate パッケージ
7.3 keras パッケージによるディープラーニング
補 遺
A.1 stringiパッケージ
A.2 udpipeパッケージ
A.3 udpipeによるトピックモデル
A.4 文章の重要度判定
A.5 RMeCabを活用する
A.6 テキストデータ取得に便利なパッケージ
参考文献
索 引
【商品詳細】
ブランド:森北出版
商品名:実践 Rによるテキストマイニング:センチメント分析・単語分散表現・機械学習・Pythonラッパー
製造元:森北出版
【当店からの連絡】