
以前の記事で「機械学習の書籍」や「ディープラーニングの書籍」を紹介させていただきました.
機械学習の書籍に記載されていた参考書籍や自然言語処理を研究している大学の研究室のサイト(首都大学東京 自然言語処理研究室)などを参考にさせていただき,書籍を選択しました.
1.「自然言語処理の基本と技術」(翔泳社)
自然言語処理関連の書籍を参考にさせていただいた,首都大学東京の小町先生監修の本です.
自然言語処理とはどういうものかを知るための入門書です.本書の第1章にも自然言語処理の書籍や記事の紹介が書かれているので,参考になります.
2.「自然言語処理概論」(サイエンス社)
「自然言語処理 (放送大学教材)」の改訂版と言ったら良いのでしょうか?「自然言語処理」と若干章立てが変わっていて,一字一句同じ部分とニューラルネットワークなどについて新たに追加されている部分とがあります.「自然言語処理の基本と技術」よりも理論について詳しく書かれています.本書の最後の参考文献の書籍も参考になりますが,放送大学教材の方は章ごとに参考文献が記載されていたので,どのテーマを深く学びたいときにどの書籍を読めばいいのかというのが明確だと思います.
3.「戦略的データサイエンス入門」(オライリー)
自然言語処理の本ではありませんが,本書の10章「テキスト表現とテキストマイニング」に自然言語処理について書かれています.30ページほどなので自然言語処理全般について触れられているわけではありませんが,上記2冊を読んだ後に読むと,TF,TF-IDFなどの理解が深まるかもしれません.

戦略的データサイエンス入門 ―ビジネスに活かすコンセプトとテクニック
- 作者: Foster Provost
- 出版社/メーカー: オライリージャパン
- 発売日: 2014/07/19
- メディア: 単行本(ソフトカバー)
4.「入門 自然言語処理」(オライリー)
Pythonや自然言語ツールキット(NLTK:Natural Language Toolkit)を使いながら自然言語処理を学ぶ書籍.500ページを超える書籍です.とりあえず12章の「Pythonによる日本語自然言語処理」だけでも読んでおこうと思います.ソフトウェアエンジニアにとっては,理論や数式を並べられるよりも,実際にコーディングしながら学べる方がありがたいのですが,本書が前提としているPythonのバージョンが2.xに対して,最新のNLTKは3.x系を前提としているので,本書のサンプルコードはそのままでは動かないものもあるかもしれません.
5.「Rによるテキストマイニング入門」(森北出版),「Rによるやさしいテキストマイニング」(オーム社)
Rを使ったテキストマイニングの入門書です.
最近のコメント