ITパスポート試験 用語辞典

テキストマイニング【Text Mining】
データマイニングを文字列データに適用した手法のことである。自由な形式で書かれた文章を、単語や文節で区切り、統計学やパターン認識、AIなどのデータ解析技法を用いて有用な情報を探し出す分析技術である。日本語は英語などに比べ、文法のゆらぎが大きく形態素解析が難しいとされていたが、自然言語処理技術の向上により実用的な分析が可能となっている。

テキストマイニングの対象は、SNSや口コミ、アンケート回答、チャットボット、掲示板などがある。テキストマイニングの中でも、ウェブページを対象にしたものはウェブマイニングという。

「マイニング」とは「採掘」を意味する。これは、膨大な文字情報の山の中から有用な情報を掘り当てるという概念からである。
分野:
ストラテジ系 » 企業活動 » 業務分析・データ利活用
重要度:

(Wikipedia テキストマイニングより)

テキストマイニング(text mining)は、文字列を対象としたデータマイニングのことである。通常の文章からなるデータを単語や文節で区切り、それらの出現の頻度や共出現の相関、出現傾向、時系列などを解析することで有用な情報を取り出す、テキストデータの分析方法である。

テキストデータの多くは形式が定まっておらず、また日本語は英語などと比べて単語の境界判別の必要性(→わかち書き)や文法ゆらぎが大きい点において形態素解析が困難であったが、自然言語処理の発展により実用的な水準の分析が可能となった。テキストマイニングの対象としては、顧客からのアンケートの回答やコールセンターに寄せられる質問や意見、電子掲示板やメーリングリストに蓄積されたテキストデータなどがある。

テキストマイニングの効果

テキストマイニングは、言葉的にはデータマイニングと似ているが、その効果は異なる。データマイニングが顧客個人の購買傾向を分析するなどの目的で行われるのに対し、テキストマイニングは顧客個人の特性よりも提供側の状態を把握する面において威力を発揮する。例えば商品の評価や顧客サービスの問題点などを把握することができる。

「業務分析・データ利活用」に属する用語
「企業活動」の他の分野
「ストラテジ系」の他のカテゴリ

クリエイティブ・コモンズ・ライセンス

このページのWikipediaよりの記事は、ウィキペディアの「テキストマイニング」(改訂履歴)の記事を複製、再配布したものにあたり、このページ内の該当部分はクリエイティブ・コモンズ 表示 - 継承 3.0 非移植 ライセンスの下 に提供されています。

© 2009-2021 ITパスポート試験ドットコム All Rights Reserved.

Pagetop