バイオインフォマティックス データマイニング テキストマイニング

ゲノム解析アルゴリズムをリバース・エンジニアリングに応用
http://hotwired.goo.ne.jp/news/news/technology/story/20041006302.html

「莫大な量の情報から相互関係を元に規則正しく階層化された分類を作り出すという課題は、どこにでも発生する。バイオインフォマティクスにおける解決策が、理解の遅れている他の巨大ネットワークの分野に適用されたとしても、私は驚かない」とカミンスキー氏は語った。

バイオインフォマティックス(Wikipedia)

プログラミング言語としてはスクリプト言語であるPerlが用いられることが多い。 これは、Perl正規表現等の強力な文字列処理機能を持っているため配列解析に有効なことがひとつの理由である。また、生物学出身の研究者はプログラミングに関しては初心者であることが多いので、Perlが比較的学習が容易であることも理由のひとつである。 このような経緯から、BioPerl (http://www.bioperl.org/)から得られるライブラリを用いることで、ある配列の公開データベースからの取得、GenBankフォーマットやEMBLフォーマットで記述されたファイルからの情報抽出、BLASTの自動化等が容易に行えるようになっている。

perlのライブラリになってるのなら色々と応用がききそうですね。
ネット上の情報検索とかに既に使われてたりするのかな?



追記:

そもそも、バイオインフォマティックス自体がデータマイニングの応用なのかな?

MUSASHI-オープンソースデータマイニングツール
http://www.musashi-ug.info/

テキストマイニングというのもある。
参考:
形態素解析システム茶筌
日本語係り受け解析器南瓜

なんかものすごく面白そう。