« 最近思っていること | メイン | コスモス自販機 »

まとめサイト2.0:2008年、Webは文字列解析で変わっていく (1/8) - ITmedia エンタープライズ

つい最近やっていたプロジェクトもそうだし、数年前に担当していたKM製品もそうだったんだけど、結局KMや"Know who"の精度って文字列解析、形態素解析、そしてそれに使用する辞書の充実度に依存するんだよね。。。

まとめサイト2.0:2008年、Webは文字列解析で変わっていく (1/8) - ITmedia エンタープライズ

トラックバック

このエントリーのトラックバックURL:
http://haggy0108.net/cgi-bin/mt/mt-tb.cgi/160

コメント (3)

こみね:

要は「検索の技術」の進歩によって知識は体系化されて、利用が促進されるということですね。

インターネットの世界のように、オタク的に物事を調べて文書化してくれる奇特な人がいてくれる世界では、文書化されたものをどう検索するかが重要になります。

でも会社の中では、それを知っている人が数人しかいなくて、忙しくて文書化されていないときにはどうすればいいでしょう? 検索の技術の問題ではなく、どうそれを吐き出させるかの問題になりますね。

最近流行のブログとか、SNS がそれに対する答えにならないかなぁ?

あっ、弊社の製品が良いとは言いませんが・・・。

twk:

言うのは簡単だけど、結局まだ技術的に追いついてないよね、辞書意外と使えないよね、てことでしょうか。業務に役立つ内容、てことでは更に・・・。

技術を進める、てのが王道なんでしょうけど、そこまで踏み込めないので、答えをいきなり出せなくても人がわかれば良いよね、とか、ネットからの情報も出しても良いよね、とか。わざわざ文書化しづらいなら、日報とかいっそメールとかと統合されていて引き出すとか (メールでこそこそ相談できなくなるけど)。

はぎー:

コメントついていることに気がついてませんでしたw

>こみねさん、
おっしゃるように、検索手法と情報提供の促進がインターネットでは肝でしょうね。社内で情報共有のコミッティーに参加していたときもこの2点が一番の焦点となりましたが、残念ながら決定的な解決策は見つかりませんでした。

インターネットっていわゆるホームページが流行ったころは書き手がレイアウトや読みやすさを考えて文書の書き方にも気を配っていた感じがしますが、2chやブログになるとまったくもってメモ書きとか、下手すると落書き以下のクオリティだったりして、検索するのも難しかったりしますよね。そこいら辺の溝を埋めるのがソフトウェアの役割なのかな?と自分なりに思っていたりするのですが・・・。

>twkさん、
現時点では辞書なし(あるいは辞書への依存性を低くして、解析の大半をロジックで対応する)でその役割を果たせているアプリ(エンジン)ってない、あるいは事実上開発できないのが現状なのかな?って去年やっていた仕事から感じました。いや、とある研究所(笑)に支援でサンプル提供してもらった形態素解析のエンジンが辞書の塊でね。。。ちょっとガッカリしました。ちゃんと言語学者さん達と協力して研究すれば、どうにかなりそうな気もするんだけどねえ。。。考えとして甘いですかねえ?

コメントを投稿

About

2007年12月29日 01:39に投稿されたエントリーのページです。

ひとつ前の投稿は「最近思っていること」です。

次の投稿は「コスモス自販機」です。

他にも多くのエントリーがあります。メインページアーカイブページも見てください。

gremz

クイズ研 - all

Amazon お買い得ウィジェット

通算:
本日:  昨日:
無料アクセス解析CGI [ FreeP Analyzer ]