海量信息今天来传教~ 他们传教的教义:一个媒体怎么才能更有价值—从掌握信息的发布权到信息的解释权。 研究了下他们做的东西 如何掌控解释权,三要素 1,抢抓时效 2,给出解释 3,价值评说 要支撑上要几点就要通过信息处理来挖掘信息和信息之间的联系。 例如下面的一个走势就可以发现两者之间有微妙的联系 现在的现状是互联网实现了计算机的互联,刚刚进入了页面的互联,信息内部的互联怎么发现并联系起来呢? 计算机读懂人的语言现在还是很困难的咯。 搜索了些资料,大概了解下分词的方法。 现在主要的一些途径是通过语义库,或者连词,标点符号来这些来分析统计大概的意思。 如,这些通过语义库来,词来替换来让计算知道大概的意思。 或者这样通过一些连词来分析句子的逻辑和语义。 海量的分词,测试了一下,语义的划分还比较准确。 在这里http://www.hylanda.com/pro.php?smid=51 可以测试下。 有了分词,得到以下几个分类的信息。 然后按地理或者时间,生成信息展示。 1. 跟踪每天最新人物发表的言论。 http://labs.hylanda.com/2008090100/Oration.htm 2. 检索指定的某个人发表过的言论。 http://labs.hylanda.com/ori.php?word=%C0%EE%D3%EE%B4%BA&type=0 3. 检索言论的内容,如:搜索"李宇春"就可以获得所有对李宇春进行评论的语言和评论人。 http://labs.hylanda.com/ori.php?word=%C0%EE%D3%EE%B4%BA&type=1 还可以加上一些信息设计,让信息更直观。