文本分析软件和草根小更新

2009/11/19   点击数:697

[作者] 触发灵感的最大值,在无限的逼近中

[单位] 触发灵感的最大值,在无限的逼近中

[摘要] ROST内容分析系统目标是海量信息采集、深度内容分析、精准情报展示的研究性软件,主要功能有:从动态更新的互联网188亿个网页海量采集信息,以及对博客、微博客、浏览记录、各类日志、网页、本地文件、互联网用户评论等各类文本源进行分词、词频统计、相关性、相似性、聚类、分类、情感倾向分析、共现分析、共词分析从而构建出语义网络、社会网络、关系网络、复杂网络。可将结果在本软件中分析,也可以导出到SPSS、Matlab、Netminer、Netdraw等软件进一步分析。

[关键词]  草根 学科 信息



草根做了若干Bug的修改

对搜索等方面做了增强,更加适合我这种重度搜索者使用,并且设计理念更加倾向实时性信息获得。有一些想法,还需要摸索如何实现。在右键菜单中,可以配置自己的科学网址。草根主要是我自己觉得上网的时候有时侯不是很方便,而开发的自用软件,当然以后会增加更多的想法进去。现在还很简陋,望谅。

ROST CM对文件框做了位置调整。收费版中增加了简单倾向统计。

ROST内容分析系统目标是海量信息采集、深度内容分析、精准情报展示的研究性软件,主要功能有:从动态更新的互联网188亿个网页海量采集信息,以及对博客、微博客、浏览记录、各类日志、网页、本地文件、互联网用户评论等各类文本源进行分词、词频统计、相关性、相似性、聚类、分类、情感倾向分析、共现分析、共词分析从而构建出语义网络、社会网络、关系网络、复杂网络。可将结果在本软件中分析,也可以导出到SPSS、Matlab、Netminer、Netdraw等软件进一步分析。

该系统可应用各学科的研究,如:新闻学研究社会舆情、网络民意等;社会学研究网络社会形态、民众公开聊天内容,微博客中闲言碎语中的宏大社会关系等;历史学中的人物网络关系,时空路线图等;文学类的各类诗歌、文献相似性研究等;经济学中的基于社会网络和生活搜索的经济评估;管理学中的人力资源管理;信息学中基于共词分析的学科热点趋势分析等等,该系统是计算机科学、信息科学前沿理论的一次跨科学扩展,为各交叉科学提供基于语义内容分析的研究方法。目前国内外的用户包括:Cambridge University(剑桥大学)、Loughborough University、Texas A&M University、日本北海道大学、北京大学、浙江大学、诺基亚、武汉大学、南开大学、厦门大学、四川大学、天津大学、东北大学、东北师范大学、中南大学、中央民族大学、中山大学、北京科技大学、南京农业大学、南京航空航天大学、山东大学、广州大学、武汉理工大学、江西师大、江西理工大学、河南大学、河海大学、泰山学院、西南交通大学、长沙理工大学等数百所高校。

草根的下载界面:

http://www.fanpq.com/Soft/neirongwajue/200911/39.html

内容挖掘的下载界面

http://www.fanpq.com/Soft/neirongwajue/200905/11.html

原文连接:http://hi.baidu.com/whusoft/blog/item/e1e43d1e4cb1b4fe1bd576bf.html