微博分析和内容挖掘系统ROST CM的开放平台简易规则发布和升级

2010/8/7   点击数:735

[作者] 梦我所想

[单位] 武大沈阳的博客---触发灵感的最大值

[摘要] 为了更加丰富内容挖掘系统-数字人文研究平台的功能,我最近在考虑如何能够将ROST CM和更多网友开源闭源的系统或者工具结合起来。

[关键词]  微博 ROST CM



为了更加丰富内容挖掘系统-数字人文研究平台的功能,我最近在考虑如何能够将ROST CM和更多网友开源闭源的系统或者工具结合起来。

最近我们虚拟团队的有些网友从网上找了些源代码修改之后形成了两款第三方的工具,一个是RSS数据的采集器,另外一个是全文检索。下载地址:

更新说明:http://hi.baidu.com/rostcm/blog/item/36585bca0cd40934b600c8a8.html

下载地址:http://hi.baidu.com/rostcm/blog/item/6dea9f0d7a13068fd0581bf6.html

先弄一个简单的结合规范。

1.首先生成的文件都必须是以ASCII中的#9字符隔离的各个字符串的ansi格式的文本文件

例如微博分析中的微博备份模块得到的数据:在记事本不自动换行情况下如下。

娃娃812世界:推荐应用:#微博分析# 今天 19:33 来自新浪微博转发 | 收藏 | 评论

陳龙Don:看看我的微博分析时间动态。 今天 18:39 来自新浪微博转发 | 收藏 | 评论

粉尘梦流年:从--日时分到,我的首页的前0页里,关注的朋友转发了我0条微博,并喜欢转发 的微博(by#微博分析) 今天 18:14 来自微博分析家转发 | 收藏 | 评论

莫兲羽:@莫兲羽 的西太平洋大学计算机博士文凭 【微博分析根据不死鸟的文凭生成器改编 】 今天 16:02 来自微博分析家转发 | 收藏 | 评论(1)

莫兲羽:从2010-07-09至今,按小时统计我在15、22、11点发的微博最多。(by#微博分析家#http://sinaurl.cn/hsXei ) 今天 15:57 来自微博分析转发 | 收藏 | 评论

汐爻:专业微博分析员。。。@沈禄政:群落无论多么开放都需要一个准入,为的是类型筛选。即便没有门槛用户也会自我选择趋向合和,类型不同却硬入且热衷表达,结果只能是生石灰入水——只剩火气。 原文转发(1)|原文评论(2) 今天 12:41 来自新浪微博手机版转发 | 收藏 | 评论

起诺卡布:@起诺卡布 的西太平洋大学哲学博士文凭 【微博分析根据不死鸟的文凭生成器改编 】 今天 10:15 来自微博分析家转发 | 收藏 | 评论

wdongg:@wdongg 的西太平洋大学计算机博士文凭 【微博分析根据不死鸟的文凭生成器改编 】 今天 09:42 来自微博分析家转发 | 收藏 | 评论

Rayro:从2010-08-02日16时26分到2010-08-07日09时12分,我的首页的前10页里,关注的朋友转发了我0条微博,并喜欢转发@蔡文胜@创意工坊@精彩语录@诺基亚@韩毛毛@新周刊@经纬张颖@胡歌@kevin谭凯@王佳音cary 的微博(by#微博分析) 今天 09:28 来自微博分析家转发 | 收藏 | 评论

乖乖kingsley:推荐应用:#微博分析 今天 08:47 来自新浪微博转发(1) | 收藏 | 评论(1)

逐梦Susan:推荐应用:#微博分析这个超赞哈哈! 今天 06:45 来自新浪微博转发 | 收藏 | 评论

如果自动换行则如下图

2.生成数据文件必须放在ROST CM下的Data目录中的某个自建目录,便于用户查找。

3.执行文件必须放在ROST CM下的Tools目录中的某个自建目录中

4.执行文件中的文件框双击应该能够直接打开文本文件

5.软件的窗口必须居中,必须永远在上。

6.如果是开源软件修改版,应承诺将该工具开源,按照原始的开发协议,随时可以再次分发该代码。

今天对软件做了极简单修改,如果网友需要测试自己的工具,可以直接覆盖ROST CM\tools\下面的test目录中的test.ext文件。

原文连接:http://hi.baidu.com/whusoft/blog/item/837a5038587827ffb211c70b.html