
2008年5月9日
摘要: 从现在开始,开始我真正的研究计划:聚类获取有价值的信息。
今天开始详细了解了已有的资源和项目代码,包含中文分词,文档向量化,现有的KA+K-MEANS聚类算法。但是据观察,聚类效果上不是很满意,主要是类簇的关键字抽取不够准确,特征选择尚未考虑,聚类精度需要提高。
以下是现有系统的流程图:明天开始到下周末,研究
1.ka+k-means,其他k-means方法,找出系统不足点
2.研究特征选择方法,提高聚类前数据的质量
阅读全文
posted @
2008-05-09 22:22 fullfocus 阅读(27) |
评论 (0) |
编辑 收藏

2008年5月7日
摘要: google的数学之美 系列九 -- 如何确定网页和查询的相关性
主要讲解TF-IDF技术,与判断查询相关性。
阅读全文
posted @
2008-05-07 15:38 fullfocus 阅读(75) |
评论 (0) |
编辑 收藏
摘要: 一直搞不清搜索引擎的查全率和查准率是什么意思,只知道这两个是衡量一个搜索引擎性能的. 今个 看一篇 南大的学士论文的时候, 又碰到这个问题. 所以决定把他搞清楚, 上百度搜了一下, 所获很多.
阅读全文
posted @
2008-05-07 14:35 fullfocus 阅读(739) |
评论 (1) |
编辑 收藏

2008年4月6日
摘要: 动态规划的经典应用,其实现在发现,其实质就是利用矩阵或者数组保存历史结果,而不用每次递归求解
关键点:
1.找出问题的递归表达式
2.然后根据表达式,直接转化为矩阵上的数据运算
本问题的递归表达式为:
L[i,j]等于 0 ifi=0 或者 j=0
等于L[i-1,j-1]+1 ifi>0 ,j>0 ai = bi
等于 max{L[i,j-1], L[i-1,j]} if i > 0 j>0, ai != bj
阅读全文
posted @
2008-04-06 22:51 fullfocus 阅读(844) |
评论 (0) |
编辑 收藏
摘要: 以前虽然看了很多书,但是只重理论不重实践,bebeyond说的没错,如果你不把知识内化,那么即使你读的书再多,你的老师水平再高也于事无补,现代社会看能力啊。所以清明也懒得去玩了,静下心,重头再来!!这是第一篇
[java重头再来系列之一]java界面布局,文件操作,线程,事件响应
源码有200多行,若要显示动画(线程)需要5张gif图片,但程序中有一个疑问,用红色高亮显示的update为何不会调用?如果把Animation类独立出来(不继承JPanel,而继承JFrame),那是会首先调用update的啊。。。向高人求助
阅读全文
posted @
2008-04-06 14:23 fullfocus 阅读(939) |
评论 (1) |
编辑 收藏