FP-growth

站位挖坑
记录一些翻译的词
frequent item set mining - 频繁项集快速挖掘算法研究

,

就做了三个简单的操作:
1、过滤非英文字符,然后依据空格来划分;
2、把复数单词转化为单数形式;
3、过滤 Stopwords。
很简单的分词,用来做英文 tag,分好后过一次词典就可以了。
例子:http://phzzy.org/code/en_seg/seg.php
代码:http://phzzy.org/code/en_seg/en_seg.zip
参考:
Stopwords: http://www.uspto.gov/patft/help/stopword.htm

,

MyISAM:
优势
– 查询速度快
– 数据和索引压缩
问题
– 表级锁
– 数据丢失
InnoDB:
优势
– 行级锁
– 事务支持
– 数据安全
问题
– 数据文件庞大
– 启动慢
– 不支持FULLTEXT索引
比较:

, ,

来源:http://www.never-online.net/blog/article.asp?id=216
由于position设为绝对定位(absolute),会导致该层里的textbox和textarea光标丢失。导致的原因已经查到,是gecko内核的bug。该bug可能在3.0以上版本后修复。
overflow:auto;
overflow-x:auto;
overflow-y:auto;
overflow:scroll;
overflow-x:scroll;
overflow-y:scroll;
overflow-x:hidden;
overflow-y:hidden;
position:absolute;
解决方法:
1. 在该容器加入css属性overflow:auto,position:relative
2. 在显示时使用延迟显示
原来被这个搞死了,找半天没找着怎么解决。

,