站位挖坑
记录一些翻译的词
frequent item set mining - 频繁项集快速挖掘算法研究
站位挖坑
记录一些翻译的词
frequent item set mining - 频繁项集快速挖掘算法研究
这几天站被弄得打不开,基本上都是数据库链接失败,链接失败的日志都有100多M了,远程连接到服务器都连不上,刚开始以为是被谁攻击了。后来想想,不对呀,我一个小破站,谁没事攻击我。
今天早上7点爬起来,连了N次才连上服务器,赶紧把 apache 和 mysql 关了,CPU降下去了,看日志,全是来自一个IP段的访问: 124.115.4.* 以及 124.115.0。 查了查,是陕西电信,百度了一下,发现N多人封了这个IP段,貌似是 soso 的。封了以后,没事了。
不会做搜索就别爬嘛,晕,爬的全是列表页,还是搜索的列表页,一秒钟十多次,连续抓了两三天,全是 like 出来的结果,直接把服务器搞挂了。
还有一个IP也老来,怕是百度的,没敢封:61.135.168.18。不过频率还行,没什么影响。
网上查到的:http://www.quickshare.com.cn/closing-today-in-the-server-124_115_0_x-of-ip
封IP段:
deny from 124.115.4.0/24
deny from 124.115.0.0/24
PS:
发现自今年2月份就有很多网站被SOSO抓死,到6月才来抓我,我真命好~~~
就做了三个简单的操作:
1、过滤非英文字符,然后依据空格来划分;
2、把复数单词转化为单数形式;
3、过滤 Stopwords。
很简单的分词,用来做英文 tag,分好后过一次词典就可以了。
例子:http://phzzy.org/code/en_seg/seg.php
代码:http://phzzy.org/code/en_seg/en_seg.zip
参考:
Stopwords: http://www.uspto.gov/patft/help/stopword.htm
MyISAM:
优势
– 查询速度快
– 数据和索引压缩
问题
– 表级锁
– 数据丢失
InnoDB:
优势
– 行级锁
– 事务支持
– 数据安全
问题
– 数据文件庞大
– 启动慢
– 不支持FULLTEXT索引
来源:http://www.never-online.net/blog/article.asp?id=216
由于position设为绝对定位(absolute),会导致该层里的textbox和textarea光标丢失。导致的原因已经查到,是gecko内核的bug。该bug可能在3.0以上版本后修复。
overflow:auto;
overflow-x:auto;
overflow-y:auto;
overflow:scroll;
overflow-x:scroll;
overflow-y:scroll;
overflow-x:hidden;
overflow-y:hidden;
position:absolute;
解决方法:
1. 在该容器加入css属性overflow:auto,position:relative
2. 在显示时使用延迟显示
原来被这个搞死了,找半天没找着怎么解决。