<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	>

<channel>
	<title>Phzzy@web</title>
	<atom:link href="http://phzzy.org/feed/" rel="self" type="application/rss+xml" />
	<link>http://phzzy.org</link>
	<description>Phzzy's weblog</description>
	<pubDate>Wed, 09 Jul 2008 07:26:15 +0000</pubDate>
	<generator>http://wordpress.org/?v=2.5.1</generator>
	<language>en</language>
			<item>
		<title>FP-growth</title>
		<link>http://phzzy.org/2008/07/fp-growth/</link>
		<comments>http://phzzy.org/2008/07/fp-growth/#comments</comments>
		<pubDate>Wed, 09 Jul 2008 07:26:15 +0000</pubDate>
		<dc:creator>phzzy</dc:creator>
		
		<category><![CDATA[Tech]]></category>

		<category><![CDATA[数据挖掘]]></category>

		<category><![CDATA[算法]]></category>

		<guid isPermaLink="false">http://phzzy.org/?p=9</guid>
		<description><![CDATA[站位挖坑
记录一些翻译的词
frequent item set mining - 频繁项集快速挖掘算法研究
]]></description>
			<content:encoded><![CDATA[<p>站位挖坑<br />
记录一些翻译的词<br />
frequent item set mining - 频繁项集快速挖掘算法研究</p>
]]></content:encoded>
			<wfw:commentRss>http://phzzy.org/2008/07/fp-growth/feed/</wfw:commentRss>
		</item>
		<item>
		<title>SB SOSO</title>
		<link>http://phzzy.org/2008/06/sb-soso/</link>
		<comments>http://phzzy.org/2008/06/sb-soso/#comments</comments>
		<pubDate>Tue, 01 Jul 2008 01:28:19 +0000</pubDate>
		<dc:creator>phzzy</dc:creator>
		
		<category><![CDATA[Work]]></category>

		<category><![CDATA[124.115]]></category>

		<category><![CDATA[soso]]></category>

		<guid isPermaLink="false">http://phzzy.org/?p=8</guid>
		<description><![CDATA[这几天站被弄得打不开，基本上都是数据库链接失败，链接失败的日志都有100多M了，远程连接到服务器都连不上，刚开始以为是被谁攻击了。后来想想，不对呀，我一个小破站，谁没事攻击我。
今天早上7点爬起来，连了N次才连上服务器，赶紧把 apache 和 mysql 关了，CPU降下去了，看日志，全是来自一个IP段的访问： 124.115.4.* 以及 124.115.0。 查了查，是陕西电信，百度了一下，发现N多人封了这个IP段，貌似是 soso 的。封了以后，没事了。
不会做搜索就别爬嘛，晕，爬的全是列表页，还是搜索的列表页，一秒钟十多次，连续抓了两三天，全是 like 出来的结果，直接把服务器搞挂了。
还有一个IP也老来，怕是百度的，没敢封：61.135.168.18。不过频率还行，没什么影响。
网上查到的：http://www.quickshare.com.cn/closing-today-in-the-server-124_115_0_x-of-ip
封IP段：
deny from 124.115.4.0/24
deny from 124.115.0.0/24
PS:
发现自今年2月份就有很多网站被SOSO抓死，到6月才来抓我，我真命好~~~
]]></description>
			<content:encoded><![CDATA[<p>这几天站被弄得打不开，基本上都是数据库链接失败，链接失败的日志都有100多M了，远程连接到服务器都连不上，刚开始以为是被谁攻击了。后来想想，不对呀，我一个小破站，谁没事攻击我。<br />
今天早上7点爬起来，连了N次才连上服务器，赶紧把 apache 和 mysql 关了，CPU降下去了，看日志，全是来自一个IP段的访问： 124.115.4.* 以及 124.115.0。 查了查，是陕西电信，百度了一下，发现N多人封了这个IP段，貌似是 soso 的。封了以后，没事了。<br />
不会做搜索就别爬嘛，晕，爬的全是列表页，还是搜索的列表页，一秒钟十多次，连续抓了两三天，全是 like 出来的结果，直接把服务器搞挂了。<br />
还有一个IP也老来，怕是百度的，没敢封：61.135.168.18。不过频率还行，没什么影响。</p>
<p>网上查到的：<a href="http://www.quickshare.com.cn/closing-today-in-the-server-124_115_0_x-of-ip">http://www.quickshare.com.cn/closing-today-in-the-server-124_115_0_x-of-ip</a></p>
<p>封IP段：<br />
deny from 124.115.4.0/24<br />
deny from 124.115.0.0/24</p>
<p>PS:<br />
发现自今年2月份就有很多网站被SOSO抓死，到6月才来抓我，我真命好~~~</p>
]]></content:encoded>
			<wfw:commentRss>http://phzzy.org/2008/06/sb-soso/feed/</wfw:commentRss>
		</item>
		<item>
		<title>简单英文分词</title>
		<link>http://phzzy.org/2008/06/en-se-segment/</link>
		<comments>http://phzzy.org/2008/06/en-se-segment/#comments</comments>
		<pubDate>Mon, 02 Jun 2008 10:41:22 +0000</pubDate>
		<dc:creator>phzzy</dc:creator>
		
		<category><![CDATA[Tech]]></category>

		<category><![CDATA[分词]]></category>

		<category><![CDATA[搜索引擎]]></category>

		<guid isPermaLink="false">http://phzzy.org/?p=7</guid>
		<description><![CDATA[就做了三个简单的操作：
1、过滤非英文字符，然后依据空格来划分；
2、把复数单词转化为单数形式；
3、过滤 Stopwords。
很简单的分词，用来做英文 tag，分好后过一次词典就可以了。
例子：http://phzzy.org/code/en_seg/seg.php
代码：http://phzzy.org/code/en_seg/en_seg.zip
参考：
Stopwords: http://www.uspto.gov/patft/help/stopword.htm
]]></description>
			<content:encoded><![CDATA[<p>就做了三个简单的操作：<br />
1、过滤非英文字符，然后依据空格来划分；<br />
2、把复数单词转化为单数形式；<br />
3、过滤 Stopwords。</p>
<p>很简单的分词，用来做英文 tag，分好后过一次词典就可以了。</p>
<p>例子：<a href="http://phzzy.org/code/en_seg/seg.php" title="简单英文分词">http://phzzy.org/code/en_seg/seg.php</a><br />
代码：<a href="http://phzzy.org/code/en_seg/en_seg.zip">http://phzzy.org/code/en_seg/en_seg.zip</a></p>
<p>参考：<br />
<strong>Stopwords</strong>: <a href="http://www.uspto.gov/patft/help/stopword.htm">http://www.uspto.gov/patft/help/stopword.htm</a></p>
]]></content:encoded>
			<wfw:commentRss>http://phzzy.org/2008/06/en-se-segment/feed/</wfw:commentRss>
		</item>
		<item>
		<title>MySQL 数据库引擎比较</title>
		<link>http://phzzy.org/2008/05/mysql-database-engines/</link>
		<comments>http://phzzy.org/2008/05/mysql-database-engines/#comments</comments>
		<pubDate>Fri, 30 May 2008 02:12:37 +0000</pubDate>
		<dc:creator>phzzy</dc:creator>
		
		<category><![CDATA[Tech]]></category>

		<category><![CDATA[InnoDB]]></category>

		<category><![CDATA[MyISAM]]></category>

		<category><![CDATA[mysql]]></category>

		<guid isPermaLink="false">http://phzzy.org/?p=4</guid>
		<description><![CDATA[MyISAM:
优势
&#8211; 查询速度快
&#8211; 数据和索引压缩
问题
&#8211; 表级锁
&#8211; 数据丢失
InnoDB:
优势
&#8211; 行级锁
&#8211; 事务支持
&#8211; 数据安全
问题
&#8211; 数据文件庞大
&#8211; 启动慢
&#8211; 不支持FULLTEXT索引
比较:

]]></description>
			<content:encoded><![CDATA[<p><strong>MyISAM</strong>:<br />
优势<br />
&#8211; 查询速度快<br />
&#8211; 数据和索引压缩<br />
问题<br />
&#8211; 表级锁<br />
&#8211; 数据丢失</p>
<p><strong>InnoDB</strong>:<br />
优势<br />
&#8211; 行级锁<br />
&#8211; 事务支持<br />
&#8211; 数据安全<br />
问题<br />
&#8211; 数据文件庞大<br />
&#8211; 启动慢<br />
&#8211; 不支持FULLTEXT索引</p>
<p>比较:<br />
<a href='http://phzzy.org/wp-content/uploads/2008/05/mysql-database-engines.jpg'><img src="http://phzzy.org/wp-content/uploads/2008/05/mysql-database-engines-580x409.jpg" alt="" title="mysql-database-engines" width="580" height="409" class="alignnone size-medium wp-image-6" /></a></p>
]]></content:encoded>
			<wfw:commentRss>http://phzzy.org/2008/05/mysql-database-engines/feed/</wfw:commentRss>
		</item>
		<item>
		<title>firefox 光标丢失</title>
		<link>http://phzzy.org/2008/05/firefox-cursor-lost-bug/</link>
		<comments>http://phzzy.org/2008/05/firefox-cursor-lost-bug/#comments</comments>
		<pubDate>Tue, 20 May 2008 02:40:46 +0000</pubDate>
		<dc:creator>phzzy</dc:creator>
		
		<category><![CDATA[Tech]]></category>

		<category><![CDATA[bug]]></category>

		<category><![CDATA[firefox]]></category>

		<guid isPermaLink="false">http://phzzy.org/?p=3</guid>
		<description><![CDATA[来源：http://www.never-online.net/blog/article.asp?id=216
由于position设为绝对定位(absolute)，会导致该层里的textbox和textarea光标丢失。导致的原因已经查到，是gecko内核的bug。该bug可能在3.0以上版本后修复。
overflow:auto;
overflow-x:auto;
overflow-y:auto;
overflow:scroll;
overflow-x:scroll;
overflow-y:scroll;
overflow-x:hidden;
overflow-y:hidden;
position:absolute;
解决方法：
1. 在该容器加入css属性overflow:auto,position:relative
2. 在显示时使用延迟显示
原来被这个搞死了，找半天没找着怎么解决。
]]></description>
			<content:encoded><![CDATA[<p>来源：<a href="http://www.never-online.net/blog/article.asp?id=216">http://www.never-online.net/blog/article.asp?id=216</a><br />
由于position设为绝对定位(absolute)，会导致该层里的textbox和textarea光标丢失。导致的原因已经查到，是gecko内核的bug。该bug可能在3.0以上版本后修复。</p>
<p>overflow:auto;<br />
overflow-x:auto;<br />
overflow-y:auto;<br />
overflow:scroll;<br />
overflow-x:scroll;<br />
overflow-y:scroll;<br />
overflow-x:hidden;<br />
overflow-y:hidden;<br />
position:absolute;</p>
<p>解决方法：<br />
1. 在该容器加入css属性overflow:auto,position:relative<br />
2. 在显示时使用延迟显示</p>
<p>原来被这个搞死了，找半天没找着怎么解决。</p>
]]></content:encoded>
			<wfw:commentRss>http://phzzy.org/2008/05/firefox-cursor-lost-bug/feed/</wfw:commentRss>
		</item>
		<item>
		<title>Again</title>
		<link>http://phzzy.org/2008/05/again/</link>
		<comments>http://phzzy.org/2008/05/again/#comments</comments>
		<pubDate>Thu, 15 May 2008 08:32:51 +0000</pubDate>
		<dc:creator>phzzy</dc:creator>
		
		<category><![CDATA[Blog]]></category>

		<guid isPermaLink="false">http://phzzy.org/?p=1</guid>
		<description><![CDATA[重新开始了，原来那个空间忘续费，没注意空间商的提醒邮件，结果过了三个月被强制删了，啥都没了，我郁闷。
现在用 tony 的空间重新开了个，希望不会被老删了，懒得自己管空间，太麻烦了。皮肤用的 underone 的，清淡得好，就是用液晶的时候有些浅色的边框看不见，有空改改细节，改成偶喜欢的样子。新版 WP 的后台已经不会用了，找半天没找到改文章 Plus 的地方。
这还是关于技术的，以及一些自己做的站和小东西，可能更新比较慢。老惦记着要更新这太累了，呵呵。
博客的 PR 从今年初的 5，降到 三个月前的 4，现在已经变 1了，可有可无的一个博客，嘿嘿。
]]></description>
			<content:encoded><![CDATA[<p>重新开始了，原来那个空间忘续费，没注意空间商的提醒邮件，结果过了三个月被强制删了，啥都没了，我郁闷。<br />
现在用 <a href="http://blog.astonysh.com">tony</a> 的空间重新开了个，希望不会被老删了，懒得自己管空间，太麻烦了。皮肤用的 <a href="http://www.underone.com/">underone</a> 的，清淡得好，就是用液晶的时候有些浅色的边框看不见，有空改改细节，改成偶喜欢的样子。新版 WP 的后台已经不会用了，找半天没找到改文章 Plus 的地方。<br />
这还是关于技术的，以及一些自己做的站和小东西，可能更新比较慢。老惦记着要更新这太累了，呵呵。<br />
博客的 PR 从今年初的 5，降到 三个月前的 4，现在已经变 1了，可有可无的一个博客，嘿嘿。</p>
]]></content:encoded>
			<wfw:commentRss>http://phzzy.org/2008/05/again/feed/</wfw:commentRss>
		</item>
	</channel>
</rss>
