宽度优先是爬虫中使用最为广泛的一种策略,更详细的可以查看宽度优先爬虫。
下午没事干,正好练练python,顺便发本月第一篇blog。。。代码简单实现了抓取网页的中超链接,就是a标签的href,其他像简单的img标签也类似。

平时找回密码用的最多的有2种机制,一是回答预设问题来重置,二是通过邮箱重置密码,想了一下第一种很容易实现,但用户注册时必须输入一大堆信息就很不好,第二种就很方便。
今天突然想试试Django的邮件功能,便去查了一下。
Django发送邮件极其简单,它依赖于settings.py中的EMAIL参数。
大致看了Django自带的用户授权认证系统,还是非常复杂的,实际开发中,我们可以直接用这套系统处理各个用户之间的权限,组等问题,我今天使用了一下它最简单的登陆注销,十分方便就能实现,不用去关心Cookie和Session的处理问题。
看了一天的The Django Book,被Django的两点多吸引,1是自己配置url形式,这个真的太方便了,想当时为了为了仿notepad.cc的url形式,研究了半天的.htaccess。。。WordPress的自定义固定链接我不知道是怎么实现的,Django到能轻易实现,url可以变得非常灵活;2是Model和数据库的对应,在SSH架构中,需要一个hbm.xml和一个实体类,Django里只需定义class即可,而且可以直接说明many-to-many或one-to-many,非常快。当然忍不住也想自己试试敲几行代码,这个app非常简单,实现了用户登陆的功能,显示一个表单供用户登陆,成功就显示成功。