资源大小: 51KB
发布时间: 2008-03-31
文件格式: rar
下载次数: 0
分享到:

下载地址:

下载地址1
(本站为飞网专业下载站,域名:down.cfei.net)

资源简介:

预览图片见:http://www.cnblogs.com/xxpyeippx/archive/2008/03/31/1131211.html
运行环境
windows nt/xp/2003 or above
.net Framework 1.1
SqlServer 2000
开发环境 VS 2003

目的
学习了网络编程,总要做点什么东西才好。
于是想到要做一个网页内容采集器。

作者主页: http://www.fltek.com.cn



使用方式
测试数据采用自cnBlog。
见下图
用户首先填写“起始网页”,即从哪一页开始采集。
然后填写数据库连接字符串,这里是定义了采集到的数据插入到哪个数据库,后面选择表名,不必说了。

网页编码,不出意外的话,中国大陆都可以采用UTF-8

爬取文件名的正则:呵呵 这个工具明显是给编程人员用的。正则都要直接填写啦。比如说cnblogs的都是数字的,所以写了\d

建表帮助:用户指定要建立


飞网下载站,免费下载共享资料,内容涉及教育资源、专业资料、IT资源、娱乐生活、经济管理、办公文书、游戏资料等。