以文本方式查看主题

-  课外天地 李树青  (http://www.njcie.com/bbs/index.asp)
--  信息检索原理课件  (http://www.njcie.com/bbs/list.asp?boardid=16)
----  关于Heritrix的启动方法  (http://www.njcie.com/bbs/dispbbs.asp?boardid=16&id=733)

--  作者:admin
--  发布时间:2009/5/20 19:26:13
--  关于Heritrix的启动方法

1)下载文件,如heritrix-1.12.0.jar

2)修改conf下的heritrix.properties,增加新的用户名称,如: heritrix.cmdline.admin = admin:admin

3)进入heritrix-1.12.0.jar所在的目录,在本例中该目录为:E:\\heritrix

4)在命令提示符中运行命令 如是1.12版本,命令为: java -Xmx512m -Dheritrix.home=e:\\\\heritrix -cp "E:\\\\heritrix\\\\heritrix-1.12.0.jar;E:\\\\heritrix\\\\lib\\\\commons-codec-1.3.jar;E:\\\\heritrix\\\\lib\\\\commons-collections-3.1.jar;E:\\\\heritrix\\\\lib\\\\dnsjava-2.0.3.jar;E:\\\\heritrix\\\\lib\\\\poi-scratchpad-2.0-RC1-20031102.jar;E:\\\\heritrix\\\\lib\\\\commons-logging-1.0.4.jar;E:\\\\heritrix\\\\lib\\\\commons-httpclient-3.0.1.jar;E:\\\\heritrix\\\\lib\\\\commons-cli-1.0.jar;E:\\\\heritrix\\\\lib\\\\mg4j-1.0.1.jar;E:\\\\heritrix\\\\lib\\\\javaswf-CVS-SNAPSHOT-1.jar;E:\\\\heritrix\\\\lib\\\\bsh-2.0b4.jar;E:\\\\heritrix\\\\lib\\\\servlet-tomcat-4.1.30.jar;E:\\\\heritrix\\\\lib\\\\junit-3.8.2.jar;E:\\\\heritrix\\\\lib\\\\jasper-compiler-tomcat-4.1.30.jar;E:\\\\heritrix\\\\lib\\\\commons-lang-2.1.jar;E:\\\\heritrix\\\\lib\\\\itext-1.2.0.jar;E:\\\\heritrix\\\\lib\\\\poi-2.0-RC1-20031102.jar;E:\\\\heritrix\\\\lib\\\\jetty-4.2.23.jar;E:\\\\heritrix\\\\lib\\\\commons-net-1.4.1.jar;E:\\\\heritrix\\\\lib\\\\libidn-0.5.9.jar;E:\\\\heritrix\\\\lib\\\\ant-1.6.2.jar;E:\\\\heritrix\\\\lib\\\\fastutil-5.0.3-heritrix-subset-1.0.jar;E:\\\\heritrix\\\\lib\\\\je-3.2.13.jar;E:\\\\heritrix\\\\lib\\\\commons-pool-1.3.jar;E:\\\\heritrix\\\\lib\\\\jasper-runtime-tomcat-4.1.30.jar" org.archive.crawler.Heritrix

如是1.14版本,命令为: java -Xmx512m -Dheritrix.home=e:\\\\heritrix -cp "E:\\\\heritrix\\\\heritrix-1.14.0.jar;E:\\\\heritrix\\\\lib\\\\commons-codec-1.3.jar;E:\\\\heritrix\\\\lib\\\\commons-collections-3.1.jar;E:\\\\heritrix\\\\lib\\\\dnsjava-2.0.3.jar;E:\\\\heritrix\\\\lib\\\\poi-scratchpad-2.0-RC1-20031102.jar;E:\\\\heritrix\\\\lib\\\\commons-logging-1.0.4.jar;E:\\\\heritrix\\\\lib\\\\commons-httpclient-3.1.jar;E:\\\\heritrix\\\\lib\\\\commons-cli-1.0.jar;E:\\\\heritrix\\\\lib\\\\mg4j-1.0.1.jar;E:\\\\heritrix\\\\lib\\\\javaswf-CVS-SNAPSHOT-1.jar;E:\\\\heritrix\\\\lib\\\\bsh-2.0b4.jar;E:\\\\heritrix\\\\lib\\\\servlet-tomcat-4.1.30.jar;E:\\\\heritrix\\\\lib\\\\junit-3.8.2.jar;E:\\\\heritrix\\\\lib\\\\jasper-compiler-tomcat-4.1.30.jar;E:\\\\heritrix\\\\lib\\\\commons-lang-2.3.jar;E:\\\\heritrix\\\\lib\\\\itext-1.2.0.jar;E:\\\\heritrix\\\\lib\\\\poi-2.0-RC1-20031102.jar;E:\\\\heritrix\\\\lib\\\\jetty-4.2.23.jar;E:\\\\heritrix\\\\lib\\\\commons-net-1.4.1.jar;E:\\\\heritrix\\\\lib\\\\libidn-0.5.9.jar;E:\\\\heritrix\\\\lib\\\\ant-1.6.2.jar;E:\\\\heritrix\\\\lib\\\\fastutil-5.0.3-heritrix-subset-1.0.jar;E:\\\\heritrix\\\\lib\\\\je-3.2.74.jar;E:\\\\heritrix\\\\lib\\\\commons-pool-1.3.jar;E:\\\\heritrix\\\\lib\\\\jasper-runtime-tomcat-4.1.30.jar" org.archive.crawler.Heritrix

5)在Web浏览器中键入: http://localhost:8080/


--  作者:小强
--  发布时间:2009/5/22 18:45:46
--  

老师,

“2)修改conf下的heritrix.properties,增加新的用户名称,如: heritrix.cmdline.admin = admin:admin”

我下载后 conf里面的三个文件打不开,请问用什么格式打开啊?怎样增加新的用户名称啊?


--  作者:admin
--  发布时间:2009/5/24 14:23:52
--  回复
使用记事本等文本编辑器即可打开,找到heritrix.cmdline.admin项目后即可添加