sql >> Base de Datos >  >> RDS >> Mysql

Conexión de MySQL a Apache Nutch

Obtenga la fuente de http://mirror.nyi.net /apache//nutch/apache-nutch-1.2-src.zip

Abra org.apache.nutch.crawl.Crawl clase en su editor.

Variable de búsqueda Path crawlDb = new Path(dir + "/crawldb");

La variable dará una pista sobre dónde reemplazar el código para obtener su propio CustomMySQLCrawl clase.

La persistencia ocurre durante esta llamada:crawlDbTool.update(crawlDb, segs, true, true); // update crawldb Así que ahí es donde debes guardarlo en la base de datos. Es posible que desee considerar la integración de hibernación en este punto.