月归档:2014年03月

C#与闭包 – jujusharp – 博客园

C#与闭包 – jujusharp – 博客园

首先想说明一点,虽然有这样那样的不好的心态(比如中文技术书),但总体来说,国内的技术人员还是喜欢分享和教导别人的,这点我的个人感受和之前在园子里看到的朋友的感受恰恰相反.个人认为其实国内很多技术网友都是很热心的,可能因为语言问题同一个技术热点会稍稍落后[……]

Read more

发表在 Uncategorized | 标签为 | C#与闭包 – jujusharp – 博客园已关闭评论

快速构建实时抓取集群 – NoSQLFan – 关注NoSQL相关技术、新闻

【说明】 本文转载自:http://blog.nosqlfan.com/html/2604.html

快速构建实时抓取集群 – NoSQLFan – 关注NoSQL相关技术、新闻

快速构建实时抓取集群

作者:nosqlfan on 星期六, 七月 30, 2011 · 评论本文 【[……]

Read more

发表在 Uncategorized | 标签为 | 快速构建实时抓取集群 – NoSQLFan – 关注NoSQL相关技术、新闻已关闭评论

Scrapy爬虫教程之URL解析与递归爬取 – ian的个人博客

【说明】 本文转载自:http://www.icodelogic.com/?p=459

Scrapy爬虫教程之URL解析与递归爬取

前面介绍了Scrapy如何实现一个最简单的爬虫,但是这个Demo里只是对一个页面进行了抓取。在实际应用中,爬虫一个重要功能是”发现新页面”,然后递归的让爬取操作进行下去。

发现新页面的方法很简单,我们首先定义一个爬虫的入口[……]

Read more

发表在 Uncategorized | 标签为 , | Scrapy爬虫教程之URL解析与递归爬取 – ian的个人博客已关闭评论

SolrCloud = Solr 4.6.1 + Apache Tomcat 8.0.1 + zookeeper3.4.5

【声明】本文为AdamsLee原创,转载请注明出自围炉网并保留本文有效链接:SolrCloud = Solr 4.6.1 + Apache Tomcat 8.0.1 + zookeeper3.4.5, 转载请保留本声明!

  • sudo vi /etc/hosts if find something like 127.0.1.1
    • #127.0.1.1 ubx1
      192.168.1.106 ubx1
  • zookeeper
    1. set zookeeper conf file conf/zoo.cfg
      • dataDir=/home[……]

Read more

发表在 Uncategorized | 标签为 | SolrCloud = Solr 4.6.1 + Apache Tomcat 8.0.1 + zookeeper3.4.5已关闭评论