搜索:

陀思妥耶夫斯基的名言

把所有经济上的满足都给予他,让他除了睡觉、吃蛋糕和为延长世界历史而忧虑之外,无所事事,把地球上的所有财富都来满足他,让他沐浴在幸福之中,直至头发根:这个幸福表面的小水泡会像水面上的一样破裂掉。

——陀思妥耶夫斯基

作者:大恐龙 - 分类: '随笔|Essay' - - 评论 (0) - 引用通告 (0) - 查看次数: (0)

高性能数据库Hypertable(1)

    今天又有新的问题要问神,在google中输入"high performance open open source database". "Hypertable"赫然名列第一,在和蚊子腿们死磕一阵之后发现又是一个令人惊喜的好好玩艺。

    “Hypertable is a high performance distributed data storage system designed to support applications requiring maximum performance, scalability, and reliability.”

     高性能,分布式可用性,可伸缩性,反正就是牛的意思.......真的吗?

    “This project is for the design and implementation of a high performance, scalable, distributed storage and processing system for structured and unstructured data. It is designed to manage the storage and processing of information on a large cluster of commodity servers, providing resilience to machine and component failures. Data is represented in the system as a multi-dimensional table of information. The data in a table can be transformed and organized at high speed by performing computations in parallel, pushing them to where the data is physically stored. ”

     人家说了,同时面向结构化和非结构化的数据设计。同时使用大规模的服务器群处理信息--云计算?没有单点故障,多重表空间,数据可以被快速并行读取,物理层无关性。说的偶只流口水。

    “Modeled after Google's well known Bigtable project, Hypertable is designed to manage the storage and processing of information on a large cluster of commodity servers......”

     呵呵,果然,真的是要做成BigTable,很好很强大,足以打消任何顾虑svn一下。

     原来人家不用SVN了,最新的git version control system ,够声色犬马的。一直对perl没好感,这次还是觉得要试一下git.   

git.JPG

使用C++和java混合编写,不知道能不能在windows上运行,使用了hadoop作为分布式存储,还有一个简单的分词,很久没有用miniGW,不过相信还是还是可以在windows上跑起来的,不是我不喜欢linux,要知道恐龙我可是AIX和HPunix的双料administrator,在windows编译主要为了2次开发方便点。

      笔者一直在构思一种数据库环境,是在用lucene和hadoop构建搜索引擎时得到的灵感,我们其实需要一种这样的数据库环境:首先是大容量,无限大的容量,因为我们不知道数据会有多大,表有多长,或者有多少个表;其次廉价的运行环境,AIX?Oracle?不要开玩笑,把利润都交给IBM吗;最后是这个系统要易于维护,或者说是免维护,使用无数的普通PC来运行,使用最简单的维护操作,就像《Matrix》面机器生物种植人类提供能源一样。

     恐龙把这种架构定义为数据城市,有农场成产数据,有仓库存储数据,有工厂加工数据,有市场出售数据,所有的功能运行在无数廉价PC上,无边界的整合到IT环境中,形成一个生物圈,这样的环境首先已经出现网站和大型在线服务程序里,就像Bigtable,以后也必将产品化,进入企业领域,笔者也一直在构思这样的系统,开始的想法编写一系列的包,封装lucene的API,使其可以用HSL这样的方式来访问,中间层使用lucene+hadoop在构建非结构化的存储。Hypertable似乎很接近笔者的这种想法,看到了Hypertable又受益不少。

 

12:02分,值班结束,回家会周公去。今天的心得是,一定要相信神,有问题就要来问神,再就是时刻不要忘记思考如何把神一脚踢翻。

Tags: '' '' '' '' ''

作者:大恐龙 - 分类: '数据库|DataBase' '系统|System' - - 评论 (0) - 引用通告 (0) - 查看次数: (0)

Squid配置以缓存大量图片-备忘

配置文件如下

http_port 59.175.238.60:80 defaultsite=219.140.171.194 vhost vport=80
 
cache_mem 2048 MB
cache_swap_low 90
cache_swap_high 95
 
maximum_object_size 20 MB
maximum_object_size_in_memory 8 MB
 
cache_dir ufs /squid_cache 100000 128 512
 
cache_peer 219.140.171.194 parent 80 0 no-query originserver
cache_peer_domain 219.140.171.194 img.cnhubei.com
 
acl all src 0.0.0.0/0.0.0.0
acl Safe_ports port 80
acl Safe_ports port 443
acl AntiBaidu req_header User-Agent Baiduspider
acl cnhubei referer_regex -i cnhubei
acl nullref referer_regex -i ^$
http_access allow nullref
http_access deny !Safe_ports
http_access deny AntiBaidu
http_access deny !cnhubei
deny_info http://www.cnhubei.com/images/2007cnhubei04y002.jpg cnhubei
http_access allow all

visible_hostname www.w3cool.com
cache_mgr zhangweijie@gmail.com
 
#### Disable Logs
cache_store_log none
cache_vary on
logfile_rotate 0
 
refresh_pattern -i \.*$ 1440 90% 129600 reload-into-ims

参数设置的都很暴力,还设置了一个反盗链 

查看全文:"Squid配置以缓存大量图片-备忘" »

Tags: '' ''

作者:大恐龙 - 分类: 'Linux/UNIX/BSD' '系统|System' - - 评论 (0) - 引用通告 (0) - 查看次数: (0)