陀思妥耶夫斯基的名言
[ 大恐龙 发表于 2008年6月12日 12:44 ]
高性能数据库Hypertable(1)
[ 大恐龙 发表于 2008年6月19日 22:42 ]
今天又有新的问题要问神,在google中输入"high performance open open source database". "Hypertable"赫然名列第一,在和蚊子腿们死磕一阵之后发现又是一个令人惊喜的好好玩艺。
“Hypertable is a high performance distributed data storage system designed to support applications requiring maximum performance, scalability, and reliability.”
高性能,分布式可用性,可伸缩性,反正就是牛的意思.......真的吗?
“This project is for the design and implementation of a high performance, scalable, distributed storage and processing system for structured and unstructured data. It is designed to manage the storage and processing of information on a large cluster of commodity servers, providing resilience to machine and component failures. Data is represented in the system as a multi-dimensional table of information. The data in a table can be transformed and organized at high speed by performing computations in parallel, pushing them to where the data is physically stored. ”
人家说了,同时面向结构化和非结构化的数据设计。同时使用大规模的服务器群处理信息--云计算?没有单点故障,多重表空间,数据可以被快速并行读取,物理层无关性。说的偶只流口水。
“Modeled after Google's well known Bigtable project, Hypertable is designed to manage the storage and processing of information on a large cluster of commodity servers......”
呵呵,果然,真的是要做成BigTable,很好很强大,足以打消任何顾虑svn一下。
原来人家不用SVN了,最新的git version control system ,够声色犬马的。一直对perl没好感,这次还是觉得要试一下git.
使用C++和java混合编写,不知道能不能在windows上运行,使用了hadoop作为分布式存储,还有一个简单的分词,很久没有用miniGW,不过相信还是还是可以在windows上跑起来的,不是我不喜欢linux,要知道恐龙我可是AIX和HPunix的双料administrator,在windows编译主要为了2次开发方便点。
笔者一直在构思一种数据库环境,是在用lucene和hadoop构建搜索引擎时得到的灵感,我们其实需要一种这样的数据库环境:首先是大容量,无限大的容量,因为我们不知道数据会有多大,表有多长,或者有多少个表;其次是廉价的运行环境,AIX?Oracle?不要开玩笑,把利润都交给IBM吗;最后是这个系统要易于维护,或者说是免维护,使用无数的普通PC来运行,使用最简单的维护操作,就像《Matrix》面机器生物种植人类提供能源一样。
恐龙把这种架构定义为数据城市,有农场成产数据,有仓库存储数据,有工厂加工数据,有市场出售数据,所有的功能运行在无数廉价PC上,无边界的整合到IT环境中,形成一个生物圈,这样的环境首先已经出现网站和大型在线服务程序里,就像Bigtable,以后也必将产品化,进入企业领域,笔者也一直在构思这样的系统,开始的想法编写一系列的包,封装lucene的API,使其可以用HSL这样的方式来访问,中间层使用lucene+hadoop在构建非结构化的存储。Hypertable似乎很接近笔者的这种想法,看到了Hypertable又受益不少。
12:02分,值班结束,回家会周公去。今天的心得是,一定要相信神,有问题就要来问神,再就是时刻不要忘记思考如何把神一脚踢翻。
Tags:
'bigtable' 'google' 'hypertable' '分布式' '数据库'
Squid配置以缓存大量图片-备忘
[ 大恐龙 发表于 2008年6月24日 01:29 ]
配置文件如下
http_port 59.175.238.60:80 defaultsite=219.140.171.194 vhost vport=80
cache_mem 2048 MB
cache_swap_low 90
cache_swap_high 95
maximum_object_size 20 MB
maximum_object_size_in_memory 8 MB
cache_dir ufs /squid_cache 100000 128 512
cache_peer 219.140.171.194 parent 80 0 no-query originserver
cache_peer_domain 219.140.171.194 img.cnhubei.com
acl all src 0.0.0.0/0.0.0.0
acl Safe_ports port 80
acl Safe_ports port 443
acl AntiBaidu req_header User-Agent Baiduspider
acl cnhubei referer_regex -i cnhubei
acl nullref referer_regex -i ^$
http_access allow nullref
http_access deny !Safe_ports
http_access deny AntiBaidu
http_access deny !cnhubei
deny_info http://www.cnhubei.com/images/2007cnhubei04y002.jpg cnhubei
http_access allow all
visible_hostname www.w3cool.com
cache_mgr zhangweijie@gmail.com
#### Disable Logs
cache_store_log none
cache_vary on
logfile_rotate 0
refresh_pattern -i \.*$ 1440 90% 129600 reload-into-ims
参数设置的都很暴力,还设置了一个反盗链













![[Valid RSS]](http://www.w3cool.com//images/valid-rss.png)
![Validate my Atom 1.0 feed [Valid Atom 1.0]](http://www.w3cool.com//images/valid-atom.png)






[卓越网] 于 08-12-22 发表: 博主您的博客挺不错的, 可否做个链接? 我那边做好了~ 我的博客是 大恐龙
[购买] 于 08-12-21 发表: 很喜欢这个功能,但是我加入代码还是不能用,是不是有限制呢? 我自己有服务器,可否购买你的软件,我自...
[大恐龙
[linuxes] 于 08-12-13 发表: 请问wordpress里面怎么用?...
[游客] 于 08-12-13 发表: 原来乌班图免费光盘是这样子的 看看就好 索取的人多了 估计要垮掉 不忍心啊...
[大恐龙
[renm79] 于 08-12-11 发表: 今天看了你的文章非常有启发,然后照着文章去试了一试,发现几个不明白的地方,还请赐教。1)直接按你说的...
[hanyu] 于 08-12-10 发表: 没办法.现在网站广告的投放各大媒体都声称自己的可以流量和点击及视频播放可以达到什么程度.其实都是在用...
[大恐龙
[hanyu] 于 08-12-08 发表: 现在ICAST已经减少了前面那种的富媒体投放形式而转为使用MPU中FLASH钳套新的FLASH或视频...
[大恐龙
[tanguan] 于 08-12-04 发表: 老是语音服务忙,怎么办?...
[443205231@qq.com] 于 08-11-28 发表: 这个功能太爽了!!...