Skip to content

Monthly Archives: January 2008

雪灾杂记

  今年要带大妈回家。前几周大妈就说:电视上说你们家好冷啊,好怕~我说湖南本来就很冷。后来父亲打电话过来,说好多年没有这么冷了,路上都结冰了。到了这个星期,情况恶化,变成雪灾了。这下好了,何时见公婆?我的情况肯定不算最惨的,网上看到一个兄弟,本来打算28号回家结婚,带着未婚妻在外面漂泊了好几天,花了数十倍的钱,愣是没回去。
  昨天打电话回家,父亲说,停电停水了,要过几天才能来,煤气还有。家里还有些炭火,粮食储备充足。晚上只能围着炭火,借着蜡烛看书了。
  有个朋友刚从长沙跑到北京面试,我说,这下好了,回不去了吧?在北京过年吧,反正北京帮人数不少,好些人都困在北京了。
  温总理从北京跑到长沙去了,还对着火车站的人喊话,据说又跑到了广州。飞机坐不了,只能坐火车去,还好他的专列还是能开的。总理喊话重点内容就是:我们正在抢修电线,有电了,火车就能开了。
  也是,现在煤、电、铁路都成了一个大循环。发电站烧煤发电,火车用电拉煤。没有电就没有火车,没有火车就没有煤,没有煤就没有电。电厂的煤储量在以每天30万吨的速度消耗,如果再运不过来,岂不是都要停摆?新闻上说,北方的一些柴油机车都临时抽调到南方去了,总算是能跑。能不能赶在煤烧完之前,把这个循环重新恢复起来?由此也可见这个系统对于外力还是十分脆弱的。
  Google赶时间出了个谷歌春运交通图,把一些消息都集中在一张图上,倒是非常的直观。看到的第一条就是北京停止发售株洲以南车票,我家就在株洲以南……
  老外赶紧跑出来喊,中国强雨雪与全球暖化有关。咱们还是先生产自救吧。
  昨夜和老板吃饭,席间说到,这雪要是初五、六再下,那是再好不过了——把大家都困在家里,多放几天假,能有多美。现在好了,大家只能坚持在工作岗位上了。其实不要想着回家,有空出去堆个雪人也好。

读书:沉思录,一本哲学书的畅销书尝试

  这本书我刚刚拿到,还没有读。
  第一次遇见这本《沉思录》是在阅读时光,中央编译出版社的,深红色封皮,显得外表含蓄沉着,内心火热无比的样子。厚薄刚刚好,200多页。扫了一眼介绍。背后的推荐人部分赫然写到:
温总理说:“这本书天天放在我的床头,我可能读了有100遍,天天都在读。
1992年,我问克林顿,除了《圣经》,哪本书对他影响最大。他略微沉思了一下,回答说:“马可·奥勒留的《沉思录》。
  我霎时间就被震住了,什么书能够得到这两个人的背书?一定要去弄一本来看看。
  今天我有机会去书店,进了店门就问,那个《沉思录》在哪里?店家指了指书架,我就跑过去找,一口气竟然找出来两本。除了红色的一本,还有一本是蓝色的,三联书店,比较薄,163页,一看就是本学术小品。封面光滑而寒冷,似乎要拒人于千里之外。
  这两本书都是2008年1月份出的,同一个译者,而且译者自序都是1988年的,内容几乎一模一样。
  但是,除了封皮,两本书的版式安排也有很多差别。比如说中央编译出版社的版本,行距比较大(所以多出来几十页),加了一些插画,另外,把比较重要的句子挑选出来,放在了页面的上端,或者章节的开头。而三联的版本,排版很紧,除了正文,几乎没有任何多余的装饰,前后也没有什么“推荐人的话”。
  调查了一下,温总理的那句话真的在新闻中出现过。豆瓣网友说,“他这么一说这本书从8.7涨到了20”。
  从豆瓣的数据来看,到目前为止,中央编译版本有206人想读,23个评分;三联版本,16人想读,4个评分。事实证明,这个包装相当成功。
  我拿的是三联的版本,便宜两块钱。

pyfan 0.0.5

  pyfan是一个python写的fanfou客户端,运行在命令行下面。
  基本功能终于差不多全了,直接下载源代码吧。
使用说明

第一次使用的时候,用 -l 用户名 作为参数,建立数据库,默认是下载前100条,可以用 –max=number 设定。
-u 是用来更新的,一直下载到你上一次更新那个时间点,可以用 pyfan -u | less 慢慢看。

想要发言,随便写就可以,例如"pyfan @xxx 天气真好~"。

这两个参数可以和以下参数配合使用(默认是从第1条开始显示20条):
-n 设定显示的数量。
-b 设定显示的开始位置。

-t 显示timeline
-m 搜索出现 @自己 的帖子。
-c 用户名 搜索你与某人的往来对话。
-w 用户名 搜索某人说的话,当然也可以搜索自己的。
-s 字符串 按字符串搜索。
-d 日期 按日期搜索,格式为10位数字,分别是年、月、日、小时、分。可以不全,比如 -d 08 ,就是搜索 2008 年的帖子。用00占位(小时和分分别是24和60占位),比如 -d 000011 就是每个月11号的帖子。

"-f 数字"用来添加分享,数字对应上一次打印出来的列表开头的数字。

题外话

饭否的API比较不全,比如没有搜索,也无法输出20条之前的内容,很不爽。
所以pyfan的主要特点就是下载20条以前的东西,为了达成这个功能,基本上主要的内容下载都用的是html解析,虽然笨拙,但是能工作。损失了一部分信息,比如说没有"秒"的属性,因为页面上没有。
favorite功能也是用html实现的,还用到了cookie。twitter的api就有这个,fanfou的人都跑去写海内了,api也没人管。
命令行下面我比较喜欢的用法,是用 pyfan -u [...]

我们的社会正在多样化

(浙江大学?似乎是浙大网新在搞鬼。)
  一早起来,同时在solidot和fanfou看到这条消息《IPv9投入使用》,我竟然一时间精神恍惚。我不知道是不是因为这个社会已经足够的多样化了,因此能够允许这种玩笑长期的存在。据说新闻说,这个东西大概搞了十年。周老虎人家只搞了几个月,还娱乐了大众,这破玩意你搞了十年?你娱乐了谁?
  一个月以前在solidot看到的消息,并没有太在意,没想到这些人竟然把这个莫须有的东西继续发扬光大。根据ruanyifeng博客上的留言链接,和solidot的链接,确实有人一直在关注这个事情。简言之,“中国IPv9是什么?是中国一家私营企业开发的一个跑在全球 Internet(互联网)上数据传输协议”。
  让我们看看实际的使用吧:
记者在下载了“中国十进制网络安全地址”插件后,输入“12345”,中华人民共和国中央人民政府门户网站首页顿时展现;输入“4312345”“73112345”,湖南省人民政府、长沙市人民政府官方网站随即打开;输入“12339”“4312339” “12315”和“4312315”,信息产业部、湖南省信息产业厅、国家工商总局和湖南省工商局的网页依次映入眼帘。
  但正如关注周老虎不会使你的生物课及格一样,吃狗屎也是没有营养的,少吃为上。我要去反思一下,我竟然为此写了篇博客。如果确实需要娱乐,可以去MOST看看。

杂记:你在火车(飞机)上读书吗?

  忘记在哪里看到的话题了,似乎是在思维的乐趣,写在纸上,今天又翻出来。
  我在旅行的时候,每次都会带上一本书,甚至是很多本——我在火车上看书的效率比在家里看书的效率还高。但是,在火车上的确很少看到有人在看书,打牌闲聊的占大多数,即使是看书,报纸杂志也是占多数的。你看书吗?
  有几个相关的要点:
  1)国外的情况是,车上或者飞机上,很多人都在看书。我没有到过国外,不知道这个比例能高多少。
  2)国外机场或者车站里面,有专门卖旅行书籍的,也就是比普通书小一点的那种。
  3)国内的车站里面只有报纸和一些非法出版物(大多是杂志),卖畅销书的也有一些,但是看到很少。
  4)国内的人均书籍消费量非常的低,阮一峰曾经贴过数据,平均每人年不到10元钱,也就是不到一本书。
  5)辽宁出版集团最近上市,虽然只是编辑业务和渠道打包上市,依旧大涨。阮一峰最近贴过很多相关信息。
  6)国外有航空公司在飞机上提供无线上网,但是后来就取消掉了,用户太少。毕竟,要在QQ上和人说“看哪我现在是在20000英尺高空”的人很少。
  7)现在的飞机上(尤其像A380这种)大多提供了娱乐系统,国内的火车上也已经布满了电视(广告)。
  8)Analy说她是在车上看书的,而且会提前准备。
  9)Kulala不在车上看书,因为会头晕。
  10)旅行的时候,尤其出去登山,并不经常看到旅伴们带上一本书,虽然看到我的书的时候会抢。
  简言之,消费者的习惯还在剧烈的变化中,他们可能还没有发现旅行很乏味(因此要准备一本书),就被多媒体信息所填充了(因此不再需要一本书)。旅行书籍市场可能还没有诞生,就已经夕阳了?

Google reader的share和read

1)关于Share
  Google Reader的社会化功能,推出已经有一个多月了。简言之,他是将好友们分享的文章,直接“推送”到你的阅读列表中来。
  我一开始并不太喜欢这个功能,但是一个月过后,觉得这个功能还是有一定的可取之处的。
  抓虾的社会化功能是这样的:所有人看过文章之后,都可以对文章进行推荐,你读到这篇文章的时候,就可以看到前人对这个文章的总体评价。虽然受到种子订阅数的影响(比如和菜头的每篇文章都有大量的推荐),但总体来说,通过这个数字,你还是可以更快的分辨出哪些文章更加的有价值。他是一种现有信息上的加权。
  而Google Reader的社会化,实际的效果大概是:好友们会将他们喜爱的主题分享出来,这可能有两个好处,第一个,你借此了解到他有什么喜好,毕竟分享这个功能一个S键就够了,执行成本很低,因此比其他渠道暴露的可能性更高;第二个,你可能借此接触到比较好的一些博客,我经常看到一个朋友频繁的Share某一个博客上的文章,当这个数量积累到一定时候,大脑就会有这样的反应——这个人的博客一定写的不错——虽然这种反应是大脑主观计算出来的,但也提供了一条挖掘有价值博客的好的渠道。
  比较过之后,我觉得,如果能够把这两种算法结合起来,就更完美了。实际上抓虾在这方面已经走在了前面,他的好友页面上是有分享列表的。但是一则这个好友列表没有做google reader这样的强制植入(从而独立于抓虾的评价体系之外,没有了附加价值,也没有任何方便性可言,就是鸡肋);二则抓虾至今位置也没有加入快捷键支持(连鲜果都有了!当你的feed超过200之后,你就知道这个功能的确必不可少,否则阅读速度上损失很大,抓虾真的没有在这个方面多用力;或者从另外一个角度来说,阅读的这个行为的黏性降低了,往往读到一半就失去了乐趣)。
  其实鲜果上这些功能都有了,做的也不错,可惜他出生的不太是时候,社会化社会化,没有用户就没有社会化了。
2)关于Read
  关于阅读的一点小想法。
  我用抓虾的时候都是这样的:用列表模式,先看标题,看到有趣的就点开看内容,比较合适的就推荐,或者搜藏。收藏的时候必须要加上标签,这个有一定的时间耗费。抓虾所有显示出来的帖子都会标记已读,所以每次至少要处理20个帖子,有一定的压力。
  我用Google Reader的时候都是这样的:用List或者Expand模式(前者多一些),ga(显示所有),然后右手按j(下一帖),左手放在s(star标记,不用贴标签)上面,看见感兴趣的就标记上。10秒钟一个贴过一遍,然后回过头在看被标记的文章。后来分出来一个代表重要程度的标签,包括一些重要的博客,每天默认先看这个标签下的文章。
  今天花一个半小时过滤了300篇,有一个想法:有些信息反正总是会错过的,不如这个j也不要用了。也就是用List模式,一般能现实帖子的前20个字,大致就能判断这个帖子是否可读。标记出来(只需要鼠标点击一下就可以实现),然后再集中处理。通过这样的手段,应该能把过滤这个工序,压缩到3秒/贴以内。
  前面我说道,google reader这个j快捷键在带来方便的同时,会造成一定的阅读黏性,或者说,信息麻醉。就像我这样,一个一个j下去,“陶醉在无边无尽的信息海洋里”,不知不觉一两个小时就过去了。这就好像在tudou上看视频,或者在joke版看笑话差不多,看完这个看那个,看完新帖看精华。
  对于信息,我们的身份在更多的时候应该是一个渔人,而不是游泳健将。你从水中划过,什么痕迹也没有留下,最多强身健体;而你从水中取鱼,却可以果腹。所以,一方面要欢迎Google Reader这样的阅读器,充分利用屏幕空间,用最快捷的方式将信息海洋推到你面前(而不是像抓虾那样,只让你听到涛声);另外一方面也要做一个清醒的渔夫,要站在岸边,站在船上,有一定距离的去看这个海,重要的是,不要忘记自己抓鱼谋生的任务。
  阅读是一个需要不断改进的技巧,也是一个“大航海时代”必须修炼的技能。
BTW: 1)最近cph服务器一直在做调整,经常出现断线的情况。不知道过了这段时间是不是好一点。我申请了两个检测服务,国内(抄袭的惟妙惟肖啊,不错),国外,专门用来检测在线时间数据。 2)改了改网站的副标题,恩。 3)这篇写的太长……要拆成两篇不就赚了……

隐形的翅膀

(2007年12月31日晚,北京大学2008新年联欢晚会在百周年纪念讲堂隆重上演。北大校长许智宏演唱了流行歌曲《隐形的翅膀》,将晚会的热烈气氛推至顶点。)
  新浪有个更清晰一些的版本。
  想起一个故事。几年前,我在宿舍大门前看到一个通知,大意如下:我校校长将于下周参观寝室,请各位提前做好卫生。
  如果你曾经这样生活过,你就知道,这样的视频怎能不叫人热泪盈眶。

apple4.us,Minifun.cn和Lifehack.cn

  张亮在最近的一篇博客里,介绍了他的Apple4.us站。阮一峰也正式宣布了他所建立的Minifun.cn。
  这两个站点有一个共同的特点,他们都是群体博客,或者目标是成为一个群体博客。关于群体博客,momo已经闹了好几年了,nklog依旧是一个BSP,并没有转型成为一个群体博客。这事情做起来并不容易,但我们看见,越来越多的人挽起袖子干起来,并且做的很好。
  Apple4.us是一个很令人惊喜的网站:风格简洁,叫人喜爱;内容很紧凑,然而张力却很大。张亮说,“我就有一个观念,就是一定要看准这两家公司(另外一个是Google)的一举一动,因为它们的行动,经常有大风起于青萍之末的敏感:它们比各自所在领域的其它公司,更聪明,更敢于走在潮流之前,也的确在引领整个行业的变化。就有点像作学术研究,总要关注最顶尖学者的新论文。”这是他选择建立这样一个博客的初衷,也是这个博客的基础。“光我个人,持续跟踪的中英文苹果相关网站,大概就不少于20个”,这是他的信息源。“我通过这个blog认识了一个叫胡维的大二学生”,“张一谋和Woody成为了幕后的支持者”,“无意中发现的ilovemac.cn的作者朱文杰”,这是他的团队。“简洁、优质、有性格、提供惊喜”,这是他的编辑原则。
  相对来说,阮一峰的Minifun.cn诞生时间要更短一些,更像一个个人的书签。虽然编辑原则是“人文视角,强调知识性和趣味性”,但是目前已经存在的这些帖子,却还没有将这个主题体现出来。浏览完现有的10页内容之后,我依旧没有抓住这个网站想要向我传递些什么。反过来说,他的主博客,虽然内容更加严肃一些,但显然信息量更大,也更能在每一篇博客文章中,体现出博客主人一种深刻的入世情怀。对于Minifun.cn,如果不大力整顿,或许只能止步于与此了。
  这让我想起前不久参与的一个项目,Lifehack.cn。这个项目刚刚发起的时候,相当的轰轰烈烈,站长召集了一大批写手(我也有幸位列其中),通宵开会确定了中文名字、站点分类、发文原则。然而接下来就是一片沉寂。再后来,站点在悄无声息中建立了起来,再后来,多了几篇文章,如此而已。
  这或许和做任何成功的事情一样:有一个引人入胜的主题,有一群核心参与者,有一个良好的组织模式,事情便这么成了。对于成功者或许很容易,但又不是那么随随便便就能够得到的。

读书:《德川家康》

  前不久刚刚读到山冈庄八的简介,就在书店里看到了刚上市的《德川家康》,于是租回来看。简介中说,山冈庄八从四十多岁开始,用了17年的时间,终于连载完了《德川家康》——17年啊,这本书到底有多长?拿到手上一看,果然很长。目前只出了两本,每本都是400多页,我现在已经看了一又三分之一本,也就是看了500多页,才刚刚从爷爷辈讲到父亲辈,再讲到主人公做了十几年的人质,现在18岁了,正要去打人生的第一仗——这个一个大将、君主,到现在还是毛孩子呢。并且,由于从小到大老是换名字,这个时候书中还根本没有出现过“德川家康”几个字——那是700多页之后的事情了。
  和菜头不久前评价过山冈庄八的另外一本书《织田信长》,那本书有1111页,估计和《德川家康》是一个路数。反正他们两个是同一个时代的人,年纪相差几岁,又有很多交往,写完这个写那个,自是很轻松的事情。山冈庄八写小说,因为是在报纸上连载,就和金庸在报纸上连载武侠小说很类似,每一篇都是几页篇幅的一个相对独立的小故事。这就好像那一把刀,去密密的削历史的这个篱笆,总之是削成了无数片。映入你眼睛的,也就是这个已经被削成了无数片的篱笆——其中有些部分曾经是篱笆的支柱,有些部分不过是编制的竹条而已——作者将这一大堆片段,一段一段的递到你面前,于是你就一段一段的去拼,努力的想象这个篱笆原来是个什么样子。
  总的来说,无论作为一本茶余饭后的消遣读物,还是研究日本精神的入门教材,这本书都是合格的。故事写的很精彩,虽然说由于体例的原因,不得不将一些很重要的故事写的很短,而将一些很无聊的东西写的很长,但这或许正是作者水平的一个表现。将“日本精神”放在这么大部头的书里面,虽然读起来叫人觉得绵绵无绝期,但或许读完之后,该了解的东西已然映入心中?时间是最好的药丸。

用Acrobat在PDF中嵌入字体

(原发于Readfree)
1)为什么要在PDF里面嵌入字体?
  因为目前还有一些平台上的PDF阅读器不支持中文——包括一些电子书(比如SONY的那个),还有一些掌上电脑(Palm等等)——如果不嵌入字体的话,就只能看到乱码了。Linux平台其实也是需要额外装中文包的。
2)用什么方式可以嵌入字体?
  大部分情况下,都可以采用虚拟打印的方式嵌入。除了Acrobat之外,PDFfactory等多款软件都有这种功能。不但可以支持PDF文件,也支持任何一种文件的打印。
  在Acrobat中,这个功能是用Distiller实现的,也就是PDF打印机,默认的情况下Distiller就是完全嵌入字体的。
3)能不能直接修改PDF中的字体嵌入属性?
  如果你手中已经有一个PDF文件,除了把它重新打印一遍,还有什么办法么?
  Acrobat中没有特别方便的方法修改PDF的字体嵌入属性(似乎其他的PDF编辑器也没有要加入这个功能的意思)。如果一定要这么做的话,可以用Tools –> Advanced Editing –> Touch Up Text Tool,选中需要嵌入字体的部分,右键菜单选择属性(Properties),就可以选择Embed嵌入字体。有些字体系统里面没有,只能手工选择系统里面有的字体嵌入,比较麻烦。并且中英文因为编码不同,不能同时修改,因此,这个功能只能用来救急,不太实用。
4)理想
  网络上有一个为SONY Reader开发的pdflrf转换工具,可以自动将PDF切边,转换为图片,再压缩成SONY专用的lrf——这还是一个命令行下的工具,意味着可以批处理。可惜作者似乎没有想过要把这个pdf再转换回pdf,如果能够实现,也能够造福其他平台和PDA。就算不行,有一个命令行下的Distiller给我们嵌入字体也好啊,可惜Windows平台下的acrobat永远不会有这么方便的功能。