一步步爬取Coursera课程资源

有时候我们需要把一些经典的东西收藏起来,时时回味,而Coursera上的一些课程无疑就是经典之作。Coursera中的大部分完结课程都提供了完整的配套教学资源,包括ppt,视频以及字幕等,离线下来后会非常便于学习。很明显,我们不会去一个文件一个文件的下载,只有傻子才那么干,程序员都是聪明人!

那我们聪明人准备怎么办呢?当然是写一个脚本来批量下载了。首先我们需要分析一下手工下载的流程:登录自己的Coursera账户(有的课程需要我们登录并选课后才能看到相应的资源),在课程资源页面里,找到相应的文件链接,然后用喜欢的工具下载。

阅读全文

人机交互之字符编码

编码其实并不神秘,可以说是随处可见。上溯到远古时期,猿人为了记录所见到的事物,就在岩壁刻下简单的图形,这些图形可以说是最古老的一种编码了。我们的汉语其实也是一种编码,李白同学为了描述瀑布美景,就写出了“飞流直下三千尺,疑是银河落九天”的千古名句。随着汉语的不断完善,我们遇见的每件具体物体和大部分抽象的概念都有了编码,比如“树”代表长有绿叶的高高的植被,“开心”代表了一种愉悦的精神状态。当然了,还有英语、法语、德语等等,它们每一个都是一种编码,可以表达自然万物以及抽象概念。

阅读全文

众里寻她千百度--正则表达式

先来看一个让人震撼的小故事,故事来自知乎问题PC用户的哪些行为让你当时就震惊了?

同学在一个化妆品公司上班,旁边一个大妈(四十多岁)发给他一个exl表,让他在里面帮忙找一个经销商的资料。
表格里面大约有几百个客户资料,我同学直接筛选填入信息,然后没找到,就转头告诉大妈,说这个表里没有。
大妈很严厉的批评了我同学,说年轻人干工作一定要沉的住气,心浮气躁可不行。这才几分钟啊,我才看了二十行,你怎么就找完了。
同学过去一看,大妈在一行一行的精挑细选,顿时一身冷汗。把筛选办法告知后,大妈不但不领情,还召集办公司其他老职员,一起声讨我同学,我们平时都是这么找的,你肯定是偷工减料,我们找一个小时没找完,你几分钟就找完了。

不知道是否确有此事,不过看起来好吓人的样子。仔细想想,大多数人都是用以往的经验来分析遇见的新问题的。就上面的大妈而言,在接触计算机之前的几十年里,她面对的都是纸质的客户资料,此时,要查找某一客户资料,只能一行一行看下去了。

阅读全文