enter image description here

当我们用崭新的视角去观察与思考,世界就会变成另外的模样。这是我们筹备举办“改变未来的算法与算法交易”研讨会的初衷。

美国雄霸全球依赖华尔街与硅谷等强大支柱,而近年来,算法对华尔街的渗透与控制体现出颠覆未来产业生态的力量。图灵公司出版的《算法帝国》一书中介绍,2000年,华尔街通过计算机程序交易的比率不足美国股市交易量的10%;2008年上半年,自动化电子交易占了全美股市交易量的60%;现在,华尔街70%以上的交易依靠所谓的黑盒子或者算法交易(闪电交易)运行。银行家和股票经纪人也闻风而动,不仅招聘聪明的交易员,还大量雇佣聪明的物理学家和数学家,将数学和科学融入金融交易,算法交易在华尔街引发巨震。

2014年6月21日,以《算法帝国》为延伸,财讯传媒集团网络智酷与静沙龙联合图灵公司共同邀请了中国计算机领域三位杰出专家——中科院计算所研究员、中国计算机学会副秘书长陈熙霖,英特尔中国研究院院长吴甘沙,上海证券交易所CTO白硕,从算法和算法交易的角度探究算法如何改变未来并统治世界,以及算法交易在中国引发的技术生态变革。中科院自动化所研究员、中国自动化学会副理事长兼秘书长王飞跃,北京邮电大学教授、中国密码学会副理事长杨义先等诸多业界高手前来论道。

研讨会由财讯传媒集团总裁戴小京和图灵公司总经理武卫东开场,财讯传媒集团首席战略官段永朝和我共同担任主持。由于财讯传媒集团在中国金融界包括“一行三会”的强大舆论影响力,以及中国计算机学会、中国自动化学会、中国密码学会等“三会”权威齐聚会场,本次研讨会吸引了金融投资界与IT界、媒体界精英的热烈参与。在这里,我要特别感谢财讯传媒集团网络智酷的发起人段永朝老师和赵婷婷对会议筹备的支持,婷婷不仅会议流程操办专业,还特地为研讨会设计了羊皮古卷风格的封面图,让这场思想风暴更具经典意味。

enter image description here

?【陈熙霖】改变未来的算法

中科院计算所研究员、中国计算机学会副秘书长陈熙霖首先引领大家“用算法来看世界”,他将抽象的算法与日常生活紧密联系在一起,对隐匿在世界运行表象背后的9大算法进行了生动剖析。陈熙霖的演讲开宗明义地说:“算法无处不在”,从这个独特的维度出发,似乎世界无处不算法。

他面对在座中国自动化学会和密码学会的权威,谦虚且风趣地说: “一个翻译胡言乱语,两个翻译吞吞吐吐,三个翻译金口难开”,但他用深入浅出的实例与比喻,对搜索引擎索引、PageRank、公钥加密、纠错编码、图形识别(模式识别)、数据压缩、数据库、数字签名等算法的本质与机理进行了精准到位的“翻译”。

在陈熙霖看来,算法无处不在,但算法运行的效果往往受设计的目标、实现能力等的制约。例如对于一个多部电梯联动的系统,如果调度的目标是“能量最优”,则不可避免地出现电梯响应迟缓、甚至久等不来的情况,相反如果调度的目标是响应时间最小化,那么即使电梯的数量减少些,仍然能够做出快速的响应。没错,我们身边的电梯,就是被算法操控的。

被算法操控的不止是电梯,还有人类的精神生活。例如搜索引擎,借助与图书后面的倒排索引没有本质区别的类似算法,但谷歌网站上为我们推荐图书、电影和音乐的是算法;Facebook网站上为我们推荐朋友的也是算法:PageRank就是一种将繁杂的网页信息通过类似众望所归的引用机理为核心的,通过计算扇入和扇出进行网页排序的算法。

enter image description here

陈熙霖还用算法来看人类历史,例如“密码”,他开玩笑说中国古代的“文字狱”就是一种对密码学的误用,是用臆想的密码来误读他人的作品。已知最早的密码就是斯巴达密码,把条绕在树棍上,写上文字,然后展开。要想恢复的时候找同样直径的棍绕上就有了。还有凯撒密码,就是置换密码,而大家最熟悉的是福尔摩斯探案集里的故事“跳舞的小人”使用的密码,也是一种置换密码。

算法改变的还有现代经济与产业。例如与“数据压缩”算法相关的数字视音频产业,已成为电子信息第一大产业,2013年产值达2万亿元。过去我国视听终端产品由于缺乏核心技术,需支付的专利费每年多达40亿元。这就是算法的巨大经济威力!

关于模式识别的问题,陈熙霖认为模式识别是让机器、机器人有辨别是非能力的一大类算法。这类算法的目的是将识别对象从高维进行降维或升维以提高区分形,最终目的就是实现一维可分。其基本的实现路径是通过一系列训练集,让机器从实践当中学习。

听完陈熙霖老师的讲解,会忽然醒悟,算法原来已经在我们所在的物理世界和人类的精神世界起到了重要的作用。计算机科学与技术,已经成为支撑社会发展的重要基础设施,渗透到生活的方方面面。

enter image description here

?【吴甘沙】算法统治世界

如果说陈熙霖研究员的演讲让我们洞察到生活中无处不在的算法控制,那么英特尔中国研究院院长吴甘沙的分享,则直观展现了算法对当今世界的巨大影响,以及对未来的颠覆。他说:如果你把互联网、把大数据分析看做运行在庞大机器上的算法,而把每个人的一言一行、一举一动作为数据,那么我们已经开始去营养这么一个机器了。我们提供的养料在帮助机器成长,从某种程度上这已经发生。

enter image description here

在阐释算法对世界的统治之前,他先用一页PPT回溯了算法在人类历史当中产生的影响,公元前1600年古巴比伦人的一块石板上,可能是目前已知的第一个算法,是做因式分解。此后,欧几里得、莱布尼茨、高斯、帕斯卡和费曼、欧拉、布尔等重要的历史人物对算法的进化做出了重大贡献。

吴甘沙还列举了构建现代世界的基础算法:压缩、纠错码、随机数生成、公钥体系、数字签名、排序、傅里叶变换、卡尔曼滤波、最短路径和隐马尔可夫模型。其中RSA是最标准的公钥和签名算法,这些与安全相关的算法对于构筑现代社会的信用体系、交易起到了基石作用,比特币也是基于数字签名的算法。而地图导航使用的是“最短路径”这种算法,卡尔曼滤波算法则从宇宙飞船到车到手机都在大量使用。

检索、推荐和预测是关乎人类生活的算法。吴甘沙介绍,预测当中很经典的是贝叶斯理论,贝叶斯理论专门搞预测,最早做棒球预测,后来做美国选举预测、奥斯卡预测。他演示了一张图,是前几年法航出事以后,根据贝叶斯理论预测进行搜索的结果,图中进行搜索的部分,红色部分概率最高,最终发现残骸的部分就是红色区域。

吴甘沙说,算法在跟世界互动的过程当中,对世界的测量可能是准的也可能是不准的。谷歌曾预测流感趋势,但2013年其预测值超过疾控中心数据的两倍以上。《自然》杂志就此尖锐批评道:观测即干涉,观察的过程当中对于被观察对象造成影响。因为谷歌对流感的预测值偏高,还造成了2013年1月流感疫苗供应短缺。《科学》杂志也评论谷歌对流感的预测是大数据的傲慢。有理论认为大数据只要相关性、不要因果性,有相关性就行了。但其实迷信就是相关性。观测到某种天象、事件的序列跟某一个结果有关系,就是有相关性。

既然算法已经影响了人类历史、构建了现代世界,那么更复杂的算法就可能统治未来。在《算法帝国》一书中,以华尔街为例,不断复杂化的算法和自动化机器,让华尔街成为算法比拼的战场。Quants即“宽客”,这群数量金融工程师利用复杂数学模型和超级计算机,在稍纵即逝的市场机会中淘金,在1980年到2007年成为华尔街新贵,当时在华尔街工作的约有2000名数学或物理学家。

吴甘沙用“算法统治华尔街”来概括华尔街交易日益自动化、程序化的发展历程,并将金融危机归结于“华尔街成也算法、败也算法”。他认为,华尔街现在的统治者可以说是算法,这个算法叫Black Scholes,网友俗称“黑寿司”,高盛公司的费希尔·布莱克、斯坦福大学的米隆·肖尔斯和哈佛大学的罗伯特·默顿共同指出了如何定价以及如何用似乎能够保障利润的方式对冲这些期权。这就是日后被宽客们奉为黄金标准的布莱克-肖尔斯模型。《算法帝国》中提到的托马斯.彼得菲提前发现了一个公式,这个公式是做期权、权证等等金融衍生品的定价。他的财富现在已经超过了安迪.克鲁夫,他们都是匈牙利难民。

后金融危机时代,则由于“宽客奔向西岸”的人才迁徙,推动了华尔街与硅谷的权力更替。他说,宽客奔向西岸,可能是比特奔向原子的前奏,例如谷歌隐藏的发力点,无一例外都跟算法控制的物理世界相关:如谷歌街景、谷歌地图、谷歌地球。更重要的是谷歌X实验室,谷歌的自动驾驶汽车、眼镜、网络气球、隐性眼镜等四大项目将会把算法的威力从虚拟世界带回物理世界。

算法要对整个世界实施控制,那就需要算法加数据、加软件、加系统。例如智慧城市的软件系统,底下是操作系统,是城市操作系统,上面是数据交易市场,可以是开放的、或者像数据交易市场,再上面是城市应用商店,在不同层面,系统里有算法、有数据、有架构,这就形成了一个比较完整的复杂系统。

被“算法”控制的物理世界,如无人机、智慧城市、物联网等,还将催生“统治物理世界的系统”。该系统首先将是基于大量数据,也将体现算法的学习、进化和创新能力,这种新的系统架构与脑(湿件)或生物、社会学隐喻相关。

如果说《三体》是一种宇宙社会学,那么未来会否形成算法社会学或复杂系统社会学?华尔街算法就是一种社会学现象,未来世界可能是无数种系统竞争的社会,系统之间必然产生博弈,如果博弈采用像《三体》中“黑暗森林”的哲学,形成囚徒困境,结果将很悲观。

算法也有可能通过生物神经网络的分层认知与学习,脑功能替代,从串行到并行计算的架构改变等获得智能的进化。吴甘沙称之为“计算智能”:算法生物学隐喻的集中体现。

enter image description here

吴甘沙认为,算法应该具备学习、进化和自我创新、变革的能力。从基于数据的学习能力,到基于算法的学习能力,而且算法和算法有希望进行融合,获得进化可能性。例如IBM的Watson采用了若干种算法,每种算法占的权重只有个位数,把这么多算法积分组合起来,形成最后的算法,可以达到90%的回答正确率。

他总结道:未来机器脑有一定优势和劣势,首先机器具有无限扩展的并行性,加入更多资源就能够扩展,而人脑每十万年才增加一立方英寸,计算资源增加速度非常慢。还有容量和速度的问题,人的神经元一秒钟只能发射几十次,而计算机频率非常高。此外,人的神经网络里传输电信号的速度是一秒走一百米,而机器接近光速。这些方面机器脑有一定优势。但能耗是机器相对于生物的劣势。所以现在大家也在探索很多新的方式,像DNA计算机、量子计算机,包括纳米晶体管,试图去解决机器脑的能源问题。最后,他寄望于生物智能与机器智能的融合,对算法统治的世界未来,持有乐观其变的开放态度。

下篇