Open Network Summit 2012参会随笔

Cisco华丽的转身,投入1亿美元于一个内部创业公司Insieme,专注于SDN产品研发;Google在内部全部部署Openflow,给出了震撼性商用案例,大批的ISP及ICP必将跟随。Juniper也证实Q-Fabric将引入OpenFlow作为控制协议。

在Internet Scale上,永远不会有集中的控制者,首先是多运营商模式不欢迎集中的控制,其次CAP理论也告诉我们,我们没法平衡这样一个系统的Consistency、Availability和partition-tolerance,传统的分散式互联网设计是牺牲一致性来保证Availability和partition-tolerance,而在如此的地域跨度上采用集中控制势必连后两者也保证不了。

在IT订制化需求比较集中的地方,SDN将是首要的应用场所,比如DataCenter和大型企业网络,另一个可能的场所就是运营商的接入网络,用作Mobility、Subscriber、QoS Policy和多接入融合的统一控制,并且也会打开以后运营商网络快速创新的窗口,但是由于电信运营商的保守天性,这一应用落地速度将远慢于Datacenter和大型企业网。

笔者(新浪微博@wang_russell)注: 欢迎转载,烦请注明出处。

一、见闻散记

连续参加两次Open Network Summit了,间隔半年明显感受到了SDN在业界显著的进展。去年十月的ONS,尚有不少的SDN质疑者,也没有有说服力的商用部署,Cisco暧昧不明的态度多少也使得大部分的客户采取观望态度。而本次会议,Cisco华丽的转身,投入1亿美元于一个内部创业公司Insieme,专注于SDN产品研发;Google在内部全部部署Openflow,给出了震撼性商用案例,大批的ISP及ICP必将跟随。会议上和各个厂家的工程师聊天,了解到产品相比较于去年大部分都有了显著的进展,更多的产品型号开始支持OpenFlow,部分厂商计划推出支持OpenFlow 1.1或1.2版本,这是个显著的标志,因为对于1.0的单表结构,只要简单映射到ASIC的ACL功能单元上就可以了,而支持1.1+的多级流水线,则需要进一步的开发工作。Intel的FM6000(来自于收购的FulCrum)则开启了硬件针对OpenFlow优化的大门,虽然还比较初步,但是已经宣告了芯片厂商们开始认真地支持OpenFlow. 会场上也碰到了国内盛科的孙总和古总,亲自摆摊展示对OpenFlow的支持,虽然仅仅是软件适配支持1.0,也算是迈出了关键的一步,相信对于市场的开拓还是有一定正面作用。

去年ONS上留给我印象最为深刻的是Scott Shenker的关于Master Complexity vs. Extract Simplicity的演讲,而本次Nick Mckeown关于SDN环境下测试方法软件化、形式化的演讲则给了我进一步对于SDN的信心。的确在过去的网络技术领域,我们只相信Running Code(IETF的风格),值得表扬的是务实的风格,不好的是码农作风,只能堆砖,没法在方法论上突破,从Paper Work Only的极端走到了不相信理论的另一个极端。

从ONF、ONS的组织来看,SDN的成功乃至创新来自于硅谷绝非偶然的,大批的风投、媒体均参加了ONS,并且和组织者有着良好的关系,ONF的Market Education工作组承担了市场推广的主要职责。创新思想的提出->市场的孵化(通过NSF资助的GENI)->风投介入的初创公司(Nicira、BigSwitch, etc.)->媒体的大肆鼓吹->更多的客户被忽悠进来->更多的公司参与其中,这一条道路想不成功也难,当然你得混在硅谷,并且被认定为像Martin Casado一样聪明无比,风投也愿意跟着你混。显然同样重要的一点的是,这个圈子里,技术上的质疑外,互相吹捧而非互相拆台也是大家共赢的必要条件。

二、关于SDN

我们过去无论是在内部推广还是外部介绍Openflow\SDN时,总是遇到很多具体的技术质疑,比如性能如何、可扩展性如何,某个具体功能和现有技术相比如何,后一个问题就如同因为一台Pc上编写的计算器软件和计算器比起来并无显著差别从而得出结论:PC和Casio的计算器比起来并无优势。SDN和现有网络体系是实现理念上的差别,转发控制分离、集中策略控制使得新的网络功能很容易引入,并且集中管理使得网络的可维护性获得质的飞跃。在转发面的具体实现上甚至可以不加多少改动,可以理解是现有的集群路由器的另外一种实现方式 – 集中控制面的集群路由器/交换机,如果非要举一个可比的例子,那就是Juniper的QFabric, 本次ONS上,Juniper也证实Q-Fabric将引入OpenFlow作为控制协议。

我们知道,Internet前身是美国军方的ARPANET,设计理念是能够在核打击后仍然可以正常通信,因此采用了全分布的体系架构,逐跳路由决策,这种网络的整体生存性最好、可扩展性也最好。如果设想一个铁路系统,同时跑了数千辆列车,没有集中的调度系统,依赖于列车长彼此间两两通信协商列车通过时间表,那么会有什么问题?首先这个系统没有单点故障,出现全面瘫痪的可能性较小,这是好处不是问题;其次局部出错的可能性较高,两两协商,个体很难获得全局信息,因此作出错误决策和非最优决策的可能性很高;第三,信息的传播速度慢,比如某线路是东西必经线路之一,线路故障被某列车发现 ,但是因为传播是逐跳的,等到传到东边时,某条列车已经按既定路线出发了,到故障点不得不返回。第四,没有统一决策,遇到利益冲突时可能产生扯皮,从而使系统总体效率严重受损。

上例我们可以看出,我们付出效率的代价可以得到避免单点故障的好处,我们一般还可以获得系统可伸缩性的好处。但是并不是每一个系统都是需要象Internet那样增长到十亿级别,其次软硬件技术的发展使得我们可以采用冗余技术使得逻辑上的集中点可用性超过5个9,物理上的Single Point of Failure其实并不存在。那么在规模上限不是很变态的情况下,集中控制的系统简单而高效,比如企业网、数据中心、局部接入网络,而在Internet Scale上,没有什么能够替代全分布的架构,最多我们可以将部分节点组成一个集群进行集中控制,这使得Internet的节点数减少,但是并不会从总体上改变互联网的架构。

三、关于SDN的过度吹捧

在新生事物刚刚萌芽时,从来不缺质疑者,同样在炒作的顶峰,我们同样不缺盲从者。OpenFlow/SDN虽然还没有炒作的最顶峰,但也为时不远。有人认为SDN将成为Internet的控制面、或者网络软件完全和硬件分离。

第一点,在Internet Scale上,永远不会有集中的控制者,首先是多运营商模式不欢迎集中的控制,其次CAP理论也告诉我们,我们没法平衡这样一个系统的Consistency、Availability和partition-tolerance,传统的分散式互联网设计是牺牲一致性来保证Availability和partition-tolerance,而在如此的地域跨度上采用集中控制势必连后两者也保证不了。

第二点, Network不是消费类产业,对人类社会而言不是承载最终使用价值的功能性产品,只是幕后英雄。没有消费者会去关心网络的App,而在产业圈子里,集中管理和订制化能力将是SDN的竞争优势,我们不会有Network的通用AppStore,但是将会像IT产业一样,出现少数寡头化的SDN软件平台、芯片厂商、大量的硬件厂商、大量的订制化应用开发者和系统集成商。

我认为SDN将改变局部网络的实现方式、改变网络设备的产业链、改变网络和应用之间的关系,这已经足够了。在IT订制化需求比较集中的地方,SDN将是首要的应用场所,比如DataCenter和大型企业网络,另一个可能的场所就是运营商的接入网络,用作Mobility、Subscriber、QoS Policy和多接入融合的统一控制,并且也会打开以后运营商网络快速创新的窗口,但是由于电信运营商的保守天性,这一应用落地速度将远慢于Datacenter和大型企业网。

此条目发表在 云计算技术, 其他 分类目录。将固定链接加入收藏夹。

发表评论

要发表评论,您必须先登录