海归网首页   海归宣言   导航   博客   广告位价格  
海归论坛首页 会员列表 
收 藏 夹 
论坛帮助 
登录 | 登录并检查站内短信 | 个人设置 论坛首页 |  排行榜  |  在线私聊 |  专题 | 版规 | 搜索  | RSS  | 注册 | 活动日历
主题: 第二十八章 散弹噪声,正态分布(美国梦幻曲:硅谷枪声系列)
回复主题   printer-friendly view    海归论坛首页 -> 生活风情           焦点讨论 | 精华区 | 嘉宾沙龙 | 白领丽人沙龙
  阅读上一个主题 :: 阅读下一个主题
作者 第二十八章 散弹噪声,正态分布(美国梦幻曲:硅谷枪声系列)   
hwarrensen
[博客]
[个人文集]




头衔: 海归少将

头衔: 海归少将
声望: 专家

加入时间: 2004/02/22
文章: 1961

海归分: 300128





文章标题: 第二十八章 散弹噪声,正态分布(美国梦幻曲:硅谷枪声系列) (4120 reads)      时间: 2016-10-24 周一, 10:16   

作者:hwarrensen生活风情 发贴, 来自【海归网】 http://www.haiguinet.com

杨师中更是掩饰不住对雷明顿700的喜爱。待到宇文博办好租枪手续,两人又各买了两匣子弹。在往靶场的路上,杨师中这回也用不着宇文博邀请他再次扫枪盲,接着蹀蹀不休:
“雷明顿的精度可以说执步枪行业牛耳。美国特种作战司令部在2009年初有一个统一美军高精度狙击步枪计划,选用一种手动枪栓狙击步枪替换美军现役的其他栓动狙击步枪。雷明顿在强手环伺中脱颖而出,赢得了八千万美元的合同。雷明顿的精度由此可见一斑。

我们俩都是做精密仪器设备的,因此很容易理解决定步枪的射击精度的因素,归根结底和其他精密仪器设备一样,有两个:随机误差和系统误差。相应的测量指标当然一个是精密度,一个是准确度。“

宇文博接着说道:“这个是自然的。随机误差是动态的还是静态的?”—— 特别在半导体计量设备领域,系统的精密度又进一步细分为静态精密度和动态精密度,两者的差别在于静态测量时半导体晶圆也就是测量目标是固定的,而动态测量时每次测量晶圆都要送回到晶圆盒也就是所谓的FOUP然后再重新由机械手传送到测量台 (Chuck) 上。

杨师中答道:“是静态精度。枪是固定在射击台上,连续发射一定数量的子弹,统计分析弹着点的散布范围,那当然是越小越好。不过和常规测量不同的是,测量射击精度的指标不是用标准差衡量,而是用全部弹着点分布的最大散布角半径来衡量,常用的单位是角分,也就是60分之一度。在英制里方便的是在一百码的距离上,一角分的线距离差不多就是一英寸。一般光学瞄准镜的刻度是四分之一角分,这大概也就是高精度狙击步枪的静态精度吧。在一百米的距离一角分的半径是29毫米,也就是弹着点分布在一个半径不到一寸的圆以内。“

“嗯,原来这样。不过在大数定律和中心极限定理的框架里,可以将弹着点近似为正态分布,这时候最大分布半径和三倍西格玛差距不大。”宇文博接话道 —— “对了,说起随机分布,我想起来在光电探测的噪声分析中有一项散弹噪声,来自于光电二象性中光子的随机,服从泊松分布。从名称上看似乎和射击有某种联系?”

二零零八金融危机后,华尔街把赌注押向软件公司,所谓的“独角兽”初创公司动辄估值几十亿美元。“福布斯”2016年9月13日的一篇文章更是把软件捧上了前所未有的高度,其中的例子就有华尔街的宠儿优步如何把汽车制造业逼入边缘 …… 等等。而实情是优步2016年上半年亏损了至少16亿美元,不过要和微软比,那真是小巫。微软用262亿的天价并购领英。当时领英的毛利是3亿9千6百万。而扣除应付的利息、税款、 计入折旧后,领英净亏损约2亿2千1百万美元 。就算按领英的毛利算,微软也需要66年多才能把这买价赚回来。

自从朵莱领他入门以来,宇文博投资深信两条基本理念:逆向投资和价值投资。在他看来,每个人在对自己职业生涯投资时,应该比对投资股票更加需要用心经营。他是把这两条理念应用到职业规划上了。

世纪初网络泡沫破灭后相当一段时间,网络、通信、软件等产业一直一厥不振。2005年时有朋友的儿子要考大学,华人本来就偏向小富即安,考医学院出来当医生大概是90%以上华人家长的首选。那朋友没事找事,找宇文博商量儿子选哪个专业。其实他本来心里早就选好了,只不过想在宇文博那儿找个赞同罢了。但宇文博德国人的古板机械无药可治,他老先生却和人说现在大家一窝蜂都让孩子选生物,等到四年毕业出来,生物毕业生必然供过于求,万一考不上医学院,找工作都困难。现在人们避软件如避瘟疫,这时候才正是学电子工程、计算机科学或计算机工程的好时机。但和股市上的逆向投资一样,知易行难。人人嘴上都说要“高抛低吸”但落实到行动上却都是“追涨杀跌。”那朋友的儿子自然报的是生物。还果然和宇文博说的一样,四年毕业出来,正碰上华尔街全力捧网络软件独角兽的臭脚,软件工程师轻轻松松就是一个年薪六位数,把那朋友给后悔的。

幸亏宇文博没和那朋友说价值投资。就象当年老巴菲特说的,投资对象不光得坚固的象城堡,堡外还得环绕护城河。在宇文博看来,符合价值投资的专业也就是所谓的科学、技术、工程和数学,而真正的核心其实是物理。在他看来物理本身就函盖了数学,因为几乎所有的物理问题都必须用数理方程描述。他原先老会跟别人说,把物理真正学明白了,对世界的认识会比不懂物理的人更加深刻明晰。不过后来发现这种一竿子打翻一船人的做法实在讨人厌,他只好收敛了,但心里其实还是德国佬固执的臭毛病,只不过不形诸词色罢了。

至于到后来程序员居然可以自以为是上帝,只要随便动动手指头,编几行代码,轻轻松松就可以让100个工作消失。听到这些,宇文博只能是苦笑。软件业中当然有绝世高手。那是一些独立特行的黑客,或者是以高级精密算法给软件业定规距划方圆的大师。象冯·诺依曼 (John von Neumann) 或阿兰·图灵 (Alan Turing) 那是不世出的的泰山北斗。或者象用深度学习神经网络打败李世乭的谷歌的首席程序设计师黄士杰, 台湾师大资工系博士。归根结底又回到数理模型非线性动力学人工智能人工生命 ……。至于那些“随便动动手指头,编几行代码”充其量也就是会用微软的Visual Studio之类的软件,帮人订订外卖或者搭搭车罢了。宇文博在股海沉浮还学得的一课是,在上帝前面一定要卑谦。自以为是上帝的,上帝最终总要惩罚他们。




图一 围棋王和李世乭第一次对局。左边是围棋王团队首席程序设计师 (Lead Programmer),台湾师大资工系博士黄士杰 (Aja Huang)。来源: CBC News March 9 “Human Go champion loses to Google DeepMind AlphaGo computer in 1st game”(https://www.cbc.ca/news/technology/alphago-ai-lee-sedol-1-of-5-1.3483020)

不过在上帝要泡沫破裂之前,没有人能知道这泡沫到底会吹得多大,也没有人能阻止华尔街将计算机退化成下里巴人的玩具, 而计算机之所以为计算机的最基本的功能 —— 强大的计算能力,倒反没多少人在意了。不过真要说起来这也应该是理所当然的事,因为象优步之类的打车或外卖网站和下里巴人们的日常经验无缝衔接,自然不存在理解问题。而计算机仿真模拟肯定难逃阳春白雪和者必寡的命运了。而且计算机模拟仿真的功能也许确实超乎常识,甚至是匪夷所思。随便举个例子,比如象核爆炸都可以通过计算机模拟仿真。

但这些对宇文博却是一点都不陌生,因为计算机仿真模拟其实就是他安身立命的饭碗。

现代精密仪器系统新产品研发现在已经完全由计算机仿真模拟主导。象他服务过的基因引擎公司这类精密光电系统,样机的研制费用至少以百万美元为单位。象二十世纪那种凭经验设计建造样机再调试的研发方式早已经被淘汰。而仿真模拟的一类重要系统参数就是系统的噪声模型和信噪比。

有意思的是在精密机电工程中至关重要的噪声机制却是一位植物学家发现的。在1827年,当时在苏格兰已经成名的植物学家罗伯特·布朗 (Robert Brown) 发现一个有趣的现象。他当时在显微镜下观察植物花粉的水溶液,发现那些微颗粒在不停地运动。开始时他以为那是因为些微粒是有生命的缘故。但后来他排除了这个假设,因为他用玻璃粉末等其他无机物质微粒也观察到了这种不规则的运动。在就是著名的以他的名字命名的布朗运动。对这种分子热运动的完整的理论一直过了差不多80年以后,到1905年爱因斯坦在他那著名的被广泛引用的论文中才被解释清楚。而到了1927年,贝尔实验室的实验物理学家约翰逊通过实验精密测定了导体两端的热噪声电势起伏。同在贝尔实验室的著名理论物理学家,信息论中著名的抽样定理的发现者纳奎斯特推导出了热噪声的理论表达式。貌似风马牛不相及的植物学和物理学通过概率论和随机过程给联到了一起。

如果说植物学和物理学至少还同属自然科学,那么布朗运动居然还成为金融工程的奠基石那也许真有些非夷所思了。1900年,当时就读巴黎大学的巴契里耶答辩他的博士论文《投机理论。这是人类历史上第一次尝试用严谨的数学工具研究股市。有论者认为那一天是现代金融工程的诞生日。

巴契里耶的分析方法的关键假设就是债券的价格变化和溶液里的粉末的布朗运动从数学的角度服从相同的随机漫步方式。现代统计物理和热力学告诉我们构成物质的分子都处于不停息的热运动状态。相对于分子的尺度,溶液中的粉末颗粒简直就是巨无霸。分子运动对它的冲撞只能算是微扰。从随机过程的角度,尽管这些分子的运动是完全随机无规则的,但每一个分子都遵从相同的随机分布,而且相互之间独立不相关。这也就是所谓的“独立同分布”—— Independent Identically Distributed (IID)。这种运动被形象地称作为“随机漫步”—— 当年朵莱教宇文博学投资,让他读的第一本书就是《华尔街随机漫步》。概率论的中心极限定理告诉我们,当一个随机过程是由无穷多独立同分布的的随机变量序列构成时,这个随机过程服从正态分布。而粉末的运动状态最终由大量IID随机运动的总和决定,因而布朗运动是服从正态分布的随机过程,也就是所谓的维纳过程。

巴契里耶从布朗运动中发现了投资者和市场的关系类似于热运动的分子和粉末的关系。他假设投资者的行为可以看作是独立同分布,每一个投资者的行为尤如热运动的分子,因而市场或者股票的价格变化类似于布朗运动。

尽管巴契里耶的研究结果在当时并没有引起同时代人的注意,但此后独立同分布和正态分布成了经典金融工程的两大奠基石。象有效市场假说和资本资产定价模型,以及布莱克-斯克尔斯期权定价模型等都建立在这两大基石上。那些理论的发明者也都得了诺贝尔经济奖。据说“宇宙即是所有随机事件概率的总和,“ 那么正态分布肯定上帝赐给人类的礼物, 因为人类的所有活动几乎都是由大量随机的过程组成。即使不知道这些随机过程到底服从什么样的分布,但只需假设它们之间相互独立,且服从相同的分布,则它们作用的总和就服从正态分布!在有些情况下,甚至不需假设独立同分布,也能导出正态分布。正因为如此,无论是自然科学或社会科学,正态分布几乎是无所不在。

比如在上世纪九十年代中叶,有人对大量数据进行严谨的统计分析后发现,甚至象人类的智商在各种族之间的分布都遵循正态分布,因而出版了一本名为《钟形曲线:美国社会智商和阶级结构》的书。即使在上世纪九十年代那样相对宽容的大环境下,那本书也引起了广泛的争议。要是在今天政治正确到荒谬的大环境里,本书也许跟不就不可能出版。两位作者在大量数据的基础上,得出的结论是人类各种族的智商服从正态分布,其中除了拉丁裔以外的白人的智商为平均值,令其为100作参照系。智商最高的是犹太人,平均智商为110;其次是中国、日本、韩国、台湾等构成的东亚人,为105。最有意思的是印度人。似乎不光印度人自视甚高,其他国家尤其是美欧似乎也一致认为印度人聪明。抬举印度唱衰中国似乎是美欧所谓主流媒体的共识。但印度次大陆的平均智商低于平均值,在85到90之间。




图二 智商分布图。来源:Voice of Reason 网文章 “Intellectual Radioactivity,” by Alex Kurtagic, November 9, 2009 (https://reasonradionetwork.com/20091109)。

印度政府和人民还有另一项过人之处,绝对值得天朝借鉴:尽管美欧主流媒体一致看好印度,但你从来不会听到类似“印度威胁论”之类的杂音。如果说“围堵中国”出于意识形态差异,人们可别忘了上世纪八十年代美国举国上下一致的共识是 “围堵日本”—— 尽管日本在意识形态上和美国高度一致,而且是美国在亚洲最重要的盟国!

另一个有意思的现象是,钟形曲线显然是非线性的。同样是五点的差别,110和105的五点之差和105和100的五点之差简直是天壤之别。难怪犹太人在一切需要智力的领域,尤其是在科学和商业金融领域 —— 也许除了在体育之外的任何其他领域 —— 取得的成就远远超过包括中国、日本、韩国、台湾等东亚人在内的任何种族。

至于宇文博提到的光电探测的另一种噪声,所谓的散弹噪声,则服从泊松分布。概率论可能是数学中最接地气的学科。这也难怪,因为本来概率论就是出堵博发展来的。但正因为其接地气,所以可能也是数学中最容易而且最多被滥用甚至误用的学科。

就比如说这泊松分布,除了象描述光电探测散弹噪声这类阳春白雪象牙塔里的应用,你也许想不到的是,泊松分布还可以用来检验比如象枪击案是否上升这类大众关心的社会问题。

美国的枪击案全球臭名昭著。就象典型的美国社会问题,两党政客从来都是以其利益为出发点,驴唇不对象嘴,高调年年唱,实际解决问题的措施却从来不曾有过。尤其在奥巴马当政的八年,治安恶化似乎已经是不争的事实。特别是近年来接二连三发生的警察枪击黑人事件,对此两党候选人对此似乎也有共识 —— 这个社会显然是病了,而且病得不轻。不同的只是他们诊断出来的病因和开出的药方。如果认为病因是警察种族岐视 —— 这诊断的依据之一是警察枪击对象中黑人的比例太偏高,远高于黑人占全体人口的比例 —— 则药方自然是要严肃整顿警察队伍。另一种诊断则是警察并不存在种族岐视,因为黑人的犯罪率,尤其是象杀人等严重暴力犯罪率同样远远高于黑人占全体人口的比例。由此出发,药方自然是加强法制和秩序,所谓的 Law and Order。

不过有人运用泊松分布,得出的结论和上述两方都不同:美国社会向来如此,枪击案并没有上升!

那篇网文的作者从名字上看似乎是一位印度人,有人用中文将之加以扩充改写。读者诸君如果有兴趣,可从文献索引中按图索骥。不过中印两位作者似乎都忽略或者忘记了泊松分布的一个重要前提,那就是泊松分布其实是二项分布 (Binomial Distribution) 在样本量极大 (N --> Infinity) 时的极限。而那两篇文章里的样本数量可能根本就不构成统计意义。泊松分布在这里被滥用或误用了。

不过如果按照华尔街的标准,比起正态分布在金融工程里的滥用和误用,象上面例子里泊松分布也许根本就不算是滥用或误用。

杨师中显然对理论的兴趣没有宇文博那么执着:“这个我还真不清楚, 不过从实际应用来说,这只是步枪可能达到的最高精密度,如果光是考虑射击的精密度,有一种说法,大炮的射击精度甚至高于狙击枪。但实际上更重要的是射击的准确度,也就是准确击中目标的能力。这不仅仅取决于枪支的精度,而且还和射手以及射击时的气流、温度、湿度等等因素有关。也就是说不仅仅是随机误差,还有系统误差。

而为了达成这个目标,你不光需要象雷明顿700那样一支高性能步枪。你还需要一架高性能的光学瞄准镜。“

作者:hwarrensen生活风情 发贴, 来自【海归网】 http://www.haiguinet.com









相关主题
第二十九章 开普勒和伽利略(美国梦幻曲:硅谷枪声系列) 生活风情 2017-2-21 周二, 08:45
第二十七章 雷明顿七零零(美国梦幻曲:硅谷枪声系列) 生活风情 2016-9-13 周二, 12:18
第二十六章 冷血杀手 (美国梦幻曲:硅谷枪声系列) 生活风情 2016-7-05 周二, 11:51
第二十三章 灯火阑珊处 (美国梦幻曲系列) 生活风情 2016-2-26 周五, 11:42
第二十二章 望尽天涯路 (美国梦幻曲系列) 生活风情 2016-2-06 周六, 12:40
第三十章 微观世界的负重越野行军 (美国梦幻曲系列) 生活风情 2017-11-06 周一, 09:34
第二十五章 松风吹解带 (美国梦幻曲系列:硅谷枪声) 生活风情 2016-6-13 周一, 01:45
第二十四章 以武会友 (美国梦幻曲系列) 生活风情 2016-4-17 周日, 13:29

返回顶端
阅读会员资料 hwarrensen离线  发送站内短信
显示文章:     
回复主题   printer-friendly view    海归论坛首页 -> 生活风情           焦点讨论 | 精华区 | 嘉宾沙龙 | 白领丽人沙龙 所有的时间均为 北京时间


 
论坛转跳:   
不能在本论坛发表新主题, 不能回复主题, 不能编辑自己的文章, 不能删除自己的文章, 不能发表投票, 您 不可以 发表活动帖子在本论坛, 不能添加附件可以下载文件, 
   热门标签 更多...
   论坛精华荟萃 更多...
   博客热门文章 更多...


海归网二次开发,based on phpbb
Copyright © 2005-2024 Haiguinet.com. All rights reserved.